Soy un novato en el desarrollo de Hadoop. Tengo experiencia en desarrollo Java. Quiero trabajar en algún proyecto pequeño para mejorar mi habilidad y convertirme en un candidato adecuado para el empleo. ¿Cómo debo proceder?

Como dicen, la práctica hace la perfección.

Yo diría que siga practicando, escriba código, pruebe, ejecute y ponga sus pequeños proyectos en GitHub (esto puede ser útil durante la transición del trabajo).

Algunas ideas para

  • Cree un analizador de registros para procesar los registros del servidor y obtener información de eso
  • Lea un corpus de Twitter basado en alguna etiqueta específica, por ejemplo #FifaWorldCup, intente hacer una lista de otras etiquetas incluidas en los tweets, excepto #FifaWorldCup, intente dividir los tweets que contengan medios y solo tweets de texto.
  • Aquí hay otro, encontré en línea hace algún tiempo. Su respecto en Groupon Math: raspado de datos para estimar los ingresos
  • PageRank es también uno de los proyectos más famosos. Aquí hay un punto de partida Uso de su computadora portátil para calcular PageRank para millones de
  • El análisis de sentimientos de twitter corpus es otro buen proyecto que puedes hacer.
  • Crear e índice invertido a partir de un conjunto dado de documentos. Un índice invertido es un conjunto de datos con pares de valores clave, donde clave = palabra única y valor = lista de documentos en los que aparece esa palabra.
  • hadoop-map-reduce-examples – Un lugar para compartir ejemplos de reducción de mapas con sus conjuntos de datos para un aprendizaje integral – Google Project Hosting

Estos son algunos con los que puedes comenzar tu práctica y mejorar tus habilidades. Seguiré actualizando la respuesta si tengo otras ideas.

Le sugiero que elija el Certificado de Desarrollador Java Hortonworks Hadoop 2.0, puede ayudar mucho en la transición del desarrollo Java al Desarrollador Hadoop para demostrar su valía. Todavía no he realizado la prueba de certificado, pero yo mismo estoy planeando hacerlo en un futuro próximo. Aquí está el enlace a la certificación Hadoop Certiifcate

Espero eso ayude
-RJ-