Big data es un término amplio y vago.
Por lo general, significa tres cosas:
1. Almacenamiento de datos:
Cómo almacena sus datos. Aquí es donde juegan las bases de datos NoSQL. El SQL tradicional a menudo no puede contener el volumen de big data, o no se ajusta debido a la estructura de los datos. Lea aquí más sobre NoSQL: NoSQL
2. Procesamiento de datos
Así es como procesa / analiza grandes cantidades de datos, o datos altamente no estructurados. Aquí es donde juegan Map Reduce y Spark.
Aquí hay dos clases principales: datos procesados como lotes (como lo está haciendo Map Reduce), o datos que se procesan continuamente como flujo (como Spark).
3. Análisis de datos
Esto es lo que hace con los datos, para extraer ideas e información útil.
Dado que puede almacenar los datos (si es necesario) y procesarlos, ¿qué tipo de información necesita?
Análisis avanzado, análisis predictivo, minería de datos: todos estos términos se refieren al análisis de los datos. Por lo general, usaría el aprendizaje automático, las estadísticas, la extracción de texto, la visualización de datos y demás para extraer estos conocimientos o recopilar la información que desee.
- Mi signo solar es virgo. Mi signo ascendente es el escorpión y mi luna está en Capricornio. ¿Cuáles son algunas de mis buenas cualidades y defectos?
- Veo más y más personas / campamentos sin hogar que aparecen en mi vecindario. ¿Qué tengo que hacer?
- Estoy planeando comprar un cobertizo de estaño para mi patio. ¿Cuál es la mejor manera de preparar mi tierra y nivelar el cobertizo?
- Tengo 17 años en la India. Quiero un trabajo a tiempo parcial. ¿Qué puedo hacer?
- He escrito un libro electrónico en hindi, ¿dónde puedo encontrar una persona que pueda convertirlo al inglés?