Confundo todos los términos de big data. ¿Son estos los métodos para analizar big data?

Big data es un término amplio y vago.
Por lo general, significa tres cosas:
1. Almacenamiento de datos:
Cómo almacena sus datos. Aquí es donde juegan las bases de datos NoSQL. El SQL tradicional a menudo no puede contener el volumen de big data, o no se ajusta debido a la estructura de los datos. Lea aquí más sobre NoSQL: NoSQL

2. Procesamiento de datos
Así es como procesa / analiza grandes cantidades de datos, o datos altamente no estructurados. Aquí es donde juegan Map Reduce y Spark.
Aquí hay dos clases principales: datos procesados ​​como lotes (como lo está haciendo Map Reduce), o datos que se procesan continuamente como flujo (como Spark).

3. Análisis de datos
Esto es lo que hace con los datos, para extraer ideas e información útil.
Dado que puede almacenar los datos (si es necesario) y procesarlos, ¿qué tipo de información necesita?
Análisis avanzado, análisis predictivo, minería de datos: todos estos términos se refieren al análisis de los datos. Por lo general, usaría el aprendizaje automático, las estadísticas, la extracción de texto, la visualización de datos y demás para extraer estos conocimientos o recopilar la información que desee.

Todos esos términos se usan en el campo de Big Data. Pero algunos de ellos también se usan en bases de datos tradicionales, como la visualización de datos, el análisis predictivo, etc.
Lo más importante para el problema de big data es la velocidad. Por lo tanto, se utilizan muchas tecnologías para mejorar la velocidad, como la base de datos de memoria im.