Si inicio un clúster ‘Hadoop’ desde cero (sin algoritmos heredados), ¿por qué debería considerar Hive si tengo el último Spark con SparkSQL?

Hive, SparkSQL e Impala tienen sus propias fortalezas y debilidades y todo depende del trabajo que intentes hacer. Las últimas versiones de Hive usan Tez como motor de ejecución (e incluso hay una variante de Hive en Spark) para ejecutar los trabajos, por lo que es mucho más rápido que Hive en Map-Reduce. Existen varios puntos de referencia en línea que comparan Hive-on-Tez con SparkSQL, Impala con Hive, pero muchos de ellos son puntos de referencia realizados por Cloudera (una compañía que creó Impala y es uno de los principales contribuyentes a Spark), y Hortonworks (contribuyente principal Colmena en Tez y Tez). Estos puntos de referencia son sesgados, limitados y producen sesgos.

Repentinamente (marzo de 2016) encontré un punto de referencia, por un tercero, comparando SparkSQL, Hive en Tez e Impala en un conjunto completo de consultas de referencia, SQL-on-Hadoop Benchmark: Un poco de historia de tortuga y liebre

Muestran que cada una de las tres soluciones diferentes tiene sus propias fortalezas para cargas de trabajo específicas.

También debe verificar el proyecto Apache Drill.

Related Content

Estoy llegando a un punto en mi vida donde quiero morir. Estoy exhausto, paralizado por el dolor mental. Morir será simple e indoloro, tengo mi cilindro de gas (gas inerte). No puedo esperar para ir a dormir para siempre. ¿Qué debo hacer antes de morir?

Soy un estudiante de licenciatura en TI que falleció en 2014, planeando aprender SAP ABAP. ¿Tendré una buena oportunidad de trabajo después de aprender SAP? ¿Cuál será mi PA como SAP más reciente?

Necesito comprar buenos auriculares (IEM) bajo Rs2000 ($ 30). Generalmente escucho metal, pero no soy un gran bajista. Además, escucho EDM, así que necesito buenos agudos. ¿Qué auriculares sugeriría (disponibles en India)?

Si mi padre de 83 años me vende una de sus casas por menos del valor de mercado, ¿puede mi hermano demandar con éxito su patrimonio una vez que muera?

Mi perro tuvo cachorros hace 2 días, uno de los cachorros se queda solo y tiene frío. ¿Hay alguna manera de mantenerlo vivo?

Tengo 16 años y mi cabello comenzó a ponerse gris desde el último año y ahora está aumentando, ¿qué se debe hacer?

Quiero seguir mi carrera como programador; ¿Debo estar usando Linux sobre Windows?

A2A: La primera regla es: “Use la herramienta adecuada para el trabajo”; Es posible que necesite los tres:

Hive es perfectamente adecuado para trabajos de transformación de datos / ETL de larga duración. Usar Hive-on-Spark te ayudará a cumplir con los SLA más estrictos que de otra manera. (Usuario ideal: ingeniero de datos).
Impala proporcionará el mejor rendimiento para consultas interactivas / estilo BI, especialmente bajo carga de múltiples usuarios. (Usuario ideal: analista de datos).
Spark SQL le permite usar construcciones SQL para el desarrollo de procedimientos, como lo haría para construir canalizaciones ML, etc. No está realmente diseñado para BI. (Usuario ideal: desarrollador o científico de datos).

Amrit Hotta

De hecho, Hive usando Map reduce Framework es mucho más lento que Spark-SQL.

Siempre puedes optar por Hive con Spark.
Spark-SQL usa Hive Context para interactuar con consultas HQL.

Sin embargo, una limitación es que los RDD en Spark no admiten combinaciones.

Kapil Jain

Porque es como aprendemos c antes que java. 🙂

Si comienza con la colmena y luego cambia a sparksql, solo compare el rendimiento aceptado de ambos.

Prueba impala también es una mejor opción.

Kapil Jain

More Interesting

Cuando miro hacia atrás, descubrí que he perdido casi 10 años imaginando lo que quiero. ¿Hay alguien cuyo camino de la vida va bien tal como estaba planeado?

¿Por qué me gusta tanto el jazz lento y genial?

Quiero tener el mejor lugar para bodas en Delhi. ¿Alguien puede sugerirme el mejor lugar en tarifas bajas?

Tengo una idea para un nuevo proceso de fabricación aditiva. ¿A dónde iría para probar una idea para un proceso de fabricación aditiva que involucra polímeros?

Me gusta este tipo, pero quiero dejar de hablar con él por un tiempo, ¿qué debo hacer?

¿Por qué mi iPhone no puede enviar mensajes de texto? ¿Cómo puedo solucionar esto?

Mi mamá me sobrealimenta y ahora me dice que estoy gorda. ¿Es esto abuso infantil?

¿Por qué soy cruel con mi perro?

¿Podría tocar cosas de Slash en la guitarra si practico guitarra durante ocho meses?

Teñí mis raíces hace 2 semanas con buey 30 vol, quiero teñirlo nuevamente por completo. ¿Dañará demasiado mi cabello?

Web Analytics Made Easy -
StatCounter