Cuando UTILICE spark, es muy probable que también desee realizar una gran cantidad de trabajo de tipo de utilidad además de usar spark. El ecosistema no es muy maduro. Tiene sentido hacer sus propios pequeños paquetes rápidos de Python para hacer todo tipo de cosas. Las bibliotecas de Python son excelentes para esto. También es muy probable que desee hacer cosas en otras plataformas como experiencias y luego usar la chispa para escalar. Es decir, Python tiene excelentes envoltorios para el proyecto R y cosas similares.
Como usuario de Python, es realmente el mejor lenguaje para este dominio de ciencia de datos. Claro que Scala es lo que sucede debajo de las cubiertas, pero no es difícil de leer, incluso sin saber cómo codificarlo.
Si iba a contribuir a la plataforma Spark, entonces Scala es obligatorio, por supuesto.
Sé ambos idiomas y tengo un sesgo extremo hacia FP. Aprender ambos es bueno, pero si solo me permitieran usar uno, elegiría Python.
- Soy estadounidense con un amigo / colega indio en un mal matrimonio. ¿Que puedo hacer para ayudar?
- Estoy planeando comprar una nueva computadora portátil. ¿Qué empresa y modelo sugiere con un presupuesto de 35-45k?
- Si cometo un error y pago en exceso mis impuestos, ¿me reembolsará el IRS el pago en exceso?
- Ahorré 40000 pm en la India. ¿Cómo debería invertirlo?
- Vivo en Nueva Zelanda. ¿Cómo se transporta la fruta a mi país?