Estoy buscando una pasantía en análisis de datos e inteligencia de negocios. ¿Cuáles son las principales habilidades en las que debería centrarme en aprender?

No vayas donde está la pelota, apunta a donde crees que estará.

Business Intelligence está desactualizado. También lo es el análisis de datos. Ambas son para compañías OWM del siglo XX donde había un equipo ejecutivo que eran las únicas personas autorizadas a tomar decisiones (Old, White Men). El análisis de los datos fue crear gráficos bonitos para que discutieran en la sala de juntas.

El aprendizaje automático es donde va la pelota. Aquí los sistemas informáticos utilizan algoritmos para analizar el comportamiento y predecirlo. El sistema analiza los datos y calcula un óptimo, luego lo prueba, observando la desviación de lo esperado y óptimo. Luego elige la mejor opción, ajusta el algoritmo para hacerlo e intenta nuevamente. Dada la información suficiente, optimizará un sistema en horas, incluso antes de que los OWM hayan llegado a su reunión, no importa tomar una decisión.

Aprenda los sistemas detrás de Machine Learning y su gran Brother Deep Learning. No es tan difícil como cree: pruebe el curso Coursera de Andrew Ng para obtener una introducción y comprenda los conceptos clave: supervisión, refuerzo, redes neuronales, etc. También aprenda Python, como un programa para poner en práctica estos algoritmos. Y entienda las estadísticas con gran detalle.

Business Intelligence y Data Analytics no son un paso en el camino hacia la ciencia de datos, son una versión anterior de la misma. Si los aprende, tendrá que volver a desaprenderlos para ser un buen científico de datos.

Primero aprenda estadísticas, que es lo básico para analizar datos. En estadística, aprenda sobre pruebas de hipótesis, tendencia central, teorema del límite central, cómo muestrear y diferentes tipos de técnicas de muestreo, distribución normal, asimetría y curtosis, varias pruebas como prueba z, prueba t, anova, etc., varios tipos de regresión (lineal , multivariante y logístico)

Después de aprender todas estas cosas, intente aplicarlas utilizando R / Python / Both.

Realice uno o dos estudios de caso seleccionando conjuntos de datos aleatorios del repositorio de UCI o de cualquier otra fuente.

Esto será suficiente para la pasantía, más tarde puedes aprender aprendizaje automático y varios otros algoritmos y otras cosas avanzadas

Todo lo mejor

De manera general, necesitará tener algunas habilidades respetables en estadística, informática y un buen conocimiento en el campo en el que trabajará.

Las habilidades son infinitas y no se pueden delimitar.

Por ejemplo, R o Python se están haciendo famosos junto con sus bibliotecas en análisis de datos, estadísticas y aprendizaje automático. definitivamente debe consultar los sitios web dedicados a la ciencia de datos y antes de eso, tendrá que preguntarse qué haré con la ciencia de datos.