¿Qué debo hacer si quiero convertirme en analista de datos y centrarme en la codificación en lugar de la construcción de modelos, pero no soy bueno en matemáticas?

Comencé mi maestría en informática pensando lo mismo: no soy bueno en matemáticas, el aprendizaje automático nunca será para mí.

Pero luego me encuentro con dos libros, una cita que cambió mi mentalidad y, finalmente, un asesor que me demostró que estaba equivocado.

El primer libro fue El diseño de las cosas cotidianas de Don Norman [1]. Principalmente, el hecho de que la mayoría de las veces no es la persona común la que falla en el uso de objetos / sistemas / etc., sino el diseño que es simplemente malo. Y mal aquí, junto con lo que se le ocurrió al diseño, pensó (¡o no!) Cómo usaría el objeto.

El segundo fue el Curso de Aprendizaje de datos de Caltec [2] (Solo dale una oportunidad a la primera conferencia y observa cómo explica el profesor las fórmulas, y también su exposición al material en su libro premiado debido a la presentación del material y verás lo que quiero decir).

En tercer lugar, una cita en uno de los libros de Edward Tufte (creo que se encuentra en algún lugar de su sitio web) deseando que su discusión sobre “tinta excesiva” [3] sea muy apreciada en las disciplinas matemáticas.

Por último, un día en el que traje a mi asesor 4 páginas de matemática pura para explicarle algo que hice en un solo ejemplo, luego me dijo que tirara al basurero todas las matemáticas y me aconsejó que “no tratara de explicarle a usted en matemáticas no se puede explicar con palabras “, a pesar de que las matemáticas son correctas.

Lo que todos esos 4 pequeños ejemplos tienen que ver con la pregunta es:

Gran parte de nuestra impresión de “Fallé en las matemáticas y no tengo futuro” tiene que ver con la presentación y discusión de las matemáticas, oponiéndose a nuestros antecedentes.

Mi consejo para usted es encontrar un proyecto pequeño y autónomo que provenga de un algoritmo muy básico y común en el que pueda estar expuesto a una variedad de explicaciones (y, por lo tanto, puede cambiar en caso de que el que tenga en sus manos simplemente no lo haga ‘ t tiene sentido) y ver cuál funciona mejor para usted (también volver y ver una vez que entendió cómo el autor fue simple tratando de hacer su vida miserable). Recomendaría la regresión de mínimos cuadrados ordinarios, una cadena de Markov de 1 orden o la comparación de k-medias versus la agrupación jerárquica con diferentes formas de enlace. Con los 4 con un esfuerzo razonable, puede escribir en el código mientras comprende los bloques de construcción de forma intuitiva. Tome uno de esos como un “proyecto” y obtenga un conjunto de datos más complicado, digamos, datos climáticos o desafíos de conjuntos de datos de yelp que tienen dimensión de tiempo.

Siga los conceptos básicos utilizando uno de esos conjuntos de datos, vea lo que obtiene. Luego pregúntese qué datos puede usar para mejorar. Iterar. En poco tiempo, se dará cuenta de hasta qué punto su modelo y su comprensión evolucionaron en el camino.

Mi sensación después de repasar lo que estoy recomendando en esta respuesta es como el concepto que se dice en [4]: ​​Dé a las personas una gráfica muy complicada, y solo unos pocos podrán entender algo. Comience a contar una historia que muestre cómo evoluciona el gráfico hasta la forma final, y verá su verdadera funcionalidad. Para mí, mucho de “aprender matemáticas” o al menos obtener un punto de partida se trataba de ser educado sobre cómo las personas le explican sus ideas en forma matemática, no realmente las matemáticas en sí.

[1] El diseño de las cosas cotidianas: Edición revisada y ampliada: Don Norman: 9780465050659: Amazon.com: Libros

[2] Aprendiendo de los datos – Curso en línea (MOOC)

[3] El trabajo de Edward Tufte y Graphics Press

[4] Uso de Storytelling para comunicar datos de manera efectiva

A lo largo de mis años de escuela, estuve convencido de que era “malo en matemáticas”. Odiaba las matemáticas, y apenas podía seguir el ritmo en clase. ¡Fue solo después de terminar la escuela y comprar una computadora que descubrí que las matemáticas son DIVERTIDAS e interesantes! ¡Descubrí que no era matemática, sino aritmética en la que era malo, y las computadoras pueden hacer mi aritmética por mí!

Empecé a estudiar matemáticas solo por diversión. No es que las matemáticas sean difíciles, es que las matemáticas se enseñan mal en la escuela. Lo convierten en un trabajo tedioso en lugar de la iluminación estética que es.

¡Ahora estoy escribiendo artículos de matemáticas para revistas matemáticas solo por diversión! Pero lo hago a mi manera, a través de imágenes intuitivas y argumentos atractivos, en lugar de páginas de ecuaciones.

Si crees que eres “malo en matemáticas”, dale a las matemáticas otra oportunidad, porque las matemáticas no son la forma en que te enseñaron en la escuela, las matemáticas son hermosas y elegantes, como el arte y la música, que también tienen fuertes componentes matemáticos.

Visite el sitio “Mejor explicado” (Lecciones amigables para una visión duradera) que demuestra cómo se deben enseñar las matemáticas.

Supongo que realmente te importa más poder ser un ingeniero de datos que trabaje en problemas de ciencia de datos.

La mejor manera de entrar en esa forma de ciencia de datos es como un codificador sólido de pila completa, y eso implica una gran cantidad de codificación. No se preocupe por ser bueno en matemáticas: en cambio, sea ​​bueno en datos 🙂 En serio … Obtendrá muchas oportunidades de trabajar con científicos de datos si es bueno en la codificación, visualización, agrupación y consulta de datos.

La cantidad de matemática que haces como analista o ingeniero de datos es bastante pequeña, y en su mayoría de octavo grado o inferior.

Aquí hay un plan paso a paso.

– Centrarse en aprender los conceptos básicos de un lenguaje de programación (es decir, Java o Python) y al mismo tiempo

– Pase tiempo aprendiendo a ser realmente competente en SQL básico . Aprenda acerca de las uniones inter y externas, aprenda sobre expresiones regulares y formatos de fecha. Sea realmente bueno en alguna base de datos (MariaDB o Postgresql por ejemplo)

Aprenda suficientes gráficos javascript / html para ser peligrosos (escriba una aplicación que, por ejemplo, use Charts.js para hacer gráficos de algunos datos que le interesan).

– Obtenga un buen libro sobre al menos una tecnología de big data (tormenta, chispa, cerdo, colmena, mahout, …) para que pueda tener una idea de cómo las personas implementan las operaciones SQL en el mundo moderno de NoSQL. Pero no se deje atrapar por la exageración: los conceptos básicos de SQL siguen siendo la moneda principal del procesamiento de datos moderno y son la habilidad más importante que debe tener. Querrá tener un buen conocimiento de al menos una de esas tecnologías para incluir en su currículum para obtener buenos resultados de palabras clave … 🙂

– Escriba al menos UN programa que tome datos json y los mueva dentro y fuera de una base de datos relacional .

Todo esto debería ser posible en aproximadamente 3 meses a 1 año si eres realmente dedicado, dependiendo de tu aptitud geek.

En este punto, puede realizar las tareas principales de un analista de datos, y estas habilidades son transferibles (es decir, una vez que conoce una unión interna izquierda, puede usar diferentes herramientas como XYZ-SQL, Hive, Pig o lo que sea para implementarlo) . Y una vez que conozca los conceptos básicos de un lenguaje de programación sólido, debería poder escribir código ETL para varias tareas únicas.

Finalmente, una vez que tenga todas estas habilidades, comience a aprender los conceptos básicos del aprendizaje automático, el reconocimiento de patrones y la agrupación (sin grandes datos involucrados). Una vez que comprenda cómo hacer estas cosas, podrá trabajar en las diversas implementaciones de “herramienta de la semana” o escribir la suya propia. No hay muchas herramientas de aprendizaje automático que necesiten ser “aprendidas” porque la “ciencia de datos reales” es a menudo una tarea tan altamente personalizada que es difícil construir un sistema que la gente pueda aprovechar genéricamente para hacerlo.

Deberías ser bueno en matemáticas. Carlos Paradis me preguntó de qué sirve. Esta es mi respuesta. Eso sí … no estoy diciendo genial.

a) Excelentes habilidades prácticas de álgebra y la capacidad de pensar algebraicamente. Deberías trabajar en tu álgebra hasta que sea una segunda naturaleza. Si no puede resolver problemas de cálculo, estadística o de probabilidad porque su álgebra no es lo suficientemente aguda, entonces todavía no está allí.

b) Estadísticas: distribución normal / gaussiana, desviación estándar, medias, medianas, otros tipos de distribución no normales, pero no te vuelvas loco. Conceptos de varianza. No creerías cuántas personas “inteligentes” no entienden la desviación estándar. De todos modos, al igual que el álgebra, debería ser capaz de resolver estos problemas rápidamente y manejar las variaciones de los temas sin tener que colgarse.

c) Cálculo: no podría llamar a alguien “bueno” en matemáticas a menos que fuera bueno en cálculo. Probablemente no va a necesitar archivos PDF en un rol de analista, pero debe ser competente en derivados, límites y más con un alto grado de precisión.

Ahora, para ser un “buen” analista de datos, tendrá las habilidades matemáticas anteriores, podrá aplicarlas en negocios o ingeniería y tendrá …

1. Habilidades Excel estelares. Me refiero a estelar. Nadie debería poder decirte nada sobre Excel porque estás en el límite.

2. SQL. T-SQL. Consultando No necesitas habilidades de desarrollo sql a menos que las desees. Domine todos los libros de Itzhak ben Gahn sobre consultas SQL.

3. Aprende cubos, DAX, powerpivot si superas el resto y te aburres.

4. Lea libros y tenga curiosidad sobre cosas fuera de los datos y las matemáticas. Eso te hará una persona más interesante para almorzar con

5. C # o Java … pero en este punto los recogerás fácilmente.

Te puedo contar mi experiencia hasta ahora.
Hace 2 años decidí tomar un curso de Estadística, bajo la impresión de que sería fácil.
No tenía ningún conocimiento de matemáticas, apenas había terminado la escuela secundaria, por lo que había eliminado gran parte de los requisitos previos.
En el camino lo descubrí. Tuve que regresar varias veces y aprender todas las cosas que no sabía (cálculo (básico), ecuaciones, qué es una ecuación cuadrática, qué es una función, tomé un par de cursos sobre estas materias y pasé una buena cantidad de tiempo tratando de aprender estas cosas. Khan Academy fue mi ayuda principalmente, donde pude ver fácilmente algunos videos y hacer algunos ejercicios, para poder agarrarme a las cosas.
Entonces todo también depende de lo que quieras aprender exactamente. El análisis de datos parece ser un área muy amplia de la ciencia y muy especializado. Decidí ir paso a paso, tomé el curso de análisis de datos e inferencia estadística, donde Estaba abrumado al pasar por algunos aspectos de las estadísticas, pero al leer el libro de estadísticas abierto en paralelo y otro que descargué libremente de Internet pude revisar los videos y los cuestionarios más de una vez para finalmente entender las bases.
En este momento estoy tomando el curso de especialización de inferencia estadística junto con la regresión logística, pero encuentro que incluso ahora hay cosas (cosas matemáticas) que siempre tengo que volver y actualizar mis conocimientos.
Pero creo que si tiene la decisión y el compromiso, puede aprender lentamente, incluso los bits que ahora parecen desalentadores.
Así que no dejes que la primera dificultad te desanime, todo es cuestión de probar varios tutores y puedes aprender de cada parte que todos juntos un día se te ocurrirán y te darás cuenta de que entiendes más de lo que creías. ‘hacer.
Al menos por ahora hay varios cursos gratuitos que puedes probar en Coursera, Udacity, la academia Khan que mencioné anteriormente, así como varios cursos de idiomas R que pueden ayudarte.
No necesitas ser un gran matemático para tomar estadísticas, pero necesitas saber algunas cosas …
Si pudiera llegar tan lejos, estoy seguro de que no tendrás ningún problema … 🙂
Espero haber ayudado
Saludos y suerte con tus estudios.

Gracias por A2A.

Estimado analista de datos Amigo:

No temas la parte matemática en el campo de la ciencia de datos, no necesitas derivar un montón de ecuaciones. La necesidad básica de las matemáticas es comprender los algoritmos, la probabilidad básica y la estadística es suficiente. Al final del día, si realmente te apasiona la ciencia de datos, nunca sentirás ninguna dificultad con la parte matemática, lo único que tienes que hacer es aprender claramente la parte teórica de los algoritmos, lo que te dará una idea clara de la fórmula matemática utilizada en esos algoritmos. .

Todo lo mejor

Es posible que desee ser un “ingeniero de datos” en lugar de un analista de datos: esta posición se ocupa de hacer que la infraestructura pueda analizar, procesar, almacenar y analizar de manera confiable grandes cantidades de datos.

Hay menos matemática y más codificación en esta posición que un analista de datos, que es algo de la descripción de la pregunta que creo que disfrutarías.

Aquí hay algunos ejemplos de descripciones de trabajo para ese puesto (ambos de Facebook):

  • Ingeniero de Datos, ASO
  • Ingeniero de datos | Empleos en Facebook | Facebook

Estoy escribiendo esto con una sola cosa en mente: desacreditar “Soy malo en matemáticas”.

Yo también pensé eso. Logré puntajes mínimos aprobados en matemáticas la mayor parte de mis años escolares. Raramente me divertía con eso. Hubo dos excepciones, ambas con maestros extraordinarios e incluso entonces mis calificaciones fueron simplemente buenas.

En pocas palabras: nunca sentí que era bueno en matemáticas.

Entonces tuve que aprender. Si quería perseguir mis objetivos de análisis del juego, simplemente tenía que hacerlo . La diferencia era cuán práctico y obvio es todo cuando no se trata de la teoría de la escuela.

En realidad soy bueno en eso. No es brillante, debo decir, ni siquiera cerca de eso, pero todo el “no soy bueno en matemáticas” es una barrera autoimpuesta. Aprendí más en los últimos tres años. Si puedes codificar, puedes aprender matemáticas. Ninguno es más difícil que el otro en mi humilde opinión.

Como otros han mencionado, es probable que lo haga muy bien con la ingeniería de datos, pero hay muy pocos modelos y, si lo hay, las matemáticas son claramente un requisito previo. Pero aquí hay un desafío, aprende la intuición detrás de esos modelos y las matemáticas comenzarán a surgir naturalmente. Hay muchos más algoritmos de recuadro negro donde la intuición es claramente más fácil como los bosques aleatorios, pero casi todos los demás se benefician enormemente de un enfoque experto en matemáticas.

Confía en mí en este caso, no eres malo en matemáticas. Te estás haciendo malo en las matemáticas. Aprender haciendo.

En mi opinión, necesitas cantidades significativas de matemáticas para ser un “científico de datos”. Esto se debe a que necesita comprender completamente cómo funciona cada algoritmo de aprendizaje estadístico para configurarlo y ajustarlo adecuadamente. Si no tienes esa base matemática, solo estás adivinando. La matemática que necesita incluye: cálculo, PDE, álgebra lineal, estadística, teoría de la probabilidad.

Para funcionar como un “analista de datos” se requiere mucha menos matemática, aunque creo que debería estar “inclinado matemáticamente” para ser bueno.

Si las matemáticas no son lo tuyo, entonces creo que deberías considerar convertirte en un gran ingeniero de datos, que en realidad es solo un programador especializado. Hay mucho que aprender, pero este sería un buen camino profesional.

Primero dite a ti mismo que puedes hacer matemáticas. Entonces puedes comenzar a convertirte en un analista de datos o lo que quieras hacer en tu vida. Decirse a sí mismo que no es bueno en matemáticas no lo ayudará a cumplir sus sueños de ser un analista de datos. Las matemáticas pueden ser parte de tu carrera profesional elegida, pero a menos que te unas a una olimpiada matemática, aún tienes una buena oportunidad … o incluso en una olimpiada matemática si realmente estás decidido.

Quien te haya dicho (incluso a ti mismo) que no eres bueno en algo, ellos (o tú mismo) “¡Te demostraré que estás equivocado!”.


¿Por qué deberías creerme? Pensé que no era bueno en matemáticas, PERO en realidad, simplemente lo odiaba. Cuando tuve que hacer una prueba de licencia de ingeniero para ser un ingeniero real en mi país, realmente estudié matemáticas hasta que me cansé de decirme “no soy bueno”. Recuerdo haber aprendido cómo funciona el cálculo, las matemáticas avanzadas de ingeniería, etc., etc. Lo seguí centímetro a centímetro … hasta que dije, ok, ahora lo entiendo. A veces no entiendo algunas matemáticas, pero bueno, comencé algo que pensé que no podía hacer antes. Progreso. ¡Terminé tomando el examen de licencia y las matemáticas se convirtieron en la asignatura más fácil del examen! Tenía confianza Yo pasé Soy ingeniero porque cambié mi mentalidad y tengo un Dios para orar y pedir un milagro (créanme, no sabía cómo obtuve un puntaje tan alto).


En pocas palabras: hazlo. La única razón por la que podría no convertirse en un analista de datos en el futuro es porque no lo ha intentado o ha cambiado de opinión. Pero no porque pensabas que no eras bueno en matemáticas.


Ser un buen analista de datos se trata de poder obtener información de los datos y comprender el proceso de minería de datos. Eso no siempre significa que debes ser bueno en matemáticas. Muchos analistas de datos solo conocen las estadísticas y la probabilidad de nivel secundario / universitario, por lo que no creo que haya nada de qué preocuparse.

Si está interesado en la codificación y quiere una carrera en datos, puede aprender lenguajes como SQL (debe saber), Python y R.

En K2 Data Science, enseñamos a los estudiantes que no tienen una sólida base matemática o técnica para convertirse en analistas de datos profesionales y brindar apoyo profesional completo a cualquiera que lo necesite en nuestro campamento de análisis de datos. Utilizamos tecnologías como Excel, SQL, Tableau, R y Python en nuestro plan de estudios.

Hay un cortometraje de IBM que presenta a Benoit Mandelbrot. Allí, dice que algunas personas son capaces de visualizar problemas matemáticos, otros, para representarlos usando notaciones y fórmulas matemáticas. Y que el simple hecho de poder visualizar las cosas no te llevará lejos en matemáticas.

Dado que la ciencia de datos depende en gran medida de las matemáticas para procesar un conjunto de datos de entrada y producir resultados analíticos, en general, la necesidad de operar con las matemáticas está implícitamente ahí.

Aconsejaría que se asegure de tener una base sólida para desarrollar su carrera. Eventualmente, todos sus esfuerzos se verán recompensados.

Puedes leer sobre Benoit Mandelbrot en Wikipedia.
Puedes ver la película Big Brains. Pequeñas películas. Benoît Mandelbrot, El padre de los fractales en YouTube. ¡Espero que lo disfruten!

Necesita una apreciación de qué es un martillo, cómo está hecho y para qué sirve. Necesita saber para qué es bueno y para qué es malo, y necesita conocer los usos y matices de cada tipo de martillo. Pero no necesariamente necesita saber exactamente cómo hacer un martillo o ser realmente bueno forjando su uso. Lo mismo puede decirse de cualquier clase de herramienta, incluida la familia de herramientas de aprendizaje automático, técnicas de muestreo estadístico o visualización.

Lo que me asusta un poco es la facilidad de uso de muchos de los juegos de herramientas de los científicos de datos, accesibles para personas que no aprecian qué herramienta es buena para cada trabajo y por qué. Por lo tanto, digo, concéntrese en los conceptos, el lenguaje utilizado y los pros y los contras de cada enfoque. Aprenda a comprender los datos que ingresan y evalúe los resultados que salen. Para eso puede hacerlo bien con una “buena” apreciación de las matemáticas involucradas. Agarre los conceptos y obtenga una muy buena apreciación del oficio, y estará muy por delante.

Las personas aprenden cosas de la manera más eficiente y rápida cuando necesitan aprenderlas. Tomaste las matemáticas de ingeniería a la ligera porque no te molestaba o el maestro no era lo suficientemente interesante o era más fácil beber la noche anterior y hacer trampa en el examen, etc. Eso no muestra que seas malo en matemáticas.

Si está interesado en la codificación y los datos, probablemente tenga una mentalidad analítica. Comienza con lo que más te gusta y las cosas que más te interesan. Math te encontrará de cualquier manera. Lo necesitará y disfrutará resolviendo problemas en el camino usando las matemáticas.

¡Espero que esto ayude!

Si ha aprendido a programar, puede aprender incluso matemáticas de alto nivel. Se trata de práctica, al igual que la programación.

Si necesita ser bueno en matemáticas para seguir su carrera profesional deseada, solo hágase bueno en matemáticas. Ve a la academia de Kahn y comienza a resolver problemas de práctica.

Te recomiendo que apuntes a modelos de estadísticas o cursos de aprendizaje automático. Este curso desarrolla el análisis de datos. Se ajusta a su deseo de hacer predicciones. Cualquier curso de matemáticas necesario para tal trabajo de curso ayuda. Hace tu estudio más suave. No te perderás con las nuevas declaraciones de matemáticas.

More Interesting

Estoy tratando de esconder mi riqueza de mi familia (padres y hermanos), pero quiero comprar cosas extravagantes. ¿Qué tengo que hacer?

En breve visitaré Walt Disney World en Orlando con dos niños pequeños. ¿Debo alquilar un automóvil o usar el transporte en autobús de Disney para viajar entre parques?

Mi hermana fue asesinada el 11 de septiembre de 2001 en la ciudad de Nueva York. No estaba relacionado con los ataques terroristas; Fue golpeada por un conductor ebrio en las primeras horas de la mañana. ¿Por qué su muerte debería ser menos trágica que las otras personas que murieron ese mismo día?

Mi novio está convencido de que fumar marihuana no lo envejecerá prematuramente como lo harían los cigarrillos, ¿está equivocado?

¿Por qué se desvanece el área impresa de mi camiseta?

Actualmente estoy construyendo una máquina del tiempo usando JavaScript. ¿Es esta una buena idea?

Tengo $ 25,000 en un fondo de jubilación separado de mi fondo principal de $ 360,000. Estoy tentado a usar esto para inversiones de alto riesgo / recompensa. ¿En qué invertirías?

Me siento muy deprimido, no me interesa nada. Podía ver belleza en todo excepto en mí, a veces desearía estar muerto, ¿qué debo hacer?

Tengo este gel para el cabello sin alcohol. ¿Todavía puede secar mi cabello?

Me encontré con esta línea, “siempre habrá algo divino entre un Leo y un Piscis”, mientras leía un artículo. ¿Son realmente los piscianos una pareja perfecta para Leo?