No soy un científico de datos principal y realmente no tengo ganas de convertirme en uno, pero el atractivo de acumular créditos de Quora a través de A2A y eventualmente convertirlos en una tarjeta de regalo de Amazon (¡ojalá!) Me obliga a responder a esta. .
Algunos puntos que le diría a mi yo más joven (si es joven hoy) serían:
- Si realmente quiere ser un buen analista de datos, estudie estadísticas / aprendizaje automático rigurosamente desde perspectivas matemáticas. Se trata de temas muy profundos y amplios, por lo que antes de desarrollar los fundamentos conceptuales, es más fácil construir sobre ellos. Dada la amplitud de los temas, es probable que tenga que seguir actualizando sus conocimientos de todos modos, pero es mejor comenzar cuando es joven y tiene más tiempo libre para hacerlo. Esto es especialmente cierto si sus antecedentes no son estadísticas o ML. Si ha estado haciendo análisis de datos dentro de un campo estrecho y especializado, entonces tiende a estar expuesto solo a un subconjunto estrecho de técnicas estadísticas relevantes para ese campo en particular. Si es un científico de datos convertido (por ejemplo, de la ciencia), intente recoger estadísticas rigurosamente.
- No aprendas a mentir con los datos. Es muy fácil en estos días usar el paquete R / Python / Cualquiera que sea, ejecutar un análisis, generar algunos números y gráficos / gráficos bonitos e impresionar a aquellos (laicos, empresarios, etc.) que realmente no entiende lo que hay debajo de tus análisis. A medida que trata con personas más comunes fuera de la escuela y la academia, se dará cuenta de lo fácil que es engañarlos con su experiencia. Esto puede ser un problema grave en una situación como los negocios, porque generalmente existe cierta presión para producir algo, incluso si no tiene suficiente información para trabajar. Los datos / estadísticas no necesariamente mienten, pero ciertamente puedes mentir con ellos. Mantente moral y conoce el poder que tienes.
- Intenta encontrar algo potencialmente más intrigante que la ciencia de datos. Una vez que termine la moda actual, ¿crees que la ciencia de datos parece tan interesante en el futuro? Creo que lo que los científicos de datos hacen ahora seguirá siendo solicitado en una década o dos, pero creo que el panorama será diferente. La mayoría de los proyectos intrigantes probablemente sigan siendo accesibles solo para un pequeño número de personas (p. Ej., Academia, divisiones orientadas a la investigación de grandes empresas de alta tecnología, nuevas empresas de élite que solo contratan de Stanford), y puede convertirse en un factor decisivo que refina un tecnología de orientación de anuncios internos o algo así de aburrido. ¿Es algo que crees que te parece interesante en una o dos décadas? Algunas personas parecen pensar que la ciencia de datos es una actualización sobre la ingeniería de software, pero en lo que respecta a las habilidades transferibles, ser un ingeniero de software sólido puede abrir una gama más amplia de posibilidades en el futuro. Los científicos de datos que no pueden codificar (la mayoría de los científicos de datos no son buenos para codificar, por lo que puedo decir) no son tan atractivos como los ingenieros que pueden construir cosas nuevas.