He estudiado conceptos de análisis de datos como análisis de conglomerados, regresión, etc. ¿Cómo puedo practicarlos? ¿Hay sitios o libros?

Elija un lenguaje, por ejemplo, R , Python , etc.

Comience a explorar el idioma, juegue con comandos, explore diferentes funciones. Cuando tenga confianza, el siguiente paso es trabajar en datos.

Ahora elija un conjunto de datos, analice qué tipo de datos es como si fuera un problema de clasificación o un problema de regresión. De acuerdo a eso comienza a hacer tu análisis. Explore los datos usando diferentes bibliotecas.

Recuerde : cuanto más trabaje en datos, más sobresaldrá en el análisis de datos.

Para fines de aprendizaje, puede consultar MOOC como Coursera | Cursos en línea de las mejores universidades. Únete gratis, Udacity – Clases gratis en línea y Nanodegrees, edX, etc.

En cuanto al conjunto de datos, puede usar el siguiente enlace. Hay una gran cantidad de conjuntos de datos como principiantes a niveles avanzados de conjuntos de datos de problemas del mundo real. Your Home for Data Science, Repositorio de aprendizaje automático UCI.

Todo lo mejor.

Yo personalmente aconsejo a los aspirantes que aprendan haciendo * haciendo *. En ciencia de datos, una de las mejores maneras de hacerlo es ensuciarse las manos con los datos.

La siguiente pregunta obvia, ¿cómo se hace eso?

Hoy en día hay cientos de fuentes de datos que son gratuitas y están disponibles públicamente, puede descargar cualquiera de ellas que le interese y que le interese explorar, y comenzar a aplicar las diferentes técnicas que ha aprendido en esos conjuntos de datos.

Puede consultar: ¿Dónde puedo encontrar grandes conjuntos de datos abiertos al público?

Alternativamente, regístrese en Kaggle: Your Home for Data Science (si aún no lo ha hecho)

e intento trabajar en los núcleos allí, personalmente creo que son una gran fuente de aprendizaje. Intente aplicar las diferentes técnicas que ha aprendido y también podría recibir comentarios de otros científicos de datos y expertos en análisis.

Si desea ir un paso más allá, intente implementar los algoritmos desde cero en lugar de usar paquetes estándar.

Feliz aprendizaje 🙂

Hay varios sitios web que le proporcionarán problemas para aplicar todos estos problemas y verificar su precisión. Algunos de ellos son :-

  1. Analytics vidhya (debe)
  2. Kaggle
  3. Hacker Earth
  4. Hacker Rank

Intenta pasar por esto y resolver los problemas. Será un gran impulso.

Una R Introducción a la Estadística