Estoy interesado en trabajar en un proyecto sobre sistemas de recomendación. Por donde puedo empezar

Hay muchos libros y MOOC populares que puede seguir para obtener una visión general y comprender los diversos algoritmos de recomendación.

Lo que sugeriría al principio es obtener un conjunto de datos popular y relativamente pequeño (por ejemplo, MovieLens 100K Dataset), y experimentar con algoritmos de recomendación colaborativos simples, como la similitud de usuario-usuario o la similitud de elemento-elemento.

Puede leer acerca de las técnicas para normalizar los datos (¿Cómo normalizar los datos en un rango de 0-1?), Y compararlos con medidas de similitud, como la correlación de Pearson y la similitud del coseno.

Recomiendo encarecidamente este curso en Coursera (Introducción a los sistemas de recomendación: Universidad de Minnesota | Coursera) y un manual para rec. sistemas de Andrew Ng (Conferencia de Andrew Ng sobre el sistema de recomendación).

En mi opinión personal, los sistemas de recomendación son una excelente opción para aprender a extraer datos. Recomendaría usar Python (o R) por simplicidad.