Estoy buscando un conjunto de datos para el análisis de pedigrí de caballos de carreras y estudiarlo aplicando algunos métodos de ML. ¿Alguien puede decirme dónde puedo encontrar datos para el mismo?

Te costará En el Reino Unido, Weatherby’s (http://www.weatherbys.co.uk) posee definitivamente los datos más antiguos sobre este tema (desde el siglo XVIII), pero sus registros no son gratuitos, excepto de forma muy limitada. Tienen datos sobre literalmente millones de caballos.

También está el Australian Stud Book , que cubre de manera similar a todos los potros de pura sangre nacidos como purasangres registrados en ese país y Nueva Zelanda. También tiene una base de datos en línea, con registros de poco menos de 900,000 caballos que datan de 1972: http://www.studbook.org.au

Todos estos registros ofrecen análisis estadísticos computarizados como uno de los servicios que puede adquirir de ellos. A menos que sea muy esotérico, me sorprendería si aún no hubieran realizado un estudio del tipo que tienes en mente.

Sin embargo, como digo, no son conjuntos de datos libres y abiertos.

También está el Sanders Bruce American Stud Book, que imagino que debe existir en formato electrónico, en algún lugar.

¿qué hay de revisar allbreedpedigree.com? Creo que tiene pedigríes de 5 generaciones gratis. y equibase.com le permite buscar registros de carreras.

Jockey Club Library Estados Unidos. Wetherby Reino Unido. Tampoco es barato. Dicho esto, el mes pasado tuvimos 2 3rds y 5 5th sin aferrarnos a estas sugerencias. Sin gloria, pero buenos cheques.