Gracias por el A2A. He trabajado en minería de texto antes y supongo que lo que está tratando de implementar cae en el análisis de sentimientos. He enumerado algunas opciones a continuación.
- gran conjunto de datos de ngrams de google storage.googleapis.com/books/ngrams/books/datasetsv2.html
- http://www.sananalytics.com/lab/…
- http://inclass.kaggle.com/c/si65…
- http://nlp.stanford.edu/sentiment/treebank.html
- o puede consultar este repositorio global de conjuntos de datos ML: https://archive.ics.uci.edu/ml
- Análisis de los sentimientos
- Conjunto de datos de revisión de usuarios para análisis de opiniones, minería de opiniones y resumen
- Conjunto de datos de sentimiento multidominio
En caso de que no pueda acceder al conjunto de datos de Stanford, deberá completar un formulario para solicitar datos con fines académicos. En la mayoría de los casos, aprueban conjuntos de datos para estudiantes actuales.