Estoy aprendiendo ML. Quiero construir una red neuronal y analizar algunos datos de reddit con ella. ¿Qué tipo de cosa simple pero genial podría hacer? ¿Me pueden ayudar a tener una idea práctica de proyecto?

Para el primero: vaya a Watson Easy Analytics de IBM y regístrese gratis en análisis guiados y automatizados desde la nube. “Con la edición gratuita, puede cargar hojas de cálculo, obtener visualizaciones, crear paneles y descubrir nuevas relaciones de datos, todo por su cuenta, en minutos”, citado en la url anterior.
2º – Luego ve a los tutoriales para encontrar proyectos de práctica.
Tercero: si aún desea ideas después de completar los ejercicios de capacitación, publique nuevamente aquí. Tengo algunas ideas para usted, sin embargo, es mejor si comienza con los modelos de compilación dentro de sus tutoriales de proyectos estructurados.
NOTA: Solo por diversión, también puede usar Real Time Search – Social Mention para aprovechar las conversaciones anónimas en tiempo real en las redes sociales sobre cualquier tema candente. Sin embargo, Social Mention ya le brinda datos básicos utilizables, con un refinamiento creativo a través de las habilidades de Watson que sabe lo que es posible.

Reddit es un foro.
Los foros son un tipo antiguo de red social.

Puedes hacer el mismo tipo de análisis.

Sin embargo, como estás aprendiendo, debes comenzar con poco. Intenta hacer esto:

EL PROYECTO DE SUGERENCIAS DE POSTES SUPERIORES DE REDDITOR

  1. Cree una araña (en este caso, un cliente reddit) y siga un subreddit.
  2. Extraiga todos los perfiles de usuario, mensajes y temas que se publiquen a partir de ahí.
  3. Descargue un diccionario de sinónimos en inglés, uno con términos y sus definiciones y una estructura gráfica entre los términos.
  4. Haga un algoritmo heurístico que clasifique las publicaciones en temas generales (¡use el diccionario de sinónimos, es fácil!), Haga conjuntos, cuantifique la cantidad de caracteres, palabras y publicaciones relacionadas con ese tema. Considere que una publicación podría estar en más de un tema.
  5. Cuantifique los temas, luego use el diccionario de sinónimos para volver a clasificarlos (generalícelos)
  6. Clasifique los temas identificados, establezca una lista de los 5 temas más comentados en ese subreddit. Proporcione métricas sobre esos cinco temas: publicación principal, usuario principal, publicación más votada en la categoría, etc.
  7. Generalice el algoritmo para todo el reddit.

Preguntas?

Encuentra una manera de identificar a los trolls. Socavan las comunidades en línea. Úselo como la base de un filtro troll que bloquea los comentarios en el navegador o ayuda a los mods a eliminarlos.

No para sonar simplista pero ¿por qué usar lenguaje de máquina para redes neuronales? ¿Eres masoquista? Use LISP o Prolog y compílelo.

Definitivamente, ML se puede usar para analizar y analizar números, pero no haría todo el proyecto en ML

Intente y prediga cuántos votos u votos negativos obtendrá un comentario analizando su contenido.

ML parece ser un lenguaje de nicho prety, ¿por qué quieres aprenderlo? ¿Hay una aplicación práctica? – De vez en cuando lo veo aparecer en conferencias (en trabajos académicos), pero en ningún otro lado.