Quiero realizar LDA en Python y tengo la matriz numpy, títulos y documentos de texto. ¿Cómo los ingreso y hago el LDA para los datos?

Si desea hacer una clasificación de texto con python, entonces olvide LDA por ahora. Como señaló Zeyu Chen, en scikit-learn se trata de un análisis discriminante lineal y no de una asignación de dirichlet latente.

Convierta su matriz de documentos numpy en el formato disperso de la matriz tf-idf. Use CountVectorizer () y TfidfTransformer () para esto. Supongo que ya ha hecho cosas relacionadas con la PNL antes (palabras vacías, stemming, minúsculas)
Entonces puedes usar cualquier clasificador. Bayes ingenuos multinomiales, regresión logística, máquinas de vectores de soporte funcionan bastante bien. Están disponibles buenos tutoriales: clasificación de documentos de texto usando características dispersas

Para utilizar la asignación de Dirichlet latente para modelar temas, siga estos enlaces con código y explicación:
Asignación de Dirichlet latente en Python
Introducción a la asignación de Dirichlet latente en Python

Related Content

¿Por qué mi gato tiene náuseas después de oler su comida?

Espero tomar un año de intercambio en un país de habla inglesa, ¿cómo puedo encontrar qué universidad está brindando la oportunidad? Gracias.

¿Por qué me duele la espalda baja cuando levanto mi cuerpo? (Mientras estaba acostada sobre mi estómago)?

Tengo 35 años. ¿Habrá una revolución médica que me permita vivir para siempre?

Mi recortadora de barba no maneja mi vello facial grueso. ¿Alguien tiene una recomendación?

Mi MacBook Pro no se enciende. La luz del cargador parpadea en naranja / verde. ¿Qué tengo que hacer?

Creo que los humanos usan la religión para explicar cosas que todavía tenemos que entender, por ejemplo, el dios Neptuno que controla los océanos. ¿Me equivoco?

More Interesting

¿Por qué mi disco duro externo ralentiza mi computadora?

Mi labrador de 4 años siempre vomita en el tapete o la cama. ¿Cómo lo entreno?

He descargado una fuente de un espejo del sitio web de gcc. ¿Cómo lo compilo y reemplazo mi versión anterior de gcc? (Tengo Ubuntu OS)

¿Por qué mi código Java me da un resultado incorrecto?

¿Soy el único que piensa que Rachel y Joey deberían haber estado juntos?

Estoy planeando comprar una propiedad en Hyderabad. Todas las propiedades que he visto cuestan aproximadamente 45L y la mayoría de los bancos ofrecen un préstamo del 80%. Puedo arreglar 4-5L máximo. ¿Qué debo hacer para organizar el descanso 4-5L?

Recientemente me he convertido en un farmacéutico registrado. Sin embargo, en este mercado saturado es difícil encontrar trabajos que remuneren de manera justa. ¿Para qué otras perspectivas laborales sería adecuado en el mercado laboral australiano? ¿Debo hacer estudios adicionales?

Estoy confundido entre Honda CB hornet 160CBS y Suzuki gixxer o cualquier otra sugerencia de menos de 1 lakh y máximo de 160cc. La calidad de construcción no es buena en gixxer.

He visto películas como Gravity y Apollo 13. Los astronautas usan un cono como cuando regresan a la Tierra. ¿Lo usan todo el tiempo? ¿No es arriesgado?

No tengo ninguna experiencia en el trabajo con Google Adwords. ¿Puedo pasar la certificación de Google AdWords estudiando las fuentes de aprendizaje proporcionadas por Google?

Web Analytics Made Easy -
StatCounter