Tengo que hacer un mini-proyecto de minería de texto al azar en Python como una tarea para conseguir un trabajo en una empresa. Tengo 5 dias. ¿Qué puedo hacer para impresionarlos?

Cosas muy básicas:

Entrene a un clasificador de sentimientos en los datos de Twitter (o cualquier otro corpus, o algo así como la detección de correo no deseado con correos electrónicos utilizando bayes ingenuos). Aquí hay un tutorial que trata sobre la creación de un clasificador de sentimientos, intenta mejorarlo:

Si el resumen cuenta como extracción de texto para usted, escriba su propio resumen de texto. Aquí un ejemplo, puedes intentar mejorarlo: ¡Construye tu propia herramienta de resumen!

Más fuerte:

¿Igual que el clasificador de sentimiento, pero tal vez un clasificador de género? Podría intentar usar word2vec para eso de alguna manera, tal vez, eso sería impresionante. (Sin embargo, no hay un 100% de posibilidades de éxito, pero es un desafío)
¿Implementar el algoritmo de agrupación de K-Means por su cuenta y usarlo junto con una bolsa de palabras para clasificar algunos textos?

Más duro:

Extracción de relaciones usando Espresso (un algoritmo Bootstrapping)

Avísame si puedo ayudarte.

Saludos

Related Content

Soy sordo, en la comunidad sorda, tengo confianza. Al escuchar a la comunidad, soy tímido, me pongo nervioso y siempre me olvido. ¿Por qué?

Tengo cinco gatitos viviendo debajo de las escaleras en nuestro edificio y quiero rescatarlos, pero tienen mucho miedo de todos. ¿Qué debo hacer para que se acostumbren a mí?

Solía escuchar que Estados Unidos está saqueando los recursos globales a través de dólares estadounidenses. ¿Es eso cierto?

¿Por qué a veces siento que veo pequeñas criaturas que se arrastran por las esquinas de mis ojos mientras en realidad no lo están?

Estoy contratando una empresa de diseño web para mi negocio. ¿Cuáles son algunos consejos de diseño web?

¿Por qué mi arrendador me permite subarrendar cuando el contrato de alquiler prohíbe estrictamente el subarriendo?

¿Por qué obtengo ‘Quora solo admite inglés por ahora? Por favor escriba solo en inglés ‘mensaje?

More Interesting

Obtuve el percentil 98 y 97 en Quant y LR respectivamente, pero puedo obtener solo el percentil 29 en Verbal. ¿Cómo puedo mejorar mi puntaje para CAT 2016 (Verbal)?

Fui aceptado en el programa Udacity Self-Driving en Udacity. ¿Debería unirme a su primera cohorte o esperar su segundo lote?

Estoy considerando obtener un título general en informática, después de la universidad. ¿Es esta una buena idea?

Siento que he existido por millones de años. ¿Porqué es eso?

¿Por qué estoy cautivado por los escenarios post apocalípticos?

Mi hija de 4 años es extremadamente cariñosa. ¿Es este comportamiento inusual para su edad?

Soy un estudiante de EC. Fui seleccionado para IBM GBS y L&T Technology Services. ¿Qué compañía es la mejor?

Si hago la pregunta de forma anónima en Quora y luego voté por las respuestas, ¿Mi nombre aparecerá como voto?

¿Por qué no tengo el control de mi vida?

Me gustaría convertirme en una actriz de dobles. ¿Qué deportes o artes marciales debo practicar?

Web Analytics Made Easy -
StatCounter