Quiero identificar entidades en un texto usando etiquetado negativo positivo. ¿Qué modelo debo usar?

Si entiendo correctamente, tienes una tarea de clasificación binaria. Dada una palabra, desea clasificarlo como positivo si es el nombre de una empresa, más bien negativo. Estás utilizando las palabras de contexto como características.

Si solo necesita que funcione bien, puede usar NER (reconocimiento de entidad con nombre). Si su código está en Python (como parece), puede usar spaCy. En Java puedes usar Stanford NER.

Si tiene que desarrollarlo usted mismo, las características del contexto parecen un enfoque razonable. Luego puede representar cada palabra objetivo como un vector dimensional | V |, donde V es el vocabulario, y contar el número de apariciones de cada palabra en una ventana. Este es el enfoque de la bolsa de palabras, que es común. También puede descargar incrustaciones de palabras pre-entrenadas (por ejemplo, word2vec o GloVe), y representar cada palabra objetivo como el promedio de vectores de palabras de sus contextos (esto se llama CBOW – bolsa de palabras continua). Debería ser más eficiente.

Supongo que por modelo te refieres a qué algoritmo de aprendizaje automático será el mejor. No sé si hay un cierto algoritmo que se adapte específicamente a una determinada tarea. Debes probar varios clasificadores y ver cuál funciona mejor. Comience con los simples como Naive Bayes o Decision Tree. Con los árboles de decisión, sería fácil analizar los resultados. Si sigue usando la bolsa de palabras (en lugar de CBOW), podrá ver exactamente qué palabras de contexto convencen al modelo de que este es realmente un nombre de empresa. Si eso no funciona bien, puede probar SVM o regresión logística. Puede usar scikit-learn: aprendizaje automático en Python para todos estos algoritmos.

¡Espero haber respondido tu pregunta!

More Interesting

Mi padre anciano tiene Alzheimer y se encuentra en un centro de vida asistida en Nueva York que está cubierto por Medicaid. Ahora dicen que no pueden cuidarlo a menos que contratemos una ayuda, que no podemos pagar. ¿Cuál es un buen lugar que tiene una unidad de demencia segura y acepta Medicaid, pero no es un hogar de ancianos?

Si estoy totalmente feliz y contenta cuando estoy tomando fotografías de mi bella dama en lencería, y es algo que siempre he disfrutado hacer con otras mujeres y las fotografías terminan siendo bastante impresionantes, elegantes y sexys, debería considerar es como una carrera?

¿Escuché que Google comenzará a clasificar los sitios optimizados para dispositivos móviles a partir del 21 de abril?

Me calvo a los 23 años (no calvo limpio, con muy poco cabello), ahora tengo 28 años, ¿hay alguna manera de volver a crecer mi cabello?

¿Soy el único que cree que el presidente del DMDK, Vijaykanth, será una fuerza a tener en cuenta en Tamil Nadu en los próximos 5-10 años?

¿Es grosero renunciar a un trabajo que odio después de 2 meses y convertirme en un profesional independiente?

Completé mi Mba y me ofrecieron un trabajo en EY GTH. ¿Cuáles son las ventajas y desventajas de trabajar como analista asociado con EY GTH?

Quiero construir una plataforma que alcance una altura de 50 km. ¿Cómo puedo encontrar ayuda para unirme?

Mi maestra tiene grandes expectativas para mí. Sin embargo, no creo que sea tan bueno como él piensa. Tengo miedo de decepcionarlo. Así que realmente tengo mucha presión. ¿Que se supone que haga?

Compraré el iPhone 4s ahora en 2015. ¿Es una buena idea hacerlo?