Obtenga un diccionario con capacidad de base de datos y extraiga todas las palabras de tipo sustantivo.
Envíelos a un motor de búsqueda que use una muestra grande (¿mil millones de palabras?) De texto específico de período actual / tiempo.
Envíe cada hit a través de un algoritmo de análisis léxico que puede separarlos, en función de los indicadores verbo / conteo, en categorías contables y no contables.
Prepárese para que las palabras aparezcan en ambos sentidos; cuente la proporción para darle a su informe ese interés extra picante.
- Tengo un conjunto de datos que creo que la gente está dispuesta a pagar, ¿cuál es la mejor manera de crear un sitio web?
- Mido aproximadamente 5’6 “, ¿cuánto debo pesar para hacer gimnasia?
- Soy un desarrollador de PL SQL y planeo aprender Java, ¿será una buena opción para mi carrera futura?
- Quiero consejos de apuestas de cricket?
- Me mudaré a San Francisco y trabajaré en el distrito financiero. ¿Debo vivir en Rincon Hill o en Nob Hill?
Deseche las palabras que son contables en todos los casos, resuma el resto si el número es demasiado grande.
Elabore una tabla de sílabas y letras contra la sílaba y el recuento de letras de los verbos contables; eso debería proporcionar motivos para una especulación interminable sobre el desarrollo de términos incontables.
Británicos y estadounidenses, por cierto, difieren en este sentido; pruebe medio billón de palabras de cada una para ver la diferencia.