Cómo integrar una función de reconocimiento de voz con mi código Java

Hay muchas API de reconocimiento de voz disponibles hoy en día con alta precisión. Por ejemplo :-

API de reconocimiento de voz de Google API de voz – Reconocimiento de voz | Google Cloud Platform

Ingenio – aterrizaje

Watson Developer Cloud

Servicios Cognitivos de Microsoft – Documentación

Houndify – Medio

Puede haber algunos más. Pero dado que su proyecto es de calculadora de voz, no recomendaré ninguno de los anteriores, por lo que no creo que esté dispuesto a pagar por el proyecto.

La mejor opción que siento para su proyecto sería un reconocimiento de voz fuera de línea.

CMUSphinx Wiki [CMUSphinx Wiki]

Para usar CMU Sphinx, todo lo que tiene que hacer es ir a su repositorio GIT:

cmusphinx / sphinx4

Clonar o descargar el proyecto. Una vez que haya descargado el proyecto, vaya a la carpeta de demostración. Dentro de la carpeta de demostración encontrará una clase Java DialogDemo, que reconoce el habla por usted.

Su precisión es cuestionable, pero no creo que en una calculadora cause ningún problema, pero incluso si lo hace, todo lo que necesita hacer es ir a su diccionario, cmudict-en-us.dict (nombre del diccionario en su git repositorio) y agregue tantas palabras nuevas que desee y asigne con su representación Fonema (cmusphinx / g2p-seq2seq). Lo último que debe hacer es actualizar las mismas palabras en el archivo dialog.gram en el repositorio y ahora no solo ha terminado con el reconocimiento de voz sino que también ha mejorado su precisión.

Hay una multitud de API de reconocimiento de voz. Estoy más familiarizado con Watson de IBM, pero estoy seguro de que todos los lanzados son bastante utilizables.

De todos modos, todo lo que necesita hacer es descargar los paquetes de Java adecuados y luego importarlos en las clases en las que los necesite.

Recuerde leer la documentación de la API antes de implementarla; de lo contrario, implementarla puede ser bastante confuso.

He agregado los enlaces a continuación:

Watson Developer Cloud

Alexa

SiriKit – Desarrollador de Apple