Hay muchas API de reconocimiento de voz disponibles hoy en día con alta precisión. Por ejemplo :-
API de reconocimiento de voz de Google API de voz – Reconocimiento de voz | Google Cloud Platform
Ingenio – aterrizaje
Watson Developer Cloud
- ¿Cómo inhiben los progresistas la libertad de expresión?
- ¿Cuáles son los aspectos fundamentales de la comunicación oral?
- ¿Cuál es el significado de la cinta azul de la libertad de expresión en internet?
- ¿Deberían los estados autoritarios intentar censurar los derechos de libertad de expresión de los ciudadanos extranjeros fuera de su frontera?
- ¿Es el discurso de odio el discurso libre?
Servicios Cognitivos de Microsoft – Documentación
Houndify – Medio
Puede haber algunos más. Pero dado que su proyecto es de calculadora de voz, no recomendaré ninguno de los anteriores, por lo que no creo que esté dispuesto a pagar por el proyecto.
La mejor opción que siento para su proyecto sería un reconocimiento de voz fuera de línea.
CMUSphinx Wiki [CMUSphinx Wiki]
Para usar CMU Sphinx, todo lo que tiene que hacer es ir a su repositorio GIT:
cmusphinx / sphinx4
Clonar o descargar el proyecto. Una vez que haya descargado el proyecto, vaya a la carpeta de demostración. Dentro de la carpeta de demostración encontrará una clase Java DialogDemo, que reconoce el habla por usted.
Su precisión es cuestionable, pero no creo que en una calculadora cause ningún problema, pero incluso si lo hace, todo lo que necesita hacer es ir a su diccionario, cmudict-en-us.dict (nombre del diccionario en su git repositorio) y agregue tantas palabras nuevas que desee y asigne con su representación Fonema (cmusphinx / g2p-seq2seq). Lo último que debe hacer es actualizar las mismas palabras en el archivo dialog.gram en el repositorio y ahora no solo ha terminado con el reconocimiento de voz sino que también ha mejorado su precisión.