Cómo integrar una función de reconocimiento de voz con mi código Java

Hay muchas API de reconocimiento de voz disponibles hoy en día con alta precisión. Por ejemplo :-

API de reconocimiento de voz de Google API de voz – Reconocimiento de voz | Google Cloud Platform

Ingenio – aterrizaje

Watson Developer Cloud

Servicios Cognitivos de Microsoft – Documentación

Houndify – Medio

Puede haber algunos más. Pero dado que su proyecto es de calculadora de voz, no recomendaré ninguno de los anteriores, por lo que no creo que esté dispuesto a pagar por el proyecto.

La mejor opción que siento para su proyecto sería un reconocimiento de voz fuera de línea.

CMUSphinx Wiki [CMUSphinx Wiki]

Para usar CMU Sphinx, todo lo que tiene que hacer es ir a su repositorio GIT:

cmusphinx / sphinx4

Clonar o descargar el proyecto. Una vez que haya descargado el proyecto, vaya a la carpeta de demostración. Dentro de la carpeta de demostración encontrará una clase Java DialogDemo, que reconoce el habla por usted.

Su precisión es cuestionable, pero no creo que en una calculadora cause ningún problema, pero incluso si lo hace, todo lo que necesita hacer es ir a su diccionario, cmudict-en-us.dict (nombre del diccionario en su git repositorio) y agregue tantas palabras nuevas que desee y asigne con su representación Fonema (cmusphinx / g2p-seq2seq). Lo último que debe hacer es actualizar las mismas palabras en el archivo dialog.gram en el repositorio y ahora no solo ha terminado con el reconocimiento de voz sino que también ha mejorado su precisión.

Related Content

Cómo decirle que sea respetuoso con mis límites de una manera amable

Cómo pensar y hablar inteligentemente

¿Qué se requiere para ir al baño preparándose para un discurso retrasado joven?

¿Debo repetir el mismo discurso ganador?

Voy a dar un discurso el día de la República. ¿Qué puntos debo incluir para que sea conmovedor?

Estás en un globo aerostático y los policías te persiguen. ¿Cómo te vas?

¿Por qué un niño autista deja de hablar?

Hay una multitud de API de reconocimiento de voz. Estoy más familiarizado con Watson de IBM, pero estoy seguro de que todos los lanzados son bastante utilizables.

De todos modos, todo lo que necesita hacer es descargar los paquetes de Java adecuados y luego importarlos en las clases en las que los necesite.

Recuerde leer la documentación de la API antes de implementarla; de lo contrario, implementarla puede ser bastante confuso.

He agregado los enlaces a continuación:

Watson Developer Cloud

Alexa

SiriKit – Desarrollador de Apple

Kartik Kapur

More Interesting

Cómo hacer un discurso de bienvenida para la graduación

¿Cuáles son algunos de los ejemplos más comunes de eufemismo en las figuras retóricas?

¿Fue valiente Meryl Streep por dar su discurso del Globo de Oro?

¿Cuál podría ser la razón por la que he comenzado a tartamudear en mi discurso a pesar de que el inglés ha sido mi idioma principal desde el jardín de infantes hasta el doctorado?

Cómo encontrar más oportunidades para hablar en público

¿Crees que la Biblia impone restricciones a la libertad de expresión?

¿Cómo puede garantizar la ley que los medios de comunicación usen su derecho a la libertad de expresión de manera responsable?

¿Un conocimiento de fonética y fonología ayuda considerablemente al intentar leer los labios o reconocer patrones hablados?

¿Qué debo decir cuando el maestro me pide que pronuncie un discurso en mi primer día en la universidad?

¿Alguien con un impedimento severo del habla se considera discapacitado?

Web Analytics Made Easy -
StatCounter