Cómo usar los MFCC para el reconocimiento de voz

Dado que la dimensión de la característica que está especificando es 26, sospecho que tiene un coeficiente de banco de filtros que mfcc. O podrían ser mfcc con características delta agregadas. Describiré aquí cómo hacer reconocimiento de fonemas usando el marco kaldi usando redes neuronales profundas.

Obtenga la transcripción y los archivos de voz correspondientes
Convierta la transcripción en secuencia de fonemas usando el convertidor de grafema a fonema.
Extraiga mfcc usando kaldi make_mfcc. Archivo Sh
Monofono de tren modelo GMM-HMM
Alinee los datos de entrenamiento usando un modelo previamente entrenado
Modelo de GMM-HMM basado en triphone de tren
Alinear de nuevo
Modelo de tren DNN-HMM
Ahora puede obtener la secuencia de fonemas para cualquier nueva emisión de voz.

Si necesita ayuda, contácteme en [correo electrónico protegido]

Related Content

¿Cuál es tu discurso favorito alguna vez dado?

Dado que Tim Kaine se saltó el discurso del Congreso de Netanyahu, ¿cómo afectará esto la relación de la administración Hillary Clinton con Israel?

¿Se ofenderían los liberales con un discurso sobre la corrección política?

¿Cómo te suena el esperanto?

¿Cómo calificar el discurso de Modi en el día del maestro? Por qué

¿Por qué el cielo estaba tan brillante como siempre con un eclipse parcial del 85%?

¿La libertad de expresión le da derecho a hablar en contra de su país?

Esta es nuestra matriz de coeficiente mfcc para cada cuadro, los pls también nos dicen si es correcto y nos guían más

Krishna

More Interesting

¿Se formulan las preguntas con una inflexión de tono ascendente en la mayoría de los idiomas?

¿Qué debería entenderse del discurso del primer ministro de Pakistán, Sr. Nawaz Sharif, en la AGNU?

¿Cuál es el USP de Narendra Modi? ¿Qué hizo que su discurso en el Madison Square Garden fuera tan especial?

¿Cómo podría un asiático como yo practicar hablar con acento estadounidense?

¿Puede un tartamudo vivir una vida ordinaria como lo hacen otras personas?

¿Qué es una lista de trabalenguas hindi?

No podía pronunciar algunas palabras simples de trabalenguas como reconocimiento. ¿Cuáles son las prácticas que debo seguir para superar este problema?

¿Por qué hablar en voz alta es más poderoso?

¿Alguien ha verificado el desarrollo en los estados donde BJP ganó a través de los discursos de Modi sobre desarrollo?

¿Cuál es el mejor discurso dado por un indio?

Web Analytics Made Easy -
StatCounter