Debe comprender (reconocer) el discurso antes de poder escribirlo (transcribirlo). Esto es cierto si eres una máquina o una persona. Reconocimiento de voz = la capacidad de entender el lenguaje hablado (generalmente el lenguaje hablado de múltiples individuos únicos, pero podría ser solo una persona). Transcripción del discurso = escribir lo que se escucha. Google hace las dos cosas.
Tengo Google Voice Por lo tanto, si llama a mi número, recibirá una grabación que dice que no puedo levantar el teléfono y que debe dejar un mensaje. Después de dejar un mensaje y colgar, Google me enviará un correo electrónico diciendo que tengo un mensaje del número de teléfono X. El correo electrónico contendrá otras 2 piezas de información: archivo WAV con el mensaje de audio real y una transcripción escrita del mismo mensaje. Esta es una instancia de reconocimiento de voz y transcripción.