traductor voz a voz

Arquitectura de un sistema de traducción voz a voz

La traducción voz a voz es un interesante campo en el que muchas empresas e instituciones

están dedicando esfuerzos para lograr avances en la aplicabilidad de la técnica en

los distintos dominios mencionados en la sección anterior.

En la Figura se puede observar que un sistema de traducción voz a voz (SST:

Speech-to-Speech Translation) se puede dividir en tres componentes básicos bien diferenciados:

Reconocimiento automático del habla (ASR: Automatic Speech Recognition). La entrada

de un SST es la voz del locutor que se desea traducir. El sistema de ASR

convierte la voz origen en texto usando técnicas estadísticas de modelado acústico y

decodificación.

Traducción automática (MT: Machine Translation). El texto en el idioma origen

se traduce al idioma destino usando un sistema de traducción automática. En esta

etapa se tienen en cuenta ciertas particularidades de los idiomas origen y destino,

tales como el ordenamiento diferente de las palabras en la oración, declinaciones,

etc.

Síntesis de voz (TTS: Text-to-Speech). El texto traducido es la entrada del sistema de

síntesis de voz. Este sistema convierte el texto en voz usando una prosodia generada

automáticamente a partir del texto.

Para tener una idea más detallada del funcionamiento de cada uno de los componentes

de un sistema de traducción voz a voz, daremos en las siguientes secciones una introducción

al reconocimiento automático del habla , traducción automática

lunes, 20 de octubre de 2014