lunes, 20 de octubre de 2014

Arquitectura de un sistema de traducción voz a voz
La traducción voz a voz es un interesante campo en el que muchas empresas e instituciones
están dedicando esfuerzos para lograr avances en la aplicabilidad de la técnica en
los distintos dominios mencionados en la sección anterior.
En la Figura se puede observar que un sistema de traducción voz a voz (SST:
Speech-to-Speech Translation) se puede dividir en tres componentes básicos bien diferenciados:
Reconocimiento automático del habla (ASR: Automatic Speech Recognition). La entrada
de un SST es la voz del locutor que se desea traducir. El sistema de ASR
convierte la voz origen en texto usando técnicas estadísticas de modelado acústico y
decodificación.
Traducción automática (MT: Machine Translation). El texto en el idioma origen
se traduce al idioma destino usando un sistema de traducción automática. En esta
etapa se tienen en cuenta ciertas particularidades de los idiomas origen y destino,
tales como el ordenamiento diferente de las palabras en la oración, declinaciones,
etc.
Síntesis de voz (TTS: Text-to-Speech). El texto traducido es la entrada del sistema de
síntesis de voz. Este sistema convierte el texto en voz usando una prosodia generada
automáticamente a partir del texto.
Para tener una idea más detallada del funcionamiento de cada uno de los componentes
de un sistema de traducción voz a voz, daremos en las siguientes secciones una introducción
al reconocimiento automático del habla , traducción automática

No hay comentarios.:

Publicar un comentario