El proceso de conversión texto a voz procesamiento del texto, generación de la prosodia y generación de la voz sintética. En el primero de
los módulos se realiza la normalización del texto (para expandir abreviaciones, convertir
números y fechas en texto, etc), y en ocasiones, luego también se hace un etiquetado
morfosintáctico. A continuación se procede a la conversión de los grafemas en fonemas
y a la silabificación para obtener la secuencia de fonemas necesaria para reproducir el
texto. Posteriormente, el módulo de prosodia genera la información prosódica para poder
producir la voz. Para ello se predicen las frases entonativas y la entonación de la oración,
y también la duración y la energía de los fonemas, etc. La correcta generación de esta
información repercutirá directamente en la naturalidad y expresividad del sistema. En
el último modulo de generación de la voz es donde se produce la voz considerando la
información provista por los módulos de procesamiento del texto y prosodia.
No hay comentarios.:
Publicar un comentario