La conversión de texto en habla


La conversión de texto en habla


La conversión de texto en habla

CTH, Conversión de texto en habla.
CTP, Conversió de text en parla.
TTS, Text-to-Speech Synthesis

Un sistema de conversión de texto en habla transforma cualquier texto escrito en formato digital en su correspondiente realización sonora.

texto_habla.gif

AcapelaGroup. (28/02/2014). How does text to speech (TTS) work - by Acapela voices [Archivo de video]. Consultado en https://www.youtube.com/watch?v=TykwDARmVIU

up arrow

Módulos de un conversor de texto en habla

La estructura de un conversor suele ser modular.

Cada módulo se ocupa de un aspecto de la transformación de la cadena de caracteres inicial hasta llegar a la señal sonora final.

../tts_structure/CTH_modulos.jpg

Módulos de un sistema de conversión de texto en habla.

../tts_structure/Dutoit_97_Diagram_TTS.gif

Módulos de un sistema de conversión de texto en habla.

Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 17)

Módulo de procesamiento previo del texto

Reglas para el procesamiento previo del texto que contemplen la expansión de los signos de puntuación sin valor lingüístico, las expresiones numéricas, las siglas y las abreviaturas.

El módulo de procesamiento previo del texto en la conversión de texto en habla

Módulo de análisis lingüístico

Reglas para el procesamiento morfológico y sintáctico en los casos en que en el conversor se realiza un análisis lingüístico automático del texto de entrada.

../linguistic_information/Dutoit_1997_Modules_NLP_TTS.gif

Módulo de análisis lingüístico de un sistema de conversión de texto en habla.

Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 63)

Módulo de transcripción fonética automática

Reglas de transcripción fonética automática, que establecen la correspondencia entre grafías y alófonos, la silabación y la acentuación, complementadas por diccionarios de pronunciación para el tratamiento de las excepciones.

El módulo de transcripción fonética automática en la conversión de texto en habla

Las unidades de síntesis

Establecimiento del inventario de fonemas y alófonos de la lengua para la constitución del diccionario de unidades de síntesis o del corpus para la síntesis.

Diseño del corpus de unidades de síntesis teniendo en cuenta las restricciones fonotácticas de la lengua y la frecuencia de aparición de unidades.

Selección del locutor y supervisión de la calidad lingüística de la grabación del corpus de síntesis.

Las unidades de síntesis

La síntesis basada en corpus

El módulo prosódico

Modelos de duración segmental que consideren los diversos factores que influyen en la duración, basados en datos procedentes de corpus representativos.

Modelos de intensidad segmental que consideren los factores que inciden en la intensidad y que se basen en corpus representativos.

Modelos de asignación de pausas que contemplen tanto las marcadas mediante signos de puntuación como las no marcadas y que establezcan diferencias de duración entre los distintos tipos de pausas.

Modelos de entonación que permitan generar una curva melódica natural, teniendo en cuenta factores fonéticos, sintácticos, semánticos y pragmáticos.

El módulo prosódico en la conversión de texto en habla

Módulo de conversión en parámetros acústicos

Conjunto de reglas que tiene como objetivo:

Módulo de síntesis

Transforma la información de la secuencia de unidades de síntesis y de los parámetros prosódicos en una onda sonora.

up arrow

La conversión de texto en habla


La conversión de texto en habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: