Los módulos lingüísticos en un conversor de texto en habla: el módulo de transcripción fonética automática
Esta página ha dejado de actualizarse
Creación de una cadena de unidades fonéticas —fonemas o alófonos— a partir del texto escrito preprocesado.
(Fuente de la imagen: Universitat Autònoma de Barcelona, Departament de Filologia Espanyola. (s.f.). Antonio Ríos Mestre. Consultado en http://filescat.uab.cat/filesp/personal/docente-e-investigador/)
|
Implica una decisión sobre el inventario de fonemas y alófonos.
El inventario de fonemas y alófonos condiciona el inventario de unidades de síntesis.
Decisiones ortológicas.
Decisión sobre el estándar oral.
Decisión sobre la variedad geográfica.
Decisión sobre el registro o estilo de habla.
Diccionario ayudado por un analizador en lenguas con una correspondencia muy irregular entre grafía y sonido.
Reglas complementadas por un diccionario de excepciones en lenguas con una correspondencia regular entre sonido y grafía.
Transcripción fonética automática basada en un diccionario y transcripción fonética automática basada en reglas.
Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 112)
❯ Las relaciones entre los sonidos y las grafías
(Fuente de la imagen: Universitat Autònoma de Barcelona, Departament de Filologia Espanyola. (s.f.). Antonio Ríos Mestre. Consultado en http://filescat.uab.cat/filesp/personal/docente-e-investigador/)
|
(Fuente de la imagen: Universitat Autònoma de Barcelona, Departament de Filologia Espanyola. (s.f.). Antonio Ríos Mestre. Consultado en http://filescat.uab.cat/filesp/personal/docente-e-investigador/)
|
En general, las reglas de transcripción son reglas dependientes del contexto.
Reglas de substitución de un signo en otro:
Reglas de elisión de un elemento:
Reglas de inserción de un elemento:
Incluso en lenguas con una correspondencia regular entre grafías y sonidos, el tratamiento de una determinada grafía puede requerir un conjunto de reglas:
Nombres propios de persona en español:
La transcripción fonética automática requiere el uso de un alfabeto fonético compatible con los sistemas informáticos.
❯ SAMPA, SAM Phonetic Alphabet
❯ Adaptación de SAMPA al español
❯ Adaptación de SAMPA al catalán
Divide la cadena de alófonos en sílabas.
Puede realizarse como parte del preprocesado del texto, partiendo de la representación ortográfica.
Determina las sílabas tónicas y las sílabas átonas de la cadena de alófonos.
Requiere información sobre palabras que son siempre átonas.
Requiere reglas de acentuación para las palabras que no llevan acento gráfico.
Puede realizarse como parte del preprocesado del texto una vez se ha llevado a cabo la división silábica.
La transcripción fonética automática en la conversión de texto en habla
Transcripción fonética automática