Los módulos lingüísticos en un conversor de texto en habla: el módulo de transcripción fonética automática


La transcripción fonética automática en la conversión de texto en habla

Transcripción fonética automática


La transcripción fonética automática

Creación de una cadena de unidades fonéticas –fonemas o alófonos– a partir del texto escrito preprocesado.

“Un sistema de transcripción fonética automática es un algoritmo que transforma un texto de entrada representado en caracteres grafemáticos en una representación expresada mediante símbolos fonéticos.”

Ríos, A. (1993). La información lingüística en la transcripción fonética automática del español. Procesamiento del Lenguaje Natural, 13, 381-387. Consultado en http://liceu.uab.cat/publicacions/Rios_93_Transcripcion_Fonetica_Automatica_Espanol.pdf

Implica una decisión sobre el inventario de fonemas y alófonos.

El inventario de fonemas y alófonos condiciona el inventario de unidades de síntesis.

Decisiones ortológicas.

Decisión sobre el estándar oral.

Decisión sobre la variedad geográfica.

Decisión sobre el registro o estilo de habla.

Palab_silab: el se. #or jo. s’e luis l’o. pez ti'e.ne dos. ci'en. tas ‘u. na v'i. #as.

Alófonos: el se. N~or xo. s’e luis l’o. peT [sil] tj'e.ne Dos. Tj'en. tas ‘u. na B'i. N~as [sil]

Castejón, F., Escalada, G., Monzón, L., Rodríguez, M. A. y Sanz, P. (1994). Un conversor texto-voz para el español. Comunicaciones de Telefónica I+D, 5(2), 114-131.
up arrow

Estrategias para la transcripción fonética automática

Diccionario ayudado por un analizador en lenguas con una correspondencia muy irregular entre grafía y sonido.

Reglas complementadas por un diccionario de excepciones en lenguas con una correspondencia regular entre sonido y grafía.

Dutoit_1997_Rules_Dictionary.gif

Transcripción fonética automática basada en un diccionario y transcripción fonética automática basada en reglas.

Dutoit, T. (1997). An introduction to text-to-speech synthesis. Dordrecht: Kluwer. (p. 112)

Las relaciones entre los sonidos y las grafías

Tipos de reglas de transcripción

Ríos, A. (1993). La información lingüística en la transcripción fonética automática del español. Procesamiento del Lenguaje Natural, 13, 381-387. Consultado en http://liceu.uab.cat/publicacions/Rios_93_Transcripcion_Fonetica_Automatica_Espanol.pdf

Características de las reglas de transcripción

Ríos, A. (1993). La información lingüística en la transcripción fonética automática del español. Procesamiento del Lenguaje Natural, 13, 381-387. Consultado en http://liceu.uab.cat/publicacions/Rios_93_Transcripcion_Fonetica_Automatica_Espanol.pdf

En general, las reglas de transcripción son reglas dependientes del contexto.

Reglas de substitución de un signo en otro:

regla de transcripción del grafema <g> como [x] ante <e, i>

Reglas de elisión de un elemento:

elisión de <u> en el dígrafo <gu> ante las vocales <e, i>

Reglas de inserción de un elemento:

regla de inserción de [k] después del grafema <x>

Incluso en lenguas con una correspondencia regular entre grafías y sonidos, el tratamiento de una determinada grafía puede requerir un conjunto de reglas:

<c> → [k] / # _ [a], [o], [u]
casa, cosa, cuna

<c> → [T] / # _ [e], [i]
cena, cine

<c> → [k] / V _ [a], [o], [u]
oca, acoso, acuna

<c> → [T] / V _ [e], [i]
hace, fácil

<c> → [k] / V _ #C
acción, sección, actor

<c> → [k] / # _ [l], [r]V
tecla, crío

<c> → [k] / _ #
coñac, vivac

<c> → [tS] / _h
techo

Subirats, C., Llisterri, J. y Poch, D. (1988). El diccionario electrónico del español con un conversor de texto a voz. En C. Martín Vide (Ed.), Lenguajes naturales y lenguajes formales III.1. Actas del III congreso de lenguajes naturales y lenguajes formales. (pp. 341-56). Barcelona: Promociones y Publicaciones Universitarias. Consultado en http://liceu.uab.cat/~joaquim/publicacions/Subirats_Llisterri_Poch_88_Diccionario_Conversor.pdf
up arrow

Problemas de la transcripción fonética automática

Nombres propios y palabras extranjeras

<#g> <#j> → [dz] [j] (George, jeans, Jordi, Jaume)

<#w> → [w] [gw] (whisky)

<ph> → [f] (Humphrey)

<sh> → [S] [tS] (show, squash)

<sch> → [S] (Schiller)

<tg> → [dZ] (Sitges)

<#sc> → [#esC] (stop, squash)

Nombres propios de persona en español:

Esther <th>: [t]

Lourdes <ou>: [u]

Feijoo <oo>: [o]

Desacentuación del primer elemento de los nombres compuestos (implica detectar el nombre compuesto)

Alfabeto fonético

La transcripción fonética automática requiere el uso de un alfabeto fonético compatible con los sistemas informáticos.

SAMPA, SAM Phonetic Alphabet

Adaptación de SAMPA al español

Adaptación de SAMPA al catalán

up arrow

División silábica o silabación

Divide la cadena de alófonos en sílabas.

Puede realizarse como parte del preprocesado del texto, partiendo de la representación ortográfica.

Determina las sílabas tónicas y las sílabas átonas de la cadena de alófonos.

Requiere información sobre palabras que son siempre átonas.

Requiere reglas de acentuación para las palabras que no llevan acento gráfico.

Puede realizarse como parte del preprocesado del texto una vez se ha llevado a cabo la división silábica.

up arrow

La transcripción fonética automática en la conversión de texto en habla

Transcripción fonética automática


Los módulos lingüísticos en un conversor de texto en habla: el módulo de transcripción fonética automática
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: