Las unidades de síntesis



Unidades de síntesis

Corpus

Selección de unidades (unit selection) de longitud variable (non-uniform) previamente recogidas en un corpus.

Síntesis basada en corpus

Frases y palabras

Utilizadas en los sistemas de grabación-reproducción.

Ofrecen una calidad alta.

Requisitos de memoria elevados.

Requieren una prosodia adecuada al mensaje en el que se insertan.

Difonemas o difonos (trifonemas, cuatrifonemas, polifonos) y semisílabas

Usadas preferentemente en los sistemas de síntesis por concatenación de unidades.

Semisílaba

Fragmento de sílaba comprendido entre su inicio y el centro de la vocal o entre el centro de la vocal y su final.

Minimiza los efectos de la coarticulación.

Difonema o difono

Segmento acústico que incluye la transición entre dos fonos consecutivos, formado por la parte estacionaria del primero, la transición del primero al segundo y la parte estacionaria del segundo.

/kasa/ → /silencio_k/ /ka/ /as/ /sa/ /a_silencio/
/el aɲo/ → /silencio_e/ /el/ /la/ /aɲ/ /ɲo/ /o_silencio/
etiquetado.jpg

Etiquetado y alineación de fonos, de difonos y de palabras en el fragmento “el año”, realizado mediante el programa Praat.

Minimiza los efectos de la coarticulación.

Fonemas, alófonos y tramas (frames)

Unidades utilizadas preferentemente en los sistemas de síntesis por reglas.

Alófonos o fonos

Inventario reducido para cada lengua.

Degradación de la calidad producida por los problemas de concatenación.

La coarticulación

Obligan a generar la prosodia artificialmente.

Tramas (frames)

Fragmento de la señal acústica que presenta características uniformes (transición, segmento estacionario).

Tipo de unidadNúmero de unidadesTotal en Kbyte
Fonema290.174
Alófono1000.6
Difonema50015
Semisílaba200096
Morfema100001800

Valoración aproximada de la base de datos LPC para la síntesis del castellano según el tipo de unidades de síntesis.

Martí, J. (1991). El dilema simplificación-calidad en conversores texto-voz. En Simposio de la lengua española. Ciencia y tecnología. Barcelona, 7-11 de octubre de 1991.

up arrow

Desarrollo de diccionarios de unidades de síntesis

Determinación del tipo de unidades de síntesis

En conversión de texto a habla suelen utilizarse unidades como el difonema, trifonema o cuatrifonema o unidades menores como fonemas o alófonos.

Determinación del inventario de unidades

Establecimiento del inventario completo de unidades que se utilizan para una lengua determinada.

Elaboración del diccionario de unidades de síntesis

Selección del locutor

Voz adecuada para la técnica de síntesis utilizada.

Buen lector.

Pruebas de síntesis y evaluación por potenciales usuarios.

Grabación de las unidades

Selección de contextos para la inclusión de las unidades.

Integración de las unidades en frases.

Segmentación de las unidades

Segmentación manual frente a segmentación automática.

Validación del diccionario

Pruebas de síntesis y evaluación por potenciales usuarios.

up arrow

Ejemplos de síntesis por concatenación de difonemas y de semisílabas

Dixon y Maxey (1968): síntesis por formantes mediante concatenación de difonemas [Klatt, 1987, (18)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

Olive (1977): concatenación de difonemas codificados mediante predicción lineal [Klatt, 1987, (22)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

Echo (1982): sistema de concatenación de difonemas de bajo coste [Klatt, 1987, (29)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

Browman (1980): concatenación de semisílabas codificadas por predicción lineal [Klatt, 1987, (23)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

up arrow
Las unidades de síntesis
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: