La síntesis por predicción lineal
(LPC, Linear Predictive Coding)



El modelo de análisis por LPC

Predicción de valores de una señal periódica a partir de valores anteriores en un sistema sin ramificaciones.

Un sistema de predicción lineal es un procedimiento que, dada una señal de habla, permite definir la función de transferencia del filtro que la ha generado.

Basado en la redundancia de las señales de habla –periodicidad y variación relativamente lenta– que permite la predicción de una señal muestreada a partir de muestras anteriores.

Separación de la estructura fina del espectro –resultado de la fuente– y de la envolvente espectral –resultado del filtro–.

Modelo de la fuente y el filtro en la producción del habla.

Resultado del análisis: coeficientes LPC relacionados con los polos espectrales, por lo que el describe la acción de una función de transferencia en la que únicamente existen picos o polos.

Análisis espectral mediante LPC (Linear Predictive Coding)

Parámetros del análisis LPC

Orden del modelo

Corresponde al número de picos o polos a partir de los cuales se modela la función de transferencia de la señal analizada.

Relacionado con la frecuencia de muestreo y con el ancho de banda de la señal.

El número de picos o polos debe ser suficiente para modelar los formantes en la amplitud de banda de la señal.

Adición de 2-4 picos o polos adicionales para aproximarse a los posibles ceros espectrales y para el modelado general del espectro.

Ancho de banda de la ventana de análisis

Equivale al número de muestras a partir de las cuales se realiza el análisis (trama o frame).

Relacionado con la frecuencia de muestreo y con la frecuencia fundamental (mínimo de 2 períodos en sistemas basados en la autocorrelación).

Superposición de ventanas para evitar la pérdida de información en las transiciones.

Posibilidades del LPC

Análisis

Detección de formantes a partir de los picos o polos del espectro y determinación de la envolvente espectral.

Seguimiento de la evolución temporal de los formantes (formant tracking).

Análisis espectral mediante LPC (Linear Predictive Coding)

Síntesis

Codificación de unidades de síntesis para la conversión de texto a habla.

Codificación de frases para sistemas de respuesta vocal.

up arrow

El modelo de síntesis por LPC

Codificación de las unidades de síntesis mediante los parámetros de control del sintetizador.

Estructura del sintetizador

Fuente: periódica y aperiódica, con posibilidad de utilización simultánea.

Filtro: modelo digital del tracto vocal simulado a partir de un conjunto de coeficientes de reflexión relacionados con las frecuencias de resonancia del tracto vocal y con los polos espectrales.

Parámetros de control

Frecuencia fundamental.

Sonoridad.

Amplitud.

Número de coeficientes.

up arrow

Adquisición y reproducción de la señal mediante LPC

Adquisición

Adquisición a través del micrófono.

Muestreo y cuantificación a través de un sistema de conversión analógico/digital (A/D).

Codificación LPC

Ventaneado.

Estimación de la periodicidad/aperiodicidad de la señal y de la frecuencia fundamental.

Extracción de los coeficientes.

Cálculo de la amplitud.

Cálculo del residuo (diferencia entre la codificación LPC y la señal original) en algunos sistemas.

Almacenamiento en memoria de los parámetros extraídos.

Decodificación LPC

Lectura de los parámetros de la memoria.

Generación de la onda periódica/aperiódica.

Cálculo de la función de transferencia a partir de los coeficientes LPC.

Aplicación de la función de onda procedente de la fuente.

Control de la amplitud.

Conversión digital/analógica (D/A).

up arrow

Ejemplos de síntesis por LPC

Wiggins (1980), Texas Instruments Speak-’n-Spell - análisis y resíntesis del habla por predicción lineal [Klatt, 1987 (13)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

Atal (1982), Comparación entre una grabación natural y la versión sintetizada utilizando análisis y resíntesis automáticas mediante predicción lineal [Klatt, 1987 (14)].

Klatt, D. H. (1987). Review of text-to-speech conversion for English. The Journal of the Acoustical Society of America, 82(3), 737-793. Consultado en https://www.cs.indiana.edu/rhythmsp/ASA/Contents.html

up arrow
La síntesis por predicción lineal
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: