Métodos de análisis acústico del habla


Técnicas de análisis acústico del habla

Técnicas de análisis acústico del habla


La conversión de analógico a digital (AD)

La conversión de analógico a digital constituye el primer paso para el almacenamiento de la onda sonora en un sistema digital.

Señales analógicas

Son señales continuas en amplitud y tiempo.

Su amplitud puede tener cualquier valor en cualquier momento en el tiempo.

señal analógica

Representación de una señal analógica.

Señales digitales

Son señales discontinuas o discretas en amplitud y en tiempo.

Tienen valores discretos (limitados) de amplitud espaciados regularmente en el tiempo.

Pueden representarse en una tabla numérica.

señal digital

Representación de una señal digital.

Cuantificación

Reducción de los valores continuos de amplitud a un conjunto de valores discretos prefijados o niveles de cuantificación.

Niveles de cuantificación expresados en bits.

1 bit - 2 niveles
8 bits - 256 niveles (28)
16 bits - 65.536 niveles (216) (Calidad de CD)
32 bits - 4.294.967.296 niveles (232)
calidad de la señal digitalizada

Cuantificación y calidad de la señal.

Muestreo (sampling)

Medida de la amplitud en determinados intervalos temporales equidistantes en el tiempo.

Frecuencia de muestreo (sampling rate):

Intervalos temporales en los que se almacena la amplitud de la señal.

Cuantificada en Hz o muestras por segundo.

44.100 muestras/s (44,1 kHz) - calidad de CD.

La frecuencia de muestreo debe ser equivalente al doble de la frecuencia máxima que se desea digitalizar.

muestreo

Proceso de muestreo.

up arrow

Análisis oscilográfico o de la forma de onda

Oscilograma o forma de onda (waveform).

Representación de las variaciones de amplitud en el habla –eje vertical– a lo largo del tiempo –eje horizontal–.

Análisis de la sonoridad, la amplitud (intensidad) la duración, las pausas, el acento, la velocidad de elocución y el ritmo.

oscilograma

Oscilograma o forma de onda del enunciado “El viento norte y el sol”.

El_viento_oscilograma_Praat.jpg

Oscilograma o forma de onda del enunciado “El viento”.

El_oscilograma_Praat.jpg

Oscilograma o forma de onda del segmento “El”.

Análisis de la forma de onda mediante Praat

up arrow

Análisis espectral

“Espectro del sonido: Diagrama que muestra las amplitudes relativas de las diferentes frecuencias componentes de un sonido” (p. 148).

Gil, J. (1988). Los sonidos del lenguaje. Madrid: Síntesis.

Espectro FFT

FFT, Fast Fourier Transform - Transformada Rápida de Fourier.

Representación de la frecuencia –eje horizontal– y la amplitud –eje vertical– de los armónicos en un instante de la señal sonora del habla.

Análisis de la sonoridad y de la estructura formántica (timbre).

Espectro

Espectro (FFT) y forma de onda (oscilograma) de la vocal [i].

Espectro

Espectro (FFT) de la vocal [u].

FFT_i_etiquetat.jpg

Espectro (FFT) de la vocal [i].

FFT_u_etiquetat.jpg

Espectro (FFT) de la vocal [u].

Análisis espectral (FFT) mediante Praat

up arrow

Análisis espectral

Espectro LPC

LPC, Linear Predictive Coding - Codificación por predicción lineal.

Representación de la frecuencia –eje horizontal– y la amplitud –eje vertical– de los picos espectrales que representan las resonancias del tracto vocal (formantes) en un instante de la señal sonora del habla.

Análisis de la estructura formántica (timbre).

LPC

Espectro (LPC) de una vocal.

LPC_i_etiquetat.jpg

Espectro (LPC) de la vocal [i].

LPC_u_etiquetat.jpg

Espectro (LPC) de la vocal [u].

FFT_LPC_i.png

Comparación entre el espectro LPC (en rojo) y el espectro FFT de la vocal [i].

FFT_LPC_u.png

Comparación entre el espectro LPC (en rojo) y el espectro FFT de la vocal [u].

Análisis espectral (LPC) mediante Praat

up arrow

Análisis espectrográfico

Espectrograma.

Representación de las variaciones de la frecuencia –eje vertical– y la amplitud –nivel de grises– de la señal sonora a lo largo del tiempo –eje horizontal–.

Análisis de la sonoridad, la duración, la estructura formántica (timbre), la amplitud (intensidad), las pausas, el acento, la velocidad de elocución y el ritmo.

Espectrograma

Espectrograma del enunciado “El viento norte y el sol”.

Espectrograma

Espectrograma del enunciado “El viento”.

Espectrograma

Espectrograma de la palabra “norte”.

Espectrograma y espectro

Representación de los formantes de las vocales [i a u] en el espectro FFT (izquierda) y en el espectrograma (derecha).

Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Ed.), Psicologia del llenguatge. (pp. 35-114). Barcelona: Editorial UOC.

Análisis espectrográfico y análisis de formantes mediante Praat

Análisis espectrográfico

up arrow

Análisis melódico

Curva melódica (pitch contour).

Representación de las variaciones de la frecuencia fundamental (f0) de la voz –eje vertical– a lo largo del tiempo –eje horizontal–.

Análisis de la melodía, el acento y la entonación.

Enunciativa

Curva melódica del enunciado “El viento norte y el sol”.

Enunciativa

Curva melódica del enunciado “María vive en Málaga” (modalidad enunciativa).

Interrogativa

Curva melódica del enunciado “María vive en Málaga” (modalidad interrogativa).

Exclamativa

Curva melódica del enunciado “María vive en Málaga” (modalidad exclamativa).

Análisis de la curva melódica mediante Praat

Análisis de la frecuencia fundamental

up arrow

Análisis de intensidad

Curva de intensidad.

Representación de la variación de la amplitud o energía sonora de la señal –eje vertical– a lo largo del tiempo –eje horizontal–.

Análisis de la amplitud (intensidad), el acento, el ritmo y las pausas.

Energía

Curva de intensidad (energía sonora) y forma de onda (oscilograma) del enunciado “El viento norte y el sol”.

Análisis de la curva de intensidad mediante Praat

up arrow

Análisis del espectro medio (LTAS, Long-Term Average Spectrum)

Espectro medio (LTAS, Long-Term Average Spectrum).

El espectro medio representa el promedio de varios espectros sucesivos de la señal.

Representación de la frecuencia –eje horizontal– y la energía sonora –eje vertical– del espectro de una muestra de habla realizada a partir del promedio de una serie de espectros calculados en puntos sucesivos en el tiempo.

Análisis de la cualidad de voz.

LTAS

Espectro medio de la lectura de “El viento norte y el sol” por un locutor masculino.

LTAS

Espectro medio de la lectura de “El viento norte y el sol” por un locutor masculino (en negro) y un locutor femenino (en rojo).

Análisis del espectro medio (LTAS, Long-Term Average Spectrum) mediante Praat

Análisis del espectro medio

up arrow

Visualización de las características acústicas del habla en los documentos de análisis acústico

  Sonoridad Duración Estructura
formántica
Frecuencia
fundamental
Amplitud Cualidad de voz
Oscilograma check check     check  
Espectro (FFT) check   check check check  
Espectro (LPC)     check   check  
Espectrograma check check check check check  
Curva melódica check check   check    
Curva de intensidad   check     check  
Espectro medio           check
up arrow

Herramientas para el análisis acústico del habla

Técnicas de análisis acústico del habla

Técnicas de análisis acústico del habla


Métodos de análisis acústico del habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: