Métodos de análisis acústico del habla
La conversión de analógico a digital constituye el primer paso para el almacenamiento de la onda sonora en un sistema digital.
Son señales continuas en amplitud y tiempo.
Su amplitud puede tener cualquier valor en cualquier momento en el tiempo.
Representación de una señal analógica.
Son señales discontinuas o discretas en amplitud y en tiempo.
Tienen valores discretos (limitados) de amplitud espaciados regularmente en el tiempo.
Pueden representarse en una tabla numérica.
Representación de una señal digital.
Reducción de los valores continuos de amplitud a un conjunto de valores discretos prefijados o niveles de cuantificación.
Niveles de cuantificación expresados en bits.
Cuantificación y calidad de la señal.
Sampling
Medida de la amplitud en determinados intervalos temporales equidistantes en el tiempo.
Frecuencia de muestreo (sampling rate): intervalos temporales en los que se almacena la amplitud de la señal.
Cuantificada en Hz o muestras por segundo.
La frecuencia de muestreo debe ser equivalente al doble de la frecuencia máxima que se desea digitalizar.
Proceso de muestreo.
Oscilograma o forma de onda (waveform).
Representación de las variaciones de amplitud en el habla —eje vertical— a lo largo del tiempo —eje horizontal—.
Análisis de la sonoridad, la amplitud (intensidad) la duración, las pausas, el acento, la velocidad de elocución y el ritmo.
Oscilograma o forma de onda del enunciado «El viento norte y el sol».
Oscilograma o forma de onda del enunciado «El viento».
Oscilograma o forma de onda del segmento «El».
❯ Análisis de la forma de onda mediante Praat
(Fuente de la imagen: Juana Gil Fernández. (s. f.). https://www.juanagilfernandez.com)
|
Espectro FFT
FFT, Fast Fourier Transform, Transformada Rápida de Fourier.
Representación de la frecuencia —eje horizontal— y la amplitud —eje vertical— de los armónicos en un instante de la señal sonora del habla.
Análisis de la sonoridad y de la estructura formántica (timbre).
Espectro (FFT) y forma de onda (oscilograma) de la vocal [i].
Espectro (FFT) de la vocal [u].
Espectro (FFT) de la vocal [i].
Espectro (FFT) de la vocal [u].
❯ Análisis espectral (FFT) mediante Praat
Espectro LPC
LPC, Linear Predictive Coding, Codificación por predicción lineal.
Representación de la frecuencia —eje horizontal— y la amplitud —eje vertical— de los picos espectrales que representan las resonancias del tracto vocal (formantes) en un instante de la señal sonora del habla.
Análisis de la estructura formántica (timbre).
Espectro (LPC) de una vocal.
Espectro (LPC) de la vocal [i].
Espectro (LPC) de la vocal [u].
Comparación entre el espectro LPC (en rojo) y el espectro FFT de la vocal [i].
Comparación entre el espectro LPC (en rojo) y el espectro FFT de la vocal [u].
❯ Análisis espectral (LPC) mediante Praat
Espectrograma.
Representación de las variaciones de la frecuencia —eje vertical— y la amplitud —nivel de grises— de la señal sonora a lo largo del tiempo —eje horizontal—.
Análisis de la sonoridad, la duración, la estructura formántica (timbre), la amplitud (intensidad), las pausas, el acento, la velocidad de elocución y el ritmo.
Espectrograma del enunciado «El viento norte y el sol».
Espectrograma del enunciado «El viento».
Espectrograma de la palabra «norte».
Representación de los formantes de las vocales [i a u] en el espectro FFT (izquierda) y en el espectrograma (derecha).
Demestre, J., Llisterri, J., Riera, M. y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Ed.), Psicologia del llenguatge. (pp. 35-114). Editorial UOC.
❯ Análisis espectrográfico y análisis de formantes mediante Praat
Curva melódica.
Representación de las variaciones de la frecuencia fundamental (f0) de la voz —eje vertical— a lo largo del tiempo —eje horizontal—.
Análisis de la melodía, el acento y la entonación.
Curva melódica del enunciado «El viento norte y el sol».
Curva melódica (suavizada e interpolada) del enunciado «María vive en Málaga» (modalidad enunciativa).
Curva melódica (suavizada e interpolada) del enunciado «María vive en Málaga» (modalidad interrogativa).
Curva melódica (suavizada e interpolada) del enunciado «María vive en Málaga» (modalidad exclamativa).
❯ Análisis de la curva melódica mediante Praat
Análisis de la frecuencia fundamental
Curva de intensidad.
Representación de la variación de la amplitud o energía sonora de la señal —eje vertical— a lo largo del tiempo —eje horizontal—.
Análisis de la amplitud (intensidad), el acento, el ritmo y las pausas.
Curva de intensidad (energía sonora) y forma de onda (oscilograma) del enunciado «El viento norte y el sol».
❯ Análisis de la curva de intensidad mediante Praat
Espectro medio (LTAS, Long-Term Average Spectrum).
El espectro medio representa el promedio de varios espectros sucesivos de la señal.
Representación de la frecuencia —eje horizontal— y la energía sonora —eje vertical— del espectro de una muestra de habla realizada a partir del promedio de una serie de espectros calculados en puntos sucesivos en el tiempo.
Análisis de la cualidad de voz.
Espectro medio de la lectura de «El viento norte y el sol» por un locutor masculino.
Espectro medio de la lectura de «El viento norte y el sol» por un locutor masculino (en negro) y un locutor femenino (en rojo).
❯ Análisis del espectro medio (LTAS, Long-Term Average Spectrum) mediante Praat
Sonoridad | Duración | Estructura formántica |
Frecuencia fundamental |
Amplitud | Cualidad de voz | |
Oscilograma | ✔ | ✔ | ✔ | |||
Espectro (FFT) | ✔ | ✔ | ✔ | ✔ | ||
Espectro (LPC) | ✔ | ✔ | ||||
Espectrograma | ✔ | ✔ | ✔ | ✔ | ✔ | |
Curva melódica | ✔ | ✔ | ✔ | |||
Curva de intensidad | ✔ | ✔ | ||||
Espectro medio | ✔ |
Herramientas para el análisis acústico del habla
Técnicas de análisis acústico del habla
Técnicas de análisis acústico del habla