Nociones básicas de psicoacústica


Psicoacústica

Psicoacústica


El campo de la audición

Límites del campo de la audición:

Campo_audicion.jpg

Grupo de Estudio de los Ototóxicos. (s. d.). Audición. Medicamentos y sordera . Madrid: Universidad Complutense de Madrid. Consultado en http://www.ototoxicos.com/audicion/

Umbral de la audibilidad

Presión sonora necesaria para que el oído perciba un sonido.

Depende de la frecuencia.

Mayor sensibilidad entre 1.000 – 2.000 y 5.000 Hz.

Referencia: umbral de una frecuencia de 1.000 Hz.

Llindar_audicio_Ainsworth76.jpg

Ainsworth, W. A. (1976). Mechanisms of speech recognition. London: Pergamon Press.

presbiacusia.gif

Presbiacusia

Ruel, J., Puel, J., y Trigueiros, N. (2007). Audiometry. Promenade ’round the cochlea. Montpellier: Institut de Neurosciences de Montpellier. Consultado en http://www.neuroreille.com/promenade/english/audiometry/audiometry.htm

Umbral del dolor

Intensidad sonora a partir de la que se produce la sensación de dolor.

Escala_dB.jpg

International Training Centre of the International Labour Organization

up arrow

Los correlatos perceptivos de los parámetros acústicos

Ley de Weber–Fechner

Ernst Heinrich Weber (1795-1878) – Gustav Theodor Fechner (1801-1887).

Formulación simplificada: cuando el estímulo crece en progresión aritmética, la sensación crece en progresión geométrica.

Progresión aritmética: 1, 2, 3, 4, 5, 6.
Progresión geométrica: 2, 4, 8, 16, 32, 64.

Altura tonal, tono (pitch)

El correlato perceptivo de la frecuencia fundamental (f0) es la altura tonal, tono o tonía (pitch).

En función de su altura tonal (tono, pitch) un sonido se percibe como más grave (frecuencia fundamental baja) o más agudo (frecuencia fundamental alta).

f0

fo

f0

Octava: intervalo entre una frecuencia y el doble de ésta.

440 Hz – 880 Hz: 1 octava.
600 Hz – 800 Hz: 1/3 de octava.
4.000 Hz – 4.200 Hz: 1/20 de octava.

Mel: unidad no lineal que relaciona frecuencia y altura tonal.

400 Hz – 500 Mels.
1.000 Hz – 1.000 Mels.
3.000 Hz – 2.000 Mels.
Relacio_Mel_Hz_Ainsworth76.jpg

Ainsworth, W. A. (1976). Mechanisms of speech recognition. London: Pergamon Press.

Intensidad (loudness)

El correlato perceptivo de la amplitud es la intensidad, sonía (loudness), intensidad sonora subjetiva o sonoridad.

En función de su intensidad un sonido se percibe como más fuerte (intensidad elevada) o más flojo (intensidad baja).

dB

dB

dB

Presión acústica o presión sonora: milibara, dina/cm2, Pascal (Pa).

Potencia acústica o potencia sonora: energía por unidad de tiempo: Watt.

Intensidad acústica o intensidad sonora: potencia por unidad de superficie: Watt/cm2.

Decibelio (Decibel, dB): unidad logarítmica de medida de la intensidad.

A 10 veces más intenso que B: 10 dB de diferencia.
A 100 veces más intenso que B: 20 dB de diferencia.
A 1000 veces más intenso que B: 30 dB de diferencia.

Decibelios relativos: diferencia entre dos sonidos.

Decibelios absolutos (SL, sound level): diferencia respecto al umbral de audibilidad.

10-16 Watt/cm2 = 0 dB SL
10-14 Watt/cm2 = 20 dB SL
10-2 Watt/cm2 = 140 dB SL

Landercy, A., y Renard, R. (1977). Éléments de phonétique. Mons - Bruxelles: Centre International de Phonétique Appliquée - Didier. (p. 49)

Intensidad de una onda sonora compuesta: resultado de la combinación de la intensidad sonora de cada uno de sus componentes.

f0 = 40 dB (absolutos)
segundo armónico = 30 dB (absolutos)
tercer armónico = 30 dB (absolutos)

30 dB corresponde a 10-13 Watt/cm2
40 dB corresponde a 10-12 Watt/cm2

10-12 + 10-13 + 10-13 =
1 x 10-12 + 2 x 10-13 =
1 x 10-12 + 0,2 x 10-12 =
1,2 x 10-12 = 49,79 dB

Landercy, A., y Renard, R. (1977). Éléments de phonétique. Mons - Bruxelles: Centre International de Phonétique Appliquée - Didier. (pp. 52-53)

Sonio (Sone): unidad de medida de la sonía definida con respecto a un tono de referencia. Un tono de referencia de 1000 Hz a una intensidad de 40 dB tiene una sonía de 1 sonio; un sonido que se perciba con una sonía (una intensidad subjetiva) dos veces mayor, tendrá una sonía de 2 sonios.

Fonio (Phon): unidad de medida del nivel de sonía para la comparación de la sonía de sonidos de frecuencia diferente. Un tono de referencia de 1000 Hz con una intensidad de 40 dB tiene un nivel de sonía de 40 fonios; un tono de cualquier otra frecuencia, pero que se perciba con el mismo nivel de sonía (de intensidad subjetiva) que el de referencia, tendrá también un nivel de sonía de 40 fonios.

Sociedad Española de Acústica (2012). Glosario de términos acústicos. Madrid: Sociedad Española de Acústica. Consultado en http://www.sea-acustica.es/fileadmin/varios/Glosario_de_terminos_acusticos.pdf

Relacio_Son_dB_Ainsworth76.jpg

Relación entre la sonía (en sonios) y la intensidad acústica en un tono de 1000 Hz.

Ainsworth, W. A. (1976). Mechanisms of speech recognition. London: Pergamon Press.

Timbre (quality)

“Timbre: Cualidad acústica propia de cada sonido y dependiente de la configuración general de su espectro” (p. 547).

Gil, J. (2007). Fonética para profesores de español: de la teoría a la práctica. Madrid: Arco/Libros.

La percepción del timbre (quality) de un sonido viene dada por las características de su espectro.

En función de su timbre un sonido se percibe como más claro (predominio de las frecuencias altas) o más oscuro (predominio de las frecuencias bajas).

db/Hz

db/Hz

db/Hz

Clasificación de las vocales del español en función del timbre

Clasificación de las consonantes del español en función del timbre

conceptos_avanzadosLas bandas críticas

Enmascaramiento: proceso por el cual el umbral de audibilidad de un sonido se eleva debido a la presencia de otro sonido.

Banda crítica: distancia (amplitud de banda) que separa dos tonos en el interior de la cual se produce el enmascaramiento; cuando se pasa de una banda crítca a otra, se produce un cambio en la respuesta auditiva, por lo que las bandas críticas se relacionan con la resolución frecuencial del sistema auditivo.

Bark: unidad empleada para la división (del 1 al 24) en bandas críticas auditivas; a una distancia igual en Barks le corresponde una misma distancia perceptiva.

Zwicker, E. (1961). Subdivision of the audible frequency range into critical bands (frequenzgruppen). The Journal of the Acoustical Society of America, 33(2), 248. doi:10.1121/1.1908630

Zwicker, E., y Terhardt, E. (1980). Analytical expressions for critical-band rate and critical bandwidth as a function of frequency. The Journal of the Acoustical Society of America, 68(5), 1523-1525. doi:10.1121/1.385079
Bandes_critiques.jpg

Zwicker, E. (1961). Subdivision of the audible frequency range into critical bands (frequenzgruppen). The Journal of the Acoustical Society of America, 33(2), 248. doi:10.1121/1.1908630

La banda crítica depende de la frecuencia: mayor sensibilidad a los cambios frecuenciales en frecuencias bajas que en las altas.

1.000 Hz – Banda crítica de 200 Hz
10.000 Hz – Banda crítica de 1.000 Hz.

Relacio_Bark_Hz_LiebermanBlumstein88.jpg

Lieberman, P., y Blumstein, S. E. (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge: Cambridge University Press.

Duración

El correlato perceptivo del tiempo es la duración o cantidad (length).

Según su duración un sonido se percibe como más largo o más breve.

ms

ms

ms

Correlatos perceptivos de los parámetros acústicos

Correlatos acústicos, articulatorios y perceptivos de los elementos segmentales

up arrow

conceptos_avanzadosUmbrales diferenciales auditivos

Altura tonal (pitch)

El función de su altura tonal (pitch) un sonido se percibe como más grave o más agudo.

Umbral diferencial: mínima diferencia de frecuencia que permite distinguir dos sonidos por su altura tonal.

Shower, E. G. y Biddulph, R. (1931). Differential pitch sensitivity of the ear. The Journal of the Acoustical Society of America, 3(1A), 7. doi:10.1121/1.1901921
Nordmark, J. O. (1968). Mechanisms of frequency discrimination. The Journal of the Acoustical Society of America, 44(6), 1533-1540. doi:10.1121/1.1911293

Intensidad (loudness)

En función de su intensidad (loudness) un sonido se percibe como más fuerte o más flojo.

Umbral diferencial: mínimo cambio en la intensidad de un sonido que puede ser detectado por el oído.

En la gama 100 – 4.000 Hz:

Riesz, R. R. (1928). Differential sensitivity of the ear for pure tones. Physical Review, 31(5), 867-875. doi:10.1103/PhysRev.31.867

En la gama 100 - 4.000 Hz:

Duración

En función de su duración un sonido se percibe como más largo o más breve.

Umbral diferencial: mínimo cambio de duración de un sonido que puede ser distinguido por el oído.

Abel, S. M. (1972). Duration discrimination of tone and tone bursts. The Journal of the Acoustical Society of America, 51(4B), 1219-1223. doi:10.1121/1.1912963
Fujisaki, H., Nakamura, K., y Imoto, T. (1975). Auditory perception of duration of speech and non-speech sounds. En G. Fant, y M. A. A. Tatham (Eds.), Auditory analysis and perception of speech. (pp. 197-220). London: Academic Press.
up arrow

conceptos_avanzadosModelos auditivos

Aplicación de los modelos auditivos a la normalización de diferencias entre hablantes

Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: A thread. En F. Fallside, y W. A. Woods (Eds.), Computer speech processing. (pp. 29-40). Englewood Cliffs, NJ: Prentice Hall International.

Normalización de las diferencias entre vocales producidas por dos hablantes de sexo diferente utilizando un modelo auditivo.

Normalitzacio_Bladon85_1.jpg

Diferencias en las características acústicas de una misma vocal [y] producida por un hablante masculino y un hablante femenino

Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: A thread. En F. Fallside, y W. A. Woods (Eds.), Computer speech processing. (pp. 29-40). Englewood Cliffs, NJ: Prentice Hall International.

Transformación del espectro considerando que:

Conversión de Hz a Barks (anchura de una banda crítica auditiva).

Filtrado del espectro en Barks teniendo en cuenta factores psicoacústicos (enmascaramiento) y la curva de respuesta de las fibras del nervio auditivo.

Este filtrado produce la desaparición de los formantes altos enmascarados por F2.

Conversión de dB en Fonos mediante curvas isófonas y conversión a Sonos/Bark.

Obtención de espectros “pseudo-auditivos” que representan un modelo de los patrones de excitación del nervio auditivo.

Normalitzacio_Bladon85_2.jpg

Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: A thread. En F. Fallside, y W. A. Woods (Eds.), Computer speech processing. (pp. 29-40). Englewood Cliffs, NJ: Prentice Hall International.

Desplazando 1 Bark el “espectro auditivo” de una vocal pronunciada por un hablante femenino se obtiene una coincidencia en el patrón de “formantes” con el espectro de la misma vocal pronunciada por un hablante masculino, con lo que se lleva a cabo una normalización.

Normalitzacio_Bladon85_3.jpg

Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: A thread. En F. Fallside, y W. A. Woods (Eds.), Computer speech processing. (pp. 29-40). Englewood Cliffs, NJ: Prentice Hall International.

up arrow

Psicoacústica

Psicoacústica


Nociones básicas de psicoacústica
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: