Modelos de percepción del habla


Modelos de percepción del habla

Modelos de percepción del habla


Modelos activos de la percepción del habla

Motivados por la ausencia de invariancia acústica y perceptiva.

Diferentes configuraciones acústicas pueden percibirse como el mismo segmento fonológico.

La misma configuración acústica puede percibirse como un segmento fonológico diferente en función del contexto.

../../fon_anal_acus/Oclusius_indicis_transicions_t.jpg

Transición del segundo formante en [ti] y en [tu].

Demestre, J., Llisterri, J., Riera, M., y Soler, O. (2006). La percepció del llenguatge. En O. Soler (Ed.), Psicologia del llenguatge. (pp. 35-114). Barcelona: Editorial UOC.

La transición del segundo formante (F2) es descendente en [ti] y ascendente en [tu].

Ambas transiciones constituyen indicios acústicos del lugar de articulación de [t].

Ocluius_Indicis_B80.jpg

Blumstein, S. E. (1980). Speech perception: An overview. En G. Yeni-Komshian, J. F. Kavanagh, y C. A. Ferguson (Eds.), Child phonology. Vol II: Perception. (pp. 9-21). New York: Academic Press.

Los experimentos sobre percepción categorial muestran la existencia de saltos abruptos entre categorías fonológicas.

Puede pensarse que, al igual que no percibimos sonidos intermedios entre categorías, tampoco somos capaces de producirlos.

La investigación sobre elementos invariantes se desplaza del estudio de la señal acústica al estudio de la articulación.

No se encuentra un único conjunto de movimientos articulatorios asociados en todos los contextos a la producción de una unidad lingüística: coarticulación.

Gesto articulatorio

Representación abstracta del conjunto de movimientos articulatorios realizados para la producción de un sonido.

La percepción consiste en “recuperar” la intención articulatoria del hablante.

Se establece una relación directa entre la producción y la percepción.

La percepción del habla implica el reconocimiento del gesto articulatorio que da lugar a una unidad lingüística codificada en la onda sonora.

El emisor utiliza su conocimiento interiorizado sobre la producción de cada sonido.

El gesto articulatorio abstracto sería una unidad de la percepción.

Existiría un módulo especializado en el procesamiento del lenguaje.

Teories_motrius.jpg

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

up arrow

Teoría motriz de la percepción del habla (Motor Theory of Speech Perception)

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1967). Perception of the speech code. Psychological Review, 74(6), 431-459. Consultado en http://www.haskins.yale.edu/Reprints/HL0069.pdf

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1972). Perception of the speech code. En E. E. David & P. B. Denes (Eds.), Human communication. A unified view. (pp. 13-50). New York: McGraw-Hill. (Obra original publicada en 1967)

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1991). Perception of the speech code. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 75-106). New York: The Acoustical Society of America. (Obra original publicada en 1967)

Alvin M. Liberman
Alvin M. Liberman
(1917-2000)
Franklin S. Cooper
Franklin S. Cooper
(1908-1999)

La percepción del habla conlleva la descodificación de la relación entre la onda sonora y la producción de los gestos articulatorios.

Los gestos articulatorios actúan de mediador entre el estímulo acústico y su percepción.

En la percepción el hablante realiza una comparación entre la señal sonora y sus conocimientos de los mecanismos de control de la articulación.

“Though we can not exclude the possibility that a purely auditive decoder exists, we find it more plausible to assume that speech is perceived by processes that are also involved in its production. The most general and obvious motivation for such a view is that the perceiver is also a speaker and must be supposed, therefore, to possess all the mechanisms for putting language through the successive coding operations that result eventually in the acoustic signal. It seem unparsimonious to assume that the speaker-listener employs two entirely separate processes of equal status, one for encoding language and the other for decoding it. A simpler assumption is that there is only one process, with appropriate linkages between sensory and motor components” (p.452).

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1967). Perception of the speech code. Psychological Review, 74(6), 431-459. Consultado en http://www.haskins.yale.edu/Reprints/HL0069.pdf

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1972). Perception of the speech code. En E. E. David & P. B. Denes (Eds.), Human communication. A unified view. (pp. 13-50). New York: McGraw-Hill. (Obra original publicada en 1967)

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., y Studdert-Kennedy, M. (1991). Perception of the speech code. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 75-106). New York: The Acoustical Society of America. (Obra original publicada en 1967)
Alvin M. Liberman
Alvin M. Liberman
(1917-2000)
Franklin S. Cooper
Franklin S. Cooper
(1908-1999)

Solapamiento de rasgos articulatorios en la sílaba y solapamiento de información acústica correspondiente a diferentes segmentos: coarticulación.

Teoria_Motriu_Paap75.jpg

Paap, K. R. (1975). Theories of speech perception. En D. W. Massaro (Ed.), Understanding language. An information processing analysis of speech perception, reading and psycholinguistics. (pp. 151-207). New York: Academic Press.

La descodificación del mensaje se lleva a cabo comparando la señal acústica con los comandos neuromotores que se activarían en la producción.

Teoria_Motriu_ER_Paap75.jpg

Paap, K. R. (1975). Theories of speech perception. En D. W. Massaro (Ed.), Understanding language. An information processing analysis of speech perception, reading and psycholinguistics. (pp. 151-207). New York: Academic Press.

Teoria_Motriu_ER_Klatt88.jpg

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

La teoría motriz revisada

Liberman, A. M., y Mattingly, I. (1986). The motor theory of speech perception revisited. Cognition, 21, 1-36. Consultado en http://www.haskins.yale.edu/Reprints/HL0519.pdf

Liberman, A. M., y Mattingly, I. (1991). The motor theory of speech perception revisited. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 107-42). New York: Acoustical Society of America. (Obra original publicada en 1986)

Alvin M. Liberman
Alvin M. Liberman
(1917-2000)

La unidad básica común a la producción y la percepción es el gesto articulatorio.

Los gestos articulatorios son unidades de producción abstractas, subyacentes e intencionales asociadas a los segmentos fonológicos.

La percepción se lleva a cabo interpretando directamente los gestos articulatorios subyacentes a los estímulos acústicos.

“The first claim of the motor theory is that the objects of speech perception are the intended phonetic gestures of the speaker, represented in the brain as invariant motor commands that call for movements of the articulators through certain linguistically significant configurations, These gestural commands are the physical reality underlying the traditional phonetic notions - for example "tongue backing", "lip rounding" and "jaw raising" - that provide the basis for phonetic categories . . . perception of the gestures occurs in a specialized mode, different in important ways from the auditory mode, responsible also for the production of phonetic structures, and part of the larger specialization for language. The adaptive function of the perceptual side of this mode . . . is to make the conversion from acoustic signal to gesture automatically” (pp. 2-3).

“On the one side of the module, the motor gestures are not the means to sounds designed to be congenial to the ear; rather, they are, in themselves, the essential phonetic units. On the other side, the sounds are not the true objects of perception, made available for linguistic purposes in some common auditory register: rather, they only supply the information for immediate perception of the gestures” (p.31).

Liberman, A. M., y Mattingly, I. (1986). The motor theory of speech perception revisited. Cognition, 21, 1-36. Consultado en http://www.haskins.yale.edu/Reprints/HL0519.pdf

Liberman, A. M., y Mattingly, I. (1991). The motor theory of speech perception revisited. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 107-42). New York: Acoustical Society of America. (Obra original publicada en 1986
Alvin M. Liberman
Alvin M. Liberman
(1917-2000)

La teoría motriz en la producción del habla

up arrow

Teoría del análisis por síntesis

Halle, M., y Stevens, K. N. (1964). Speech recognition: A model and a program for research. En J. A. Fodor, y J. J. Katz (Eds.), The structure of language. Readings in the philosophy of language. (pp. 604-12). Englewood Cliffs, NJ: Prentice Hall.

Stevens, K. N., y Halle, M. (1967). Remarks on analysis by synthesis and distinctive features. En W. Wathen-Dunn (Ed.), Models for the perception of speech and visual form. (pp. 88-102). Cambridge, MA: The MIT Press.

Stevens
Kenneth N. Stevens
(1924-2013)

La percepción se basa en un sistema de comparación entre el análisis del estímulo y los modelos generados por un conjunto de reglas.

Las reglas que crean los modelos abstractos con los que se compara el estímulo son comunes a la producción y a la percepción.

La comparación se lleva a cabo mediante un catálogo de descripciones articulatorias y representaciones auditivas.

Analisi_sintesi_Paap75.jpg

Halle, M., y Stevens, K. N. (1964). Speech recognition: A model and a program for research. En J. A. Fodor, y J. J. Katz (Eds.), The structure of language. Readings in the philosophy of language. (pp. 604-12). Englewood Cliffs, NJ: Prentice Hall.

Paap, K. R. (1975). Theories of speech perception. En D. W. Massaro (Ed.), Understanding language. An information processing analysis of speech perception, reading and psycholinguistics. (pp. 151-207). New York: Academic Press.

Analisi_sintesi_Klatt88.jpg

Halle, M., y Stevens, K. N. (1964). Speech recognition: A model and a program for research. En J. A. Fodor, y J. J. Katz (Eds.), The structure of language. Readings in the philosophy of language. (pp. 604-12). Englewood Cliffs, NJ: Prentice Hall.

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

up arrow

Modelos pasivos de la percepción del habla

Los modelos auditivos de percepción del habla postulan la existencia de mecanismos de detección de indicios acústicos, de rasgos acústico-fonéticos o de rasgos distintivos.

La percepción se lleva a cabo mediante procedimientos de comparación con representaciones almacenadas en la memoria.

Modelos auditivos

El oyente es sensible únicamente a las estructuras acústicas distintivas.

Los estímulos se comparan con representaciones internalizadas de cada una de las categorías fonéticas o se analizan para encontrar su estructura acústica.

Fundamentados en la existencia de un mecanismo de detección de indicios acústicos o de rasgos fonéticos.

Basados en la comparación entre la señal sonora y un conjunto de plantillas o patrones acústicos previamente almacenados.

El análisis auditivo extrae estructuras subfonémicas de tipo auditivo relacionadas con los rasgos distintivos.

A partir de la extracción de parámetros acústicos se lleva a cabo la detección de segmentos fonéticos, con los que se construyen las unidades mayores hasta llegar a la descodificación completa del mensaje.

Fant, G. (1964). Auditory patterns of speech. Speech Transmission Laboratory - Quarterly Progress and Status Report, 5(3), 16-20. Consultado en http://www.speech.kth.se/prod/publications/files/qpsr/1964/1964_5_3_016-020.pdf

Fant, G. (1967). Auditory patterns of speech. En W. Wathen-Dunn (Ed.), Models for the perception of speech and visual form. Cambridge, MA: The MIT Press. (Obra original publicada en 1964

Fant
Gunnar Fant
(1919-2009)
Model_auditiu_Paap75.jpg

Fant, G. (1964). Auditory patterns of speech. Speech Transmission Laboratory - Quarterly Progress and Status Report, 5(3), 16-20. Consultado en http://www.speech.kth.se/prod/publications/files/qpsr/1964/1964_5_3_016-020.pdf
Fant, G. (1967). Auditory patterns of speech. En W. Wathen-Dunn (Ed.), Models for the perception of speech and visual form. Cambridge, MA: The MIT Press. (Obra original publicada en 1964)

Paap, K. R. (1975). Theories of speech perception. En D. W. Massaro (Ed.), Understanding language. An information processing analysis of speech perception, reading and psycholinguistics. (pp. 151-207). New York: Academic Press.

up arrow

Modelos de detección de rasgos

Los modelos auditivos llevan al desarrollo de modelos de extracción directa de rasgos fonéticos o modelos de detección de rasgos.

Deteccio_trets.jpg

Modelo de percepción del habla basado en la detección de rasgos.

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

LAFS, Lexical Access from Spectra

Klatt, D. H. (1979). Speech perception: A model of acoustic-phonetic analysis and lexical access. Journal of Phonetics, 7, 279-312.

Klatt, D. H. (1980). Speech perception: A model of acoustic-phonetic analysis and lexical access. En R. A. Cole (Ed.), Perception and production of fluent speech. (pp. 243-88). Hillsdale, NJ: Lawrence Erlbaum. (Obra original publicada en 1979)

Klatt, D. H. (1991). Speech perception: A model of acoustic-phonetic analysis and lexical access. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 41-74). New York: The Acoustical Society of America. (Obra original publicada en 1979)

Klatt
Dennis H. Klatt
(1938-1988)

Diccionario de espectros prototípicos disponible en la memoria.

Almacena las combinaciones de sonidos (CV, por ejemplo) existentes en la lengua.

El diccionario se compara con el análisis auditivo de la señal sonora que llega al oído.

LAFS_Klatt88.jpg

Klatt, D. H. (1979). Speech perception: A model of acoustic-phonetic analysis and lexical access. Journal of Phonetics, 7, 279-312.
Klatt, D. H. (1980). Speech perception: A model of acoustic-phonetic analysis and lexical access. En R. A. Cole (Ed.), Perception and production of fluent speech. (pp. 243-88). Hillsdale, NJ: Lawrence Erlbaum. (Obra original publicada en 1979)
Klatt, D. H. (1991). Speech perception: A model of acoustic-phonetic analysis and lexical access. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 41-74). New York: The Acoustical Society of America. (Obra original publicada en 1979)

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

FLMP, Fuzzy Logical Model of Speech Perception

Massaro, D. W. (1992). The fuzzy logical model of speech perception: A framework for research and theory. En Y. Tohkura, E. Vatikiotis-Bateson, y Y. Sagisaka (Eds.), Speech perception, production and linguistic structure. (pp. 79.82). Tokyo - Amsterdam: Ohmsha - IOS Press.

Massaro, D. W., y Cohen, M. M. (1993). The paradigm and the fuzzy logical model of perception are alive and well. Journal of Experimental Psychology: General, 122(1), 115-124. Consultado en https://mambo.sites.ucsc.edu/wp-content/uploads/sites/158/2015/02/aaw.pdf

Identificación de rasgos acústico-fonéticos que se encuentran en la señal sonora.

Evaluación de la probabilidad de aparición de un rasgo empleando todas las fuentes de información disponibles.

Comparación de las hipótesis con un conjunto de prototipos de fonemas.

Descripción de los rasgos acústicos y fonéticos que idealmente caracterizarían a cada fonema.

Determinación del grado de adecuación entre los prototipos de fonemas almacenados en la memoria y los rasgos detectados en la señal sonora.

Deteccio_trets_Massaro87.jpg

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

LAFF, Lexical Access from Features

Stevens, K. N., Manuel, S. Y., Shattuck-Hufnagel, S., y Liu, S. (1992). Implementation of a model for lexical access bases on features. En ICSLP 1992. Proceedings of the 2nd International Conference on Spoken Language Processing. (pp. 499-502). Banff, Alberta, Canada. 13-16 October, 1992.

Stevens
Kenneth N. Stevens
(1924-2013)

Las palabras estarían representadas en el léxico mediante patrones de rasgos distintivos.

En la percepción el oyente busca los indicios acústicos o perceptivos de los rasgos distintivos y los compara con los patrones almacenados en la memoria.

up arrow

Modelos de procesado distribuido en paralelo (PDP, Parallel Distributed Processing)

Modelos de extracción de rasgos basados en redes neuronales.

Una red está formada por unidades de procesamiento interconectadas.

Las unidades se activan según la información que reciben de las unidades del nivel inferior a las que están conectadas y envían información a otras unidades del nivel superior a las que también están conectadas.

Cada unidad tiene su umbral de excitación y de inhibición.

El grado de excitación depende de la fuerza del estímulo.

Perceptron_Unitat_Klatt88.jpg

La unidad de procesamiento clasifica los patrones de activación de entrada.

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

El reconocimiento es el resultado de la combinación de la acción en paralelo de todas las unidades de la red.

El modelo TRACE

McClelland, J. L., y Elman, J. L. (1986). The TRACE model of speech perception. Cognitive Psychology, 18, 1-86. Consultado en https://pdfs.semanticscholar.org/a22c/d5f4f39b14a84a6ce0d4b7c150c5cf8e94ef.pdf

McClelland, J. L., y Elman, J. L. (1991). The TRACE model of speech perception. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 175-260). New York: The Acoustical Society of America. (Obra original publicada en 1986)

Primer nivel: detectores de rasgos fonéticos extraídos a partir de las propiedades espectrales de la señal acústica.

Segundo nivel: decisiones fonémicas en función de los rasgos fonéticos detectados.

Tercer nivel: detección de palabras en función de las unidades fonémicas detectadas.

Trace_Klatt88.jpg

McClelland, J. L., y Elman, J. L. (1986). The TRACE model of speech perception. Cognitive Psychology, 18, 1-86. Consultado en https://pdfs.semanticscholar.org/a22c/d5f4f39b14a84a6ce0d4b7c150c5cf8e94ef.pdf
McClelland, J. L., y Elman, J. L. (1991). The TRACE model of speech perception. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 175-260). New York: The Acoustical Society of America. (Obra original publicada en 1986)

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

“the unit for /ɡ/ has mutually excitatory connections with units for words containing /ɡ/, and has mutually inhibitory connections with units for other phonemes. When the activation of a unit exceeds some threshold activation value, it begins to influence the activation of other units via its outgoing connections; the strength of these signals depends on the degree of the sender’s activation. The state of the system at a given point in time represents the current status of various possible hypothesis about the input: information processing amounts to the evolution of that state over time. Throughout the course of processing, each unit is continually receiving input from other units, continually updating its activation on the basis of these inputs, and, if it is over threshold, it is continually sending excitatory and inhibitory signals to other units. This ‘interactive-activation’ process allows each hypothesis both to constrain and be constrained by other mutually consistent or inconsistent hypotheses” (p. 3).

McClelland, J. L., y Elman, J. L. (1986). The TRACE model of speech perception. Cognitive Psychology, 18, 1-86. Consultado en https://pdfs.semanticscholar.org/a22c/d5f4f39b14a84a6ce0d4b7c150c5cf8e94ef.pdf
McClelland, J. L., y Elman, J. L. (1991). The TRACE model of speech perception. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 175-260). New York: The Acoustical Society of America. (Obra original publicada en 1986)
Trace_Klatt88_2.jpg

McClelland, J. L., y Elman, J. L. (1986). The TRACE model of speech perception. Cognitive Psychology, 18, 1-86. Consultado en https://pdfs.semanticscholar.org/a22c/d5f4f39b14a84a6ce0d4b7c150c5cf8e94ef.pdf
McClelland, J. L., y Elman, J. L. (1991). The TRACE model of speech perception. En J. L. Miller, R. D. Kent, y B. S. Atal (Eds.), Papers in speech communication: Speech perception. (pp. 175-260). New York: The Acoustical Society of America. (Obra original publicada en 1986)

Klatt, D. H. (1988). Review of selected models of speech perception. En Speech Communication Group Working Papers 17. (pp. 201-62). Cambridge, MA: Research Laboratory of Electronics, Massachusetts Institute of Technology.
Klatt, D. H. (1989). Review of selected models of speech perception. En W. Marslen-Wilson (Ed.), Lexical representation and process. (pp. 169-226). Cambridge, MA: The MIT Press. (Obra original publicada en 1988)

up arrow

La teoría cuántica (Quantal Theory)

Stevens, K. N. (1989). On the quantal nature of speech. Journal of Phonetics, 17(1-2), 3-45.

Stevens, K. N. (1991). On the quantal nature of speech. En R. D. Kent, B. S. Atal, y J. L. Miller (Eds.), Papers in speech communication: Speech perception. (pp. 357-99). New York: The Acoustical Society of America. (Obra original publicada en 1989)

Stevens
Kenneth N. Stevens
(1924-2013)

Establece las relaciones entre las propiedades articulatorias, acústicas y auditivas.

En ciertos casos la configuración articulatoria puede modificarse sin variaciones importantes en el resultado acústico.

En ciertos casos, un pequeño cambio en la configuración articulatoria produce cambios importantes en la configuración acústica.

El mismo fenómeno sucede entre las características acústicas y la respuesta auditiva.

Teoria_Quantica_Acustica_Articulatoria.jpg

Stevens, K. N. (1989). On the quantal nature of speech. Journal of Phonetics, 17(1-2), 3-45.
Stevens, K. N. (1991). On the quantal nature of speech. En R. D. Kent, B. S. Atal, y J. L. Miller (Eds.), Papers in speech communication: Speech perception. (pp. 357-99). New York: The Acoustical Society of America. (Obra original publicada en 1989)

Si el valor de un parámetro acústico supera el nivel umbral, se produce un cambio en el nivel de la respuesta auditiva.

La relación entre características acústicas y auditivas no es continua, sino cuántica.

Teoria_Quantica_Acustica_Audicio.jpg

Stevens, K. N. (1989). On the quantal nature of speech. Journal of Phonetics, 17(1-2), 3-45.
Stevens, K. N. (1991). On the quantal nature of speech. En R. D. Kent, B. S. Atal, y J. L. Miller (Eds.), Papers in speech communication: Speech perception. (pp. 357-99). New York: The Acoustical Society of America. (Obra original publicada en 1989)

Discontinuidad entre las características acústicas y la respuesta auditiva.

Entre 800 Hz y 3000 Hz las fibras del nervio auditivo responden a la frecuencia a la que se encuentran los picos de los formantes vocálicos más que a la frecuencia característica de la parte correspondiente de la membrana basilar en la que se encuentran.

Por encima de 3000 Hz y con espectros de ruido, las fibras del nervio auditivo responden según la frecuencia característica de la parte correspondiente de la membrana basilar en la que se encuentran.

La diferencia entre los dos tipos de respuesta viene dada por la amplitud de la banda de los filtros (bandas críticas) del sistema auditivo.

De este modo se crea una discontinuidad en las respuestas del sistema auditivo a diferentes estímulos acústicos.

Teoria_Quantica_Audicio.jpg
“there are some articulatory states or configurations or gestures that give rise to well-defined patterns of auditory response in a human listener, such that these patterns are not strongly sensitive to small perturbations or inaccuracies in the articulation. These patterns are distinctive in the sense that if some articulatory parameter crosses over a threshold region there will be a significant change in the auditory response. . . . We suggest that this tendency for quantal relations between articulatory and acoustic parameters and between acoustic and auditory parameters is a principal factor shaping the inventory of articulatory states or gestures and their acoustic consequences that are used to signal distinctions in language” (p.3).

Stevens, K. N. (1989). On the quantal nature of speech. Journal of Phonetics, 17(1-2), 3-45.

Stevens, K. N. (1991). On the quantal nature of speech. En R. D. Kent, B. S. Atal, y J. L. Miller (Eds.), Papers in speech communication: Speech perception. (pp. 357-99). New York: The Acoustical Society of America. (Obra original publicada en 1989)
Stevens
Kenneth N. Stevens
(1924-2013)
up arrow

El modelo de la hiper- y la hipo-articulación (H&H Theory)

Lindblom, B. (1990). Explaining phonetic variation: A sketch of the H and H theory. En W. J. Hardcastle, y A. Marchal (Eds.), Speech production and speech modelling. (pp. 403-39). Dordrecht: Kluwer.

El objetivo de la comunicación es transmitir información del emisor al receptor mediante una onda sonora.

La comunicación se da en un contexto que condiciona el modo de producción del habla.

Contexto que dificulta la inteligibilidad → estilo hiperarticulado.

Contexto que permite predecir el mensaje o énfasis en el contacto → estilo hipoarticulado.

Problemas en la definición de la invarianza a distintos niveles:

Articulatorio:

Acústico:

Auditivo:

La invarianza debe definirse en función de la comprensión del mensaje por parte del oyente.

La percepción del habla es el resultado de una combinación entre la información contextual y la información presente en la señal acústica.

El comportamiento articulatorio se rige por la plasticidad –reorganización orientada hacia el oyente– y la economía –simplificación en beneficio del hablante–.

El comportamiento auditivo se rige por la información presente en la señal acústica modulada por la información existente en el contexto.

La variabilidad fonética es el resultado de la adaptación al intercambio de información entre el hablante y el oyente.

Para que el habla sea inteligible, la suma de la información explícita en la onda sonora y la información contextual debe alcanzar un cierto umbral.

Necesidad de un contraste suficiente entre las características de la señal para llegar a la discriminación de las unidades que permita la comprensión del mensaje.

Cuando la señal acústica es pobre (→ hipoarticulación) se requiere mucha información contextual.

Cuando la información contextual es pobre se necesita una señal acústica clara (→ hiperarticulación).

Hipoarticulación

Velocidad de elocución rápida.

Caracterizada por la presencia de fenómenos como la reducción vocálica o las elisiones de segmentos.

Hiperarticulación

Tipo de pronunciación que se emplearía, por ejemplo, para repetir una palabra que una persona no ha entendido en una conversación telefónica con ruidos de fondo.

../../fon_produccio/Variabilitat_adaptativa.jpg

Lindblom, B. (1987). Adaptive variability and absolute constancy in speech signals: Two themes in the quest for phonetic invariance. En ICPhS 1987. Proceedings of the 11th International Congress of Phonetic Sciences. Vol. 3. (pp. 9-18). Tallinn: Academy of Sciences of the Estonian S.S.R., Institute of Language and Literature.

Variabilidad adaptativa en el comportamiento del hablante.

La percepción del habla puede considerarse el resultado de la interacción entre la señal sonora y la situación comunicativa.

Ambas se complementan para que la transmisión de la información se realice del modo más eficiente posible.

up arrow

Modelos de percepción del habla

Modelos de percepción del habla


Modelos de percepción del habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: