La representación fonética suprasegmental de corpus orales
❯ Los elementos suprasegmentales
La representación (o transcripción) de los elementos suprasegmentales requiere realizar un proceso de abstracción para determinar:
Las categorías lingüísticas deben representarse mediante un sistema de notación.
La representación de los elementos suprasegmentales puede realizarse en distintos niveles, según el grado de abstracción o la orientación teórica del investigador.
Independientemente del sistema, pueden definirse tres niveles de representación en lo que se refiere a la entonación:
El Alfabeto Fonético Internacional (AFI/IPA, International Phonetic Alphabet) ofrece un conjunto de símbolos para la representación de los elementos suprasegmentales.
Revisión del Alfabeto Fonético Internacional (Kiel, Alemania, del 18 al 21 de agosto de 1989): grupo de trabajo sobre categorías suprasegmentales surgido de la necesidad de representar los elementos suprasegmentales de un modo más adecuado, especialmente en lo que se refiere a la entonación.
El conjunto actual de símbolos del AFI para los elementos suprasegmentales permite transcribir, básicamente, el acento, la duración, las fronteras prosódicas, el tono y algunos aspectos globales de la entonación.
Elementos suprasegmentales
International Phonetic Association. (2015). Full IPA chart. https://www.internationalphoneticassociation.org/content/full-ipa-chart
Tonos y acentos de palabra
International Phonetic Association. (2015). Full IPA chart. https://www.internationalphoneticassociation.org/content/full-ipa-chart
ESPRIT 1541 SAM (Speech Assessment Methods) (1987-1989)
Desarrollo de sistemas de transcripción prosódica compatibles con las necesidades de anotación de bases de datos en formato electrónico: PROSPA, SAMSINT, SAMPROSA.
Concebido por Margret Selting y Dafydd Gibbon para el análisis de la conversación y del discurso.
Basado en criterios auditivos.
Recoge únicamente los elementos necesarios para los objetivos de la transcripción.
Transcripción de contornos melódicos en el interior de unidades entonativas.
Basado en INTSINT, con algunas modificaciones adicionales.
Propuesto inicialmente por Dafydd Gibbon y desarrollado por John Wells.
Conjunto de caracteres correspondientes a códigos ASCII (American Standard Code for Information Interchange).
Permite la transcripción de:
Presenta rasgos característicos de la tradición británica de análisis de la entonación como la codificación de tonos nucleares, pero es adecuado para la transcripción prosódica de diversas lenguas.
SAMPROSA
Cuadro de símbolos de SAMPROSA
![]() René Collier (Fuente de la imagen: Haepers, K. y Maes, L. (2003). Germanist werd hoogleraar industrial design: René Collier (promotie 1967). Mededelingenblad van de Leuvense Germanisten, 16. https://alum.kuleuven.be/germaanse/mededelingenblad/collier.htm)
|
(Fuente de la imagen: Nooteboom, S. G. (1996). Antonie Cohen. Phonetica, 53, 230–232. https://doi.org/10.1159/000262203)
|
(Fuente de la imagen: Juan María Garrido Almiñana. (s. f.). https://sites.google.com/site/juanmariagarrido/)
|
Desarrollado desde principios de los años 60 el Institute for Perception Research (IPO, Instituut voor Perceptie Onderzoek) en Eindhoven (Países Bajos) por Johan ’t Hart, Antonie Cohen y René Collier.
Teoría sobre la entonación basada en el modelado de contornos entonativos en forma de representaciones estilizadas perceptivamente equivalentes al contorno original.
Formalización de un sistema de representación de la curva melódica.
El sistema permite una representación de la curva melódica adecuada a la transcripción prosódica.
Curva estilizada y anotada según el sistema propuesto por Garrido (1996, 2001) correspondiente a la oración «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciada por un locutor femenino.
Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007
Garrido, J. M. (1996). Modelling Spanish intonation for text-to-speech applications [Tesis doctoral, Universitat Autònoma de Barcelona]. TDX, Tesis Doctorals en Xarxa. http://hdl.handle.net/10803/4885
Garrido, J. M. (2001). La estructura de las curvas melódicas del español: Propuesta de modelización. Lingüística Española Actual, 23(2), 173–210.
(Fuente de la imagen: Hirst, D. (s. f.). Daniel Hirst [Perfil en Google Scholar]. Google Scholar. Consultado el 9 de octubre de 2020, en https://scholar.google.com/citations?user=OEgFhrsAAAAJ)
|
(Fuente de la imagen: Baqué, L. (s. f.). Papers [Perfil en Academia.edu]. Academia.edu. Consultado el 9 de octubre de 2020, en https://uab.academia.edu/LorraineBaqué)
|
(Fuente de la imagen: Estruch, M. (s. f.). Mònica Estruch Axmacher [Perfil en LinkedIn]. LinkedIn. Consultado el 9 de octubre de 2020, en https://www.linkedin.com/in/mònica-estruch-axmacher-9636a589/)
|
El objetivo de INTSINT ( International Transcription System for Intonation) es proporcionar un sistema para la comparación interlingüística de sistemas prosódicos.
Desarrollado por Daniel Hirst en el marco de un proyecto de análisis automático de la entonación.
Basado en la estilización de la curva melódica realizada a partir de una interpolación entre puntos en los que se produce un cambio significativo en el valor de la frecuencia fundamental (puntos de inflexión o target points).
Los puntos de inflexión —combinación de un valor temporal y un valor frecuencial— pueden codificarse automáticamente mediante los símbolos de INTSINT.
Se trata de un sistema para la representación simbólica —transcripción— de la entonación.
La transcripción requiere un proceso en tres etapas:
Curva melódica detectada mediante el sistema MOMEL.
Detección en la curva de f0 de un conjunto de puntos de inflexión que conservan la información macroprosódica original. La curva estilizada debe ser perceptivamente equivalente a la original.
Curva melódica original (en violeta) y curva melódica estilizada (en azul) mediante el sistema MOMEL. Los círculos azules corresponden a los puntos de inflexión empleados para estilizar la curva.
Oscilograma (ventana superior) y curva melódica natural —en negro— y estilizada —en azul— (ventana inferior) correspondientes al enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino. Los círculos azules corresponden a los puntos de inflexión empleados para estilizar la curva.
Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007
Anotación de la curva de f0 mediante los símbolos de INTSINT.
Representación mediante un alfabeto de símbolos (etiquetas) que convierte la curva estilizada en una secuencia de categorías discretas que pueden utilizarse para regenerar la curva original.
Curva melódica natural —en violeta— y curva estilizada —en azul— con los puntos de inflexión marcados mediante círculos azules (ventana superior) y etiquetado mediante INTSINT (ventana inferior) del enunciado «No disposes d’un espai a part per a servir-lo».
Proceso implementado inicialmente en el programa MES (Motif Environement for Speech) constituido por dos módulos:
Representación fonológica de la curva melódica, simbolizando los diferentes niveles tonales de la curva original.
Curva melódica original —en negro—, curva estilizada y puntos de inflexión —en azul— utilizando el sistema MOMEL y anotación mediante INTSINT (ventana superior) y oscilograma y anotación mediante INTSINT (ventana inferior) realizada con el programa Phonédit.
Oscilograma (ventana superior), curva melódica original —en negro—, curva estilizada con puntos de inflexión —en azul— utilizando el sistema MOMEL y anotación mediante INTSINT (ventana inferior) correspondientes al enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino.
Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007
Representación de secuencias tonales mediante INTSINT:
Perspectiva global en función del rango de variación tonal del hablante.
![]() |
T (Top) | altura tonal máxima del locutor |
![]() |
M (Mid) | etiqueta inicial correspondiente a un valor medio del locutor |
![]() |
B (Bottom) | altura tonal mínima del locutor |
Punto de vista local en relación con la altura tonal de puntos de inflexión anteriores y posteriores.>
Puntos intermedios en secuencias ascendentes o descendentes.
![]() |
U (Up) | punto en una secuencia ascendente |
![]() |
D (Down) | punto en una secuencia descendente |
Puntos de inflexión que no corresponden a tonos absolutos ni a puntos en secuencias.
![]() |
H (Higher) | punto más alto que los dos puntos adyacentes |
![]() |
L (Lower) | punto más bajo que los dos puntos adyacentes |
![]() |
S (Same) | punto igual que su precedente |
Modelado prosódico multilingüe.
(Fuente de la imagen: Campione, E. (s. f.). Estelle Campione-Veronis [Perfil en LinkedIn]. LinkedIn. Consultado el 10 de octubre de 2020, en https://www.linkedin.com/in/estelle-campione-veronis-9b65b7a4/)
|
Anotación prosódica de parte del corpus EUROM en francés, inglés, alemán, suceo y español en el proyecto LRE 62050 MULTEXT (Multilingual Text Tools and Corpora, 1994-1996).
INTSINT, International Transcription System for Intonation
Desarrollado en el marco del modelo métrico-autosegmental para contar con un sistema de transcripción para la descripción fonológica de las lenguas y para anotar corpus adecuados al desarrollo de sistemas de tecnologías del habla.
Basado en el inglés americano y desarrollado posteriormente para otras lenguas.
Transcripción de patrones entonativos partiendo de un análisis de la curva melódica representada como evolución temporal de la frecuencia fundamental.
Uso de herramientas de análisis y etiquetado basadas en los programas Waves y PitchWorks en una primera etapa. Actualmente se emplean muy a menudo scripts diseñados para el programa Praat.
Gravano, A. (2017, 2 de febrero). ToBI annotation environment on Praat. ToBI Annotation Environments. http://www1.cs.columbia.edu/~agus/tobi/tobi-praat/manual.php
Elvira, W. y Garrido, J. M. (2018, 26 de noviembre). FonetiToBI (Versión 1.0) [Script de Praat]. GitHub. https://github.com/wendyelviragarcia/FonetiToBI
Se han desarrollado también convenciones para anotar la representación ortográfica.
Indicadores de límite que marcan las fronteras entre las unidades melódicas estableciendo cuatro grados de cohesión entre las mismas.
Dos niveles tonales:
Eventos tonales (pitch events) divididos en tonos de frase al principio y al final de las unidades melódicas.
Los tonos de frontera, alto y bajo, pueden presentar en español los contornos siguientes:
Acentos tonales (pitch accent) en la sílabas en las que se produce un movimiento de la frecuencia fundamental.
Para el español, se distinguen tres tipos de acentos tonales:
Incorpora los comentarios del transcriptor.
Para cada uno de los niveles de se define un conjunto de símbolos, alineados temporalmente con los fenómenos entonativos transcritos.
Anotación mediante el sistema ToBI (tonos, palabras, índices de disyunción y comentarios), oscilograma, curva de intensidad y curva melódica del enunciado «million times it’s from Mary’s mother»
Oscilograma (ventana superior), curva melódica (ventana inferior) y anotación mediante el sistema ToBI del enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino.
Aguilar, L., de la Mota, C. y Prieto, P. (2009). Sp_ToBI training materials. http://prosodia.upf.edu/sp_tobi/en/index.php
Aguilar, L., de la Mota, C. y Prieto, P. (2009–2011). Cat_ToBI training materials. http://prosodia.upf.edu/cat_tobi/en/index.php
Representación fonética de los elementos suprasegmentales en los corpus orales