La representación fonética suprasegmental de corpus orales


 Representación fonética suprasegmental de corpus orales


Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales

Los elementos suprasegmentales

❯ Los elementos suprasegmentales

tornar al principi

Problemas en la representación de los elementos suprasegmentales

La representación (o transcripción) de los elementos suprasegmentales requiere realizar un proceso de abstracción para determinar:

Las categorías lingüísticas deben representarse mediante un sistema de notación.

tornar al principi

Requisitos de un sistema de notación de los elementos suprasegmentales:

La representación de los elementos suprasegmentales puede realizarse en distintos niveles, según el grado de abstracción o la orientación teórica del investigador.

Independientemente del sistema, pueden definirse tres niveles de representación en lo que se refiere a la entonación:

tornar al principi

La transcripción de los elementos suprasegmentales mediante el Alfabeto Fonético Internacional

El Alfabeto Fonético Internacional (AFI/IPA, International Phonetic Alphabet) ofrece un conjunto de símbolos para la representación de los elementos suprasegmentales.

Revisión del Alfabeto Fonético Internacional (Kiel, Alemania, del 18 al 21 de agosto de 1989): grupo de trabajo sobre categorías suprasegmentales surgido de la necesidad de representar los elementos suprasegmentales de un modo más adecuado, especialmente en lo que se refiere a la entonación.

El conjunto actual de símbolos del AFI para los elementos suprasegmentales permite transcribir, básicamente, el acento, la duración, las fronteras prosódicas, el tono y algunos aspectos globales de la entonación.

IPA

Elementos suprasegmentales

International Phonetic Association. (2015). Full IPA chart. https://www.internationalphoneticassociation.org/content/full-ipa-chart

IPA

Tonos y acentos de palabra

International Phonetic Association. (2015). Full IPA chart. https://www.internationalphoneticassociation.org/content/full-ipa-chart

tornar al principi

Sistemas de transcripción prosódica para el intercambio electrónico

Las propuestas de SAM

ESPRIT 1541 SAM (Speech Assessment Methods) (1987-1989)

Desarrollo de sistemas de transcripción prosódica compatibles con las necesidades de anotación de bases de datos en formato electrónico: PROSPA, SAMSINT, SAMPROSA.

PROSPA

Concebido por Margret Selting y Dafydd Gibbon para el análisis de la conversación y del discurso.

Basado en criterios auditivos.

Recoge únicamente los elementos necesarios para los objetivos de la transcripción.

SAMSINT (SAM System for Intonation Transcription)

Transcripción de contornos melódicos en el interior de unidades entonativas.

Basado en INTSINT, con algunas modificaciones adicionales.

SAMPROSA (SAM Prosodic Alphabet)

Propuesto inicialmente por Dafydd Gibbon y desarrollado por John Wells.

Conjunto de caracteres correspondientes a códigos ASCII (American Standard Code for Information Interchange).

Permite la transcripción de:

Presenta rasgos característicos de la tradición británica de análisis de la entonación como la codificación de tonos nucleares, pero es adecuado para la transcripción prosódica de diversas lenguas.

SAMPROSA
Cuadro de símbolos de SAMPROSA

tornar al principi

El sistema de representación del IPO

’t Hart, J., Collier, R. y Cohen, A. (1990). A perceptual study of intonation: An experimental-phonetic approach to speech melody. Cambridge University Press. https://doi.org/10.1017/CBO9780511627743

René Collier
René Collier
(Fuente de la imagen: Haepers, K. y Maes, L. (2003). Germanist werd hoogleraar industrial design: René Collier (promotie 1967). Mededelingenblad van de Leuvense Germanisten, 16. https://alum.kuleuven.be/germaanse/mededelingenblad/collier.htm)
Antonie Cohen
Antonie Cohen (1922–1996)
(Fuente de la imagen: Nooteboom, S. G. (1996). Antonie Cohen. Phonetica, 53, 230–232. https://doi.org/10.1159/000262203)
Garrido, J. M. (2003). La escuela holandesa: el modelo IPO. En P. Prieto (Ed.), Teorías de la entonación (pp. 97–122). Ariel.

(Fuente de la imagen: Juan María Garrido Almiñana. (s. f.). https://sites.google.com/site/juanmariagarrido/)

Desarrollado desde principios de los años 60 el Institute for Perception Research (IPO, Instituut voor Perceptie Onderzoek) en Eindhoven (Países Bajos) por Johan ’t Hart, Antonie Cohen y René Collier.

Teoría sobre la entonación basada en el modelado de contornos entonativos en forma de representaciones estilizadas perceptivamente equivalentes al contorno original.

Formalización de un sistema de representación de la curva melódica.

El sistema permite una representación de la curva melódica adecuada a la transcripción prosódica.

../../phonetics/fon_prosod/Anotacion_Garrido.jpg

Curva estilizada y anotada según el sistema propuesto por Garrido (1996, 2001) correspondiente a la oración «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciada por un locutor femenino.

Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007

Garrido, J. M. (1996). Modelling Spanish intonation for text-to-speech applications [Tesis doctoral, Universitat Autònoma de Barcelona]. TDX, Tesis Doctorals en Xarxa. http://hdl.handle.net/10803/4885

Garrido, J. M. (2001). La estructura de las curvas melódicas del español: Propuesta de modelización. Lingüística Española Actual, 23(2), 173–210.

tornar al principi

INTSINT (International Transcription System for Intonation)

Hirst, D., Di Cristo, A. y Espesser, R. (2000). Levels of representation and levels of analysis for the description of intonation systems. En M. Horne (Ed.), Prosody: Theory and experiment. Studies presented to Gösta Bruce (pp. 51–88). Kluwer. https://doi.org/10.1007/978-94-015-9413-4_4

Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En J. Trouvain y W. J. Barry (Eds.), 16th International Congress of Phonetic Sciences. Saarbrücken, Germany, 6-10 August, 2007 (pp. 1233–1236). http://www.icphs2007.de/conference/Papers/1443/index.html

(Fuente de la imagen: Hirst, D. (s. f.). Daniel Hirst [Perfil en Google Scholar]. Google Scholar. Consultado el 9 de octubre de 2020, en https://scholar.google.com/citations?user=OEgFhrsAAAAJ)
Baqué, L. y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación (pp. 123–153). Ariel. https://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf

(Fuente de la imagen: Baqué, L. (s. f.). Papers [Perfil en Academia.edu]. Academia.edu. Consultado el 9 de octubre de 2020, en https://uab.academia.edu/LorraineBaqué)
(Fuente de la imagen: Estruch, M. (s. f.). Mònica Estruch Axmacher [Perfil en LinkedIn]. LinkedIn. Consultado el 9 de octubre de 2020, en https://www.linkedin.com/in/mònica-estruch-axmacher-9636a589/)

Características generales de INTSINT

El objetivo de INTSINT ( International Transcription System for Intonation) es proporcionar un sistema para la comparación interlingüística de sistemas prosódicos.

Desarrollado por Daniel Hirst en el marco de un proyecto de análisis automático de la entonación.

Basado en la estilización de la curva melódica realizada a partir de una interpolación entre puntos en los que se produce un cambio significativo en el valor de la frecuencia fundamental (puntos de inflexión o target points).

Los puntos de inflexión —combinación de un valor temporal y un valor frecuencial— pueden codificarse automáticamente mediante los símbolos de INTSINT.

Se trata de un sistema para la representación simbólica —transcripción— de la entonación.

La transcripción mediante INTSINT

La transcripción requiere un proceso en tres etapas:

Cálculo de la curva de f0

MOMEL_Deteccion_F0.gif

Curva melódica detectada mediante el sistema MOMEL.

Estilización de la curva de f0

Detección en la curva de f0 de un conjunto de puntos de inflexión que conservan la información macroprosódica original. La curva estilizada debe ser perceptivamente equivalente a la original.

MOMEL_PuntosInflexion_F0.gif

Curva melódica original (en violeta) y curva melódica estilizada (en azul) mediante el sistema MOMEL. Los círculos azules corresponden a los puntos de inflexión empleados para estilizar la curva.

../../phonetics/fon_prosod/MOMEL_Estilizacion.jpg

Oscilograma (ventana superior) y curva melódica natural —en negro— y estilizada —en azul— (ventana inferior) correspondientes al enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino. Los círculos azules corresponden a los puntos de inflexión empleados para estilizar la curva.

Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007

Codificación

Anotación de la curva de f0 mediante los símbolos de INTSINT.

Representación mediante un alfabeto de símbolos (etiquetas) que convierte la curva estilizada en una secuencia de categorías discretas que pueden utilizarse para regenerar la curva original.

INTSINT_CodificacionPuntosInflexion.gif

Curva melódica natural —en violeta— y curva estilizada —en azul— con los puntos de inflexión marcados mediante círculos azules (ventana superior) y etiquetado mediante INTSINT (ventana inferior) del enunciado «No disposes d’un espai a part per a servir-lo».

Proceso implementado inicialmente en el programa MES (Motif Environement for Speech) constituido por dos módulos:

❯ MOMEL (MOdelling MELody)

Representación de la melodía en INTSINT

Representación fonológica de la curva melódica, simbolizando los diferentes niveles tonales de la curva original.

INTSINT_Etiquetado.gif

Curva melódica original —en negro—, curva estilizada y puntos de inflexión —en azul— utilizando el sistema MOMEL y anotación mediante INTSINT (ventana superior) y oscilograma y anotación mediante INTSINT (ventana inferior) realizada con el programa Phonédit.

../../phonetics/fon_prosod/Anotacion_INTSINT.jpg

Oscilograma (ventana superior), curva melódica original —en negro—, curva estilizada con puntos de inflexión —en azul— utilizando el sistema MOMEL y anotación mediante INTSINT (ventana inferior) correspondientes al enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino.

Estruch, M., Garrido, J. M., Llisterri, J. y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. Revista de Lingüística Teórica y Aplicada, 45(2), 59–87. https://doi.org/10.4067/S0718-48832007000200007

Representación de secuencias tonales mediante INTSINT:

Tonos absolutos

Perspectiva global en función del rango de variación tonal del hablante.

INTSINT_Top.gif T (Top) altura tonal máxima del locutor
INTSINT_Mid.gif M (Mid) etiqueta inicial correspondiente a un valor medio del locutor
INTSINT_Bottom.gif B (Bottom) altura tonal mínima del locutor

Tonos relativos

Punto de vista local en relación con la altura tonal de puntos de inflexión anteriores y posteriores.>

Tonos relativos iterativos

Puntos intermedios en secuencias ascendentes o descendentes.

INTSINT_Up.gif U (Up) punto en una secuencia ascendente
INTSINT_Down.gif D (Down) punto en una secuencia descendente
Tonos relativos no iterativos

Puntos de inflexión que no corresponden a tonos absolutos ni a puntos en secuencias.

INTSINT_Higher.gif H (Higher) punto más alto que los dos puntos adyacentes
INTSINT_Lower.gif L (Lower) punto más bajo que los dos puntos adyacentes
INTSINT_Same.gif S (Same) punto igual que su precedente

Aplicación de INTSINT

Modelado prosódico multilingüe.

Campione, E. y Véronis, J. (1998). A multilingual prosodic database. The 5th International Conference on Spoken Language Processing, incorporating the 7th Australian International Speech Science and Technology Conference. Sydney Convention Centre, Sydney, Australia, 30th November - 4th December 1998 (Paper 0844). ISCA Archive. https://www.isca-speech.org/archive/icslp_1998/i98_0844.html

(Fuente de la imagen: Campione, E. (s. f.). Estelle Campione-Veronis [Perfil en LinkedIn]. LinkedIn. Consultado el 10 de octubre de 2020, en https://www.linkedin.com/in/estelle-campione-veronis-9b65b7a4/)

Jean Véronis (1955–2013)
(Fuente de la imagen: Aixtal – Obra personal, CC BY-SA 3.0, Enlace)

Anotación prosódica de parte del corpus EUROM en francés, inglés, alemán, suceo y español en el proyecto LRE 62050 MULTEXT (Multilingual Text Tools and Corpora, 1994-1996).

INTSINT, International Transcription System for Intonation

tornar al principi

ToBI (Tone and Break Index)

Características generales de ToBI

Desarrollado en el marco del modelo métrico-autosegmental para contar con un sistema de transcripción para la descripción fonológica de las lenguas y para anotar corpus adecuados al desarrollo de sistemas de tecnologías del habla.

Basado en el inglés americano y desarrollado posteriormente para otras lenguas.

Transcripción de patrones entonativos partiendo de un análisis de la curva melódica representada como evolución temporal de la frecuencia fundamental.

Uso de herramientas de análisis y etiquetado basadas en los programas Waves y PitchWorks en una primera etapa. Actualmente se emplean muy a menudo scripts diseñados para el programa Praat.

Gravano, A. (2017, 2 de febrero). ToBI annotation environment on Praat. ToBI Annotation Environments. http://www1.cs.columbia.edu/~agus/tobi/tobi-praat/manual.php

Elvira, W. y Garrido, J. M. (2018, 26 de noviembre). FonetiToBI (Versión 1.0) [Script de Praat]. GitHub. https://github.com/wendyelviragarcia/FonetiToBI

Se han desarrollado también convenciones para anotar la representación ortográfica.

Niveles de transcripción en ToBI

Representación ortográfica del enunciado

Nivel de índice de disyunción (break index)

Indicadores de límite que marcan las fronteras entre las unidades melódicas estableciendo cuatro grados de cohesión entre las mismas.

Nivel tonal

Dos niveles tonales:

Eventos tonales (pitch events) divididos en tonos de frase al principio y al final de las unidades melódicas.

Los tonos de frontera, alto y bajo, pueden presentar en español los contornos siguientes:

Acentos tonales (pitch accent) en la sílabas en las que se produce un movimiento de la frecuencia fundamental.

Para el español, se distinguen tres tipos de acentos tonales:

Nivel misceláneo

Incorpora los comentarios del transcriptor.

Para cada uno de los niveles de se define un conjunto de símbolos, alineados temporalmente con los fenómenos entonativos transcritos.

../../phonetics/fon_anal_acus/PitchWorks.gif

Anotación mediante el sistema ToBI (tonos, palabras, índices de disyunción y comentarios), oscilograma, curva de intensidad y curva melódica del enunciado «million times it’s from Mary’s mother»

../../phonetics/fon_prosod/Anotacion_ToBI.jpg

Oscilograma (ventana superior), curva melódica (ventana inferior) y anotación mediante el sistema ToBI del enunciado «Una vez en el interior, los agentes encontraron a tres de los niños», pronunciado por un locutor femenino.

Aguilar, L., de la Mota, C. y Prieto, P. (2009). Sp_ToBI training materials. http://prosodia.upf.edu/sp_tobi/en/index.php

Aguilar, L., de la Mota, C. y Prieto, P. (2009–2011). Cat_ToBI training materials. http://prosodia.upf.edu/cat_tobi/en/index.php

tornar al principi

 Representación fonética de los elementos suprasegmentales en los corpus orales


La representación fonética suprasegmental de corpus orales
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Darrera actualització: