La representación fonética suprasegmental de corpus orales


 Representación fonética suprasegmental de corpus orales


Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales

Los elementos suprasegmentales

Los elementos suprasegmentales

Problemas en la representación de los elementos suprasegmentales

Necesidad de abstracción para determinar:

Las categorías deben representarse mediante un sistema de notación.

Requisitos de un sistema de representación de los elementos suprasegmentales:

La representación de los elementos suprasegmentales puede realizarse a distintos niveles, según el grado de abstracción o la orientación teórica del investigador.

Independientemente del sistema, pueden definirse tres niveles de representación en lo que se refiere a la entonación:

up arrow

La transcripción de los elementos suprasegmentales mediante el Alfabeto Fonético Internacional (AFI/IPA, International Phonetic Alphabet)

El Alfabeto Fonético Internacional (AFI) ofrece un conjunto de símbolos para la representación de los elementos suprasegmentales.

Grupo de trabajo sobre categorías suprasegmentales (Kiel, 1989) surgido de la necesidad de representar las categorías suprasegmentales de un modo más adecuado, especialmente en lo que se refiere a la entonación.

El conjunto actual de símbolos del AFI para los elementos suprasegmentales permite transcribir, básicamente, el acento, la duración, las fronteras prosódicas, el tono y algunos aspectos globales de la entonación.

IPA

Elementos suprasegmentales

International Phonetic Association. (2015). The International Phonetic Alphabet (revised to 2015). International Phonetic Association. Consultado en https://www.internationalphoneticassociation.org/content/full-ipa-chart

IPA

Tonos y acentos de palabra

International Phonetic Association. (2015). The International Phonetic Alphabet (revised to 2015). International Phonetic Association. Consultado en https://www.internationalphoneticassociation.org/content/full-ipa-chart

up arrow

Sistemas de transcripción prosódica para el intercambio electrónico

Las propuestas de SAM

ESPRIT 1541 SAM (Speech Assessment Methods) (1987-1989)

Desarrollo de sistemas de transcripción prosódica compatibles con las necesidades de anotación de bases de datos en formato electrónico: PROSPA, SAMSINT, SAMPROSA.

PROSPA

Concebido por M. Selting y D. Gibbon para el análisis de la conversación y del discurso.

Basado en criterios auditivos.

Recoge únicamente los elementos necesarios para sus objetivos.

SAMSINT (SAM System for Intonation Transcription)

Transcripción de contornos melódicos en el interior de unidades entonativas.

Basado en INTSINT, con algunas modificaciones adicionales.

SAMPROSA (SAM Prosodic Alphabet)

Propuesto inicialmente por D. Gibbon y desarrollado por J. Wells.

Conjunto de caracteres correspondientes a códigos ASCII (American Standard Code for Information Interchange).

Permite la transcripción de:

Presenta rasgos característicos de la tradición británica de análisis de la entonación como la codificación de tonos nucleares, pero es adecuado para la transcripción prosódica de diversas lenguas.

SAMPROSA
Cuadro de símbolos de SAMPROSA

El sistema de representación del IPO (Center for Research on User-System Interaction, Eindhoven)

Teoría sobre la entonación basada en el modelado de contornos entonativos en forma de representaciones estilizadas perceptivamente equivalentes al contorno original.

Formalización de un sistema de representación de la curva melódica.

El sistema permite una representación de la curva melódica adecuada a la transcripción prosódica.

../../phonetics/fon_prosod/Anotacion_Garrido.jpg

Curva estilizada y anotada según el sistema de Garrido (1996, 2001) correspondiente a la oración “Una vez en el interior, los agentes encontraron a tres de los niños”, pronunciada por un locutor femenino.

Garrido, J. M. (1996). Modelling Spanish intonation for text-to-speech applications. PhD Thesis, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona. Consultado en http://hdl.handle.net/10803/4885

Garrido, J. M. (2001). La estructura de las curvas melódicas del español: Propuesta de modelización. Lingüística Española Actual, 23(2), 173-210.

INTSINT (International Transcription System for Intonation)

Características generales de INTSINT

El objetivo de INTSINT ( International Transcription System for Intonation) es proporcionar un sistema para la comparación interlingüística de sistemas prosódicos.

Desarrollado por Daniel Hirst en el marco de un proyecto de análisis automático de la entonación.

Baqué, L. y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en https://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf

Hirst, D., Di Cristo, A. y Espesser, R. (2000). Levels of representation and levels of analysis for the description of intonation systems. En M. Horne (Ed.), Prosody: Theory and experiment. Studies presented to Gösta Bruce. (pp. 51-88). Dordrecht: Kluwer. Consultado en http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.40.2187

Hirst, D. (2007). A Praat plugin for MOMEL and INTSINT with improved algorithms for modelling and coding intonation. En ICPhS 2007. Proceedings of the 16th International Congress of Phonetic Sciences. (pp. 1233-6). Saarbrücken, Germany, 6-10 August, 2007. Consultado en http://www.icphs2007.de/conference/Papers/1443/1443.pdf

Basado en la estilización de la curva melódica realizada a partir de una interpolación entre puntos en los que se produce un cambio significativo en el valor de la frecuencia fundamental (puntos de inflexión o target points).

Los puntos de inflexión –combinación de un valor temporal y un valor frecuencial– pueden codificarse automáticamente mediante los símbolos de INTSINT.

Se trata de un sistema para la representación simbólica –transcripción– de la entonación.

La transcripción mediante INTSINT

La transcripción requiere un proceso en tres etapas:

Cálculo de la curva de f0

MOMEL_Deteccion_F0.gif

Estilización de la curva de f0

Detección en la curva de f0 de un conjunto de puntos de inflexión que conservan la información macroprosódica original. La curva estilizada debe ser perceptivamente equivalente a la original.

MOMEL_PuntosInflexion_F0.gif

../../phonetics/fon_prosod/MOMEL_Estilizacion.jpg

Oscilograma (ventana superior) y curva melódica y estilizada (ventana inferior) correspondientes al enunciado “Una vez en el interior, los agentes encontraron a tres de los niños”, pronunciado por un locutor femenino.

Codificación

Anotación de la curva de f0 mediante los símbolos de INTSINT.

Representación mediante un alfabeto de símbolos –etiquetas– que convierte la curva estilizada en una secuencia de categorías discretas que pueden utilizarse para regenerar la curva original.

INTSINT_CodificacionPuntosInflexion.gif

Proceso implementado inicialmente en el programa MES (Motif Environement for Speech) constituido por dos módulos:

MOMEL (MOdelling MELody)

Representación de la melodía en INTSINT

Baqué, L. y Estruch, M. (2003). Modelo de Aix-en-Provence. En P. Prieto (Ed.), Teorías de la entonación. (pp. 123-53). Barcelona: Ariel. Consultado en https://sites.google.com/site/lorrainebaqueuab/publis/ModeloAix-en-ProvenceV3.pdf

Representación fonológica de la curva melódica, simbolizando los diferentes niveles tonales de la curva original.

INTSINT_Etiquetado.gif

../../phonetics/fon_prosod/Anotacion_INTSINT.jpg

Oscilograma (ventana superior), curva melódica original, curva estilizada (sistema MOMEL) y anotación INTSINT (ventana inferior) correspondientes al enunciado “Una vez en el interior, los agentes encontraron a tres de los niños”, pronunciado por un locutor femenino.

Representación de secuencias tonales:

Tonos absolutos

Perspectiva global en función del rango de variación tonal del hablante.

INTSINT_Top.gif T (Top) altura tonal máxima del locutor
INTSINT_Mid.gif M (Mid) etiqueta inicial correspondiente a un valor medio del locutor
INTSINT_Bottom.gif B (Bottom) altura tonal mínima del locutor

Tonos relativos

Punto de vista local en relación con la altura tonal de puntos de inflexión anteriores y posteriores.>

Tonos relativos iterativos

Puntos intermedios en secuencias ascendentes o descendentes.

INTSINT_Up.gif U (Up) punto en una secuencia ascendente
INTSINT_Down.gif D (Down) punto en una secuencia descendente
Tonos relativos no iterativos

Puntos de inflexión que no corresponden a tonos absolutos ni a puntos en secuencias.

INTSINT_Higher.gif H (Higher) punto más alto que los dos puntos adyacentes
INTSINT_Lower.gif L (Lower) punto más bajo que los dos puntos adyacentes
INTSINT_Same.gif S (Same) punto igual que su precedente

Aplicación de INTSINT

Modelado prosódico multilingüe.

Anotación prosódica de parte del corpus EUROM en francés, inglés, alemán, suceo y español en el proyecto LRE 62050 MULTEXT (Multilingual Text Tools and Corpora, 1994-1996).

Campione, E. y Véronis, J. (1998). A multilingual prosodic database. En ICSLP 1998. Proceedings of the 5th International Conference on Spoken Language Processing. Vol. 7. (pp. 3163-6). Sydney, Australia. 30 November - 4 December, 1998. Consultado en http://sites.univ-provence.fr/~veronis/pdf/1998icslp-database.pdf

Aplicación de INTSINT a niveles de análisis como el párrafo.

INTSINT, International Transcription System for Intonation

ToBI (Tone and Break Index)

Características generales de ToBI

Desarrollado para cubrir al mismo tiempo las necesidades de descripción fonética y de anotación de corpus adecuados al desarrollo de sistemas de tecnologías del habla.

Basado en el inglés americano.

Transcripción de patrones entonativos partiendo de un análisis de la curva melódica representada como evolución temporal de la frecuencia fundamental.

Uso de herramientas de análisis y etiquetado basadas en el programa Waves en una primera etapa. Actualmente se emplean programas como PitchWorks y existe la posibilidad de anotar siguiendo las convenciones de ToBI mediante el programa Praat utilizando scripts.

Gravano, A. (2008). ToBI annotation environment on Praat. ToBI annotation environments. New York: Spoken Language Processing Group, Department of Computer Science, Columbia University. Consultado en http://www1.cs.columbia.edu/~agus/tobi/tobi-praat/manual.php

Winters, S. (2010). Making text grids for ToBI labeling in Praat: A beginners' guide. Linguistics 411. Calgary: Department of Linguistics, University of Calgary. Consultado en http://www.basesproduced.com/441/TOBIlab/makingtextgrids.pdf

Convenciones para la anotación de textos representados ortográficamente.

Niveles de transcripción en ToBI

Representación ortográfica del enunciado

Nivel de índice de disyunción (break index)

Indicadores de límite que marcan las fronteras entre las unidades melódicas estableciendo cuatro grados de cohesión entre las mismas.

Nivel tonal

Dos niveles tonales:

Eventos tonales (pitch events) divididos en tonos de frase al principio y al final de las unidades melódicas.

Los tonos de frontera, alto y bajo, pueden presentar en español los contornos siguientes:

Acentos tonales (pitch accent) en la sílabas en las que se produce un movimiento de la frecuencia fundamental.

Para el español, se distinguen tres tipos de acentos tonales:

Nivel misceláneo

Incorpora los comentarios del transcriptor.

Para cada uno de los niveles de se define un conjunto de símbolos, alineados temporalmente con los fenómenos entonativos transcritos.

../../phonetics/fon_anal_acus/PitchWorks.gif

../../phonetics/fon_prosod/Anotacion_ToBI.jpg

Oscilograma, curva melódica y anotación mediante el sistema ToBI del enunciado “Una vez en el interior, los agentes encontraron a tres de los niños”, pronunciado por un locutor femenino.

Problemas y ventajas de ToBI

Problemas:

Ventajas:

ToBI

Guidelines for ToBI labelling (American English)
http://www.ling.ohio-state.edu/~tobi/ame_tobi/annotation_conventions.html
http://www.ling.ohio-state.edu/research/phonetics/E_ToBI/singer_tobi.html
http://www.ling.ohio-state.edu/~tobi/ame_tobi/labelling_guide_v3.pdf

Spanish ToBI

Catalan ToBI

up arrow

 Representación fonética de los elementos suprasegmentales en los corpus orales


La representación fonética suprasegmental de corpus orales
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: