La representación fonética de corpus orales



La representación fonética

La representación fonética de un corpus oral supone pasar de una señal continua a una representación discreta y simbólica como es la transcripción fonética.

Discreta Continua
Representación ortográfica

Transcripción fonética
Señal sonora

La señala sonora y la transcripción fonética recogen la variabilidad, mientras que la representación ortográfica no ofrece información sobre la variabilidad propia del habla.

Variable Invariable
Señal sonora

Transcripción fonética
Representación ortográfica

La transcripción fonética suele realizarse conjuntamente con otras dos operaciones:

Dificultades y limitaciones de la transcripción fonética

up arrow

Niveles de representación y etiquetado fonético

Las propuestas del proyecto SAM (Speech Assessment Methodology)

Niveles de etiquetado fonético de un corpus oral.

Barry, W. J., y Fourcin, A. J. (1992). Levels of labelling. Computer Speech & Language, 6(1), 1-14. doi:10.1016/0885-2308(92)90041-2

Propiedades acústicas presentes en la señal sonora.

Propiedades de los segmentos en términos de categorías fonéticas (oclusión, fricción, nasalización, sonoridad, etc.).

Caracterización de los segmentos utilizando los símbolos del Alfabeto Fonético Internacional o sus equivalentes computacionales.

Se transcriben únicamente los elementos funcionalmente distintivos que se encuentran en la palabra pronunciada aisladamente en estilo cuidado (citation form).

Se utilizan los símbolos correspondientes a los elementos fonológicos en una lengua dada para transcribir realizaciones alofónicas condicionadas por el contexto.

El etiquetado prosódico se considera de forma independiente.

Las propuestas del proyecto EAGLES (Expert Advisory Group on Language Engineering Standards)

La propuesta del Grupo de Trabajo sobre Lengua Oral (Spoken Language Working Group) de EAGLES

Se utiliza la representación ortográfica convencional.

Se representa la forma de pronunciación aislada de las palabras en estilo cuidado.

Se utilizan los símbolos que representan elementos fonológicos en una lengua dada, pero se transcriben aquellos fenómenos predecibles propios de la fonética sintáctica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).

Se basa en una representación alofónica de las realizaciones fonéticas de los hablantes. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).

Se distinguen características acústicas de los segmentos observables en una representación de la onda sonora.

Representado en términos de parámetros acústicos o articulatorios.

Sonidos de naturaleza comunicativa o introducidos por el hablante; información paralingüística; ruidos externos a la grabación.

La propuesta del Subgrupo de Trabajo sobre Textos Orales (Spoken Texts Subgroup)

Representación ortográfica convencional del texto.

Representación fonológica de las palabras en su forma canónica. El sistema de representación recomendado es SAMPA (SAM Phonetic Alphabet).

Representación simbólica discreta de la realización del enunciado tal como es percibido por el transcriptor. El sistema de representación recomendado es X-SAMPA (Extended SAM Phonetic Alphabet).

Las formas canónicas y la transcripción fonotípica

Formas canónicas (citation form):

Transcripción fonotípica:

Tipos de transcripción fonética

Niveles de etiquetado de corpus orales

up arrow

La representación fonética de los elementos segmentales

La representación fonética de los elementos segmentales

up arrow

La representación fonética de los elementos suprasegmentales

La representación fonética de los elementos suprasegmentales

up arrow

Etiquetado fonético de corpus orales

Transcribir y etiquetar fonéticamente un corpus oral representa un considerable esfuerzo, tanto en términos de tiempo como de recursos económicos.

Etiquetado manual

El etiquetado manual de un corpus requiere el desarrollo de convenciones detalladas para asegurar la coherencia entre diversos transcriptores.

Kiesling, S., Diller, L., y Raymond, W. D. (2006). The Variation in Conversation (ViC) project: Creation of the Buckeye corpus of conversational speech. Columbus, OH: Department of Pyschology, Ohio State University. Consultado en http://buckeyecorpus.osu.edu/BuckeyeCorpusmanual.pdf

Lander, T. (1997). The CSLU labeling guide. Beaverton, OR: Center for Spoken Language Understanding, Oregon Graduate Institute. Consultado en http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.163.165&rep=rep1&type=pdf

Criterios de etiquetado de corpus orales

El etiquetado manual de un corpus requiere el establecimiento de un procedimiento de validación de la transcripción y del etiquetado.

Un procedimiento habitual para validar los criterios de etiquetado y su aplicación es el cálculo del grado de acuerdo entre diferentes transcriptores.

Medida del grado de acuerdo entre transcriptores: Kappa (κ) de Cohen.

Validación del etiquetado de corpus orales

Etiquetado manual de corpus orales mediante Praat

Etiquetado semi-automático o automático

La transcripción de formas canónicas y la transcripción fonotípica pueden obtenerse automáticamente a partir de la representación ortográfica si se dispone de una herramienta de transcripción fonética automática.

El etiquetado automático requiere una serie de operaciones:

Goldman, J. P. (2012). EasyAlign: Phonetic alignment with Praat. [Fonetiks] @ UniGe. Some phonetics at University of Geneva [Programa informático]. Genève: Département de Linguistique, Université de Genève. Consultado en http://latlntic.unige.ch/phonetique/easyalign.php

Goldman, J. P. (2011). EasyAlign: An automatic phonetic alignment tool under Praat. En Interspeech 2011. Proceedings of the 12th Annual Conference of the International Speech Communication Association. Florence, Italy. 28-21 August, 2011. Consultado en http://latlcui.unige.ch/phonetique/easyalign/goldman_interspeech2011_easyalign.pdf

Goldman, J.-P., y Schwab, S. (2014). EasyAlign Spanish: an (semi-)automatic segmentation tool under Praat. En Y. Congosto, M. L. Montero, y A. Salvador (Eds.), Fonética experimental, educación superior e investigación (Vol. 1, pp. 629-640). Madrid: Arco/Libros. Consultado en http://latlcui.unige.ch/phonetique/easyalign/GoldmanSchwab-EasyAlignSpanish-5thCFE-2011.pdf

Herramientas para el etiquetado de corpus orales

up arrow
La representación fonética de corpus orales
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: