Introducción a los corpus orales y escritos


Joaquim Llisterri

2 créditos, contenidos metodológicos, curso 1997-1998


Objetivos

El curso constituye una presentación general de los principios básicos que rigen el diseño y la constitución de corpus escritos y orales, y de los principales proyectos, iniciativas y estándares en este campo.


Contenidos

1. Los corpus escritos y orales

Definición y tipología de los corpus. Necesidades y aplicaciones. Principales iniciativas y estándares actuales.

2. Los corpus escritos

El desarrollo de los corpus escritos. Etapas en la constitución de un corpus escrito. Usos potenciales. Herramientas básicas para la explotación de corpus. Los principales proyectos actuales.

3. Los corpus orales

El desarrollo de los corpus orales. Etapas en la constitución de un corpus oral: diseño, adquisición de datos, segmentación, etiquetado, alineación, transcripción. Tipología de corpus orales: corpus para la investigación en fonética, corpus para las tecnologías del habla, corpus de lengua oral. Los principales proyectos actuales.

Evaluación

Los estudiantes deberán realizar un trabajo práctico de diseño, recogida o anotación/transcripción de corpus orales o escritos en el marco de los proyectos que se lleven a término en el Seminari de Filologia i Informàtica de la UAB.


Bibliografía fundamental

AARTS, J.- MEIJS, W. (Eds.) (1990) Theory and Practice in Corpus Linguistics. Amsterdam: Rodopi.

COLE, R. (Ed.) (1996) “Language Resources”, in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds.) Survey of the State of the Art in Human Language Technology. pp. 441-474.

LEECH, G. (1991) “The State of the Art in Corpus Linguistics” in AIJMER, K.- ALTENBERG, B. (Eds) English Corpus Linguistics. Sudies in Honour of Jan Svartvik. London: Longman. pp. 8-29.

LEECH, G.- FLIGELSTONE, S. (1992) “Computers and corpus analysis” in BUTLER, C.S. (Ed) (1992) Computers and Written Texts. Oxford: Basil Blackwell. pp. 115-140.

McENERY, T.- WILSON, A. (1996) Corpus Linguistics. Edinburgh: Edinburgh University Press (Edinburgh Textbooks in Empirical Linguistics).

SINCLAIR, J. (Ed) (1987) Looking Up, An Account of the COBUILD Project. London: Collins).


Introducción a los corpus orales y escritos (1997-1998)
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/corpus_97/intro_corpus_97.html
Last updated: 30/06/98

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.