Diseño, constitución y tratamiento de corpus orales y escritos en lengua española

Presentación, bibliografía básica y evaluación

La lingüística de corpus

El concepto de corpus

La lingüística de corpus

Manuales de lingüística de corpus

Actas de congresos y compilaciones

Publicaciones periódicas

Anotación de corpus escritos

Codificación de corpus escritos

Corpus escritos y corpus orales

Los corpus escritos

El texto oral

El desarrollo de los corpus orales

Corpus orales (speech corpora) y corpus de lengua oral (spoken language corpora)

Los corpus de lengua hablada

Etapas en la constitución de los corpus de lengua hablada

Estándares en corpus de lengua hablada

Aplicaciones de los corpus de lengua hablada

Aplicaciones de los corpus de lengua hablada

El diseño de corpus

La selección de los materiales del corpus

La selección de los informantes

Corpus de lengua oral

Criterios de diseño derivados del análisis del discurso y del análisis de la conversación

Corpus de conversaciones coloquiales del grupo Val.Es.Co

Criterios de diseño derivados de la sociolingüística

Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico

PRESEEA, Proyecto para el Estudio Sociolingüístico del Español del España y de América

Criterios de diseño derivados de la dialectología

Corpus de referencia

Corpus Oral de Referencia del Español Contemporáneo

Subcorpus oral del CREA, Corpus de Referencia del Español Actual

Diseño de corpus de lengua oral

Corpus de lengua oral en español

Corpus orales

Criterios de diseño de corpus para el estudio fonético

Corpus orales en español para estudios fonéticos

Criterios de diseño de corpus para el desarrollo de las tecnologías del habla

Albayzín, Base de datos para el reconocimiento del habla en español

EUROM

Corpus orales en español para el desarrollo de aplicaciones en tecnologías del habla

Diseño de corpus orales

La obtención de corpus de lengua hablada

La grabación

Objetivos de la grabación

El entorno de la grabación

Los aparatos de grabación

Situaciones de grabación

Los informantes y la grabación

Grabación

Tipos de corpus

Corpus de habla semi-espontánea

Corpus preparado ad-hoc

Obtención del corpus

Entrevistas individuales

Tareas específicas para la elicitación de habla semi-espontánea

Elicitación de datos

Transcripción y etiquetado de los corpus de lengua hablada

La transcripción ortográfica de la lengua oral

La representación ortográfica

Propuestas para la representación ortográfica en el ámbito de la lingüística de corpus

La propuesta del NERC (Network of European Reference Corpora)

La propuesta del Grupo de Trabajo de Textos Orales de EAGLES (Expert Advisory Group on Language Engineering Standards)

Propuestas para la representación ortográfica en el ámbito de las tecnologías del habla

La propuesta de SpeechDat

La propuesta del Grupo de Trabajo de Lengua Oral de EAGLES (Expert Advisory Group on Language Engineering Standards)

La transcripción ortográfica de corpus de lengua hablada en español

La propuesta del CREA, Corpus de Referencia del Español Actual

Transcripción y codificación de corpus orales

Transcripción fonética de los corpus orales

Transcripción fonética segmental

Sistemas de representación de los elementos segmentales

AFI (Alfabeto Fonético Internacional)

SAMPA (SAM-Phonetic Alphabet)

WordlBet

Las adaptaciones al español

SAMPA-Spanish

SALA (SpeechDat across Latin America)

Transcripción del español en WorldBet

Transcripción fonética de los elementos segmentales

Transcripción de los elementos suprasegmentales

Sistemas de representación de los elementos suprasegmentales

Problemas y requisitos de los sistemas de representación de los elementos suprasegmentales

AFI (Alfabeto Fonético Internacional)

SAMPROSA (SAM Prosodic Alphabet)

ToBI (Tones and Break Indices)

INTSINT (International System for Intonation Transcription)

Transcripción fonética de los elementos suprasegmentales

El etiquetado de los corpus orales

Niveles de etiquetado en los corpus orales

La representación de los datos en un corpus de lengua hablada

Niveles de representación de los datos en un corpus de lengua hablada

Niveles de representación fonética en un corpus oral

Etiquetado de corpus

Etiquetado de corpus de lengua hablada

Etiquetado fonético de corpus de lengua oral

La codificación de los corpus de lengua oral

El concepto de codificación

Elementos transcritos y codificados en el estudio de la lengua oral

Propuestas de estándares para la codificación de corpus de lengua oral

Las Guías de la TEI (Text Encoding Initiative)

La propuesta del Grupo de Trabajo de Textos Orales de EAGLES (Expert Advisory Group on Language Engineering Standards)

La codificación del discurso oral en español

La propuesta para el CREA (Corpus de Referencia del Español Actual)

La propuesta para PRESEEA (Proyecto para el Estudio Sociolingüístico del Español del España y de América)

Transcripción y codificación de corpus de lengua oral

La explotación y las aplicaciones de los corpus

La explotación y las aplicaciones de corpus escritos

Herramientas para el análisis textual

WordSmith

Tratamiento de corpus escritos

Aplicaciones de los corpus escritos

La explotación y las aplicaciones de corpus orales

Herramientas para el análisis acústico del habla y para el etiquetado de corpus orales

Praat

WaveSurfer

Aplicaciones de los corpus orales

Publicaciones sobre recursos lingüísticos del Grup de Fonètica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

left arrow