El corpus de trabajo


La constitución del corpus


Definición y tipos de corpus

Corpus

Conjunto de realizaciones sonoras de la lengua que serán objeto de estudio.

“Le choix des matériaux qui constituent le corpus sur la réalisation duquel le phoneticien veut travailler est déterminé par le but qu’il se propose”

Debrock, M. (1975). Contribution à la phonétique acoustique du français et du néerlandais. Thèse doctorale, Louvain. [Citado en: Murillo, J. (1981). El umbral de fonologización de los sonidos turbulentos agudos del habla en francés y en español. Tesis doctoral, Facultat de Lletres, Universitat Autònoma de Barcelona. p. IV-12]

La selección del tipo de corpus y de sus características específicas viene condicionada por la hipótesis de trabajo.

En el diseño del corpus y de los procedimientos de recogida de los datos se deben tener en cuenta, en ocasiones, características específicas de los participantes en el experimento.

La noción de corpus

Tipos de corpus

Corpus de habla espontánea

Corpus diseñado para obtener el estilo de habla propio del locutor en una situación en la que no estuviera presente el investigador.

Estrategias para obtener muestras de habla cercanas al estilo que habitualmente usan los informantes.

Los informantes tienden a emplear la lengua tal como lo hacen en su entorno cotidiano al estar cada vez menos pendientes del observador.

Problemas en la recogida del corpus:

Aplicaciones de un corpus de habla espontánea:

La entrevista

Diseño de corpus de lengua oral

Corpus preparados ad hoc

Tendencia general en los estudios de fonética experimental.

Preparación de corpus especialmente diseñados para el estudio de un fenómeno específico en función de la hipótesis inicial que guía la investigación.

En general, los participantes seleccionados leen o producen el corpus en un entorno que facilite una grabación técnicamente correcta.

Cobertura

Elementos segmentales

Inventario de elementos segmentales de la lengua:

Combinaciones entre los elementos segmentales de la lengua:

Aparición de los elementos segmentales en función de las variables fonéticas consideradas en el diseño del corpus.

Número representativo de muestras de cada alófono en cada contexto.

Pares mínimos con los contrastes fonológicos de la lengua.

Elementos suprasegmentales

Estructuras silábicas propias de la lengua.

Patrones acentuales de la palabra.

Patrones melódicos de la oración.

“Pares mínimos” acentuales y melódicos.

Variaciones en la velocidad de elocución.

Materiales

Sonidos aislados

En los estudios fonéticos no suelen utilizarse sonidos aislados excepto si se requiere el uso de algunas técnicas de análisis articulatorio como la palatografía.

En algunos estudios de fonética clínica se emplean vocales aisladas sostenidas para evaluar la fonación.

Sílabas aisladas

En los estudios fonéticos no suelen emplearse sílabas aisladas, pero la estructura silábica o la frecuencia de aparición del tipo de sílabas o el número de sílabas de la palabra pueden constituir variables consideradas en el diseño del corpus.

Duñabeitia, J. A., Cholin, J., Corral, J., Perea, M., y Carreiras, M. (s. f.). Syllabarium: Complete statistics for Basque and Spanish syllables. Donostia: Basque Center on Cognition, Brain and Language. Consultado en http://www.bcbl.eu/syllabarium/index.php

En el ámbito de la fonética clínica se emplean repeticiones rápidas de sílabas para evaluar la diadococinesia en determinadas patologías.

Logatomas

Palabras sin sentido, inexistentes en el léxico de la lengua, cuyas características fonológicas corresponden a lo que podría ser una palabra real en la lengua que se estudia.

Utilizado en la enseñanza de la pronunciación, en la corrección fonética (tanto en la enseñanza de segundas lenguas como en la intervención logopédica en patologías del habla) o en la audiometría verbal o verbo-tonal para neutralizar el efecto del significado y centrar la actividad sobre la audición o para presentar determinados sonidos en un contexto específico que favorece su producción o su percepción.

“Logatome: groupe phonique sans valeur significative utilisé en audiometrie ou en phonétique, à des fins expérimentales et quelquefois pratiques (correction phonétique). Il apparaît en effet malaisé de déterminer ce qui, dans la perception de la parole, relève de l’audition au sens estrict et d’autres facteurs, d’ordre sémantique, notamment” (p. 121).

Renard, R. (1979). Introduction à la méthode verbo-tonale de correction phonétique (3ème ed.). Bruxelles - Mons: Didier - Centre International de Phonétique Appliquée.
Renard
Raymond Renard

También denominado logotoma, logotomo o pseudopalabra.

“Logatoma” es el término que aparece en la edición española de Rétro-spection: Guberina, P. (2008). Retrospección (Edición en español y prólogo de Julio Murillo Puyal). Mons: Centre International de Phonétique Appliquée - Asociación Española Verbotonal.

Keuleers, E., y Brysbaert, M. (2010). Wuggy: a multilingual pseudoword generator. Ghent: Center for Reading Research, Department of Experimental Psychology, Ghent University. Consultado en http://crr.ugent.be/programs-data/wuggy

Palabras

Pueden encontrarse palabras que cumplan determinados requisitos fonéticos efectuando búsquedas en diccionarios en formato electrónico o mediante herramientas especializadas.

Alves, A. H., Rico, J. y Roca, I. (2011). BuFón. Buscador de patrones fonológicos. [Versión 1.1]. Madrid: Laboratorio de Fonética, Centro de Ciencias Humanas y Sociales, Consejo Superior de Investigaciones Científicas. Consultado en http://www.estudiosfonicos.cchs.csic.es/fonetica/bufon

Duchon, A., Perea, M., Sebastián Gallés, N., Martí, M. A., y Carreiras, M. (2013). EsPal - Spanish Lexical Database. Donostia: Basque Center on Cognition, Brain and Language. Consultado en http://www.bcbl.eu/databases/espal/index.php

Guasch, M., Masip, A., Sunyer, E., y Boada, R. (2012). NIM. El buscador de estímulos hecho por y para psicolingüistas. Tarragona: Departament de Psicologia, Universitat Rovira i Virgili. Consultado en http://psico.fcep.urv.es/utilitats/nim/index_esp.php

Northwestern Bilingualism and Psycholinguistics Research Group. (2015). CLEARPOND: Cross-Linguistic Easy-Access Resource for Phonological and Orthographic Neighborhood Densities. Evanston, IL: Northwestern University. Consultado en http://clearpond.northwestern.edu/

Frases

Frases cortas en las que se introducen las palabras que contienen los elementos que se desean analizar.

Frase marco o frase portadora (carrier sentence)

“conservar en la medida de lo posible las características del habla espontánea, de los enunciados producidos en situaciones reales de comunicación lingüística” (p. IV-12).

Murillo, J. (1981). El umbral de fonologización de los sonidos turbulentos agudos del habla en francés y en español. Tesis doctoral, Facultat de Lletres, Universitat Autònoma de Barcelona.
Julio Murillo
Julio Murillo

Secuencia constante a lo largo de todo el corpus, en la cual se incluye, siempre en la misma posición, el elemento que se desea analizar.

Va dir-li ‘quica’ i va sortir
Va dir-li ‘papa’ i va callar
Va dir-li ‘títol’ i va callar
Va dir-li ‘còctel’ i va penjar
Va dir-li ‘pipa’ i va marxar
Va dir-li ‘coca’ i va callar
Va dir-li ‘pupa’ i va plorar

Ventajas de la frase marco

Permite evitar el efecto de serie.

Impide que se produzcan influencias de un elemento del corpus sobre otro debido a la predictibilidad de los elementos.

Variación de los elementos léxicos o de la estructura sintáctica para reducir el efecto de la repetición de enunciados similares.

“Dijo . . . y se fue”
“Dijo ... y salió”
“Dijo ... y colgó”

La inserción del elemento analizado en la frase marco permite que éste se integre en un enunciado que mantenga las características de los enunciados naturales de la lengua.

Importancia de la estructura sintáctica.

Justificación en una situación comunicativa real.

“Dijo . . . y colgó” permite imaginar el contexto de una conversación telefónica.
“enunciados que podrían haberse pronunciado como frases únicas en una situación de comunicación hablada (es decir, que constituyan producciones sonoras de habla que reúnen las condiciones de ‘autonomía’ y ‘verosimilitud’)” (p. IV-18).

Murillo, J. (1981). El umbral de fonologización de los sonidos turbulentos agudos del habla en francés y en español. Tesis doctoral, Facultat de Lletres, Universitat Autònoma de Barcelona.
Julio Murillo
Julio Murillo

Mediante la frase marco se respetan:

La frase marco hace que los elementos estudiados adquieran una función metalingüística.

Contexto desprovisto de toda connotación.

Se reduce la posibilidad de que el hablante realice variaciones entonativas asociadas a posibles interpretaciones del enunciado.

Mediante la frase marco se neutralizan:

La frase marco o portadora tiene una doble función:

Frases fonéticamente equilibradas o textos fonéticamente equilibrados

La frecuencia de aparición de cada segmento en el corpus se acerca lo más posible a la frecuencia de aparición de cada segmento en una muestra más amplia de la lengua.

El diseño de corpus fonéticamente equilibrados requiere disponer de datos sobre la frecuencia de aparición de los segmentos en la lengua, preferiblemente procedentes de corpus de lengua oral que constituyan una muestra representativa.

Textos fonéticamente equilibrados en español

Frecuencia de aparición de unidades lingüísticas del español

Frecuencia de aparición de unidades lingüísticas del catalán

En el caso de disponer de diversas distribuciones, es necesario establecer criterios de selección para determinar la distribución que mejor se adapta a la finalidad para la que se diseña el corpus:

up arrow

La constitución del corpus

El tamaño del corpus

Análisis lingüístico de un corpus espontáneo.

“about ten hours will be needed to analyse each hour of recorded data” (p. 7).

Milroy, L. (1987). Observing and analysing natural language. A critical account of sociolinguistic method. Oxford: Basil Blackwell.

La noción de variable

“an attribute of a person or of an object which ‘varies’ from person to person or from object to object” (p. 1).

Hatch, E. M. y Farhady, H. (1982). Research design and statistics for Applied Linguistics. Rowley, Mass: Newbury House.

En un diseño experimental, una variable es un elemento que el investigador hace “variar” a fin de averiguar su comportamiento.

Identificación de las variables

Depende de los conocimientos sobre el tema del investigador.

Posibilidad de un estudio piloto basado en un corpus y en un número reducido de informantes.

Identificar las variables...

“involves finding evidence that a linguistic unit varies in a systematic way between speakers, or between different speech styles of a single speaker. It also involves identifying linguistic constraints on variation; that is, specifying the manner in which variable elements are embedded in linguistic structure” (p. 115).

Milroy, L. (1987). Observing and analysing natural language. A critical account of sociolinguistic method. Oxford: Basil Blackwell.

Transcripción fonética del corpus recogido.

Análisis de las variaciones en la realización de un mismo fonemaalófonos– que aparecen condicionadas por:

Variables e hipótesis

Una hipótesis establece la relación entre dos –o más– variables.

Hipótesis: la duración de las vocales es mayor en sílaba tónica que en sílaba átona

Variables: duración vocálica y tonicidad de la sílaba
Hipótesis: la duración de las vocales es menor cuando van seguidas por una consonante sorda que cuando van seguidas de una consonante sonora

Variables: duración vocálica y sonoridad de la consonante que sigue a la vocal
Hipótesis: la duración de las vocales es mayor en posición prepausal que en posición postpausal

Variables: duración vocálica y posición de la vocal con respecto a la pausa

Tipos de variables

Variables que intervienen en la constitución del corpus

Tres tipos de variables o “condicionamientos”:

Murillo, J. (1981). El umbral de fonologización de los sonidos turbulentos agudos del habla en francés y en español. Tesis doctoral, Facultat de Lletres, Universitat Autònoma de Barcelona.

Julio Murillo
Julio Murillo

Variables relacionadas con la elocución

Idioma

Variable en:

Orden de grabación

Variable que debe ser controlada.

Neutralización del efecto de serie.

Suele deshacerse el orden interno del corpus para efectuar la grabación en un orden aleatorio.

Velocidad de elocución

Variable que debe controlarse en los estudios que impliquen parámetros fonéticos de naturaleza temporal.

La velocidad de elocución

Variables fonéticas

Relacionadas con el contexto en el cual se insertan los sonidos estudiados.

Situación en el conjunto del enunciado

Variable, en general, controlada, a no ser que la hipótesis haga referencia explícita a ella.

Incide en:

“en un grupo fónico con melodía ascendente se observa un incremento de la tensión fonadora en el conjunto de los alófonos que constituyen dicho grupo (muy especialmente en las dos últimas sílabas)” (p. IV-63).

Murillo, J. (1981). El umbral de fonologización de los sonidos turbulentos agudos del habla en francés y en español. Tesis doctoral, Facultat de Lletres, Universitat Autònoma de Barcelona.
Julio Murillo
Julio Murillo

Posición en la sílaba

La posición en la sílaba de un determinado alófono y el tipo de sílaba en el que se encuentre tiene consecuencias sobre sus características.

Incide en las características articulatorias y acústicas.

Influye especialmente sobre la duración.

Acento

El acento puede causar variaciones en:

Entorno fonético inmediato

Segmentos que se encuentran antes y después del elemento estudiado.

Influencia mutua entre sonidos adyacentes: coarticulación.

Influye en las características acústicas y articulatorias: duración, trayectoria de los formantes.

Variables lingüísticas

Valor funcional

Diferencia entre un segmento que se realiza como parte de un morfema léxico y el que forma parte de un morfema gramatical.

Estructura del enunciado

Las realizaciones del hablante son distintas si el enunciado constituye una frase entera o un fragmento.

La estructura sintáctica condiciona:

Intuición ortológica

Los hablantes de una lengua suelen tender hacia un determinado modelo de pronunciación.

Influencia en el momento de producir un corpus, especialmente cuando el informante sabe será objeto de análisis por parte de un especialista.

Hipercorrección

“a ‘misfire’ attempt at a prestige pronunciation which speakers have reconstructed by means of a linguistic schema fairly obviously derived by over-generalized analogical reasoning” (p. 177).

Milroy, L. (1987). Observing and analysing natural language. A critical account of sociolinguistic method. Oxford: Basil Blackwell.

La variación estilística

Estilos de habla o registros

Variedades del repertorio verbal de una lengua seleccionadas en función de la situación comunicativa.

Caracterizados por rasgos fonéticos, fonológicos, sintácticos o léxicos.

Coexistencia más de un estilo o registro en un mismo hablante.

El estudio de la variación estilística en la lengua oral

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell. Consultado en http://www.linguistics.ucla.edu/people/hayes/201/readings/Labov1972ContextualStyles.pdf

Labov, W. (1983). La diferenciación de los estilos contextuales. En Modelos sociolingüísticos. (pp. 105-53). Madrid: Cátedra. (Obra original publicada en 1972)

Estudio basado en entrevistas individuales realizadas por el investigador.

La entrevista individual

A lo largo de la entrevista se realizan una serie de tareas asociadas a diferentes situaciones comunicativas (situaciones contextuales).

Cada situación comunicativa da lugar a la aparición de un estilo de habla o registro.

“styles can be arranged along a single dimension, measured by the amount of attention payed to speech” (p. 208).

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell.

El estilo depende del grado de atención del hablante hacia las características de su propia producción lingüística.

Escala desde el habla más cuidada hasta la más informal.

Estilo formal (careful)

“In our investigation, this is the type of speech that normally occurs when the subject is answering questions which are formally recognized as «part of the interview»” (p. 79).

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell.

Estilo utilizado cuando los informantes contestan a las preguntas de un entrevistador.

Estilo informal (casual)

“By casual speech, in a narrow sense, we mean the everyday speech used in informal situations, where no attention is directed to language” (p. 86).

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 183-259). Oxford: Basil Blackwell.

Inhibido por la presencia del experimentador.

La paradoja del observador.

“We are then left with the Observer’s Paradox: the aim of linguistic research in the community must be to find out how people talk when they are not being systematically observed; yet we can only obtain these data by sistematic observation ” (p. 209).

Labov, W. (1972). The study of language in its social context. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell.

Estilo espontáneo (spontaneous)

“Spontaneous speech refers to a pattern used in excited, emotionally charged speech when the constraints of a formal situation are overridden” (p. 86).

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell.

Puede obtenerse fuera del contexto de la entrevista o mediante preguntas que despierten la emotividad del hablante.

Cada situación contextual creada durante la entrevista da lugar a un estilo de habla.

Situación contextual Situación contextual Estilo de habla
A A1 Interacción fuera del contexto de la entrevista Informal (casual)
A2 Interacción con una tercera persona Informal (casual)
A3 Interacción fuera de las respuestas directas a preguntas del entrevistador Transición del estilo informal (casual) al espontáneo
A4 Rimas y costumbres infantiles Espontáneo
A5 Peligro de muerte Espontáneo
B Situación de entrevista Formal (careful)
C Textos Lectura
D Palabras aisladas Lectura
D’ Pares mínimos Lectura

Labov, W. (1972). The isolation of contextual styles. En Sociolinguistic patterns. (pp. 70-109). Oxford: Basil Blackwell.

La adaptación al interlocutor

Desde el punto de vista de la psicología social, la elección de un determinado estilo viene dada por la adaptación al interlocutor.

La variabilidad fonética es el resultado de la adaptación al intercambio de información entre el hablante y el oyente.

“we feel justified in proposing, as a working hypothesis, that intra-speaker’s phonetic variation is genuine and arises as a consequence of the speaker’s adaptation to his judgement of the ‘needs of the situation’. In the sense of the biologist’s term speech behaviour is an adaptive process” (p. 163).

Lindblom, B. (1988). Phonetic invariance and the adaptive nature of speech. En B. A. G. Elsendoorn, y H. Bouma (Eds.), Working models of human perception. London: Academic Press.

El modelo de la variabilidad adaptativa en la percepción del habla

up arrow

La obtención del corpus

Lectura

Procedimiento utilizado en los corpus ad hoc diseñados para estudios fonéticos específicos.

La lectura de un texto puede complementarse con una paráfrasis, explicación o comentario del texto realizado por el participante en el experimento después de la lectura, lo que permite obtener una muestra de habla espontánea.

Entrevistas individuales

Permiten la obtención de un corpus largo y relativamente espontáneo.

Permiten la grabación de lecturas de textos o de un corpus ad hoc constituido por frases marco.

Permiten la recogida de elementos léxicos aislados.

Estrategias para obtener la palabra deseada sin que el investigador la mencione previamente, para evitar ofrecer un modelo de pronunciación.

Permiten la obtención de habla semi-espontánea a partir de la realización de una tarea como la descripción de una imagen o de una serie de imágenes.

Estrategias para obtener un estilo espontáneo y superar la paradoja del observador.

“Individuals who are being questioned will seldom produce large volumes of speech in their replies” (p. 46)

Milroy, L. (1987). Observing and analysing natural language. A critical account of sociolinguistic method. Oxford: Basil Blackwell.

El diálogo se rige por unas normas sociales entre las que se encuentra el “principio de cooperación”.

La distribución de los turnos de habla y del tiempo que ocupa cada hablante tiende a ser equitativa.

Las preguntas directas no suelen ser habituales en la conversación corriente entre personas del mismo estatus.

“even when interviewed by a stranger, a speaker will settle down to a pattern approximating to his or her everyday interactional style after about the first hour. Speech produced before this period has elapsed tends to show radically different patterns”

Douglas-Cowie, E. (1978). Linguistic code-switching in a Northern Irish village: Social interaction and social ambition. En P. Trudgill (Ed.), Sociolinguistic patterns in British English. (pp. 37-51). London: Edward Arnold.
1.- Saludos
2.- El tiempo
3.- Lugar donde vive
4.- Familia y amistad
5.- Costumbres
6.- Peligro de muerte
7.- Anécdotas importantes en la vida
8.- Deseo de mejora económica
9.- Final

Módulos temáticos de una entrevista en el “Proyecto para el estudio sociolingüístico del español de España y de América” (PRESEEA).

PRESEEA. (2003). Metodología del “Proyecto para el estudio sociolingüístico del español de España y de América” (PRESEEA). Versión revisada - Octubre 2003. PRESEEA, Proyecto para el estudio sociolingüístico del español de España y de América. Consultado en http://preseea.linguas.net/Metodolog%C3%ADa.aspx

En el momento de la difusión del corpus debe eliminarse la información que pueda hacer posible la identificación personal de los hablantes.

En el caso de las grabaciones (archivos de sonido), el procedimiento más extendido para garantizar el anonimato de los informantes es la sustitución de los nombres de personas o lugares por un pitido, que debería tener la misma duración que el nombre pronunciado, para asegurar el buen funcionamiento de la alineación entre transcripción y grabación. Esta es la forma en que debe procederse para un uso abierto y generalizado de las grabaciones. Mientras el proceso de modificación de las grabaciones no se haya llevado a cabo por parte de los equipos responsables, los equipos o investigadores colaboradores deberían firmar un compromiso de confidencialidad garantizando el adecuado uso de las muestras sonoras. Para el cumplimiento de este compromiso puede recurrirse al simple control de que en el fragmento seleccionado no aparece ninguna mención personal que debiera ser eliminada.

PRESEEA. (2011). Guía PRESEEA para la investigación lingüística. Versión 2.0. PRESEEA, Proyecto para el estudio sociolingüístico del español de España y de América. Consultado en http://preseea.linguas.net/Portals/0/Metodologia/GUIA_PRESEEA_INVESTIGACION_LINGUISTICA.pdf

Tareas específicas para la elicitación de habla semi-espontánea

Realizadas en parejas formadas por dos participantes en el experimento.

Los participantes en la tarea deben colaborar para alcanzar un objetivo común.

Tarea del mapa

Participan dos informantes, cada uno de los cuales tiene un mapa que no puede ver el otro informante.

En el mapa se indican una serie de lugares señalados con su nombre.

En uno de los mapas se ha señalado un camino y en el otro no.

El informante que tiene el mapa sin el camino trazado tiene que dibujarlo siguiendo las instrucciones del informante que tiene el mapa con el camino.

Al finalizar la tarea, cada uno de los informantes lee una lista de palabras consistente en los nombres de lugar señalados en el mapa y en otros elementos que aparecen en la conversación.

Tarea del mapa
Tarea del mapa
Mapa con el camino trazado Mapa sin camino
1 Neil: Right. Start from the sandy shore,
2 Chris: Okay.
3 Neil: moving down ... straight down.
4 Chris: How far?
5 Neil: Down as far as the bottom of the well.
6 Chris: I don’t have a well.
7 Neil: Right. Move down,, vertically down about a quarter of the way down the page. Move to the right in ... Do you have local residents?
8 Chris: I do.
9 Neil: Right, well, move up and round and above them.
10 Chris: Okay.
11 Neil: Right. Across, not as far as a wood. Do you have a wood?
12 Chris: Do I cross the bridge?

HCRC. (2010). HCRC Map Task Corpus. Human Communication Research Centre, University of Edinburgh. Consultado en http://groups.inf.ed.ac.uk/maptask/

Tarea del mapa

Tarea del mapa en español.

Aguilar, L. (2001). Los procesos fonológicos y su manifestación en diferentes situaciones comunicativas: La alternancia vocal/semiconsonante/consonante. Tesis doctoral, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona. Consultada en http://hdl.handle.net/10803/4886

Juego de las diferencias

Cada participante dispone de una lámina que representa una escena.

Las dos láminas contienen diferencias.

Cada participante solamente puede ver su propia lámina.

Los participantes deben descubrir las diferencias entre las dos láminas.

p1#1: <breath> soy Julián y yo soy el número uno
p2#2: #<eeh> yo soy Paco y soy el número dos#
p1#3: #<inspiration> vale pues empiezo yo ##<p2#4> #<sp># te cuento lo que veo #<sp> hay un chico que está en el mar tiene un flotador que es un flotador de un patito con pintas negras y está mirando un#<nn> especie de huevo que parece como que lo hubiese pues+ pues , está asombrado porque#<ee> porque el flotador que es un pato #<sp> ##<p2#4> ha puesto un huevo# #
p2#4: #<p1#3> sí# #<lp> ##<p1#3> #<laugh># ¿ cuántas manchas tiene el huevo ?#
p1#5: el huevo tiene tres manchas#
p2#6: ¿ y una se le está cayendo por ##<p1#7> abajo# ?#
p1#7: ##<p2#6> y una# que se le está cayendo por ##<p2#8> abajo# sí#
p2#8: ##<p1#7> vale# #<lp> ##<p1#9> #<eh>##
p1#9: ##<p2#8> el flotador# tiene uno , dos , tres , cuatro , cinco manchas#
p2#10: ##<p1#11> sí# #
p1#11: ##<p2#10> el# patito este #
p2#12: ¿ tiene la boca abierta ?#
p1#13: no tiene la boca cerrada #
p2#14: pues no encontramos ni una#
p1#15: #<inspiration> y cuando encontramos un error #<sp> da igual seguimos #<sp> #<eeh> el chico tiene un bañador , #<eeh> es moreno #<sp> #<tongue-click> #<eeh> bueno te sigo describiendo lo ##<p2#16> que hay##
p2#16: ##<p1#15> sí sí sigue# y yo si ve+ si veo algo que ##<p1#17> no#<oo> concuerda# con el mío te lo digo #
p1#17: ##<p2#16> vale# #<inspiration> hay dos nubes una en / a la izquierda y otra a la derecha #<eeh> y#<yy> en#<nn> el lado derecho hay un barco que tiene una banderita blanca #<lp> ##<p2#18> un velero##
p2#18: ##<p1#17> ¿ blanca?# ¿ cómo que blanca ? #<sp> todo es blanco#
p1#19: no bueno que no / no está / no está rellena no está ##<p2#20> pintada de negro##
p2#20: ##<p1#19> #<ah> vale vale##
p1#21: #<ehm>#
p2#22: todo es igual#
p1#23: todo es igual ##<p2#24> #<lp># #
p2#24: ##<p1#23> #<laugh>##

Savy, R., De Leo, S., Alfano, I., Solís, I. y Cioffi, E. (n.d.). Corpus PraTiD nelle lingue europee. Corpora. Parlare italiano. Consultado en http://www.parlaritaliano.it/index.php/it/corpora-di-parlato/672-corpus-pratid-nelle-lingue-europee

Diapix.jpg

Materiales usados en el proyecto DiapixUK

Baker, R., & Hazan, V. (2011). DiapixUK: task materials for the elicitation of multiple spontaneous speech dialogs. Behavior Research Methods, 43(3), 761-770. doi:10.3758/s13428-011-0075-y

El estudio de las emociones

Scherer, K. R. (2013). Vocal markers of emotion: Comparing induction and acting elicitation. Computer Speech & Language, 27(1), 40-58. doi:10.1016/j.csl.2011.11.003

Scherer, K. R. (2014). Corpus design for studying the expression of emotion in speech. En T. Raso y H. Mello (Eds.), Spoken corpora and linguistic studies (pp. 210-232). Amsterdam - Philadelphia, PA: John Benjamins.

Tareas que inducen la aparición de determinadas emociones.

Inducción de emociones mediante estímulos visuales o auditivos.

Fernández Megías, C., Pascual, J. C., Soler, J., y García Fernández-Abascal, E. (2011). Validación española de una batería de películas para inducir emociones. Psicothema, 23(4), 778-785. Consultado en http://www.unioviedo.es/reunido/index.php/PST/article/view/9159

Grabaciones procedentes de los medios de comunicación.

Imitación de emociones por parte de participantes profesionales o no profesionales.

“Many of the studies in this domain have used acted portrayals in which laymen or professional actors have been asked to portray or enact the emotions of interest, using a variety of procedures. Most of the corpora of emotional expressions currently available consist of such portrayals. Recently, and increasingly, this approach to obtaining speech and voice samples for the analysis of vocal markers of emotion has been the subject of criticism, highlighting the lack of naturalness and authenticity of the portrayed expression (e.g., Douglas-Cowie et al., 2003). Also, Batliner et al. (2000) have suggested that actors are supposed to display their emotions, whereas speakers in real-life settings may not do so. Wilting et al. (2006) suggest that actors do not feel the acted emotion and may engage in overacting, casting doubt on the usefulness of actors as a way to study real emotions” (p. 41)

Scherer, K. R. (2013). Vocal markers of emotion: Comparing induction and acting elicitation. Computer Speech & Language, 27(1), 40-58. doi:10.1016/j.csl.2011.11.003

Observación participativa

Si el investigador se sumerge en la vida del grupo, llega un momento en que éste ya no es consciente de su presencia y adopta un comportamiento más espontáneo.

Corpus de conversación coloquial - Grupo Val.Es.Co

Entrevistas telefónicas

Permiten obtener respuestas simples centradas sobre determinados fenómenos si las preguntas se construyen de modo suficientemente restrictivo.

La experiencia de Labov parece indicar que la calidad de las grabaciones es suficiente para un posterior análisis en el laboratorio, siempre y cuando no se trate de sonidos que cubran una gama de frecuencias mayor que la utilizada en la banda telefónica.

Pregunta breve y anónima

Ejemplo paradigmático:

La estratificación social de [r] en la ciudad de Nueva York (Labov, 1966)

Según los cálculos de Labov, es posible entrevistar a 264 personas en seis horas y media.

Problemas y ventajas:

up arrow

La representación fonética de corpus orales

La constitución del corpus

Corpus orales y corpus de lengua oral


El corpus de trabajo
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: