ESTIVOZ, Grado de espontaneidad y factores temporales en el disimulo de la voz

Memoria del proyecto

Metodología y plan de trabajo

Tarea.1 Revisión bibliográfica y formulación de las hipótesis iniciales

Responsable: Joaquim Llisterri
Participantes: Mario Carranza, María J. Machuca, Victoria Marrero, Antonio Ríos y Sandra Schwab

Tarea 1.1 Revisión bibliográfica para establecer y describir los fenómenos de naturaleza temporal que caracterizan el habla espontánea

En esta tarea se llevará a cabo una revisión bibliográfica basada en los trabajos que estudian desde distintos enfoques (análisis del discurso, tecnologías del habla, español como lengua extranjera, entre otros) los fenómenos que pueden caracterizar una interacción comunicativa espontánea.

La descripción de estos fenómenos que se encuentra en los trabajos publicados se ha llevado a cabo desde diferentes ámbitos de investigación. Quizá, por esta razón, tanto los términos empleados como la definición de los propios términos son confusos. A modo de ejemplo, en el campo de las tecnologías del habla se han aglutinado bajo la denominación de “disfluencias” (del inglés disfluencies) varios tipos de fenómenos: ruidos, pausas silenciosas, pausas sonoras o llenas, y alargamientos (Rodríguez y Torres, 2006; Rodríguez, Torres y Varona, 2002); en cambio, otros trabajos que los abordan desde el punto de vista del análisis del discurso (Rebollo Couto, 1997) los describen como procedimientos rítmicos que permiten al hablante ganar un cierto tiempo para organizar el discurso, entre los que se incluyen las pausas sonoras, constituidas por sonidos de apoyo (alargamientos) y las palabras clave. Los mismos elementos, abordados desde el punto de vista del aprendizaje del español como lengua extranjera (Menjura, 2007; Sánchez Avendaño, 2007) se tratan como fenómenos habituales en el contexto de la comunicación oral: repeticiones, pausas, silencios, alargamientos, enunciados truncados o inconclusos, vacilaciones y ruidos. Como se puede observar, bajo la etiqueta de “pausa sonora”, por ejemplo, se incluyen los alargamientos y las palabras clave, pero, por otra parte, a la pausa sonora también se la denomina “pausa hablada”. La revisión bibliográfica es necesaria para establecer los términos que caracterizan los fenómenos que se van a analizar y para definirlos. Esta tarea es imprescindible a fin de llevar a cabo de forma coherente el etiquetado de los fenómenos en el corpus de análisis.

Menjura, M. P. (2007). La fluidez discursiva oral. Una propuesta de evaluación. Ogigia. Revista electrónica de estudios hispánicos, 1, 7-16.

Rebollo Couto, L. (1997). Pausas y ritmo en la lengua oral. Didáctica de la pronunciación. En F. Moreno Fernández, M. Gil Bürmann, y K. Alonso (Eds.), El español como lengua extranjera: del pasado al futuro. Actas del VIII Congreso Internacional de la Asociación para la Enseñanza del Español como Lengua Extranjera. Alcalá de Henares, 17-20 de septiembre de 1997 (pp. 667-676). Alcalá de Henares: Servicio de Publicaciones de la Universidad de Alcalá.

Rodríguez, L. J. y Torres, M. I. (2006). Spontaneous speech events in two speech databases of human-computer and human-human dialogs in Spanish. Language and Speech, 49(3), 333-366.

Rodríguez, L. J., Torres, I., y Varona, A. (2002). Anotación de disfluencias en un corpus de habla espontánea no específico. En A. J. Rubio Ayuso (Ed.), II Jornadas en Tecnología del Habla. Granada: Universidad de Granada - Red Temática en Tecnologías del Habla.

Sánchez Avendaño, C. (2002). La percepción de la fluidez en español como segunda lengua. Revista de Filología y Lingüística de la Universidad de Costa Rica, 28(1), 137-163.

Tarea 1.2 Formulación de las hipótesis

La revisión bibliográfica permitirá determinar qué recursos puede emplear el hablante en una interacción espontánea, recursos que podrán o no coincidir con los que empleará en el disimulo de la voz. Estos fenómenos pueden ser característicos del habla de un individuo, de modo que se establezca una relación entre las estrategias de planificación y de organización del discurso que emplea una persona determinada en una situación comunicativa espontánea y la identificación correcta de dicha persona.

Tarea 2 Selección de muestras de habla espontánea en el corpus CIVIL

Responsable: Antonio Ríos
Participantes: Mario Carranza y María J. Machuca

El corpus CIVIL –creado en el subproyecto del mismo nombre en el marco del proyecto La contribución del nivel suprasegmental del habla y la caracterización del locutor en fonética judicial– está constituido por grabaciones en las que se recogen tres modos de fonación diferentes. Al mismo tiempo, se recogen, para cada uno de estos modos de fonación, diferentes estilos de habla: habla semiespontánea (aunque se obtuvo en condiciones de laboratorio, se intentó que fuera lo más semejante posible al habla emitida de un un contexto natural), lectura de textos y lectura de palabras en frase marco. En el subproyecto ESTIVOZ se realizará una selección de muestras de habla espontánea del corpus CIVIL y se establecerán unos criterios para escoger aquellos hablantes que presenten un mayor grado de espontaneidad en su producción oral.

Este corpus se complementará con el corpus EMULANDO, que se desarrollará en el subproyecto del mismo nombre y que se utilizará en el tercer año de ESTIVOZ para analizar los mismos fenómenos que ya se habrán estudiado en el corpus CIVIL. Con ello, se obtendrá información sobre la incidencia del disimulo vocal mediante la imitación de un acento extranjero en los elementos que caracterizan el discurso espontáneo.

Tarea 3 Análisis del corpus

Responsable: María J. Machuca
Participantes: Mario Carranza, Antonio Ríos y Sandra Schwab

Tarea 3.1 Segmentación y etiquetado del corpus

Tarea 3.1.1 Segmentación y etiquetado de los fenómenos propios del estilo espontáneo en el habla no disimulada (corpus CIVIL)

Se llevará a cabo la segmentación y el etiquetado de las pausas silenciosas, las pausas sonoras que no forman parte de unidades léxicas, los alargamientos, las vocalizaciones y los elementos léxicos de apoyo en el corpus recogido durante el proyecto CIVIL. Además, se incluirán en el etiquetado otros fenómenos que se hayan descrito en la bibliografía analizada en la Tarea 1.1.

Tarea 3.1.2 Segmentación y etiquetado de los fenómenos propios del estilo espontáneo en el habla disimulada (corpus EMULANDO)

Se realizará la segmentación y el etiquetado de las pausas silenciosas, las pausas sonoras que no forman parte de unidades léxicas, los alargamientos, las vocalizaciones y los elementos léxicos de apoyo en el corpus que se creará durante el primer año del subproyecto EMULANDO. Además, se incluirán en el etiquetado otros fenómenos que se hayan descrito en la bibliografía analizada en la Tarea 1.1.

Tarea 3.2 Extracción de los datos

Una vez etiquetado el corpus, se extraerán de manera semiautomática los valores temporales de todas las unidades asociadas a cada uno de los fenómenos que se hayan determinado en el análisis llevado a cabo en las Tareas 3.1.1 y 3.1.2. Además, se obtendrá el número de ítems de cada unidad. Así se establecerá no solo la frecuencia de aparición de cada fenómeno estudiado para cada uno de los hablantes, sino que se valorará si las características temporales de estos fenómenos resultan relevantes para la identificación del hablante.

Tarea 3.3 Tratamiento estadístico de los datos

Una vez obtenidos los valores de los diferentes fenómenos analizados, se procederá a su tratamiento estadístico con el fin de estudiar su relevancia.

Tarea 4 Validación perceptiva de los fenómenos que identifican a los hablantes

Responsable: Sandra Schwab
Participantes: Mario Carranza, María J. Machuca y Victoria Marrero

En el último año de ESTIVOZ, se elaborará una prueba de percepción a modo de experimento piloto para observar si los fenómenos analizados en la Tarea 3 pueden resultar pertinentes desde el punto de vista perceptivo para identificar a un hablante. La tarea se realizará en tres etapas: selección de los fenómenos y preparación de los estímulos (4.1), elaboración de la prueba de percepción (4.2) y obtención de los datos y tratamiento estadístico de los mismos (4.3).

Tarea 5 Elaboración de las conclusiones finales

Responsable: Joaquim Llisterri
Participantes: Mario Carranza, María J. Machuca, Victoria Marrero, Antonio Ríos y Sandra Schwab

El análisis global de los resultados alcanzados mediante las Tareas 3 y 4 se abordará considerando si, como se plantea en la hipótesis inicial, los factores de naturaleza temporal que caracterizan el estilo de habla espontáneo de un locutor se mantienen estables en ese mismo hablante aunque disfrace su voz aparentando un acento extranjero. Tal estabilidad se considerará tanto desde el punto de vista acústico como desde la perspectiva que ofrezcan los resultados de la prueba de percepción. Las conclusiones se orientarán a las necesidades y los retos que se plantean en el contexto judicial, intentando aportar datos de interés para los procedimientos de identificación del hablante basados en el conocimiento fonético y para los métodos automáticos de reconocimiento del locutor.


FFI2014-59848-C2-2-P ESTIVOZ, Grado de espontaneidad y factores temporales en el disimulo de la voz
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: