La grabación


La grabación


Las condiciones técnicas de la grabación

Los objetivos de la grabación

Transcripción ortográfica de las realizaciones de los hablantes

Es necesario que el contenido de la grabación sea inteligible.

Transcripción fonética del material de trabajo

La inteligibilidad del corpus recogido debe ser óptima.

Análisis acústico

La grabación debe realizarse con requisitos técnicos específicos.

Situaciones de grabación

Grabaciones recogidas por el propio investigador

Grabación en contexto natural

Suele presentar problemas relacionados con los ruidos de fondo propios de los lugares públicos, que aparecen también recogidos en la grabación.

Grabación secreta con consentimiento posterior de los informantes.

Micrófono alejado de la fuente de sonido.

Atenuación de la intensidad de la señal en micrófonos ocultos.

La inteligibilidad de la grabación puede ser insuficiente incluso para una transcripción ortográfica.

Grabación en contexto controlado

Permite un control acústico del entorno y la obtención de una grabación de mejor calidad.

Puede inhibir la espontaneidad del informante: la paradoja del observador.

Calidad suficiente para una transcripción ortográfica y para una transcripción fonética; si el entorno está adecuadamente controlado la calidad puede ser suficiente para un análisis acústico.

Grabación de más de un hablante

Un micrófono para cada hablante.

Conectado cada uno a un canal distinto del sistema de grabación.

Micrófonos bidireccionales que pueden usarse colocando los interlocutores a cada uno de los lados del micrófono.

Grabaciones procedentes de los medios de comunicación

Aseguran, en conjunto, una buena calidad de la grabación, suficiente para una transcripción ortográfica, una transcripción fonética y un análisis acústico si se trata de grabaciones realizadas en un estudio y sin fondo sonoro.

Grabaciones procedentes de archivos sonoros

Pueden presentar problemas de calidad sonora.

La calidad suele ser suficiente para una transcripción ortográfica.

La posibilidad de una transcripción fonética y de un análisis acústico dependen de las condiciones de la grabación.

Condiciones ambientales

Ruido ambiental

Procedente del exterior

Procedente del exterior del recinto en el que se efectúa la grabación.

Para evitar completamente el ruido ambiental procedente del exterior es necesario realizar las grabaciones en entornos acústicamente controlados.

Ruidos interiores

Fluorescentes.

Sistemas de aire acondicionado.

Ruido producidos por el propio locutor al pasar las hojas del texto que esté leyendo.

Ruidos derivados de los movimientos del hablante.

Reducción del ruido ambiental

Aislamiento acústico

Reducción de la intensidad de los sonidos que llegan a entrar en la sala de grabación mediante el uso de materiales aislantes.

Cámaras sordas

Recintos aislados del ruido exterior mediante materiales especialmente diseñados para conseguir la máxima disminución de la intensidad de los ruidos externos.

Reverberación o eco

Reverberación o eco

El grado de reverberación de un recinto se relaciona con la inteligibilidad del habla dentro del mismo.

Producida por la reflexión del sonido en las paredes y en los diversos obstáculos que el sonido encuentra en el entorno.

Se reduce si se facilita la absorción del sonido.

Tiempo de reverberación

Tiempo transcurrido entre el momento en el que se interrumpe la emisión del sonido y el momento en que éste es prácticamente inaudible en cualquier punto del recinto.

A un mayor tiempo de reverberación corresponde una menor inteligibilidad del habla.

Reducción de la reverberación

Requiere elementos absorbentes en el interior de la sala de grabación.

Habitación pequeña como una sala de estar con moqueta o alfombra en el suelo y sofás.

Evaluación auditiva de los resultados.

Cámara anecoica

Sala forrada en su interior –incluyendo el techo y el suelo– de material muy absorbente, colocado en forma de conos o pirámides para aumentar la irregularidad de la pared, lo que evita la reflexión del sonido.

Una ausencia total de reverberación no es deseable para el estudio del habla.

Los aparatos de grabación

Aparatos de grabación

Relación señal-ruido

La dinámica de la voz se sitúa en los 50 dB.

Suele haber unos 50 dB de diferencia entre las intensidades más altas y las más bajas que produce una persona al hablar.

Relación señal-ruido (SNR, signal-to-noise ratio)

Diferencia entre la amplitud de las señales más altas y las más bajas que pueden registrarse sin que se produzcan distorsiones.

En una buena grabación, la relación entre señal y ruido debe situarse en los 50 dB.

Respuesta frecuencial

La voz abarca una gama de frecuencia que empieza por debajo de los 100 Hz y llega más allá de los 15.000 Hz.

Respuesta frecuencial

Margen de frecuencias que puede recoger un sistema de grabación.

Se recomienda normalmente una respuesta frecuencial desde 45 Hz hasta 18.000 Hz, procurando que sea uniforme en toda la gama de frecuencias.

Control de la intensidad

Los sistemas de grabación usados en estudios profesionales permiten controlar la intensidad de la señal.

Para una buena grabación, debe ajustarse el control de la intensidad (recording level o gain) de modo que en las partes de mayor intensidad se llegue a la zona de 0 dB, sin sobrepasarla, para evitar la saturación.

Si se realiza una grabación mediante Praat, debe observarse la parte de la pantalla de control de la grabación denominada Meter: el color verde indica una intensidad correcta, el amarillo indica que la intensidad está en el límite previo a la saturación y el rojo indica que la intensidad es demasiado elevada.

La grabación digital

La conversión analógico-digital

En la actualidad las grabaciones suelen realizarse en formato digital empleando sistemas que permiten la grabación directa en un soporte informático.

La ventaja de una grabación digital es que la señal puede almacenarse directamente en un formato electrónico –por ejemplo, en el disco duro de un ordenador o en una memoria– sin tener que realizar la conversión de analógico a digital necesaria cuando se emplea cinta magnética. De este modo, se puede disponer de modo inmediato de los datos.

Calidad de la grabación en DAT y Minidisk
Ventajas del DAT

Ofrece una mayor calidad en la grabación.

No utiliza ningún procedimiento de compresión de la señal sonora.

Ventajas del Minidisk

Menor tamaño que el DAT.

Soporte más difundido.

Facilidad para identificar y marcar las partes de una grabación.

Diferencias acústicas entre la grabación en DAT y en Minidisk, especialmente en las frecuencias situadas hacias los 5,5-6 kHz.

“We concluded that while there are undeniably differences in the speech signal between DAT and MD recordings, the derived estimates of formants, fundamental frequency, and glottal parameters reveal only small differences, and we maintain that the two recording media can be considered as equivalent for the purposes of prosodic analysis. Informal listening tests, switching between the two sources, confirmed that the recorded speech of both media sounds the same to the ear even when played over high quality headphones.”

Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf
“Although the numerical data of our comparison reveal differences, presumably arising as a result of the perceptually-masking-based compression used in the MiniDisc, the derived estimates of formants, fundamental frequency, and glottal parameters reveal only small differences and the two recording media can be considered equivalent for the purposes of prosodic analysis.”

Campbell, N. (2002). Recording techniques for capturing natural every-day speech. En LREC 2002. Proceedings of the 3rd International Conference on Language Resources and Evaluation. Las Palmas de Gran Canaria, Spain, May 29-31, 2002. Consultado en http://www.speech-data.jp/nick/pubs/lrec2002.pdf
Calidad de la grabación en MP3

Menor calidad que las grabaciones en DAT o en Minidisk debido a la compresión de la señal sonora.

“. . . whereas the MP3 encoding potentially offers considerably more compression of the data than MD recorders (1:11 for MP3), we find the differences in quality to be unacceptable for our purposes.”

Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Calidad aceptable si no se pretende realizar un análisis acústico.

“. . . MP3 compression may have an advantage in media-streaming, over poor-quality or low-bandwidth lines. It has good potential for wide distribution of sample speech data, such as from a web-page, in situations where the listener is more concerned with listening to the content of the speech than with an analysis of its characteristics.”

Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Micrófonos

Micrófonos incorporados al aparato de grabación

Al no poder colocar el micrófono cerca del informante si no es acercándole todo el aparato de grabación se recogen gran parte de los ruidos ambientales.

Puede aparecer en la grabación el ruido del propio aparato.

Micrófonos de solapa

Evitan la aparición de ruidos producidos por la salida del aire.

Se mantiene una distancia adecuada respecto a la fuente sonora.

Ruidos provocados por los propios informantes al moverse excesivamente.

Micrófonos de cabeza

Se mantiene siempre la misma distancia respecto a la fuente de sonido.

Evitan parcialmente los ruidos provocados por los movimientos del informante.

Requieren una adecuada colocación para evitar los efectos de la salida de aire por la cavidad nasal y los ruidos de explosión en las oclusivas.

Micrófonos remotos

Micrófonos conectados mediante transmisión por radiofrecuencia al aparato de grabación.

“Yet to date, we have not noticed a drop in recording quality that has been serious enough to prevent acoustic-prosodic analysis of the speech signal. Formant and pitch extraction is unaffected, and even voice-quality estimation from the derived glottal waveform appears to be effective.”

Campbell, N. (2002). Recording and storing of speech data. En International workshop on resources and tools in field linguistics (LREC 2002. 3rd International Conference on Language Resources and Evaluation). (pp. 6.1-3). Las Palmas de Gran Canaria, Spain, May 26-27, 2002. Consultado en http://www.mpi.nl/lrec/2002/papers/lrec-pap-06-nick-speech.pdf

Direccionalidad

Indica cómo responde un micrófono a la presión de la onda sonora que debe recoger para que sea posible la grabación.

Micrófonos omnidireccionales

Captan el sonido proveniente de todas las direcciones.

Favorecen la aparición del ruido ambiental en las grabaciones.

Cuando se dispone de una cámara sorda un micrófono omnidireccional puede ser utilizado con ventajas.

Son menos sensibles a los cambios de orientación de la fuente sonora derivados de los movimientos de cabeza del informante.

Micrófonos direccionales

Sensibles únicamente a la señal que llega de un lugar determinado.

Colocándolos en la dirección de los labios del informante se consigue captar adecuadamente la señal sonora, eliminado al máximo los sonidos indeseados del entorno.

Un buen complemento a una habitación acústicamente aislada es un micrófono direccional.

No recoge los sonidos que le llegan desde atrás o de los lados.

Respuesta frecuencial

Debe situarse dentro de la gama de frecuencias utilizadas en el habla.

Entre los (50 -) 75 Hz y los 12.000 (- 15.000) Hz.

Respuesta plana, sin modificaciones en ninguna de las frecuencias comprendidas entre el máximo y el mínimo.

Distancia y orientación respecto a la fuente de sonido

Micrófono siempre a la misma distancia de la fuente sonora a lo largo de toda la grabación.

Preferiblemente entre 10 y 40 cm de los labios del informante.

Micrófono no situado directamente en el canal de salida del aire.

Capuchón de espuma que atenua la fuerza con la que la corriente de aire llega al micrófono.

Inclinación suficiente colocándolo fuera del canal de salida del aire.

up arrow

Los participantes en el experimento y la grabación

Recogida de datos sobre los partcipantes en los experimentos

Conversación con el participante

Recogida de los datos personales.

Recogida de los datos relativos a su historia lingüística.

Cuestionarios

La obtención de datos sobre los participantes en los experimentos

Consentimiento

Es conveniente que los participantes firmen un documento en el que manifiestan estar informados de las condiciones de participación en el experimento.

Los equipos responsables de la recolección de las grabaciones y de la transcripción de sus respectivos materiales deben conocer la legislación de su país y ajustarse a ella. En algunos países, como España, es habitual pedir a los entrevistados que firmen un documento de conformidad y darles la garantía de que sus datos personales no estarán a disposición de nadie ajeno al equipo investigador. La difusión de las transcripciones se hace habitualmente mediante la sustitución sistemática y congruente de todos los nombres de personas o de lugares que aparezcan en la entrevista y que puedan permitir la identificación de los hablantes.

Las transcripciones realizadas de este modo pueden ofrecer garantías suficientes para su uso y estudio por parte de otros equipos participantes o colaboradores de PRESEEA, incluyendo la integración en el corpus general PRESEEA y su posible cesión a otros proyectos. Siendo así, corresponde a cada equipo recolector la responsabilidad de garantizar que los materiales que se ceden al conjunto de PRESEEA o a algín otro equipo cumplen los requisitos exigidos por la legislación existente en el país de origen. En el caso de que un equipo responsable ceda materiales a otros equipos o a miembros de otros equipos en su transcripción original, debería exigir la firma de un acuerdo de confidencialidad equivalente al suscrito por los miembros del equipo responsable.

PRESEEA. (2011). Guía PRESEEA para la investigación lingüística. Versión 2.0. PRESEEA, Proyecto para el estudio sociolingüístico del español de España y de América. Consultado en http://preseea.linguas.net/Portals/0/Metodologia/GUIA_PRESEEA_INVESTIGACION_LINGUISTICA.pdf
consentiment_CLC.jpg

Modelo de documento de consentimiento.

Col·legi de Logopedes de Catalunya. (2009). Models d’autoritzacions. Logopèdia. Revista del Col·legi de Logopedes de Catalunya, 16, 20-21. Consultado en http://www.clc.cat/pdf/module_26/61/logopedia_016____UaVJGj4Su7N7SfuQXXZ7_ca.pdf

Universitat Autònoma de Barcelona. (s. f.). Experimentació humana. Comissió d’ètica en experimentació animal i humana. Bellaterra: Universitat Autònoma de Barcelona. Consultado en http://www.recerca.uab.es/ceeah/pexphum.htm

Instrucciones para la grabación y presentación del corpus

Instrucciones

Es importante que el participante reciba de forma clara, por escrito, las instrucciones sobre el procedimiento de grabación del corpus o sobre la tarea que deba realizar.

Aumenta la confianza del participante.

Si se presentan por escrito se garantiza que, sea cual sea la persona encargada de realizar los experimentos, todos los participantes hayan recibido las mismas consignas.

Identificación de la grabación

Suele pedirse al locutor que empiece la grabación diciendo su nombre y apellidos, edad o lugar de nacimiento.

Numeración de las lecturas o de las tareas, dando instrucciones al participante para que indique el número de lectura o de tarea antes de empezar.

Grabación de varias lecturas del corpus

Permite descartar la primera si no resulta excesivamente natural.

Permite prever problemas en el momento del análisis.

Errores de producción

Error detectado por el propio participante:

Puede pedírsele que tras decir “repito”, repita el elemento del corpus en el que ha cometido el error (con todo su contexto) y siga adelante.

Error detectado por el investigador:

Si se trata de un corpus corto es conveniente que el experimentador tome nota para realizar una repetición una vez acabada la grabación.

Presentación del corpus

Escrito en un tipo de letra que resulte fácil de leer y de la manera más clara posible, de forma que la lectura o la realización de la tarea no requiera ningún esfuerzo adicional.

Listas de palabras o frases marco.

Presentación en orden aleatorio los enunciados.

Programas especficos para la presentación de estímulos y para la grabación del corpus.

Bavarian Archive for Speech Signals. (2015). SpeechRecorder. München: Bavarian Archive for Speech Signals, Institute of Phonetics and Speech Processing, Ludwig-Maximlians-Universität München. Consultado en http://www.bas.uni-muenchen.de/Bas/software/speechrecorder/

Dellwo, V. (2015). Sentence presenter. Material. Zurich: Phonetics Laboratory, University of Zurich. Consultado en http://www.pholab.uzh.ch/en/leute/dellwo/software.html

Familiarización con el corpus

Es conveniente que los participantes se familiaricen previamente con el corpus que van a grabar o con la tarea que van a realizar.

Tiempo de hacer preguntas al experimentador sobre la forma o el contenido del corpus.

Indicaciones generales sobre el objeto de la investigación –incluso pueden ser ficticias–, sin mencionar las variables objeto de estudio.

Elementos distractores

Elementos que no van a estudiarse.

Impiden que el informante descubra los fenómenos analizados y focalice su atención en ellos.

Explicación de la especificidad del corpus

Las listas de palabras, las frases marco y los logatomos son elementos poco habituales para los participantes en el experimento.

Requieren un comentario general sobre cómo debe realizarse la lectura.

Frases marco

Control de la grabación

Ajuste del nivel de la grabación de acuerdo con los máximos y mínimos de intensidad del locutor.

Es imprescindible escuchar atentamente la grabación mientras se está realizando.

Anotación de los errores que comete el locutor, si es el caso, para repetir posteriormente los fragmentos necesarios.

up arrow

La grabación


La grabación
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: