La manipulación del habla natural mediante Praat



La segmentación temporal mediante Praat

Una vez abierto el fichero que se desea segmentar, se selecciona en la ventana Objects.

Mediante el comando Edit, se abrirá una nueva ventana con la forma de onda y el espectrograma.

Se selecciona el segmento que se desea eliminar y, en el menú Edit de la ventana se elige la opción Cut. Los resultados pueden escucharse inmediatamente haciendo clic en la parte inferior de la ventana.

El nuevo fichero segmentado puede guardarse seleccionando toda la señal y empleando el comando Write selection to WAV file... en el menú File que aparece en la misma ventana.

La segmentación temporal del habla

up arrow

El filtrado mediante Praat

Una vez abierto el fichero que se desea filtrar, se selecciona en la ventana Objects.

En el apartado Synthesize se encuentra el comando Filter.

Si se selecciona pass Hann band, pueden realizarse los tres tipos de filtrado siguientes:

Filtro de paso bajo (Low-pass)

From frequency: 0
To frequency: límite superior de frecuencia

Filtro de paso alto (High-pass)

From frequency: límite inferior de frecuencia
To frequency: 0

Filtro de paso de banda (Band-pass)

From frequency: límite inferior de frecuencia
To frequency: límite superior de frecuencia

Los resultados pueden escucharse inmediatamente haciendo clic en la parte inferior de la ventana.

El fichero filtrado aparece en la ventana Objects con el nombre acabado en _band, y puede guardarse con el comando Write to WAV file en el menú Write.

Debe tenerse en cuenta que el filtrado suele reducir la intensidad de los sonidos. Para aumentarla, se selecciona el fichero de sonido y se escoge la opción Modify; el comando Multiply permite aumentar la intensidad global, multiplicándola por un factor.

Praat manual: Filtering

El filtrado del habla en bandas frecuenciales

La percepción del habla filtrada

up arrow

La manipulación de la duración mediante Praat

Manipulación de la duración de un segmento

Una vez abierto el fichero que se desea manipular, se selecciona en la ventana Objects.

En el apartado Manipulate se encuentra el comando To manipulation....

Con este procedimiento se crea un fichero que tiene el mismo nombre que el original, precedido de Manipulation, y que aparece en la ventana Objects.

Se selecciona el fichero cuyo nombre empieza por Manipulation y se edita mediante el comando Edit.

La ventana que aparece está dividida en tres partes: la forma de onda (Sound), la frecuencia fundamental (Pitch manipulation) y la duración (Duration manipulation).

Se marca el inicio y el final del segmento que se desea manipular, colocando el cursor en el lugar adecuado y, en el menú Dur, seleccionando Add duration point at cursor. Los errores pueden corregirse con el comando Remove duration points, también en el menú Dur.

Supongamos que tenemos un segmento de 0.21 segundos y que queremos reducir su duración a 0.10 segundos. Dividiendo la duración que queremos obtener por la duración original se obtiene la duración relativa, en este caso 0.47. A modo de ejemplo, 0.50 indica que el sonido manipulado tendrá una duración correspondiente al 50 % del original, mientras que 1.50 significa que la duración será de un 150 % respecto a la del sonido original.

Cerca de los puntos de inicio y final del segmento, se introduce un nuevo punto mediante el comando Add duration point at..., que se encuentra en el menú Dur. Aparece una ventana, y en Relative duration se escribe la duración relativa (0.47 en este caso); esta operación se realiza cerca del inicio del segmento y cerca del final del segmento. Estos puntos pueden añadirse en la parte estable del segmento para no modificar la parte en la que se da una mayor coarticulación con los segmentos adyacentes.

Los resultados pueden escucharse inmediatamente haciendo clic en la parte inferior de la ventana, activando la opción Sound & Pulses -- Pitch & Duration (PSOLA Manipulation) en el menú Synth.

duracion_praat_4a

En la ventana Objects, se selecciona el fichero Manipulation y Get resynthesis PSOLA. El resultado de la manipulación puede escucharse seleccionando el fichero Manipulation y el comando Play (PSOLA).

Con ello se crea un nuevo fichero, con las duraciones modificadas, cuyo nombre empieza por Sound y que aparece debajo del fichero denominado Manipulation.

Seleccionando este fichero y con el comando Play, puede escucharse el resultado de la manipulación.

El nuevo fichero puede guardarse con el comando Write to WAV file en el menú Write.

Otra alternativa consiste en emplear el comando Publish resynthesis, que se encuentra en el menú File de la ventana de edición.

Con ello se crea un fichero llamado Sound from ManipulationEditor, que contiene los valores de duración modificados y puede escucharse mediante Play o guardarse con el comando Write to WAV file en el menú Write.

Uso de Duration tier

Praat puede guardar en un fichero llamado Duration tier en el que se almacenan valores relativos de duración relacionados con el tiempo.

Duration tier se obtiene creando, en primer lugar, un fichero de manipulación (cuyo nombre empieza por Manipulation), seleccionándolo y empleando el comando Extract duration tier.

Con ello se crea un fichero cuyo nombre empieza con DurationTier.

Duration tier puede editarse junto con un fichero de sonido, seleccionando Sound y DurationTier simultáneamente en la ventana Objects y utilizando el comando Edit.

Para reemplazar las duraciones de un fichero con las de una Duration tier manipulada o con las de la Duration tier correspondiente a otro fichero, se selecciona el fichero Manipulation y el fichero Duration tier simultáneamente, y aparece la opcion Replace duration tier.

Una vez reemplazada la Duration tier, con la opción Get resynthesis PSOLA, se puede resintetizar el fichero Manipulation, con lo que se crea un nuevo fichero Sound que contiene las nuevas duraciones; también puede escucharse el fichero Manipulation con el comando Play (PSOLA).

Mediante el comando Edit y seleccionando el fichero Manipulation, también pueden editarse las duraciones en la ventana de edición.

Manipulación de las duraciones mediante scripts

El script function_createIsochronousSpeech.praat iguala la duración de todos los segmentos etiquetados en un TextGrid.

Dellwo, V. (2012). function_createIsochronousSpeech.praat. Praat plug-ins and scripts. Materials. Zürich: Phonetics Laboratory, University of Zurich. Consultado en http://www.pholab.uzh.ch/static/volker/software/function_createIsochronousSpeech.praat

Praat manual: Manipulation of duration

Praat manual: Duration tier

up arrow

La manipulación de la frecuencia fundamental mediante Praat

Una vez abierto el fichero que se desea manipular, se selecciona en la ventana Objects. En el apartado Manipulate se encuentra el comando To manipulation....

Con este procedimiento se crea un fichero que tiene el mismo nombre que el original, precedido de Manipulation, y que aparece en la ventana Objects.

Se selecciona el fichero cuyo nombre empieza por Manipulation y se edita mediante el comando Edit.

La ventana que aparece está dividida en tres partes: la forma de onda (Sound), la frecuencia fundamental (Pitch manipulation) y la duración (Duration manipulation).

Cambios en los puntos de frecuencia fundamental mediante comandos

Mediante el comando Remove pitch point(s) que aparece bajo el menú Pitch se eliminan todos los puntos de frecuencia fundamental (originalmente en verde); una vez eliminados, los puntos del fichero original aparecen en color gris.

Mediante el comando Remove pitch point(s) que aparece bajo el menú Pitch se pueden eliminar también los puntos seleccionados con el cursor; el punto del fichero original aparece en color gris.

Mediante el comando Add pitch point at cursor que aparece bajo el menú Pitch se añade un punto de frecuencia fundamental en el lugar en el que se halla en cursor.

Se puede añadir un punto especificando el tiempo y la frecuencia fundamental mediante el comando Add pitch point at...; se abre una ventana, en la que se indica la frecuencia fundamental deseada.

Cambios en los puntos de frecuencia fundamental mediante el cursor

La modificación puede realizarse moviendo uno o varios puntos ya existentes con el cursor, después de seleccionarlos.

Los resultados pueden escucharse inmediatamente haciendo clic en la parte inferior de la ventana, activando la opción Sound & Pulses -- Pitch & Duration (PSOLA Manipulation) en el menú Synth.

Los errores pueden corregirse con el comando Remove pitch point(s), también en el menú Pitch.

En la ventana Objects, se selecciona Get resynthesis PSOLA y con ello se crea un nuevo fichero, con los puntos de frecuencia fundamental modificados, cuyo nombre empieza por Sound y que aparece debajo del fichero denominado Manipulation.

Seleccionando este fichero y con el comando Play, puede escucharse el resultado de la manipulación.

El nuevo fichero puede guardarse con el comando Write to WAV file en el menú Write.

Otra alternativa consiste en emplear el comando Publish resynthesis, que se encuentra en el menú File de la ventana de edición.

Con ello se crea un fichero llamado Sound from ManipulationEditor, que contiene los valores de duración modificados y que puede escucharse mediante Play o guardarse con el comando Write to WAV file en el menú Write.

Uso de Pitch tier

Praat puede guardar en un fichero llamado Pitch tier en el que se almacenan valores de frecuencia fundamenal alineados con el tiempo.

Pitch tier se obtiene creando, en primer lugar, un fichero de manipulación (cuyo nombre empieza por Manipulation), seleccionándolo y empleando el comando Extract pitch tier.

Con ello se crea un fichero cuyo nombre empieza con PitchTier.

Pitch Tier puede editarse junto con un fichero de sonido, seleccionando Sound y PitchTier simultáneamente en la ventana Objects.

Para reemplazar los valores de frecuencia fundamental de un fichero con los de una Pitch tier manipulada o con las de la Pitch tier correspondiente a otro fichero, se selecciona el fichero Manipulation y el fichero PitchTier simultáneamente, y aparece la opcion Replace pitch tier.

Una vez reemplazada la Pitch tier, con la opción Get resynthesis PSOLA, se puede resintetizar el fichero Manipulation, con lo que se crea un nuevo fichero Sound que contiene los nuevos valores de frecuencia fundamental; también puede escucharse el fichero Manipulation con el comando Play (PSOLA).

Praat manual: Manipulation of pitch

Praat manual: Pitch tier

up arrow

La manipulación de la intensidad mediante Praat

Para la manipulación de la intensidad, se parte de un segmento en el cual realizamos las mediciones de intensidad en los puntos deseados para crear una Intensity tier.

Una vez abierto el fichero que se analizará, en el menú Annotate se selecciona To TextGrid.

En la ventana que se abre para que pueda crearse el TextGrid, se indica que sólo se utilizará un tier y que éste estará formado por puntos (point tier).

Se selecciona simultáneamente el archivo cuyo nombre empieza por Sound y el archivo cuyo nombre empieza por Textgrid y se edita el TextGrid junto con el sonido.

En la ventana de análisis se señalan los puntos de intensidad colocando el cursor en el lugar deseado. En el ejemplo, los valores serían 71,53 dB (0.0696 s), 72,61 dB (0.1137 s) y 63,13 dB (0.2296 s).

Una vez obtenidos los datos, se procede a crear el estímulo que manipularemos. Para ello, se selecciona el fichero de sonido (Sound) y en el menú Analyse, se selecciona To Intensity...

Así se crea un fichero cuyo nombre empieza por Intensity, que se convierte en un conjunto de puntos mediante el comando Down to IntensityTier en el menú Convert.

A continuación, se seleccionan conjuntamente el fichero de sonido (Sound) y la IntensityTier y se editan.

Con la opción Remove point(s) en el menú Point, seleccionando con el cursor la totalidad de la señal, se eliminan todos los puntos de intensidad.

Una vez se han eliminado todos los puntos de intensidad, se introducen los nuevos valores de intensidad y de tiempo -71,53 dB (0.0696 s), 72,61 dB (0.1137 s) y 63,13 dB (0.2296 s) en el ejemplo- con el comando Add point at... en el menú Points.

El siguiente paso es crear un nuevo archivo de sonido, seleccionando simultáneamente los ficheros cuyos nombres empiezan por IntensityTier y por Sound, y utilizando el comando Multiply.

De este modo se crea un nuevo fichero, cuyo nombre empieza por Sound y acaba en _int, que puede escucharse o editarse.

En principio, el archivo Soun_int debería tener las intensidades modificadas que se han almacenado en IntensityTier, pero puede comprobarse, efectuando mediciones sobre la curva de intensidad en los puntos en el tiempo que se han determinado anteriormente, que no sucede así. La mayoría de los valores son más altos que los previstos: 82,24 db (0.0696 s), 83,57 dB (0.1137 s), 65,26 dB (0.2296 s).

El fichero cuyo nombre empieza por IntensityTier puede editarse para modificar los valores hasta conseguir los resultados deseados.

Si se abre simultáneamente el fichero TextGrid y el fichero Sound y se editan con el comando Edit , se crea una ventana de edición.

Seleccionando IntensityTier y editando con el comando Edit , se abre una nueva ventana de edición.

La posición del cursor está sincronizada en estas dos ventanas.

Praat manual: Manipulation of intensity

Praat manual: Intensity Tier

up arrow
La manipulación del habla natural mediante Praat
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: