La comparación entre muestras de habla en el contexto judicial


El problema de la comparación de muestras de habla

Hablante desconocido (habitualmente el sospechoso): grabación dubitada

Hablante conocido: grabación indubitada

El problema: ¿se trata de la misma voz en la grabación dubitada y en la grabación indubitada?

El resultado: el sospechoso se identifica como el culpable si se demuestra que las dos grabaciones corresponden a la misma voz

Implica el estudio de

La variación fonética en el nivel acústico

La identificación del hablante requiere evaluar si las diferencias entre muestras de habla se deben a la variación intralocutor o a la variación interlocutor

La variación interlocutor debe ser mayor que la variación intralocutor

Parámetros acústicos para la caracterización de la individualidad del locutor

Estudio de “dimensiones”, parámetros o rasgos fonéticos para caracterizar la variación

Parámetros fonéticos acústicos

Parámetros acústicos cuantificables automáticamente

Parámetros lingüísticos

Variación geográfica, social y de estilo

Parámetros paralingüísticos

BATTANER, E.- GIL, J.- MARRERO, V.- LLISTERRI, J.- CARB, C.- MACHUCA, M.J.- de la MOTA, C. - ROS, A. (2003) "VILE: Estudio acústico de la variación inter e intralocutor en español", in SEAF 2003. Actas del II Congreso de la Sociedad Española de Acústica Forense. Barcelona, 10 y 11 de abril de 2003. Barcelona: SEAF, Sociedad Española de Acústica Forense. pp. 59-70.

VILE, Estudio acústico y perceptivo de la variación inter e intralocutor en español

Parámetros referidos a la fuente

Valor medio de la f0

Contorno tonal

Forma de la onda glotal

Fluctuación de la f0

Parámetros referidos a los resonadores

Frecuencias formánticas; anchura de banda de los formantes; trayectorias de los formantes; distancias y ratios entre formantes

LTAS (Long Term Averaged Spectrum)

Sonidos turbulentos y consonantes nasales

Efectos coarticulatorios (vocales, nasales y líquidas)

Variables temporales

Tiempo total de habla

Proporción de habla y de silencios

Velocidad del habla

Importancia relativa de los parámetros en el establecimiento de la individualidad del locutor

Prioridad de la f0

Prioridad del LTAS

Prioridad de la estructura espectral: frecuencias formánticas absolutas o trayectorias formánticas F1, F2 y F3, y distancias entre F1-F2 y F2-F3

Información localizada entre los 2.5 kHz y los 3.5 kHz

Misma prioridad para la f0 y la estructura formántica

Variables temporales

Contorno tonal

La importancia de cada parámetro puede diferir

Mayoría de trabajo publicados en los años 70 y 80, asumidos - sin cuestionarlos - como punto de partida de los actuales

Falta de resultados coincidentes y concluyentes sobre el parámetro más decisivo para el reconocimiento del hablante

Dificultad de establecer una jerarquía absoluta entre los parámetros

Interdependencia entre los índices

Prioridad relativa dependiente del hablante

Número muy variable de locutores en los experimentos realizados: entre 8 y 40 voces distintas

El “parámetro fonético ideal”

NOLAN, F. (1983) The Phonetic Bases of Speaker Recognition. Cambridge: Cambridge University Press. p. 11.

Elevada variabilidad entre locutores y baja variabilidad en el mismo locutor

Resistente a los intentos de imitación o de cambiar la voz

Elevada frecuencia de aparición en las muestras disponibles

Robusto frente a las distorsiones de la transmisión

Relativamente fácil de extraer y de medir

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 52.

Cada parámetro debe de mantener la máxima independencia respecto a los demás parámetros

F0_mitja_3locutors_Rose.jpg

Valores medios de f0 en tres locutores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 11.

La comparación de muestras de habla

Problema: solapamiento en los valores de un mismo parámetro para diferentes locutores

Valors_mitjans_1dimensio_3locutors_Rose.jpg

Valores medios de una dimensión acústica en tres locutores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 12.

Establecimiento de umbrales que permitan establecer probabilidades

Probabilidad de observar una diferencia entre los valores de un determinado parámetro si corresponden a un mismo locutor

Probabilidad de observar una diferencia entre los valores de un determinado parámetro si corresponden a dos locutores diferentes

Valors_mitjans_1dimensio_3locutors_Rose.jpg

Valores medios de una dimensión acústica en tres locutores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 12.

Locutor DM: 1399Hz - 1723 Hz
Locutor MD: 1351 Hz - 1799 Hz
Locutor RS: 1244 Hz - 1406 Hz

Umbral de 150 Hz
Diferencias de más de 150Hz: locutores diferentes
Diferencias de menos de 150Hz: mismo locutor

Diferencia entre el valor máximo y mínimo de RS: dos locutores diferentes!
Diferencia entre el valor máximo de RS y el mínimo de DM: mismo locutor!

El umbral de 150Hz permite discriminar correctamente un 60% de los pares de comparaciones de valores posibles entre locutores y en un mismo locutor

Si los valores difieren en menos de 150Hz hay un 60% (1,5 veces) de probabilidades de que correspondan al mismo locutor
Si los valores difieren en más de 150Hz hay un 60% (1,5 veces) de probabilidades de que correspondan a dos locutores diferentes

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. pp. 12-14.

El habla es un fenómeno multidimensional

La comparación se lleva a cabo considerando diversos parámetros

Valors_mitjans_2dimensio_3locutors_Rose.jpg

Valores medios de dos dimensions acústicas en tres locutores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 15.

La introducción de un nuevo parámetro permite discriminar el 70% de los posibles pares de valores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 15.

Valors_mitjans_3dimensio_3locutors_Rose.jpg

Valores medios de tres dimensions acústicas en tres locutores

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 17.

Multidimensionalitat_Rose.jpg

Multidimensionalidad en la comparación entre muestras de habla

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 23.

Si los valores están correlacionados no aumenta la capacidad de discriminación

No todos los parámetros o dimensiones tienen la misma capacidad de discriminación

Los parámetros más relevantes son los que presentan mayor variación entre locutores que en un mismo locutor

Problemas en el contexto judicial

No es factible controlar los factores que inciden en la variación de un determinado parámetro

Condicionantes de la situación en la que se producen las muestras

Reducción de los parámetros disponibles para la comparación

Canal de transmisión (teléfono)

Sistema de grabación de las muestras dubitadas y de las indubitadas

Factores que inciden en la fiabilidad de la comparación

Número de muestras de habla del locutor dubitado y del locutor indubitado

Número de parámetros que pueden compararse

Número de observaciones que pueden realizarse para cada parámetro

Técnicas para la comparación de muestras de habla

Análisis auditivo

Necesario para determinar la inteligibilidad de las muestras

til en la selección de parámetros acústicos que se toman en consideración

Centrado en el análisis de la variación alofónica y de la cualidad de la voz (voice quality)

Efectes_temps_formacio_Hollien.jpg

Efecto de la formación y del tiempo entre la toma de muestras del mismo locutor en la identificación de voces

HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.

Efecte_temps_Hollien.jpg

Efecto del tiempo entre la toma de muestras (4 semanas) del mismo locutor en la identificación de voces similares

HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.

Efecte_temps_Hollien.jpgFactors_Identificacio_Hollien.jpg

Factores que inciden en la identificación de voces

N: habla normal; S: habla producida en condiciones de estrés; D: habla intentando “disfrazar” la voz

A: sujetos que conocían muy bien al locutor
B: sujetos que no conocían al locutor pero entrenados para reconocer las voces
C: sujetos entrenados pero que no conocen ni el locutor ni la lengua

HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.

Rasgos considerados en el análisis auditivo

HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. pp. 59 ss.

Tono: nivel general, variabilidad y patrones tonales

Articulación: producción idiosincrática de elementos segmentales

Cualidad general de la voz

Prosodia: velocidad de habla y fluidez melódica

Intensidad vocal: variabilidad

Carácterísticas del habla: variante geográfica, acento lingüístico, coarticulación, patologías

Análisis acústico

Requiere muestras comparables

Requiere la normalización de valores

Centrado en los parámetros que presentan un menor grado de variación intralocutor

Basado en el conocimiento de los indicios acústicos de cada clase de sonidos

Análisis fonético auditivo-acústico

Constituye la técnica más aceptada hoy en día

Dos voces pueden parecer auditivamente similares y presentar diferencias acústicas significativas

Dos hablantes con las mismas características acústicas pueden diferir en ciertos rasgos lingüísticos

En la mayoría de los casos se estima la probabilidad de observar las diferencias que se encuentran entre muestras de habla

No se llega a una identificación o a una exclusión absoluta

Un modelo de la voz

Model_veu_Rose.jpg

ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 285.

Fonética judicial


La comparación entre muestras de habla en el contexto judicial
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: