Conocimiento lingüístico y tecnologías del habla


Conocimiento lingüístico en las tecnologías del habla

Natalia Dos Santos Figueiredo, Santiago González Fuente, Ander Martínez Egurcegui y Dimitra Theodorou

Conocimiento fonético y tecnologías del habla, Máster en Fonética y Fonología, Programa Oficial de Estudios Fónicos, Consejo Superior de Investigaciones Científicas - Universidad Internacional Menéndez Pelayo, curso 2011 - 2012.

Tecnologías del habla Conocimiento lingüístico
Conversión de texto en habla
Módulo de segmentación Conocimiento ortográfico
Módulo de transcripción fonética automática Conocimiento ortológico (normativa, dialectología, sociolingüística)

Inventario de fonemas y alófonos de la lengua

Reglas de correspondencia grafema-alófono

Patrones de acentuación

Fonética sintáctica
Módulo categorizador Conocimiento morfológico: categorías léxicas, segmentación de la palabra (POS tagger)
Módulo estructurador - pausador Conocimiento sintáctico: estructura de constituyentes (Parser)
Módulo prosódico Unidades prosódicas y patrones de f0 asociados a cada unidad

Factores temporales: duración

Patrones de intensidad/energía

Cualidad de voz
Reconocimiento automático del habla
Módulo de extracción de características Conocimiento fonético acústico

Conocimiento fonético articulatorio (en sistemas multimodales)

Conocimiento prosódico audiovisual (en sistemas multimodales)

Conocimiento del sistema auditivo - Conocimiento psicoacústico
Modelos acústicos Inventario de unidades fonéticas y fonológicas de la lengua
Modelo de lenguaje Conocimiento sintagmático (probabilístico)
Diccionario de pronunciación Conocimiento sobre formas canónicas (fonológicas) y sobre variación fonética (fonética)
Sistemas de diálogo
Módulo de gestión del diálogo Conocimiento pragmático

Conocimiento prosódico
Recursos lingüísticos para el desarrollo de tecnologías del habla Conocimiento lingüístico
Corpus para la síntesis

Corpus para el reconocimiento
Conocimiento sociolingüístico (variación diatópica, diastrática y diafásica)

Inventario de fonemas y alófonos de la lengua

Frecuencia de aparición de unidades
Corpus para sistemas de diálogo Conocimiento del dominio de la aplicación

Análisis de la conversación

Pragmática

up arrow

Claudia Colomés, José Alejandro Correa, Rubén Pérez, Cristina Polo y María Ruiz

Conocimiento fonético y tecnologías del habla, Máster en Fonética y Fonología, Programa Oficial de Estudios Fónicos, Consejo Superior de Investigaciones Científicas - Universidad Internacional Menéndez Pelayo, curso 2010 - 2011.

Conversión de texto en habla Reconocimiento automático del habla Sistemas de diálogo Recursos
Conocimiento ortográfico Reglas de asociación grafía-segmento

Conocimiento ortológico

Tratamiento de los signos de puntuación

Interpretación de elementos prosódicos reflejados en la escritura

Adecuación ortográfica de la salida

Reflejo en la escritura de elementos prosódicos

Adecuación ortográfica de la salida Transcriptor fonético automático
Conocimiento fonético Conocimiento sociofonético: norma, variación geográfica (diátopica), variación estilística (diafásica), variación generacional (diastrática)

Conocimiento sobre características vocales del locutor

Conocimiento sobre necesidades especiales de accesibilidad

Conocimiento sociofonético: norma, variación geográfica (diátopica), variación estilística (diafásica), variación generacional (diastrática)

Conocimiento sobre necesidades especiales de accesibilidad

Informante
Conocimiento fonético segmental Inventario de sonidos

Inventario de sonidos

Fenómenos relacionados con la coarticulación
Transcriptor fonético automático
Conocimiento fonético suprasegmental Duración (Tiempo)

Intensidad (Amplitud)

Tono - Tonía (Frecuencia fundamental)

Acentuación

Patrón melódico

Tempo - velocidad de habla

Pausas

Ritmo
Duración (Tiempo)

Intensidad (Amplitud)

Tono - Tonía (Frecuencia fundamental)

Acentuación

Patrón melódico

Tempo - velocidad de habla

Pausas

Ritmo
Parámetros prosódicos relacionados con fenómenos pragmáticos

Parámetros prosódicos relacionados con las “disfluencias“
Conocimiento fonológico Sistema fonológico de la lengua

Reglas de realización de alófonos
Sistema fonológico de la lengua

Reglas de realización de alófonos
Conocimiento morfosintáctico Categorías morfológicas Categorías morfológicas Gramática
Conocimiento léxico Campo léxico

Tratamiento de mayúsculas

Tratamiento de siglas, abreviaturas y cifras

Campo léxico Léxico
Conocimiento sintáctico Relaciones y regímenes sintácticos: argumentos

Patrón melódico asociado a modalidad oracional o al foco
Patrón melódico asociado a modalidad oracional o al foco

Reflejo en la escritura de elementos prosódicos
“Disfluencias“ Gramática
Conocimiento pragmático Reflejo en la escritura de elementos prosódicos Tema y rema (información conocida e información nueva)

“Disfluencias“
up arrow

Alicia González, María Olimpia Pérez, Manoela Ramalho y Laura Rodríguez

Conocimiento fonético y tecnologías del habla, Máster en Fonética y Fonología, Programa Oficial de Estudios Fónicos, Consejo Superior de Investigaciones Científicas - Universidad Internacional Menéndez Pelayo, curso 2009 - 2010.

Conversión de texto en habla

Tratamiento previo del textoAnálisis lingüísticoTranscripción fonética automáticaMódulo prosódicoMódulo de síntesis
Tratamiento de números: fechas, teléfonos, ordinales, números romanos

Tratamiento de los símbolos especiales

Expansión de las siglas

Expansión de abreviaturas

Tratamiento de los signos de puntuación: ambigüedad, segmentación

Corrector ortográfico: general y específico
Reconocimiento de entidades (named entities)

Segmentación de unidades (chunking)

Etiquetado morfológico (POS): tratamiento de la ambigüedad

Etiquetado sintáctico (parsing): tratamiento de la ambigüedad

Etiquetado textual: correferencia

Etiquetado semántico (a partir de ontologías, frames, WordNet)

Etiquetado pragmático: marcadores discursivos, marcadores de cortesía, marcadores de estilo de habla
Inventario de alófonos: definición de los alófonos, selección de variedad geográfica, social y de estilo

Reglas de silabificación y de resilabificación (fonotaxis)

Reglas de acentuación léxica y de grupo acentual

Pronunciación de extranjerismos

Pronunciación de neologismos extranjeros

Pronunciación de nombres propios extranjeros

Modelo de acentuación: F0, duración, intensidad en función del contexto

Segmentación prosódica: unidades (grupo acentual, grupo tónico, grupo entonativo, frase intermedia, grupo fónico...)

Modelo de asignación de patrones melódicos en función de: factores sintácticos, factores pragmáticos

Modelo de duración segmental

Modelo de intensidad segmental

Modelo de pausas
Unidades de síntesis

Concatenación de unidades

Reconocimiento automático del habla

Módulo de tratamiento de la señalModelo acústicoModelo de lenguaje
Modelado psicoacústico Modelos acústicos (parámetros acústicos) en función de la variación: de registro/estilo/situación comunicativa, geográfica, social

Modelo prosódico

Tratamiento de las “disfluencias“
Modelos de lenguaje (léxico y combinatoria) en función de la variación: de registro/estilo/situación comunicativa, geográfica, social

Tratamiento de las “disfluencias“

Diccionario de pronunciación (monolexemático y polilexemático)

Sistema de diálogo

Módulo de gestión del diálogoMódulo de representación semánticaMódulo de generación
Modelo de usuario: conocimiento pragmático - análisis de la conversación (turnos de palabra), actos de habla, relevancia / inferencia

Modelo de usuario: conocimiento sociolingüístico
Conocimiento semántico (PLN) Conocimiento sintáctico (PLN)
up arrow
Conocimiento lingüístico y tecnologías del habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: