Tecnologías del habla

curso 2011-2012

Lorraine Baqué
Departament de Filologia Francesa i Romànica, Universitat Autònoma de Barcelona

Joaquim Llisterri
Departament de Filologia Espanyola, Universitat Autònoma de Barcelona


1. Introducción a las tecnologías del habla

La interacción oral con los sistemas informáticos

La interacción oral con los sistemas informáticos

La comunicación persona-máquina (HCI, Human - Computer Interaction)

La interacción con los ordenadores

La interacción humana

Las nuevas necesidades

¿Qué quisiéramos tener?

¿Qué tecnologías necesitamos?

Ventajas de la comunicación oral persona-máquina

Libertad para otras tareas simultáneas
Acceso a la información mediante el teléfono
Medio de comunicación natural

Limitaciones de la comunicación oral persona-máquina

La comunicación persona-persona mediatizada por una máquina (CMM, Computer-Mediated Communication)

Traducción entre modalidades

Escrito - escrito
Oral - oral
Escrito - oral
Oral - escrito
Lengua oral - movimientos labiales
Lengua oral - lengua de signos

Las tecnologías del habla

Las tecnologías del habla

El ámbito de las tecnologías del habla

Salida vocal

Entrada vocal

Interacción vocal

El desarrollo histórico de las tecnologías del habla


2. Los sistemas de síntesis del habla

Objetivos y aplicaciones de la síntesis del habla

Los objetivos y las aplicaciones de la síntesis del habla

Los objetivos de la síntesis del habla

Las aplicaciones de la síntesis del habla

La síntesis de palabras aisladas

La conversión de texto en habla

La síntesis del los estilos de habla y del habla con emociones

Síntesis de estilos de habla y de habla con emociones

La síntesis multimodal

Síntesis multimodal

Parámetros para la caracterización de los sistemas de síntesis del habla

Parámetros para la caracterización de los sistemas de síntesis del habla

La salida vocal

La versatilidad del sistema

La complejidad del procesamiento

La síntesis por codificación de la onda sonora

Síntesis por codificación de la onda sonora

Técnicas de codificación en el dominio temporal

Aplicaciones de la síntesis por codificación de la onda sonora

La síntesis paramétrica

El modelo de la fuente y el filtro en la síntesis del habla

Modelo de la fuente y el filtro en la síntesis del habla

La síntesis por LPC (Linear Predictive Coding)

Síntesis por LPC (Linear Predictive Coding)

El modelo de análisis por LPC

El modelo de síntesis por LPC

Adquisición y reproducción de la señal mediante LPC

La síntesis por formantes

Síntesis por formantes

Sintetizador por formantes

Elementos de un sintetizador por formantes

Configuración en serie y configuración en paralelo

Parámetros acústicos en la síntesis por formantes

El sintetizador por formantes de Klatt

El sintetizador por formantes de Klatt

La síntesis articulatoria

Síntesis articulatoria

La síntesis basada en corpus

Síntesis basada en corpus

Selección de unidades

Diseño del corpus

El sistema LoquendoTTS®

Las unidades de síntesis

Unidades de síntesis

Las unidades de síntesis

Frases y palabras

Difonemas (trifonemas, cuatrifonemas, polifonos) y semisílabas

Fonemas, alófonos y tramas (frames)

El desarrollo de diccionarios de unidades de síntesis

Determinación del tipo de unidades de síntesis

Determinación del inventario de unidades

Elaboración del diccionario de unidades de síntesis

La conversión de texto en habla

Los módulos de un sistema de conversión de texto en habla

Módulos de un conversor de texto en habla

Módulo de procesamiento previo del texto

Módulo de análisis lingüístico

Módulo de transcripción fonética automática

El diccionario de unidades de síntesis

El módulo prosódico

Módulo de conversión en parámetros acústicos

Módulo de síntesis

El módulo de procesamiento previo del texto

Módulo de procesamiento previo del texto

El módulo de procesamiento previo del texto

Problemas en el procesamiento previo del texto

Módulo de normalización

El módulo de transcripción fonética automática

Módulo de transcripción fonética automática

La transcripción fonética automática

Estrategias para la transcripción fonética automática

Problemas de la transcripción fonética automática

División silábica o silabificación

El módulo prosódico

Módulo prosódico

Asignación de duración segmental

Asignación de intensidad segmental

Asignación de pausas

Asignación de la curva melódica


3. Los sistemas de reconocimiento automático del habla

Los sistemas de reconocimiento automático del habla

Características de los sistemas de reconocimiento automático del habla. Técnicas para el reconocimiento automático del habla. Estructura de los sistemas de reconocimiento. Las aplicaciones del reconocimiento automático del habla.

4. Los sistemas de diálogo

Características de los sistemas de diálogo

Los sistemas de diálogo

Módulos de un sistema de diálogo

El diseño de un sistema de diálogo

Tipología de los sistemas de diálogo

El conocimiento lingüístico en los sistemas de diálogo

El conocimiento prosódico en los sistemas de diálogo

Conocimiento prosódico en los sistemas de diálogo

Tratamiento de las emociones en los sistemas de diálogo

La multimodalidad en los sistemas de diálogo

La multimodalidad en los sistemas de diálogo

Las aplicaciones de los sistemas de diálogo

Las aplicaciones de los sistemas de diálogo

Sistemas de información

Información sobre viajes en tren

Información sobre vuelos

Información ciudadana

Información meteorológica

Información académica

Consulta del correo electrónico

Portales de voz

Sistemas de transacciones

Venta de entradas

Banca telefónica

Servicios de atención al cliente

Sistemas de ayuda

La traducción automática del habla

La traducción automática del habla


Guions - Tecnologies de la parla (2011-2012)
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/speech_technology/Tecnol_parla_2011/Tecn_Parl_2011_guions.html
Last updated: 17/1/12 15:22