Tecnologies de la parla (2005-2006)

Joaquim Llisterri

Departament de Filologia Espanyola, Universitat Autònoma de Barcelona


La comunicació oral persona - màquina

La interacció oral amb els ordinadors

Avantatges de la comunicació oral persona - màquina

Llibertat per a altres tasques simultànies. Accés a l’ordinador mitjançant el telèfon. Sistema potencialment econòmic. Mitjà de comunicació natural.

Limitacions de la comunicació oral persona - màquina

Manca de naturalitat dels sistemes de síntesi. Limitacions en el reconeixement de parla contínua en sistemes independents del locutor. Manca d’adequació dels models de diàleg persona-màquina.

La multimodalitat en la interacció amb sistemes informàtics


Les tecnologies de la parla

Definició del camp

Desenvolupament històric

Àmbits de treball de les tecnologies de la parla

La síntesi de la parla. El reconeixement de la parla. Els sistemes de diàleg.

Aplicacions de les tecnologies de la parla

Aplicacions de la síntesi

Síntesi de paraules aïllades. Síntesi a partir del text.

Aplicacions del reconeixement

Reconeixement de paraules aïllades. Dictat automàtic. Identificació i verificació del locutor. Reconeixement en entorns adversos. Ensenyament de llengües estrangeres.

Aplicacions del diàleg persona - màquina

Sistemes d’informació. Sistemes de transaccions. Traducció automàtica de la parla.

La síntesi de la parla

Consideracions generals sobre la síntesi

Objectius. Nocions generals sobre la síntesi. Paràmetres que caracteritzen un sistema de síntesi. Línies de recerca actuals. Resultats assolits. Aplicacions de la síntesi de la parla. El disseny d’una aplicació.

Tècniques de síntesi de la parla

Codificació del senyal sonor

Característiques dels sistemes de codificació i emmagatzemament del senyal sonor. Tècniques de codificació en el domini temporal. Aplicacions.

Síntesi paramètrica per concatenació d’unitats emmagatzemades

Les unitats de síntesi. La síntesi per LPC. La síntesi per formants. El sintetitzador de Klatt. L’anàlisi per a la síntesi.

Síntesi per regles

Característiques generals. El Pattern Playback dels Laboratoris Haskins. El sistema Delta de síntesi per regles.

Síntesi articulatòria

La conversió de text a parla

Desenvolupament dels sistemes de conversió de text a parla. Esquema general d’un conversor. Etapes en la conversió de text a parla. Sistemes i productes actuals de conversió de text a parla.

El reconeixement de la parla

Característiques generals dels sistemes de reconeixement

Tipus d’enunciat. Nombre de locutors. Tamany del vocabulari.

Àmbits relacionats amb el reconeixement de la parla

Reconeixement en ambients adversos. Identificació i verificació del locutor. Identificació automàtica de la llengua. Comprensió de la parla.

Punts de vista en el reconeixement de la parla

La producció de la parla. El senyal acústic. L’audició. La percepció.

El tractament del senyal en el reconeixement de la parla

Comparació de senyals continus: senyals continus i senyals parametritzats. Comparació de senyals discrets.

Estratègies per al reconeixement de la parla

Decodificació acustico-fonètica. Reconeixement de paraules aïllades. Reconeixement de grans vocabularis. Reconeixement de parla contínua.

Sistemes i productes actuals de reconeixement de la parla


Els sistemes de diàleg

Característiques generals d’un sistema de diàleg

Mòduls d’un sistema de diàleg. Tasques d’un sistema de diàleg.

El disseny dels sistemes de diàleg

Model de l’entorn. Model de la tasca. Model de l’usuari. Bases de coneixement.

Tècniques de disseny dels sistemes de diàleg

Disseny a partir de la intuïció. Disseny a partir de l’observació de diàlegs naturals. Disseny per simulació de la interacció persona - màquina. Disseny mitjançant la interacció d’un sistema real.

Tipologia dels sistemes de diàleg

Sistemes de diàleg guiats. Sistemes de diàleg cooperatius. Sistemes de diàlegs constitutius. Sistemes de diàleg adaptatius.

Sistemes de diàleg actuals

Sistemes d’informació. Sistemes de transaccions. Traducció de la llengua oral.


Guions - Tecnologies de la parla (2005-2006)
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/speech_technology/Tecnol_parla_2005/Tecn_Parl_2005_guions.html
Last updated: 08/08/06 14:13