Tecnologies de la parla (2006-2007)

Joaquim Llisterri

Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

3 crèdits, 2on semestre


exclamation point

Aquí es publica informació de darrera hora sobre el desenvolupament de l’assignatura

line_red

Objectius

L’assignatura té com a objectiu presentar, des d’una perspectiva eminentment lingüística, les principals àrees de treball que constitueixen les tecnologies de la parla - síntesi, reconeixement i diàleg -, emmarcant-les en el context de la interacció persona - màquina.

El curs s’iniciarà amb una reflexió general sobre la comunicació oral entre persones i sistemes informàtics, per passar a continuació a una exposició dels principis bàsics, les tècniques, els sistemes i les aplicacions en els camps de la síntesi de la parla, el reconeixement de la parla i dels sistemes de diàleg persona - màquina. L'èmfasi del curs es posarà en els components i coneixements lingüístics implicats en el disseny, desenvolupament i avaluació de sistemes, més que no pas en les tecnologies més pròpies del processament de senyals o de la informàtica.


Programa

La comunicació oral persona - màquina

La interacció oral amb els ordinadors. Avantatges i limitacions de la comunicació oral persona - màquina. La multimodalitat en la interacció amb sistemes informàtics.

Les tecnologies de la parla

Desenvolupament històric i situació actual. Àmbits de treball de les tecnologies de la parla. Relacions amb altres disciplines.

La síntesi de la parla

Tècniques de síntesi de la parla: codificació del senyal sonor, concatenació d’unitats emmagatzemades, síntesi paramètrica síntesi per regles i síntesi articulatòria. La conversió de text a parla: etapes en la conversió de text a parla i sistemes actuals. Aplicacions de la síntesi de la parla.

El reconeixement de la parla

Característiques dels sistemes de reconeixement. Àmbits relacionats amb el reconeixement de la parla: identificació i verificació del locutor i identificació automàtica de la llengua. Tècniques per al reconeixement de la parla. Sistemes actuals. Aplicacions del reconeixement.

Els sistemes de diàleg

Característiques dels sistemes de diàleg. El disseny dels sistemes de diàleg. Aplicacions: sistemes d’informació, sistemes de transaccions i traducció de la llengua oral.

red Bibliografia bàsica

Durant el curs s’aniran proporcionant guions i bibliografies detallades per a cada tema a la pàgina web de l’assignatura. La bibliografia bàsica proposada és la següent:

COHEN, P. R. - OVIATT, S. L. (2006) "Multimodal interaction with computers", in BROWN, K. (Ed.) Encyclopedia of Language & Linguistics. Amsterdam: Elsevier. pp. 376-386.
http://dx.doi.org/10.1016/B0-08-044854-2/04362-5

HOLMES, J.N..- HOLMES, W. (2001) Speech Synthesis and Recognition. London: Taylor & Francis, 2nd edition.

HUANG, B.-H. - RABINER, L. R. (2006) "Automatic speech recognition: History", in BROWN, K. (Ed.) Encyclopedia of Language & Linguistics. Amsterdam: Elsevier. pp. 806-819.
http://dx.doi.org/10.1016/B0-08-044854-2/00906-8

LLISTERRI, J. (2001) "Les tecnologies de la parla", in MARTÍ, M.A. (Coord.) Les tecnologies del llenguatge. Barcelona: Edicions de la Universitat Oberta de Catalunya (Manuals, 53). pp. 239-272; trad. cast.: "Las tecnologías del habla", in MARTÍ, M.A. (Coord.) Tecnologías del lenguaje. Barcelona: Editorial UOC (Manuales, Humanidades), 2003. pp. 249-281.

LLISTERRI, J.- CARBÓ, C.- MACHUCA, M. J.- de la MOTA, C.- RIERA, M.- RÍOS, A. (2003) "El papel de la lingüística en el desarrollo de las tecnologías del habla", in CASAS GÓMEZ, M. (Dir.) - VARO VARO, C. (Ed.) VII Jornadas de Lingüística. Cádiz: Servicio de Publicaciones de la Universidad de Cádiz. pp. 137-191.
http://liceu.uab.cat/~joaquim/publicacions/Llisterri_Carbo_Machuca_Mota_Riera_Rios_03_Linguistica_Tecnologias_Habla.pdf

LLISTERRI, J.- MACHUCA, M. J. (Eds.) (2006) Los sistemas de diálogo. Bellaterra - Soria: Universitat Autònoma de Barcelona, Servei de Publicacions - Fundación Duques de Soria (Manuals de la Universitat Autònoma de Barcelona, Lingüística, 45).

NUSBAUM, H. C. - SHINTEL, H. (2006) "Speech synthesis", in BROWN, K. (Ed.) Encyclopedia of Language & Linguistics. Amsterdam: Elsevier. pp. 19-31.
http://dx.doi.org/10.1016/B0-08-044854-2/00913-5

O'SHAUGHNESSY, D. (1987) Speech Communication. Human and Machine. Reading, Mass.: Addison Wesley. Second Edition: New York: IEEE Press, 2000.

TAPIAS, D. (2002) "Interfaces de voz con lenguaje natural", in MARTÍ, M.A.- LLISTERRI, J. (Eds.) Tratamiento del lenguaje natural. Tecnología de la lengua oral y escrita. Barcelona: Edicions Universitat de Barcelona - Fundación Duques de Soria (Biblioteca de la Universitat de Barcelona, Manuales, 53). pp. 189-207.

Es por trobar una bibliografia més detallada a:
http://liceu.uab.cat/~joaquim/speech_technology/tecnol_parla/speech_tech_general/refs_gen_tecnol_parla.html


Avaluació

Els estudiants podran optar per una de les dues modalitats d’avaluació següents:
(1) Un treball de revisió bibliogràfica que representi una aportació crítica sobre el paper del coneixement lingüístic en les tecnologies de la parla.

(2) Un treball experimental o aplicat sobre algun aspecte relacionat amb la incorporació de coneixement lingüístic a sistemes de tecnologies de la parla.

En ambdós casos, el tema del treball es determinarà conjuntament amb el professor de l’assignatura.

Dates de lliurament dels treballs:

Els treballs es podran lliurar per correu electrònic, enviant-los des de l’adreça institucional a Joaquim.Llisterri@uab.cat.


Requisits previs

Per cursar aquesta assignatura no cal tenir coneixements previs sobre el camp de les tecnologies de la parla ni tampoc coneixements en l'àmbit tecnològic. Cal, però, tenir coneixements de fonètica equivalents als propis d’una assignatura de segon cicle com ara Fonètica o Fonética del español, especialment pel que fa a la descripció fonètica del castellà o el català, la fonètica acústica i el mètode experimental en fonètica.

Els estudiants que necessitin una introducció als conceptes bàsics de fonètica acústica o de fonètica experimental poden consultar la bibliografia recomanada a:

http://liceu.uab.cat/~joaquim/phonetics/fon_anal_acus/Bib_anal_acus.html
http://liceu.uab.cat/~joaquim/phonetics/fon_met_exper/Bib_met_exp.html


Joaquim Llisterri
Departament de Filologia Espanyola

Horari de classes:
Dilluns de 15 a 16:30 h, aula 218, del 19 de febrer al 28 de maig de 2007.

Horari d’atenció als estudiants:
Dilluns i dimecres de 13 a 14h, despatx B11-290.5, Facultat de Filosofia i Lletres
Divendres de 10.30 a 12.30, despatx K2004, Facultat de Traducció i Interpretació
i a hores prèviament concertades.

Telèfons:
93.581.19.12 (Facultat de Filosofia i Lletres) i 93.581.33.85 (Facultat de Traducció).

Correu electrònic
Joaquim.Llisterri@uab.catTecnologies de la parla (2006-2007)
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/speech_technology/Tecnol_parla_2006/Tecn_Parl_2006_prog.html
Last updated: 28/8/14 22:10