Spoken Language Systems
Bibliography


Person-machine communication

Multimodality

Spoken language systems


General overviews


= Recommended introductory/general reading

ALLEN, J.- BYRON, D.- DZIKOVSKA, M.- FERGUSON, G.- GALESCU, L.- STENT, A. (2001) "Towards Conversational Human-Computer Interaction", AI Magazine 22, 4: 27-37.
http://www.cs.rochester.edu/research/cisd/pubs/2001/allen-et-al-aimag2001.pdf

CARRÉ, R.- DÉGREMONT, J.-F.- GROSS, M. - PIERREL, J.-M.- SABAH, G. (1991) Language humain et machine. Paris: Presses du CNRS. [Chap 5: Les mécanismes du dialogue]

COLE, R.- HIRSCHMAN, L.- ATLAS, L.- BECKMAN, M.- BIERMAN, A.- BUSH, M.- COHEN, J.- GARCÍA, O.- HANSON, B.- HERMANSKY, H.- LEVINSON, S.- McKEOWN, K.- MORGAN, N.- NOVICK, D.- OSTENDORF, M.- OVIATT, S. - PRICE, P.- SILVERMAN, H.- SPITZ, J.- WAIBEL, A.- WEINSTEIN, C.- ZAHORIAN, S.- ZUE. V. (1995) "The challenge of spoken language systems: Research direction for the nineties", IEEE Transactions on Speech and Audio Processing 3, 1: 1-21.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.125.3098

GIACHIN, E. (1997) "Spoken Language Dialogue", in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds.) Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press. pp. 241-244.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.366.9300

GIACHIN, E.- McGLASHAN, S. (1997) "Spoken Language Systems", in YOUNG, S.- BLOOTHOOFT, G. (Eds.) Corpus-Based Methods in Language and Speech Processing. Dordrecht: Kluwer Academic Publishers (Text, Speech and Language Technology, 2) pp. 69-117.

HEISTERKAMP, P. (2003) ""Do not attempt to light with match!": Some thoughts on progress and research goals in Spoken Dialog Systems", Towards a Roadmap for Speech Technology, ELSNET Special Session. Eurospeech’03 - Interspeech 2003. 8h european conference on speech communication and technology. Geneva, Switzerland, 1-4 September, 2003.
http://www.elsnet.org/dox/heisterkamp.pdf


LLISTERRI, J. (2006) "Introducción a los sistemas de diálogo", in LLISTERRI, J.- MACHUCA, M. J. (Eds.) Los sistemas de diálogo. Bellaterra - Soria: Universitat Autònoma de Barcelona, Servei de Publicacions - Fundación Duques de Soria (Manuals de la Universitat Autònoma de Barcelona, Lingüística, 45). pp. 11-21.
http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf


LÓPEZ-CÓZAR, R. (2006) "Análisis y gestión del diálogo", in LLISTERRI, J.- MACHUCA, M. J. (Eds.) Los sistemas de diálogo. Bellaterra - Soria: Universitat Autònoma de Barcelona, Servei de Publicacions - Fundación Duques de Soria (Manuals de la Universitat Autònoma de Barcelona, Lingüística, 45). pp. 119-152.

LUZATTI, D. (1993) "Dialogue homme-machine" in FUCHS, C. Linguistique et traitement automatique des langues. Paris: Hachette (Hachette Université Linguistique) pp. 267-290.

McTEAR, M.F. (2002) "Spoken dialogue technology: enabling the conversational interface", ACM Computing Surveys 34, 1 (March): 90-169.
http://dx.doi.org//10.1145/505282.505285

Meng, H., & Li, D. (2006). Multilingual spoken dialog systems. In T. Schultz & K. Kirchhoff (Eds.), Multilingual speech processing. (pp. 399-447). Burlington, MA: Elsevier Academic Press.

PIERREL ,J.M. (1987) "Aspects of Man-Machine Voice Dialog", in HATON, J.P. (Ed.) Fundamentals in Computer Understanding. Cambridge University Press, pp. 249-274.

TAPIAS MERINO, D. (2002) "Interfaces de voz con lenguaje natural". in MARTÍ, M.A.- LLISTERRI, J. (Eds.) Tratamiento del lenguaje natural. Tecnología de la lengua oral y escrita. Barcelona: Edicions Universitat de Barcelona - Fundación Duques de Soria (Biblioteca de la Universitat de Barcelona, Manuales, 53). pp. 189-207.


Sanchís, E. (2016). Discurso y diálogo. In Á. L. Gonzalo (Ed.), Tecnologías del lenguaje en España. Comunicación inteligente entre personas y máquinas (pp. 101-116). Madrid - Barcelona: Fundación Telefónica - Ariel. Retrieved from https://www.fundaciontelefonica.com/arte_cultura/publicaciones-listado/pagina-item-publicaciones/itempubli/565/

WAIBEL, A. (2001) "Los sistemas integrales completos del habla, del lenguaje y la interfaz humana", Quark. Ciencia, Medicina, Comunicación y Cultura 21: 95-102.
http://quark.prbb.org/21/021095.htm

ZUE, V. (1997) "Conversational interfaces: advances and challenges", in KOKKINAKIS, G.- FAKOTAKIS, N.- DERMATAS, E. (Eds.) Eurospeech’97. 5th european conference on speech communication and technology. Rhodes, Greece, 22-25 September 1997. Vol. 1. pp. KN-9 - KN 18.
http://groups.csail.mit.edu/sls//publications/1997/eurospeech97-zuekeynote.pdf

arrow_gray_up

Textbooks


= Recommended introductory/general reading

Jokinen, K., & McTear, M. (2009). Spoken dialogue systems. San Rafael, CA: Morgan & Claypool Publishers. doi:10.2200/S00204ED1V01Y200910HLT005

Preface; Introduction to Spoken Dialogue Systems; Dialogue Management; Error Handling; Case Studies: Advanced Approaches to Dialogue Management; Advanced Issues; Methodologies and Practices of Evaluation; Future Directions; References.


LLISTERRI, J.- MACHUCA, M. J. (Eds.) (2006) Los sistemas de diálogo. Bellaterra - Soria: Universitat Autònoma de Barcelona, Servei de Publicacions - Fundación Duques de Soria (Manuals de la Universitat Autònoma de Barcelona, Lingüística, 45).

1.- J. Llisterri; Introducción a los sistemas de diálogo; 2.- B. Gallardo: El diálogo entre personas; 3.- M. J. Machuca: Corpus para el desarrollo de sistemas de diálogo; 4.- M. I. Torres: El reconocimiento del habla; 5.- E. Segarra: La interpretación semántica; 6.- R. López-Cózar: Análisis y gestión del diálogo; 7.- J. Lavid: La generación del lenguaje en los sistemas de diálogo; 8.- A. Bonafonte, D. Escudero, M. Riera: La conversión de texto en habla.


LÓPEZ-CÓZAR DELGADO, R. - ARAKI, M. (2005) Spoken, Multilingual and Multimodal Dialogue Systems: Development and Assessment. Chichester: John Wiley & Sons.

1.- Introduction to Dialogue Dystems; 2.- Technologies Employed to Set Up Dialogue Systems; 3.- Multimodal Dialogue Systems; 4.- Multilingual Dialogue Systems; 5.- Dialogue Annotation, Modelling and Management; 6.- Development Tools; 7.- Assessment; Appendix A: Basic Tutorial on VoiceXML; Appendix B: Multimodal Databases; Appendix C: Coding Schemes for Multimodal Resources; Appendix D: URLs of Interest; Appendix E: List of Abbreviations.

McTEAR, M.F. (2004) Spoken dialogue technology: Toward the conversational user interface. London; Springer.

MINKER, W.- BENNACEF, S. (2001) Parole et dialogue homme-machine. Paris: Étidions Eyrolles - Éditions du CNRS (Sciences et techniques de l’ingénieur).

MINKER, W.- BENNACEF, S. (2004) Speech and Human-Machine Dialog. Dordrecht: Kluwer (The Kluwer International Series in Engineering and Computer Science, 770).

PIERREL, J.M. (1988) Dialogue oral homme-machine: Connaissances linguistiques, strategies et architecture des systèmes. Paris: Editions Hermes.

SABAH, G.- VIVIER, J.- VILNAT, A.- PIERREL, J.M.- ROMARY, L.- NICOLLE, A. (1998) Machine, langage et dialogue. Paris: L’Harmattan (Figures de l’Interaction).

SMITH, R.W.- HIPP, R. (1994) Spoken Natural Language Dialogue Systems: A Practical Approach. New York: Oxford University Press.

arrow_gray_up

Compilations and conference proceedings

BOVES, L.- DALSGAARD, P.- LARSEN, L.B. (Eds.) (1995) Proceedings of the ESCA tutorial and research workshop on Spoken Dialogue Systems. Vigsø, Denmark, May 30- June 2, 1995.

CARLSON, R.- HIRSCHBERG, J.B.- SWERTS, M. (Eds.) (2005) Error Handling in Spoken Dialogue Systems, Special Issue. Speech Communication 45, 3.

DE MORI, R. (Ed.) (1997) Spoken Dialogues with Computers. London: Academic Press (Signal Processing and Its Applications).

DYBKJAER, L. (Ed.) (2000) From Spoken Dialogue to Full Natural Interactive Dialogue - Theory, Empirical Analysis and Evaluation. Workshop Proceedings. LREC 2000, Second International Conference on Language Resources and Evaluation. Athens, Greece, 29 May 2000.

Error Handling in Spoken Dialogue Systems. ISCA tutorial and research workshop, Château d’Oex, Vaud, Switzerland, August 28-31, 2003.
http://www.isca-speech.org/archive_open/ehsd2003/index.html

GIBBON, D.- MERTINS, I.- MOORE, R. (Eds.) (2000) Handbook of Multimodal and Spoken Dialogue Systems. Resources, Terminology and Product Evaluation. Dordrecht: Kluwer Academic Publishers (Kluwer International Series in Engineering and Computer Science, 565).

1.- Representation and annotation of dialogue (Martine Grice, Geoffrey Leech, Martin Weisser, Andrew Wilson); 2.- Audio-visual and multimodal speech-based systems (Christian Benoit, Jen-Claude Martin, Catherine Pelachaud, Lambert Schomaker, Bernhard Suhm); 3.- Consumer off-the-shelf (COTS) product and service evaluation (David van Leeuwen, Herman Steeneken); 4.- Terminology for spoken language systems. (Dafydd Gibbon, Inge Mertins); 5. Reference materials. (Christoph Draxler).

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language System Assessment. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume III).[Chap 6: Assessment of interactive systems]

KUPPEVELT, J. van - SMITH, R.W. (Eds.) (2003) Current and new directions in discourse and dialogue. Dordrecht: Kluwer Academic Publishers (Text, Speech and Language Technology, 22).

Minker, W., Lee, G. G., Nakamura, S., & Mariani, J. (Eds). (2011). Spoken dialogue systems technology and design. Dordrecht: Springer.

Proceedings of the ESCA tutorial and research workshop on Interactive Dialogue in Multi-Modal Systems. Kloster Irsee, Germany, June22-25, 1999.
http://www.isca-speech.org/archive_open/ids_99/

Proceedings of the ISCA tutorial and research workshop on Multi-Modal Dialogue in Mobile Environments. Kloster Irsee, Germany, June 17-19, 2002.
http://www.isca-speech.org/archive_open/ids_02/

TAYLOR, M.M. - NÉEL, F.- BOUWHUIS, D.(Eds.) (1989) The Structure of Multimodal Dialogue. Amsterdam: Elsevier Science Publishers B.V., North Holland.

TAYLOR, M.M.- NÉEL, F.- BOUWHUIS, D.G. (Eds.) (2000) The Structure of Multimodal Dialogue II. Amsterdam: John Benjamims.

arrow_gray_up

Spoken Language Systems design


= Recommended introductory/general reading

COHEN, Ph. (1997) "Dialogue Modeling", in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds.) Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press. pp. 234-240.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.366.9300

FISCHER, K. (1999) "Repeats, reformulations and emotional speech: Evidence for the design of human-computer speech interfaces", in BULLINGER, H.J.- ZIEGLER, J. (Eds) Human-Computer Interaction: Ergonomics and User Interfaces. Proceedings of the 8th International Conference on Human-Computer Interaction. Munich, Germany. London: Lawrence Erlbaum Ass. Vol 1, pp. 560-565.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.59.8074&rep=rep1&type=pdf

FRASER, N.- GILBERT, G.N. (1991) "Simulating speech systems", Computer Speech and Language 5,1: 81-99.

LEE Ch.- H. (1994) "Stochastic modeling in spoken dialogue system design", Speech Communication 15, 3-4: 311-322.


MACHUCA, M. J. (2006) "Corpus para el desarrollo de sistemas de diálogo", in LLISTERRI, J.- MACHUCA, M. J. (Eds.) Los sistemas de diálogo. Bellaterra - Soria: Universitat Autònoma de Barcelona, Servei de Publicacions - Fundación Duques de Soria (Manuals de la Universitat Autònoma de Barcelona, Lingüística, 45). pp. 61-79.

MACHUCA, M.J.- BUENO, L.- CALONGE, R.- ESTRUCH, M.- RIERA, M. (2000) Eines de reconeixement i prototip de conversa oral, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://liceu.uab.cat/~joaquim/publicacions/SFI_UAB_Disseny_prototip.pdf

MACDERMIND, C. (1993) "Features of naive callers’dialogues with a simulated speech understanding and dialogue system", in Eurospeech’93. 3rd european conference on speech communication and technology. Berlin, Germany, 21-23 September 1993. Vol.2. pp.955-958.

SADEK, D. (1999) "Design considerations on dialogue systems: from theory to technology - the case of Artimis", in Proceedings of the ESCA Workshop on Interactive Dialogue in Multimodal Systems. Kloster Irsee, Germany, 22-25 June 1999. pp. 173-187.
http://www.isca-speech.org/archive_open/ids_99/ids9_173.html

arrow_gray_up

Linguistic and phonetic knowledge in Spoken Language Systems

ÁLVAREZ, J.- CAMINERO, C.- CRESPO, C.- TAPIAS, D. (1996) "The Natural Language Processing Module for a Voice Assisted Operator at Telefónica I+D", in ICSLP 96, The Fourth international conference on spoken language processing. October 3 - 6, Wyndham Franklin Plaza Hotel, Philadelphia, PA, USA. pp. 1161-1164.

ÁLVAREZ CERCADILLO, J.- CRESPO CASAS, C.- ESCALADA SARDINA, G.- TAPIAS MERINO, D.- LÓPEZ SOTO, M. T. (1996) "Modelado del lenguaje y gestor de diálogo en un sistema de operador ’asistido por voz’", Procesamiento de Lenguaje Natural, Boletín n. 19: 179-188.

CAMINERO GIL, J.- ÁLVAREZ CERCADILLO, J.- CRESPO CASAS, C.- TAPIAS MERINO, D. (1996) "Data-Driven Discourse Modelling for Semantic Interpretation", in ICASSP’96 Proceedings of the International Conference on Acoustics, Speech and Signal Processing. pp. 401-404.

CASTRO, M.J.- SANCHIS, E. (2002) "A Simple Connectionist Approach to Language Understanding in a Dialogue System", in Proceedings of the 8th Ibero-American Conference on Artificial Intelligence. Sevilla, 12-15 November 2002. Springer Verlag (LNAI, 2527). pp. 664-673.
http://users.dsic.upv.es/grupos/rfia/papers/fullpapers/castro_iberamia02.ps

EGGINS, S.- VONWILLER, J.-MATTHIESSEN, C.M.I.- SEFTON, P. (1991) "The description of minor clauses in information-seeking telephone dialogues", in Eurospeech’91. 2nd european conference on speech communication and technology. Genova, Italy, 24-26 September 1991.Vol 3. pp.1059-1062.

FERNÁNDEZ, G.- QUESADA, J.F. (1999) "Delfos. Un modelo basado en unificación para la representación y el razonamiento en sistemas de gestión de diálogo", Procesamiento del Lenguaje Natural, Revista nº 25: 67-74.

HEEMAN, P.- ALLEN, J.F. (1999) "Speech Repairs, Intonational Phrases, and Discourse Markers: Modeling Speakers’ Utterances in Spoken Dialogue", Computational Linguistics 24, 4: 527-572.

LÓPEZ SOTO, M.T. (1999) Estrategias de análisis gramatical y semántico para un sistema dirigido por voz. Tesis Doctoral. Departamento de Filología Inglesa (Lengua Inglesa), Universidad de Sevilla.

LÓPEZ SOTO, M.T. - AMORES, J.G.- QUESADA, J.F. (1998) "Parsing strategies for a Spoken Language Processing System", Procesamiento del Lenguaje Natural, Revista n. 23: 8-15.

OVIATT, S.- MacEACHERN, M.- LEVOW, G.-A. (1998) "Predicting hyperarticulate speech during human-computer error resolution", Speech Communication 24,2: 87-110.

PÉREZ-PIÑAR LÓPEZ, D.- GARCÍA MATEO, C. (2002) "Integración automática de fuentes de conocimiento lingüístico en el desarrollo de un sistema de diálogo", Procesamiento del Lenguaje Natural, Revista nº 29:197-204.
http://www.sepln.org/revistaSEPLN/revista/29/29-Pag197.pdf

SANCHIS, E.- CASTRO, M.J. (2002) "Dialogue Act Connectionist Detection in a Spoken Dialogue System", in HIS2002, Second International Conference on Hybrid Intelligent Systems. Santiago de Chile, Chile, 1-4 December 2002. IOS Press. pp. 644-651.
http://users.dsic.upv.es/grupos/rfia/papers/fullpapers/dialogo_his02.ps

SANCHIS, E.- GARCÍA, F.- GALIANO, I.- SEGARRA, E. (2002) "Applying dialogue constraints to the understanding process in a dialogue system", in TSD 2000, Proceedings of the 5th International Conference on Text, Speech and Dialogue. Brno, 9-12 September 2002. Springer Verlar (LNAI, 2448). pp. 389-395.
http://users.dsic.upv.es/grupos/rfia/papers/fullpapers/tsd02.ps

Phonetic knowledge in speech technology

arrow_gray_up

Prosodic knowledge in Spoken Language Systems

Coria, S. R., & Pineda, L. A. (2009). An analysis of prosodic information for the recognition of dialogue acts in a multimodal corpus in Mexican Spanish. Computer Speech and Language, 23(3), 277-310.

Dialogue and prosody. ESCA tutorial and research workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999.
http://www.isca-speech.org/archive_open/dia_pros/index.html

Dral, J., Heylen, D., & op den Akker, R. (2011). Detecting uncertainty in spoken dialogues: An explanatory research for the automatic detection of speaker uncertainty by using prosodic markers. In K. Ahmad (Ed.), Affective computing and sentiment analysis. (pp. 67-78). Dordrecht: Springer.

GRANSTRÖM, B.- HOUSE, D. (2005) "Audiovisual representation of prosody in expressive speech communication", Speech Communication 46: 473-484.
http://dx.doi.org/10.1016/j.specom.2005.02.017

HEEMAN, P.- ALLEN, J.F. (1999) "Speech Repairs, Intonational Phrases, and Discourse Markers: Modeling Speakers’ Utterances in Spoken Dialogue", Computational Linguistics 24, 4: 527-572.
http://www.cs.rochester.edu/u/james/CL99.pdf

HESS, W.- BATLINER, A.- KIESSLING, R.- KOMPE, E.- NOTH, A.- PETZOLD, M.- REYELT, M.- STROM, V. (1996) "Prosodic Modules for Speech Recognition and Understanding in Verbmobil", in SAGISAKA, Y. et al (Eds.) Computing Prosody: Approaches to a Computational Analysis and Modelling of Prosody of Spontaneous Speech. New York: Springer. pp. 363-384.
http://www5.informatik.uni-erlangen.de/Forschung/Publikationen/1996/Hess96-PMF.pdf

Hirose, K., & Kawanami, H. (2002). Temporal rate change of dialogue speech in prosodic units as compared to read speech. Speech Communication, 36, 97-111. doi:10.1016/S0167-6393(01)00028-0

HIRSCHBERG, J. (1999) "Communication and prosody: Functional aspects of prosody", in Dialogue and prosody. ESCA tutorial and research workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999. pp. 7-15.
http://www.isca-speech.org/archive_open/dia_pros/diap_007.html

Hirschberg, J. (2002). Communication and prosody: Functional aspects of prosody. Speech Communication, 36(1-2), 31-43. doi:10.1016/S0167-6393(01)00024-3

HIRSCHBERG, J.- LITMAN, D.- SWERTS, M. (1999) "When good recognizers go bad: Prosodic cues to recognition errors", in WS’99 Proceedings and Final Team Reports. An NSF Workshop: Language Engineering for Students and Professionals Integrating Research and Education. The Center for Language and Speech Processing, John Hopkins University. Baltimore.
https://www.clsp.jhu.edu/vfsrv/ws99/guest_lectures/julia.html

HIRSCHBERG, J.- LITMAN, D.- SWERTS, M. (2004) "Prosodic and other cues to speech recognition failures", Speech Communication 43, 1-2: 155-176.
http://dx.doi.org/10.1016/j.specom.2004.01.006

HOUSE, D. (2005) "Phrase-final rises as prosodic feature in wh-questions in Swedish human-machine dialogue", Speech Communication 46: 268-283.
http://dx.doi.org/10.1016/j.specom.2005.03.009

KOMPE, R. (1997) Prosody in Speech Understanding Systems. Berlin-New York: Science Springer (Lecture Notes in Artificial Intelligence, Vol. 1307 Subseries of Lecture Notes in Computer Science Springer).

Kompe, R., Nöth, E., Kieβling, A., Kuhn, T., Mast, M., Niemann, H., . . . Batliner, A. (1994). Prosody takes over: Towards a prosodically guided dialog system. Speech Communication, 15, 155-167. doi:10.1016/0167-6393(94)90049-3

KOUMPIS, K.- RENALS, S. (2001) "The role of prosody in a voicemail summarization system", in BACCHIANI, M.- HIRSCHBERG, J.- LITMAN, D.- OSTENDORF, M. (Eds.) Proceedings of the ISCA tutorial and research workshop on Prosody and Speech Recognition. Red Bank, N.J., 22-24 October 2001.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.15.8996

KRAHMER, E.- SWERTS, M.- THEUNE, M.- WEEGELS, M. (1999) "Prosodic correlates of disconfirmations", in Dialogue and prosody. ESCA tutorial and research workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999. pp. 169-174.
http://www.isca-speech.org/archive_open/dia_pros/diap_169.html

Krahmer, E., Swerts, M., Theune, M., & Weegels, M. (2002). The dual of denial: Two uses of disconfirmations in dialogue and their prosodic correlates. Speech Communication, 36, 133-145. doi:10.1016/S0167-6393(01)00030-9

KUREMATSU, A.- SHIONOYA, Y. (2000) "Identification of utterance intention in Japanese spontaneous spoken dialogue by use of prosody and keyword information", in ICSLP-2000, Proceedings of the Sixth international conference on spoken language processing. Beijing, China, October 16-20, 2000. Vol.1, pp. 98-101.
http://www.isca-speech.org/archive/icslp_2000/i00_1098.html

Levow, G. -A. (2002). Adaptations in spoken corrections: Implications for models of conversational speech. Speech Communication, 36, 147-163. doi:10.1016/S0167-6393(01)00031-0

LÓPEZ, T. (2002) "Análisis de los rasgos prosódicos en un sistema de diálogo", in DÍAZ GARCÍA, J. (Ed.) Actas del II Congreso de Fonética Experimental. Sevilla 5, 6 y 7 de marzo de 2001. Sevilla: Laboratorio de Fonética, Facultad de Filología, Universidad de Sevilla. pp. 243-253.

LLISTERRI, J.- MACHUCA, M.J.- de la MOTA, C.- RIERA, M.- RÍOS, A. (2003) "Entonación y tecnologías del habla", in PRIETO, P. (Ed.) Teorías de la entonación. Barcelona: Ariel. pp. 209-243.
http://liceu.uab.cat/~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_Rios_03_Entonacion_Tecnologias_Habla.pdf

NÖTH, E.- BATLINER, A.- WARNLE, V.- HAAS, J.- BOROS, M.- BUCKOW, J.- HUBER, R.- GALLWITZ, F.- NUTT, M.- NIEMANN, H. (1999) "On the use of prosody in automatic dialogue understanding", in Dialogue and prosody. ESCA Tutorial and Research Workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999. pp. 25-34.
http://www.isca-speech.org/archive_open/dia_pros/diap_025.html

Nöth, E., Batliner, A., Warnke, V., Haas, J., Boros, M., Buckow, J., . . . Niemann, H. (2002). On the use of prosody in automatic dialogue understanding. Speech Communication, 36, 45-62. doi:10.1016/S0167-6393(01)00025-5

NUTT, M.- BATLINER, A.- WARNKE, V.- NÖTH. E. (1999) "Using phrase accent information for dialog act recognition in spontaneous German speech", in Dialogue and prosody. ESCA tutorial and research workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999. pp. 151-155.
http://www.isca-speech.org/archive_open/dia_pros/diap_151.html

POLLER, P.- HEISTERKAMP, P. (1997) "A Compact Representation of Prosodically Relevant Knowledge in a Speech Dialogue System", in ALTER, K.- PIRKER, H.- FINKLER, W. (Eds.) Concept to Speech Generation Systems. Proceedings of a Workshop Sponsored by the Association for Computational Linguistics. 11 July 1997, Universidad Nacional de Educación a Distancia, Madrid, Spain. pp. 17-22.
http://aclweb.org/anthology/W/W97/W97-1203.pdf

ROMEAS, P. (1991) "Prosodic effects of reiteration in man-machine dialog by voice", in Proceedings of the ESCA Workshop on Phonetics and Phonology of Speaking Styles. Barcelona, Spain, 30 September - 2 October, 1991. pp. 46.1-46.7.

Shimojima, A., Katagiri, Y., Koiso, H., & Swerts, M. (2002). Informational and dialogue-coordinating functions of prosodic features of Japanese echoic responses. Speech Communication, 36, 113-132. doi:10.1016/S0167-6393(01)00029-2

SHRIBERG, E.- BATES, R.- TAYLOR, P.- STOLCKE, A.- RIES, K.- JURAFSKY, D.- COCCARO, N.- MARTIN, R.- METEER, - van ESS-DYMKEMA (1998) "Can Prosody Aid the Automatic Classification of Dialog Acts in Conversational Speech?", Language and Speech 41, 3-4.
http://www.cstr.ed.ac.uk/downloads/publications/1998/Shriberg_1998_a.pdf

SIEPMAN, R.- BATLINER, A.- OPPERMANN, D. (2001) "Using prosodic features to characterize Off-Talk in human-computer interaction", in Prosody in Speech Recognition and Understanding. ISCA tutorial and research workshop (ITRW). Molly Pitcher Inn, Red Bank, NJ, USA, October 22-24, 2001. paper 27.
http://www.isca-speech.org/archive_open/prosody_2001/prsr_027.html

Sridhar, V. K. R., Bangalore, S., & Narayanan, S. (2009). Combining lexical, syntactic and prosodic cues for improved online dialog act tagging. Computer Speech and Language, 23(4), 407-442.

Swerts, M., & Ostendorf, M. (1997). Prosodic and lexical indications of discourse structure in human-machine interactions. Speech Communication, 22(1), 25-41. doi:10.1016/S0167-6393(97)00011-3

SWERTS, M. - TERKEN, J. (Eds.) (2002) Special Issue on Dialogue and Prosody. Speech Communication 36, 1-2.

TAYLOR, P. - KING, S.- ISARD, S.D. - WRIGHT, H. (1998) "Intonation and Dialogue Context as Constraints for Speech Recognition", Language and Speech 41, 3-4: 493-512.
http://www.cstr.ed.ac.uk/downloads/publications/1998/Taylor_1998_b.pdf

WANG, C. (2001) Prosodic Modeling for Improved Speech Recognition and Understanding. PhD Dissertation. Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology.
http://groups.csail.mit.edu/sls//publications/2001/Wang_phd_thesis.pdf

WANG, C.- SENEFF, S. (2001) "Prosodic scoring of recognition outputs in the JUPITER domain", in Prosody in Speech Recognition and Understanding. ISCA Tutorial and Research Workshop (ITRW). Molly Pitcher Inn, Red Bank, NJ, USA, October 22-24, 2001. paper 28.
http://www.isca-speech.org/archive_open/prosody_2001/prsr_028.html

Ward, N. G., Vega, A., & Baumann, T. (2012). Prosodic and temporal features for language modeling for dialog. Speech Communication, 54(2), 161-174. doi:10.1016/j.specom.2011.07.009. Retrieved from http://www.cs.utep.edu/nigel/papers/prosody-lm11.pdf

WARNKE, V.- KOMPE, R.- NIEMANN, H.- NÖTH, E. (1997) "Integrated dialog act segmentation and classification using prosodic features and language models", in Eurospeech’97. Proceedings of the 5th European Conference on Speech Communication and Technology. Rhodes, Greece, 22-25 September 1997. Vol. 1, pp. 207-210.

WRIGHT, H. (2000) Modelling Prosodic and Dialogue Information for Automatic Speech Recognition. Phd Thesis. Center for Speech Technology Research, University of Edinburgh.
http://www.cstr.ed.ac.uk/downloads/publications/2000/Wright_2000_a.pdf

WRIGHT, H.- POESIO, M.- ISARD, S. (1999) "Using high level dialogue information for dialogue act recognition using prosodic features", in Dialogue and prosody. ESCA tutorial and research workshop (ITRW). Veldhoven, The Netherlands, September 1-3, 1999. pp. 139-143.
http://www.isca-speech.org/archive_open/dia_pros/diap_139.html

Wright Hastie, H., Poesio, M., & Isard, S. (2002). Automatically predicting dialogue structure using prosodic features. Speech Communication, 36, 63-79. doi:10.1016/S0167-6393(01)00026-7

YANG, L.- ESPOSITO, R. (2000) "Prosody and topic structuring in spoken dialogue", in ICSLP-2000, Proceedings of the Sixth International Conference on Spoken Language Processing. Beijing, China, October 16-20, 2000. Vol. 1, pp. 126-129.
http://www.isca-speech.org/archive/icslp_2000/i00_1126.html

ZEISSLER, V. - ADELHARDT, J. - BATLINER, A. - FRANK, C. - NÖTH, E. - SHI R. P. - NIEMANN, H. (2006) "The prosody module", in WAHLSTER, W. (Ed.) SmartKom: Foundations of Multimodal Dialogue Systems. New York: Springer. pp. 139-152.

arrow_gray_up

Emotions in Spoken Language Systems

Ang, J., Dhillon, R., Krupski, A., Shriberg, E., & Stolcke, A. (2002). Prosody-Based automatic detection of annoyance and frustration in human-computer dialog. In ICSLP 2002 - Interspeech 2002. Proceedings of the 7th international conference on spoken language processing. (pp. 2037-40). Denver, Colorado, USA, September 16-20, 2002. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.13.4027

Batliner, A., Hacker, C., Steidl, S., Nöth, E., & Haas, J. (2004). From emotion to interaction: Lessons from real human-machine dialogues. In E. André, L. Dybkjaer, W. Minker, & P. Heisterkamp (Eds.), Affective dialogue systems. (pp. 1-12). Berlin: Springer.

Batliner, A., Hacker, C. h., Steidl, S., Nöth, E., & Haas, J. (2003). User states, user strategies, and system performance: How to match the one with the other. In Error handling in spoken dialogue systems. ISCA tutorial and research workshop. (pp. 5-10). Château d’Oex, Vaud, Switzerland. August 28-31, 2003. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.6.2659

Batliner, A., Steidi, S., Seppi, D., Vogt, T., Wagner, J., Devillers, L., . . . Amir, N. (2011). Whodunnit – searching for the most important feature types signalling emotion-related user states in speech. Computer Speech and Language, 25(1). doi:10.1016/j.csl.2009.12.003. Retrieved from http://www.esat.kuleuven.be/psi/spraak/cgi-bin/get_file.cgi?/dseppi/csl10/csl10.pdf

Burkhardt, F., Ajmera, J., Englert, R., Stegmann, J., & Burleson, W. (2006). Detecting anger in automated voice portal dialogs. In Interspeech 2006 - ICSLP. Proceedings of the 9th international conference on spoken language processing. Pittsburgh, PA, USA. September 17-21, 2006. Retrieved from http://felix.syntheticspeech.de/publications/recognitionOfAnger.pdf

Cavazza, M., Santos, R., Turunen, M., Relaño, J., Hakulinen, J., Crook, N., & Field, D. (2010). ‘How was your day?’ An affective companion ECA prototype. In SIGDIAL 2010. Proceedings of the 11th annual meeting of the Special Interest Group on Discourse and Dialogue. (pp. 277-80). The University of Tokyo. 24-25 September, 2010. Retrieved from http://aclweb.org/anthology//W/W10/W10-4353.pdf

Cowie, R., Douglas-Cowie, R., & Romano, A. (1999). Chaging emotional tone in dialogue and its prosodic correlates. In Dialogue and prosody. ISCA tutorial and research workshop. (pp. 41-6). Velhoven, The Netherlands. September 1-3, 1999. Retrieved from http://www.personalweb.unito.it/antonio.romano/1999_ISCA_Cowie_DouglasCowie_Romano.pdf

Huber, R., Batliner, A., Buckow, J., Nöth, E., Warnke, V., & Niemann, H. (2000). Recognition of emotion in a realistic dialogue scenario. In ICSLP 2000. Proceedings of the 6th international conference on spoken language processing. (pp. 665-8). Beijing, China, October 16-20, 2000. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.18.6965

Kessous, L., Castellano, G., & Caridakis, G. (2010). Multimodal emotion recognition in speech-based interaction using facial expression, body gesture and acoustic analysis. Journal on Multimodal User Interfaces, 3(1), 33-48. doi:10.1007/s12193-009-0025-5. Retrieved from http://www.image.ntua.gr/papers/638.pdf

Laukka, P., Neiberg, D., Forsell, M., Karlsson, I., & Elenius, K. (2011). Expression of affect in spontaneous speech: Acoustic correlates and automatic detection of irritation and resignation. Computer Speech & Language, 25(1), 84-104. doi:10.1016/j.csl.2010.03.004

Litman, D. J., & Forbes-Riley, K. (2004). Predicting student emotions in computer-human tutoring dialogues. In ACL-04. 42nd annual meeting of the Association for Computational Linguistics. Proceedings of the conference. 21-26 july, 2004. Barcelona, Spain. (pp. 351-8). Barcelona: The Association for Computational Linguistics. Retrieved from http://people.cs.pitt.edu/~litman/acl04-pub-2.pdf

Litman, D. J., & Forbes-Riley, K. (2006). Recognizing student emotions and attitudes on the basis of utterances in spoken tutoring dialogues with both human and computer tutors. Speech Communication, 48(5), 559-590. doi:10.1016/j.specom.2005.09.008.

López-Cózar, R., Silovsky, J., & Griol, D. (2010). Mejora del funcionamiento de sistemas de diálogo hablado mediante reconocimiento del estado emocional de usuarios. Procesamiento del Lenguaje Natural, 45, 191-198. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/802

Lucas, J. M., Alcázar, R., Montero, J. M., Fernández Martínez, F., Barra, R., D’Haro, L. F., . . . Pardo, J. M. (2008). Desarrollo de un robot-guía con integración de un sistema de diálogo y expresión de emociones: Proyecto ROBINT. Procesamiento del Lenguaje Natural, 40, 51-58. Retrieved from http://www.sepln.org/revistaSEPLN/revista/40/09p12.pdf

Maerizeiro, B., Litman, D., & Hwa, R. (2004). Co-Training for predicting emotions with spoken dialogue data. In ACL-04. Companion volume to the proceedings of the conference. Proceedings of the student research workshop, interactive posters / demonstrations and tutorial abstracts. 21-16 july, 2004. Barcelona, Spain. (pp. 203-6). Barcelona: The Association for Computational Linguistics. Retrieved from http://people.cs.pitt.edu/~litman/Maeireizo.pdf

Morrison, D., Wang, R., & De Silva, L. C. (2007). Ensemble methods for spoken emotion recognition in call-centres. Speech Communication, 49(2), 98-112. doi:10.1016/j.specom.2006.11.004

Pittermann, J., Pittermann, A., & Minker, W. (2010). Handling emotions in human-computer dialogues. Berlin - Heidelberg: Springer.

Streit, A., Batliner, A., & Portele, T. (2006). Emotion analysis and emotion-handling in subdialogues. In W. Wahlster (Ed.), SmartKom: Foundations of multimodal dialogue systems. (pp. 317-32). New York: Springer.

Zhang, T., Hasegawa-Johnson, M., & Levinson, S. E. (2006). Cognitive state classification in a spoken tutorial dialogue system. Speech Communication, 48(6), 616-632. doi:10.1016/j.specom.2005.09.006. Retreived from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.5476&rep=rep1&type=pdf

Prosody and emotions

Synthesis of emotional speech

Recognition of emotional speech

arrow_gray_up

Spoken Language Systems and applications

ÁLVAREZ, J.- TAPIAS, D.- CRESPO, C.- CORTÁZAR, I. - MARTÍNEZ, F. (1997) "Development and Evaluation of the ATOS Spontaneous Speech Conversational System", in ICASSP’97 Proceedings of the International Conference on Acoustics, Speech and Signal Processing. pp. 1139-1142.

AUST, H.- OERDER, M.- SEIDE, F.- STEINBISS, V. (1995) "The Philips automatic train timetable information system", Speech Communication 17, 3-4: 249-262.

Ábalos, N., Espejo, G., López-Cózar, R., & Callejas, Z. (2010). Sistema de diálogo multimodal para una aplicación de inteligencia ambiental en una vivienda. Procesamiento del Lenguaje Natural, 44, 51-58. Retrieved from http://www.sepln.org/revistaSEPLN/revista/44/articulos/revista4410.pdf

BAGGIA, P.- CIARAMELLA, A.- CLEMENTINO, D.- FISSORE, L.- GERBINO, E.- GIACHIN, E.- MICCA, G.- NEBBIA, L.- PACIFICI, R.- PIRANI, G.- RULLENT, C. (1991) "A man-machine dialogue system for speech access to e-mail information using the telephone: implementation and first results", in Eurospeech’91. 2nd European Conference on Speech Communication and Technology. Genova, Italy, 24-26 September 1991. Vol.2. pp.865-868.

BENEDÍ, J.M.- VARONA, A.- LLEIDA, E. (2004) "DIHANA: Sistema de diálogo para el acceso a la información en habla espontánea en diferentes entornos", in SANCHIS ARNAL, E. (Ed.) Actas de las III Jornadas en Tecnología del Habla. Valencia, del 17-19 de noviembre de 2004. Organizadas por la Red Temática en Tecnología del Habla. Valencia: Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia. pp. 141-146.

BILLI, R.- CANAVESIO, F.- CIARAMELLA, A.- NEBBIA, L. (1995) "Interactive voice techonology at work: The CSELT experience", Speech Communication 17, 3-4: 263-272.

BILLI, R.- LAMEL, L.F. (1997) "RailTel: Railway Telephone Services", Speech Communication 23, 1-2: 63-65.

BONAFONTE, A.- AIBAR, P.- CASTELL, N.- LLEIDA, E.- MARIÑO, J.B.- SANCHÍS, E.- TORRES, M-I. (2000) "Desarrollo de un Sistema de Diálogo Oral en Dominios Restringidos", in Actas de las I Jornadas en Tecnologías del Habla. Universidad de Sevilla, Sevilla, Noviembre de 2000.
https://pdfs.semanticscholar.org/2a94/5e57e647616ed6c1eeb554254f8fb1a186c8.pdf

BONNEAU-MAYNARD, H - GAUVAIN, J.L - GOODINE, D - LAMEL, L.F - POLIFRONI, J - SENEFF, S. (1993) "A French Version of the MIT-ATIS System: Portability Issues" in Eurospeech’93. European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993 Vol 3. pp. 2059-2062.

CASACUBERTA, F.- MARTÍNEZ, C.- NEVADO, F.- VIDAL, E. (2000) "Implementación de una centralita automática dirigida por voz", in Actas de las I Jornadas de Tecnologías del Habla. Universidad de Sevilla, Sevilla, noviembre de 2002.

COLE, R.A.- NOVICK, D.G.- VERMEULEN, P.J.E.- SUTTON, S.- FANTY, M.- WESSELS, L.F.A. - de VILLIERS, J.H.- SCHALKWYK, J.- HANSEN, B.- BURNETT, D. (1997) "Experiments with a spoken dialogue system for taking the US census", Speech Communication 23, 3: 243-260.

CRISTÓBAL MUÑIZ, M.J.- CUESTA CUESTA, J.C.- ORTUÑO PÉREZ, J.- SALCEDO GARCÍA, M.- MELERO JIMÉNEZ, F.J. (2002) "La automatización del servicio de directorios 1003", Comunicaciones de Telefónica I+D 25: 7-28.

de CÓRDOBA, R.- SAN SEGUNDO, R.- MONTERO; J.M.- COLÁS, J.- FERREIROS, J.- MACÍAS, J.- PARDO; J.M. (2001) "An interactive directory assistance service for Spanish with large-vocabulary recognition", in Eurospeech’01. Proceedings of the 7th european conference on speech communication and technology. Aalborg, Denmark, 3-7 September, 2001. pp. 1279-1282.
http://www-gth.die.upm.es/research/documentation/AI-69Ani-01.pdf

Doncel, J., Olaso, J. M., Justo, R., Guijarrubia, V., Pérez, A., & Torres, M. I. (2010). Kiosko de información basado en un sistema de diálogo multimodal. Procesamiento del Lenguaje Natural, 45, 311-312. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/823

Espejo, G., balos, N., López-Cózar, R., Callejas, Z., & Griol, D. (2010). Sistema mayordomo: Uso de un entorno de inteligencia ambiental a través de un sistema de diálogo multimodal. Procesamiento del Lenguaje Natural, 45, 309-310. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/816

FERNÁNDEZ, F.- FERREIROS, J.- SAMA, V.- MONTERO, J.M.- GARCÍA, R. (2005) "Demostración de una interfaz vocal para el control de un sistema de alta fidelidad", Procesamiento del Lenguaje Natural (Actas del XXI Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural. Universidad de Granada, 14-16 de septiembre de 2005), Revista nº 35: 451-452.
http://www-gth.die.upm.es/research/documentation/AG-27Dem-05.pdf

FERNÁNDEZ IGEA, S.- ORTEGA DEL RÍO, R.- SERRANO ARANDA, R. (2000) "Portales de voz: Internet en el teléfono", Comunicaciones de Telefónica I+D 19: 15-24.

GAGNOULET, C.- JOUVET, D.- DAMAY, J. (1991) "MARIEVOX: A voice-activated information system", Speech Communication 10,1: 23-32.

GAMM, S. - HAEB-UMBACH, R.- LANGMANN, D. (1997) "The development of a command-based speech interface for a telephone answering machine", Speech Communication 23, 1-2: 161-171.

GARCÍA MORENO, M.- SÁNCHEZ ESGUEVILLAS, A.- FERNÁNDEZ CHAICHIO, M.L.- SÁEZ ARANCE, F.- FERNÁNDEZ GUTIÉRREZ, M.A. (2001) "Los servicios conversacionales de nueva generación", Comunicaciones de Telefónica I+D 20: 77-92.

GATIUS, M.- GONZÁLEZ, M. (2005) "Un sistema de diálogo multilingüe dirigido por la semántica", Procesamiento del Lenguaje Natural, Revista nº 34: 105-114.

GLASS, J.- FLAMMIA, G.- GOODINE, D.- PHILLIPS, M.- POLIFRONI, J.- SAKAI, S.- SENEFF, S.- ZUE, V. (1995) "Multilingual spoken-language understanding in the MIT Voyager system", Speech Communication 17, 1-2: 1-18.

GLASS, J - GOODINE, D - PHILLIPS, M - SAKAI, S. - SENEFF, S - ZUE, V. (1993) "A bilingual VOYAGER system", in Eurospeech’93. European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993 Vol 3. pp. 2063 - 2066.

GONZÁLEZ, M.- GATIUS, M. (2005) "Un sistema de diálogo multimodal para acceder a la infomación y servicios de las administraciones públicas", Procesamiento del Lenguaje Natural (Actas del XXI Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural. Universidad de Granada, 14-16 de septiembre de 2005), Revista nº 35: 285-292.

GORIN, A.L. RICCARDI, G.- WRIGHT, J.H. (1997) "How may I help you?", Speech Communication 23, 1-2: 113-127.

Griol, D., Patricio, M. ., Molina, J. M., Arroyo, ., Callejas, Z., & López-Cózar, R. (2010). Integración de los sistemas de diálogo para la interacción en redes sociales. Procesamiento del Lenguaje Natural, 44, 107-114. Retrieved from http://www.sepln.org/revistaSEPLN/revista/44/articulos/revista4424.pdf

Griol, D., Rojo, E., Callejas, X., López Cózar, R., balos, N., & Espejo, G. (2010). Aplicación del procesamiento del lenguaje natural y las tecnologías del habla en mundos virtuales. Procesamiento del Lenguaje Natural, 45, 307-308. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/817

HERNANDO, J.- PADRELL, J.- RODRÍGUEZ, H. (2002) "Sistema de información meteorológica automática por teléfono ATTEMPS", Procesamiento del Lenguaje Natural (Actas del XVII Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural, Universidad de Valladolid, 11-13 de septiembre de 2002), Revista nº 29: 311-312.
http://www.sepln.org/revistaSEPLN/revista/29/29-Pag311.pdf

HURTADO, Ll.-F.- BLAT, F.- GRAU, S.- GRIOL, D.- SANCHIS, E.- SEGARRA, E.- TORRES, F. (2005) "Sistema de diálogo para el proyecto DIHANA", Procesamiento del Lenguaje Natural (Actas del XXI Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural. Universidad de Granada, 14-16 de septiembre de 2005), Revista nº 35: 453-454.
http://www.sepln.org/revistaSEPLN/revista/35/61.pdf

Justo, R., Torres, M. I., Lleida, E., Sanchis, E., de Córdoba, R., & Macías, J. (2010). SD-TEAM: Tecnologías de aprendizaje interactico, autoevaluación y multimodalidad en sistemas de diálogo hablado multidominio. Procesamiento del Lenguaje Natural, 45, 331-332. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/824

KELLNER, A.- RUEBER, B.- SEIDE, F.- TRAN, B.-H. (1997) "PADIS - An automatic telephone switchboard and directory information system", Speech Communication 23, 1-2: 95-111.

LAMEL, L.- ROSSET, S.. GAUVAIN, J.L.- BENNACEF, S.- GARNIER-RIZET, M.- PROUTS, B. (2000) "The LIMSI Arise system", Speech Communication 31, 4: 339-353.

LAU, R.- FLAMMIA, G.- PAO, C.- ZUE, V. (1997) "WebGALAXY: Beyond Point and Click - A Conversational Interface to a Browser", in Proceedings of the Sixth International World Wide Web Conference. Santa Clara, CA, April 1997. pp. 119-127.
http://www.raylau.com/webgalaxy

LAU, R.- FLAMMIA, G.- PAO, C.- ZUE, V. (1997) "Webgalaxy - Integrating Spoken Language and Hypertext Navigation", in KOKKINAKIS, G.- FAKOTAKIS, N.- DERMATAS, E. (Eds.) Eurospeech’97. Proceedings of the 5th European Conference on Speech Communication and Technology. Rhodes (Greece), 22-25 September 1997. pp. 883-886.
http://groups.csail.mit.edu/sls//publications/1997/eurospeech97-webgalaxy.pdf

LENNING, M.- BIELBY, G.- MASSICOTTE, J. (1995) "Directory assistance automation in Bell Canada: Trial results", Speech Communication 17, 3-4: 227-234.

LÓPEZ-CÓZAR DELGADO, R. (1998) "SAPLEN (Sistema Automático de Pedidos en Lenguaje Natural)", Procesamiento del Lenguaje Natural 23: 198.
http://www.sepln.org/revistaSEPLN/revista/23/23-Demostraciones.pdf

LÓPEZ-CÓZAR DELGADO, R. (1999) Análisis, diseño, implementación y evaluación de sistemas automáticos de diálogo. Desarrollo de un sistema experimental. Tesis doctoral. Departamento de Electrónica y Tecnología de los Computadores. Universidad de Granada.

LÓPEZ-CÓZAR DELGADO, R.- RUBIO AYUSO, A.J. (1997) "SAPLEN: Un sistema de diálogo en lenguaje natural para una aplicación comercial", Procesamiento del Lenguaje Natural, Revista n. 20: 65-81.

LÓPEZ-CÓZAR, R.- RUBIO, A.J.- GARCÍA, P.- SEGURA, J.C. (1999) "Uso de valores de confianza y expectativas en el sistema de diálogo SAPLEN", Procesamiento del Lenguaje Natural, Revista nº 24: 37-42.

LÓPEZ-CÓZAR, R.- RUBIO, A.J.- BENÍTEZ, M.C.- MILONE, D.H. (2000) "Restricciones de funcionamiento en tiempo real de un sistema automático de diàlogo", Procesamiento del Lenguaje Natural, Revista nº 26: 169-174.

LÓPEZ-CÓZAR, R.- GARCÍA, P.- DÍAZ, J.- RUBIO, A.J. (1997) "A Voice Activated Dialogue System for Fast-Food Restaurant Applications" in KOKKINAKIS, G.- FAKOTAKIS, N.- DERMATAS, E. (Eds.) Eurospeech’97. 5th European Conference on Speech Communication and Technology. Rhodes, Greece, 22-25 September 1997. Vol. 4. pp. 1439 - 1442.

LÓPEZ-CÓZAR, R.- RUBIO, A.J.- GARCÍA; P.- DÍAZ-VERDEJO, J.E.- LÓPEZ-SOLER, J.M. (2000) "Sistema telefónico de atención a viajeros", in Actas de las I Jornadas en Tecnologías del Habla. Universidad de Sevilla, Sevilla, noviembre de 2000.

MARTÍNEZ HINAREJOS, C.D.- CASACUBERTA, F. (2000) "Modelado probabilístico de sistemas de diálogo", in Actas de las I Jornadas de Tecnologías del Habla. Universidad de Sevilla, Sevilla, noviembre de 2000.

Meza, I., Pérez, E., Salinas, L., Aviles, H., & Pineda, L. A. (2010). A multimodal dialogue system for playing the game "guess the card". Procesamiento del Lenguaje Natural, 44, 131-138. Retrieved from http://www.sepln.org/revistaSEPLN/revista/44/articulos/revista4430.pdf

MINKER, W.- HAIBER, U.- HEISTERKAMP, P.- SCHEIBLE, S. (2004) "The SENECA spoken dialogue system", Speech Communication 43, 1-2: 89-102.
http://dx.doi.org/10.1016/j.specom.2004.01.005

Minker, W., Pittermann, J., Pittermann, A., Strauß, P. M., & Bühler, D. (2007). Challenges in speech-based human-computer interfaces. International Journal of Speech Technology, 10(2-3), 109-119.

MAZOR, B.- ZEIGLER, B.L. (1995) "The design of speech-interactive dialogs for transaction-automation systems", Speech Communication 17, 3-4: 313-320.

PARGELLIS, A.N.- KUO, H.-K.J.- LEE, C.-H. (2004) "An automatic dialogue generation platform for personalized dialogue applications", Speech Communication 42, 3-4: 329.352.
http://dx.doi.org/10.1016/j.specom.2003.10.003

Pineda, L. A., Massé, A., Meza, I., Salas, M., Schwarz, E., Uraga, E., & Villaseñor, L. (2002). The DIME project. In C. A. Coello, A. Albornoz, L. E. Sucar, & O. C. Battistutti (Eds.), Lecture Notes in Artificial Intelligence: MICAI 2002. Advances in artificial intelligence. Proceedings of the second Mexican international conference on artificial intelligence. (pp. 166-75). Dordrecht: Springer. Retrieved from http://turing.iimas.unam.mx/~luis/DIME/publicaciones/papers/dime-micai.pdf

QUESADA, F.J.- AMORES, J.G.- BALLESTEROS, R. (2001) "Integration of dialogue moves and speech recognition in a telephone scenario", Procesamiento del Lenguaje Natural (Actas del XVII Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural, Universidad de Jaén, 12-14 de septiembre de 2001), Revista n. 27: 71-78.

RELAÑO GIL, J.- TAPIAS, D.- RODRÍGUEZ, M.C.- CHARFUELÁN, M.- HERNÁNDEZ GÓMEZ, L. (1999) "Robust and flexible mixed-initiative dialogue for telephone services", in EACL’99. Proceedings of the Ninth Conference of the European Chapter of the Association for Computational Linguistics. Bergen. Norway. p.. 287-290.
http://aclweb.org/anthology//E/E99/E99-1051.pdf

RUBIO, A. J.- GARCÍA, P. - DE LA TORRE, A.- SEGURA, J.C.- DÍAZ VERDEJO, J.- BENÍTEZ, M.C.- SÁNCHEZ, V.- PEINADO, A.M. - LÓPEZ SOLER, J.M.- PÉREZ CÓRDOBA, J.L. (1997) "An Automatic Service for Information Access Using Continuous Speech Recognition Through the Telephone Line", in KOKKINAKIS, G.- FAKOTAKIS, N.- DERMATAS, E. (Eds.) Eurospeech’97. 5th European Conference on Speech Communication and Technology. Rhodes, Greece, 22-25 September 1997. Vol. 4. pp. 1779-1782.

Sanchis, E., Hurtado, L. . F., Gómez, J. A., García, F., Pastor, J., Planells, J., & Segarra, E. (2011). Sistema de diálogo multimodal basado en modelos estadísticos. Procesamiento del Lenguaje Natural, 47, 325-326. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/993

SAN SEGUNDO, R.- MONTERO; J.M.- FERREIROS, J.- MACÍAS, J.- PARDO, J.M. (2001) "Sistema de información ferroviaria por teléfono: propuesta de una metodología de gestores de diálogo", in Actas del Segundo Taller Internacional de Procesamiento Computacional del Español y Tecnologías del Lenguaje. Jaén, 14-15 de septiembre de 2001. pp. 241-245.
http://www-gth.die.upm.es/research/documentation/AN-37Sis-01.pdf

SAN SEGUNDO, R.- COLÁS, J.- MONTERO, J.M.- de CÓRDOBA, R.- FERREIROS, J.- MACÍAS-GUARASA, J.- GALLARDO, A.- GUTIÉRREZ, J.M.- PASTOR, J.- PARDO; J.M. (1999) "Servidores vocales interactivos: Desarrollo de un servicio de páginas blancas por teléfono con reconocimiento de voz (Proyecto IDAS: Interactive telephone-based Directory Assistance Service)", in IX Jornadas Telecom I+D. Barcelona - Madrid, noviembre de 1999.
http://www-gth.die.upm.es/research/documentation/AN-30Ser-99.pdf

SENEFF, S. (1991) "TINA: A natural language system for spoken language applications", Computational Linguistics, 18,1: 61-86.

TAPIAS, D.- ÁLVAREZ, J.- CORTÁZAR, I. (1997) "ATOS: un sistema de control automático del teléfono mediante computador", Philologia Hispalensis (Sevilla) 11, 2: 151-161.

TAPIAS, D.- HERNÁNDEZ, L.A. (2004) "Los sistemas de diálogo en los servicios telefónicos: evolución y consideraciones de diseño", in MARTÍ, M. A. - LLISTERRI, J. (Eds.) Tecnologías del texto y del habla. Barcelona. Edicions de la Universitat de Barcelona – Fundación Duques de Soria (UB, 72). pp. 225-253.

WAHLSTER, W. (Ed.) (2006) SmartKom: Foundations of Multimodal Dialogue Systems. New York: Springer (Cognitive Technologies).

ZUE, V. - SENEFF, S. - POLIFRONI, J. - PHILLIPS, M. - PAO, Ch. - GOODINE, D. - GODDEAU, D. - GLASS, J. (1994) "PEGASUS: A spoken dialogue interface for on-line air travel planning", Speech Communication 15, 3-4: 331-340.

arrow_gray_up

Assessment of Spoken Language Systems

Baggia, P., Castagneri, G., & Danieli, M. (2000). Field trials of the Italian Arise train timetable system. Speech Communication, 31(4), 355-367. doi:10.1016/S0167-6393(99)00068-0

Benyon, D., Gamback, B., Hansen, P., Mival, O., & Webb, N. (2013). How was your day? Evaluating a conversational companion. IEEE Transactions on Affective Computing, 4(3), 299-311. doi:10.1109/T-AFFC.2013.15

Bernsen, N. O., & Dybkjær, L. (2005). User evaluation of conversational agent H. C. Andersen. In Eurospeech 2005 - Interspeech 2005. Proceedings of the 9th European Conference on Speech Communication and Technology (pp. 2473-2476). Lisbon, Portugal. 4-8 September, 2005. Retrieved from http://spokendialogue.dk/Publications/2005d/NICE-IS-13.4.05-F.pdf

Berry, D. C., Butler, L. T., & de Rosis, F. (2005). Evaluating a realistic agent in an advice-giving task. International Journal of Human-Computer Studies, 63(3), 304-327. doi:10.1016/j.ijhcs.2005.03.006

Billi, R., Castagneri, G., & Danieli, M. (1997). Field trial evaluations of two different information inquiry systems. Speech Communication, 23(1-2), 83-93. doi:10.1016/S0167-6393(97)00041-1

Callejas, Z., & López-Cózar, R. (2008). Evaluación de campo de un sistema de diálogo oral empleando relaciones estadísticas. In V Jornadas en Tecnología del Habla (pp. 187-190). Universidad del País Vasco, Bilbao. 12-14 de noviembre de 2008. Retrieved from http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/V/pdfs/articulo/art_46.pdf

Charfuelán, M., Esteban, C., Relaño, J., Rodríguez Gancedo, M. C., & Hernández Gómez, L. A. (2000). Language dialogue systems: Experience with call center agent systems. In ROMAND 2000. 1st workshop on RObust Methods in Analysis of Natural language Data. Swiss Federal Institute of Technology, Lausanne, Switzerland. 19-20 October, 2000. Retrieved from https://www.researchgate.net/publication/228790216_A_general_evaluation_framework_to_asses_spoken_language_dialogue_systems_Experience_with_call_center_agent_systems

Charfuelán, M., Relaño, J., Rodríguez Gancedo, M. C., Tapias, D., & Hernández Gómez, L. A. (2000). Dialogue annotation for language systems evaluation. In LREC 2000. Proceedings of the 2nd International Conference on Language Resources and Evaluation (Vol. 3, p. 33). Athens, Greece. May 31 - June 2, 2000. Retrieved from http://www.lrec-conf.org/proceedings/lrec2000/html/summary/33.htm

Damper, R. I., & Gladstone, K. (2007). Experiences of usability evaluation of the IMAGINE speech-based interaction system. International Journal of Speech Technology, 9(1-2), 41-50. doi:10.1007/s10772-006-9003-4

Díaz Pardo de la Vera, D. (2014). User Experience in Human-Technology Interaction. Communication, context and evaluation methodology (PhD Thesis). Departamento de Señales, Sistemas y Radiocomunicaciones, Escuela Técnica Superior de Ingeniería de Telecomuniación, Universidad Politécnica de Madrid, Madrid. Retrieved from http://oa.upm.es/28992/

Doumanis, I. (2013). Evaluating humanoid embodied conversational agents in mobile guide applications (PhD Thesis). Department of Computer and Communications Engineering, Middlesex University, London. Retrieved from http://eprints.mdx.ac.uk/id/eprint/12627

Dybkjær, L., Bernsen, N. O., & Minker, W. (2004). Evaluation and usability of multimodal spoken language dialogue systems. Speech Communication, 43(1-2), 33-54. doi:10.1016/j.specom.2004.02.001

Gibbon, D., Moore, R., & Winski, R. (Eds.). (1998). Spoken language system assessment. Berlin - New York: Mouton de Gruyter.

Glass, J. R., Polifroni, J., Seneff, S., & Zue, V. (2000). Data collection and performance evaluation of spoken dialogue systems: The MIT experience. In ICSLP 2000 - Interspeech 2000. Proceedings of the 6th International Conference on Spoken Language Processing (Vol. 4, pp. 1-4). Beijing, China. October 16-20, 2000. Retrieved from https://groups.csail.mit.edu/sls/publications/2000/685.pdf

González Ferreras, C., & Cardeñoso, V. (2005). Development and evaluation of a spoken dialog system to access a newspaper website. In Eurospeech 2005 - Interspeech 2005. Proceedings of the 9th European Conference on Speech Communication and Technology (pp. 857-860). Lisbon, Portugal. September 4-8, 2005. Retrieved from https://www.researchgate.net/publication/221489136_Development_and_evaluation_of_a_spoken_dialog_system_to_access_a_newspaper_web_site

Höllerer, S. (2002). Challenges and important aspects in planning and performing evaluation studies for multimodal dialogue systems. In S. Krauwer (Ed.), Towards a Roadmap for Language Resources and Evaluation (pp. 1-6). Las Palmas de Gran Canaria, Spain. 2 June, 2002. Retrieved from http://www.lrec-conf.org/proceedings/lrec2002/pdf/ws18.pdf

Kamm, C., Walker, M., & Litman, D. J. (1999). Evaluating spoken language systems. In AVIOS 1999. Proceedings of the annual meeting of the American Voice Input/Output Society (pp. 187-197). San JosÈ, CA. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.9747&rep=rep1&type=pdf

Kuligowska, K. (2015). Commercial chatbot: Performance evaluation, usability metrics and quality standards of embodied conversational agents. Professionals Center for Business Research, 2, 1-16. Retrieved from https://ssrn.com/abstract=2569637

Lamel, L., Bennacef, S., Rosset, S., Devillers, L., Foukia, S., Gangolf, J. J., & Gauvain, J.-L. (1997). The LIMSI RailTel System: Field trial of a telephone service for rail travel information. Speech Communication, 23(1-2), 67-82. doi:10.1016/S0167-6393(97)00037-X

Lamel, L., Bennacef, S., Gauvain, J.-L., Dartigues, H., & Temem, J. N. (2002). User evaluation of the Mask kiosk. Speech Communication, 38(1-2), 131-139. doi:10.1016/S0167-6393(01)00048-6

López-Cózar, R., & Araki, M. (2005). Spoken, multilingual and multimodal dialogue systems: Development and assessment. Chichester: John Wiley & Sons.

López-Cózar, R., Callejas, Z., & Gea, M. (2005). Análisis de metodologías de evaluación de sistemas de diálogo multimodal. Procesamiento del Lenguaje Natural, 34, 9-16. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3037/1530

López-Cózar, R., de la Torre, A., Segura, J. C., & Rubio, A. J. (2003). Assessment of dialogue systems by means of a new simulation technique. Speech Communication, 40(3), 387-407. doi:10.1016/S0167-6393(02)00126-7

López-Cózar, R., Segura, J. C., de la Torre, A., & Rubio, A. J. (2001). Una nueva técnica para evaluar sistemas conversacionales basada en la generación automática de diálogos. Procesamiento del Lenguaje Natural, 27, 255-262. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3367/1855

López-Mencía, B. (2011). Agentes animados personificados en sistemas interactivos: diseño y evaluación (Tesis doctoral). Departamento de Señales, Sistemas y Radiocomunicaciones, Escuela Técnica Superior de Ingenieros de Telecomúnicación, Universidad Politécnica de Madrid, Madrid. Retrieved from http://oa.upm.es/9588/

Möller, S. (2008). Evaluating interactions with spoken dialogue telephone services. In L. Dybkjaer & W. Minker (Eds.), Recent Trends in Discourse and Dialogue (pp. 69-100). Dordrecht: Springer.

Möller, S., Krebber, J., & Smeele, P. (2006). Evaluating the speech output component of a smart-home system. Speech Communication, 48(1), 1-27. doi:10.1016/j.specom.2005.05.004

Niculescu, A. I., Yeo, K. H., D’Haro, L. F., Kim, S., Jiang, R., & Banchs, R. E. (2014). Design and evaluation of a conversational agent for the touristic domain. In 2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (pp. 1-10). New York, NY: IEEE. doi:10.1109/APSIPA.2014.7041744

Polifroni, J., Seneff, S., Glass, J. R., & Hazen, T. J. (1998). Evaluation methodology for a telephone-based conversational system. In LREC 1998. Proceedings of the 1st International Conference on Language Resources and Evaluation (pp. 42-50). Granada, Spain. 28-30 May, 1998. Retrieved from https://groups.csail.mit.edu/sls/publications/1998/lrec98-polifroni.pdf

San-Segundo, R., Macías, J., Montero, J. M., Ferreiros, J., Córdoba, R. de, & Pardo, J. M. (2004). Medidas de confianza en sistemas de diálogo. Procesamiento del Lenguaje Natural, 33, 95-102. Retrieved from http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3063/1556

Silvervarg, A., & Jönsson, A. (2011). Subjective and objective evaluation of conversational agents in learning environments for young teenagers. In 7th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems (pp. 54-63). Barcelona, Spain. 17 July, 2011. Retrieved from http://www.lucs.lu.se/wp-content/uploads/2013/09/silvervarg_jonsson_confproc_2011.pdf

Walker, M. A., Litman, D. J., Kamm, C., & Abella, A. (1998). Evaluating spoken dialogue agents with PARADISE: Two case studies. Computer Speech & Language, 12(4), 317-347. doi:10.1006/csla.1998.0110

Webb, N., Benyon, D., Hansen, P., & Miwal, O. (2010). Evaluating human-machine conversation for appropriateness. In LREC 2010. Proceedings of the 7th International Conference on Language Resources and Evaluation. Valletta, Malta. 17-23 May, 2010. Retrieved from http://www.lrec-conf.org/proceedings/lrec2010/summaries/115.html

arrow_gray_up

Spoken Language Translation


= Recommended introductory/general reading

AMORES, J.G.- QUESADA MORENO, J.F.- TAPIAS, D. (1994) "Traducción automática basada en el formalismo LFG con entrada y salida por voz", Comunicaciones de Telefónica I+D 10.

ARRANZ, V.- COMELLES, E.- FARWELL, D. (2004) "Sistema de traducción oral de ayuda al intercambio multicultural", in SANCHIS ARNAL, E. (Ed.) Actas de las III Jornadas en Tecnología del Habla. Valencia, del 17-19 de noviembre de 2004. Organizadas por la Red Temática en Tecnología del Habla. Valencia: Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia.
http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/III/actas3JTH.pdf

Arranz, V., Comelles, E., & Farwell, D. (2005). Sistema de traducción oral para el castellano, catalán e inglés. Procesamiento del Lenguaje Natural, 35, 343-350. Retrieved from http://www.sepln.org/revistaSEPLN/revista/35/42.pdf

ARRANZ, V.- COMELLES, E.- FARWELL, D.- NADEU, C.- PADRELL, J. (2004) "Sistema de traducció oral per al català, castellà i anglès", in CELC 04, II Congrés d’Enginyeria en Llengua Catalana. 19-21 de novembre de 2004. Andorra la Vella, Andorra.
http://www.eicc.cat/celc/pp/C112%20Elisabet%20Comellas%20PPT.pdf

ARRANZ, V.- COMELLES, E.- FARWELL, D.- NADEU, C.- PADRELL, J.- FEBRER, A.- ALEXANDER, D.- PETERSON, K. (2004) "A speech-to-speech translation system for Catalan, Spanish and English", in AMTA 2004. The 6th Conference of the Association for Machine Translation in the Americas. 28 September - 2 October 2004. Georgetown University, Washington DC, USA.
http://www.cs.cmu.edu/~dorcas/publications/04-amta-speech2speech-catspaeng.pdf

CASACUBERTA, F. (2001) La traducción automática del habla, Curso de Industrias de la Lengua "Confluencias entre el procesamiento del lenguaje natural y las tecnologías del habla", Fundación Duques de Soria, Soria, 23-27 de julio de 2001.

CASACUBERTA, F. (2004) "Traducción automática del habla", in MARTÍ, M. A. - LLISTERRI, J. (Eds.) Tecnologías del texto y del habla. Barcelona. Edicions de la Universitat de Barcelona - Fundación Duques de Soria (UB, 72). pp. 121-144.

CASACUBERTA, F.- LLORENS, D.- MARTÍNEZ, C.- MOLAU, S.- NEVADO, C.- NEY, H.- PASTOR, M.- PICÓ, D.- SANCHIS, A.- VIDAL, E.- VILAR, J.M. (2001) "Speech-to-speech translation based on finite-state transducers", in International Conference on Acoustic, Speech and Signal Processing. Volume 1. IEEE Press, April 2001.

COMELLES, E.- ARRANZ, V.- FARWELL, D. (2005) "Sistema de traducción oral para el castellano, catalán e inglés", Procesamiento del Lenguaje Natural (Actas del XXI Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural. Universidad de Granada, 14-16 de septiembre de 2005), Revista nº 35: 343-350.
http://www.sepln.org/revistaSEPLN/revista/35/42.pdf

FARRÚS, M.- ANGUITA, J.- ANGUERA, X.- CREGO, J.M.- de GISPERT, A.- HERNANDO, J.- NADEU, C. (2004) "Els sistemes de reconeixement de veu i traducció automàtica en català: present i futur", in CELC 04, II Congrés d’Enginyeria en Llengua Catalana. 19-21 de novembre de 2004. Andorra la Vella, Andorra.
http://nlp.lsi.upc.edu/papers/hernando_sist.pdf

FREDERKING, R.- RUDNICKY, A.- HOGAN, C. (1997) "Interactive Speech Translation in the DIPLOMAT Project", in Spoken Language Translation. Proceedings of a Workshop Sponsored by the Association for Computational Linguistics and by the European Network in Language and Speech (ELSNET). 11 July 1997, Universidad Nacional de Educación a Distancia, Madrid. Spain.
http://www.aclweb.org/anthology/C00-2154

FÜGEN, C.- WESTPHAL, M.- SCHNEIDER, M.- SCHULTZ, T.- WAIBEL, A. (2001) "LingWear: A Mobile Tourist Information System", in Proceedings of the Human Language Technology Meeting (HLT-2001), San Diego, March 2001.
http://www.cs.cmu.edu/~tanja/Papers/fuegen_hlt01-final.ps.gz

GONZÁLEZ, J.- NAVARRO, J.R.- NEVADO, F.- PASTOR, M.- CASACUBERTA, F.- VIDAL, E.- FABREGAT, F.- de VAL, J.M.- ARENAS, L.- PLA, F.- TOMÁS, J. (2002) "SisHiTra: Sistemas de traducción catalán-castellano y castellano-catalán con entrade de texto y voz", in RUBIO AYUSO, A. (Ed.) Actas de las II Jornadas en Tecnologías del Habla. Granada, del 16 al 18 de diciembre de 2002. Organizadas por la Red Temática en Tecnologías del Habla. Granada: Universidad de Granada, Departamento de Electrónica y Tecnología de Computadores.
http://users.dsic.upv.es/~fpla/ARTICLES2002/sishitra_granada2002.pdf

Juan, A., Silvestre, J. A., del Agua, M. A., Garcés, G., Gascó, Guillem, Giménez, A., . . . Sanchís, A. (2012). TransLectures. In IberSPEECH 2012. Proceedings of VII Jornadas en Tecnología del Habla and III Iberian SLTech Workshop (pp. 345-351). Escuela Politécnica Superior, Universidad Autónoma de Madrid, Madrid. 21-23 November 2012. Retrieved from http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/VII/IberSPEECH2012_OnlineProceedings.pdf

KRAUWER, S.- ARNOLD, D.- KASPER, W.- RAYNER, M.- SOMERS, H. (Eds.) (1997) Spoken Language Translation. Proceedings of a Workshop Sponsored by the Association for Computational Linguistics and by the European Network in Language and Speech (ELSNET). 11 July 1997, Universidad Nacional de Educación a Distancia, Madrid, Spain.

LAVIE, A.- METZE, F.- PIANESI, F. (2002) "Enhancing the Usability and Performance of NESPOLE! - a Real-World Speech-to-Speech Translation System", in Proceedings of the Human Technology Conference, San Diego 2002.
http://www-cgi.cs.cmu.edu/afs/cs.cmu.edu/Web/People/clangley/papers/hlt-02-nespole-system.pdf

LAZZARI, G. (2000) "Spoken Translation: Challenges and Opportunities", in YUAN, B.- HUANG, T.- TANG, X. (Eds.) Proceedings of 6th International Conference on Spoken Language Processing, ICSLP 00. Beijing, China, October 16-20, 2000. Vol IV, pp. 430-435.

Mariño, J. B. (2006). AVIVAVOZ: Tecnologías para la traducción de voz. In L. Buera, E. Lleida, A. Miguel, & A. Ortega (Eds.), IV jornadas en tecnología del habla. (pp. 285-90). Zaragoza: Universidad de Zaragoza - Red Temática en Tecnologías del Habla. Retrieved from http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/IV/4jth_cdrom.html

METZE, F.- LANGLEY, C.- LAVIE, A.- McDONOUGH, J.- SOLTAU, H.- WAIBEL, A.- BURGER, S.- LASKOWSKI, K.- LEVIN, L.- SCHULTZ, T.- PIANESI, F.- CATTONI, R.- LAZZARI, G.- MANA, N.- PIANTA, E.- BESACIER, L.- BLANCHON, H.- VAUDEFREYDAZ, D.- TADDEI, L. (2002) "The NESPOLE! Speech-to-Speech Translation System", in Proceedings of the Human Language Technology Conference. San Diego 2002.
http://www.ri.cmu.edu/pub_files/pub3/metze_f_2002_1/metze_f_2002_1.pdf

PASTOR, M.- SANCHIS, A.- CASACUBERTA, F.- VIDAL, E. (2000) "Eutrans: prototipo de traducción automática de voz a voz", Jornadas de Tecnología del Habla. Sevilla (Spain), October 2000.

PASTOR, M.- SANCHIS, F.- CASACUBERTA, F.- VIDAL, E. (2001) "Eutrans: Speech to speech translator prototype", in Proceedings of the Spanish Symposium on Pattern Recognition and Image Analysis. Castellón (Spain), June 2001.

PASTOR, M.- SANCHIS, A.- CASACUBERTA, F.- VIDAL, E. (2001) "Eutrans: a speech-to-speech translator prototype", in Eurospeech 2001. Proceedings of the 7th european conference on speech communication and technology. September 3-7, 2001, Aalborg, Denmark.

Pérez, A., Torres, M. I., Guijarrubia, V., & Casacuberta, F. (2006). Basque-Spanish-English machine translation using finite state transducers. In L. Buera, E. Lleida, A. Miguel, & A. Ortega (Eds.), IV jornadas en tecnología del habla. (pp. 49-53). Zaragoza: Universidad de Zaragoza - Red Temática en Tecnologías del Habla. Retrieved from http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/IV/4jth_cdrom.html

ROE, D.- PEREIRA, F .- SPROAT, R .- RILEY, M.- MORENO, P.- MACARRÓN, A. (1991) "Toward a spoken language translator for restricted-domain context-free languages" in Eurospeech’91. 2nd European Conference on Speech Communication and Technology. Genova, Italy, 24-26 September 1991. Vol.3. pp.1063-1066.

Sánchez Martínez, R., Neto, J. P., & Caseiro, D. (2008). Statistical machine translation of broadcast news from Spanish to Portuguese. In PROPOR 2008. Computational processing of the Portuguese language. Eighth international conference, Aveiro, Portugal, September 8-10, 2008, Proceedings. (pp. 112-21). Heidelberg: Springer. Retrieved from http://www.inesc-id.pt/pt/indicadores/Ficheiros/5008.pdf

Schulz, H., Costa-Jussà, M., & Fonollosa, J. A. (2008). TECNOPARLA - speech technologies for Catalan and its application to speech-to-speech translation. Procesamiento del Lenguaje Natural, 41, 319-320. Retrieved from http://www.sepln.org/revistaSEPLN/revista/41/proy5.pdf

STENTIFORD, F.W.M.- STEER, M.G. (1990) "Machine translation of speech", in WHEDDON, C.- LINGGARD, R. (Eds.) Speech and Language Processing. London: Chapman and Hall. pp. 183-196.

TAPIAS MERINO, D.- SILES SÁNCHEZ, J.A. (1992) "La traducción automática. Descripción de un sistema con entrada y salida por voz", Comunicaciones de Telefónica I+D 5.

WAHLSTER, W. (Ed.) (2000) Verbmobil: Foundations of Speech-to-Speech Translation. Heidelberg - New York: Springer Verlag (Artificial Intelligence).
http://verbmobil.dfki.de/Vm-Buch.final.html


WAHLSTER, W. (2000) "Mobile Speech-to-Speech Translation of Spontaneous Dialogs: An Overview of the Final Verbmobil System", in WAHLSTER, W. (Ed.) Verbmobil: Foundations of Speech-to-Speech Translation. Heidelberg - New York: Springer Verlag (Artificial Intelligence).
http://verbmobil.dfki.de/ww.html

Waibel, A. (1996). Interactive translation of conversational speech. IEEEE Computer, 29(7), 41-48. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.45.9546

WAIBEL, A. (1997) "Multilingual Speech Processing", in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds.) Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press. pp. 306-313.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.366.9300


WAIBEL, A. (2000) "La traducción interactiva del habla", Quark. Ciencia, Medicina, Comunicación y Cultura 19: 58 - 65.
http://quark.prbb.org/19/019058.htm

Waibel, A. (2004). Speech translation: Past, present and future. In Interspeech 2004 - ICSLP. Proceedings of the 8th international conference on spoken language processing. (pp. 353-6). Jeju Island, Korea. October 4-8, 2004. Retrieved from http://www.isca-speech.org/archive/interspeech_2004/i04_0353.html

Waibel, A., Bernardin, K., & Wölfel, M. (2007). Computer-supported human-human multilingual communication. In Interspeech 2007. Proceedings of the 8th annual conference of the international speech communication association. (pp. 14-21). Antwerp, Belgium, August 27-31, 2007. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.91.6650&rep=rep1&type=pdf

arrow_gray_up

Person-machine communication

Spoken language systems


Spoken Language Systems - Bibliography
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: