line_red

1. La síntesis del habla

Tecnologies de la parla I (1996-1997)

line_red
1.1. Objetivos y aplicaciones
Referencias generales sobre aplicaciones de la síntesis
Referencias sobre aplicaciones de la síntesis a ayudas para discapacitados
Referencias sobre aplicaciones de la síntesis a la enseñanza asistida por ordenador
Referencias sobre aplicaciones de la síntesis a sistemas de información y comunicaciones
1.2 Parámetros en el diseño y evaluación de un sistema de síntesis

1.3. Las técnicas de síntesis

Referencias generales sobre la síntesis del habla
line_red

1.1. Objetivos y aplicaciones

La síntesis como generación automática de una señal vocal. La síntesi en el marco de las tecnologías del habla.

Las aplicaciones de la síntesis.

Síntesis de palabras aisladas: aplicaciones industriales, aplicaciones a servicios públicos,aplicaciones domésticas, aplicaciones a invidentes.

Síntesis a partir del texto (conversión de texto a habla): sistemas de información telefónica, acceso telefónico a textos escritos, aplicaciones a los invidentes y a los discapacitados vocales, enseñanza asistida por ordenador.

Aplicaciones de la síntesis

Applications of Speeech Technology, Proceedings of joint ESCA - NATO/RSG 10 Tutorial and Workshop. Lautrach Conference Center, Bavaria, Germany, 16-17 September, 1993.

TALBOTT, M. (1984) "A Cookbook of Application Ideas" in BRISTOW, G. (Ed) Electronic Speech Synthesis. Techniques, Technology and Applications. London: Granada pp. 303-319.

REOPATH, R. (1984) "Specific Applications of Speech Synthesis" in HOLMES, J. (Ed) (1984) Proceedings of the 1st International Conference on Speech Technology. 23-25 October 1984, Brighton, UK. Bedford & Amsterdam: IFS (Publications ) Ltd UK & North- Holland. pp. 145-159

Ayudas a discapacitados

ABADJIEVA, E.- MURRAY, I.R.- ARNOTT, J.L. (1993) "An enhanced development system for emotional speech synthesis for used in vocal prostheses", Proceedings of ECART2, the 2nd European Conference on the Advancement of Rehabilitation Technology. Stockholm, Sweden, 26-28 May 1993. paper 1.2 -. 4-6

CARLSON, R.- GALYAS, K.- GRANSTROM, B.- HUNNICUTT, S.- LARSSON, B.- NEOVIUS, L. (1981) " A Multi-Language, Portable Text-to-Speech System for the Disabled ", Speech Transmission Laboratory - Quarterly Progress Status Report 2-3: 8-16.

CARLSON, R.- GRANSTROM, B.- LARSSON, K. (1976) " Evaluation of a Text-to-Speech System as a Reading Machine for the Blind ", Speech Transmission Laboratroy - Quaterly Progress Status Report 2-3: 9-13.

DAMPER, R.I. (1990) "Speech aids for the handicapped" in AINSWORTH, W.A. (Ed) (1990) Advances in speech, hearing and language processing. Vol 1. London: JAI Press. pp. 297-332

DELIEGE, R.J.H. (1989) " An experimental Dutch keyboard-to-speech system for the speech impaired ", Speech Communication 8,1: 81-90

GALYAS, K.- FANT, G.- HUNNICUTT, S. (1992) Voice Output Communication Aids. Stockholm: The Swedish Handicap Institute.

GOLDEROS, A.- MARTINEZ, R.- NOMBELA, J.R. - PARDO, M.- SANTOS, J.- MUÑOZ, E. (1980) " Comunicación hombre-máquina por voz (II) Calculadora parlante en español para invidentes ", Mundo electrónico 97: 95-98.

GRANSTRöM, B. (1987) " Speech Technology for the Visually Impaired - The Swedish Perspective " Speech Transmission Laboratory - Quaterly Progress Status Report 1: 29-38.

GRANSTRÖM, B.- HUNNICUTT, S.- SPENS, K.E. (Eds) (1993) Speech and Language Technology for Disabled Persons. Proceedings of an ESCA Workshop. Stockholm, Sweden, May 31-June 2, 1992. Stockholm: KTH-ESCA.

HJELMQUIST, E. (1989) " Spoken Newspaper for the Blind" in Proceedings of the ESCA Tutorial Day on Speech Input/Output Assessment and Speech Databases. Noordwijkerhout, the Netherlands, 20-23 September 1989. pp. 13-20 HUNNICUTT, S. (1987) " La síntesis de voz como ayuda técnica", Mundo electrónico 170: 63-68.

KURZWEIL, R. (1976) " The Kurzweil Reading Machine: a technical overview" in REDDEN, M.R.- SCHWANDT, W. (Eds) Science, Technology and the Disabled. Washington DC: American Association for the Advancement of Science, Report 76-R-11. pp. 3-11

LLISTERRI, J.- FERNÁNDEZ, N.- GUDAYOL, F.- POYATOS, J.J.- MARTÍ, J. (1993) "Testing user's acceptance of Ciber232, a text to speech system used by blind persons", in GRANSTRÖM, B.- HUNNICUTT, S.- SPENS, K.-E. (Eds) Speech and Language Technology for Disabled Persons. Proceedings of an ESCA Workshop. Stockholm, Sweden, May 31-June 2, 1993. pp.203-206

MARRERO, V.- DE SANTOS, A.- AGUILERA, S. (1991) " ASELA: Análisis,síntesis y evaluación del lenguaje y la audición ", Procesamiento del lenguaje natural 10: 87-93

NÉMETH, G.- OLASZY, G.- PATAKI, L.- HERNÁNDEZ-GÓMEZ, L.A.- FREITAS, D. (1995) "Improvement, Evaluation and Testing of a Low Cost Multilingual Portable Speaking Aid for the Speech Impaired", in Eurospeech'95. Proceedings of the 4th European Conference on Speech Communication and Technology. Madrid, Spain, 18-21 September, 1995. Vol 3, pp. 1887-1890.

Enseñanza

COHEN, R. (Dir) (1992) Quand l’ordinateur parle... Utilisation de la synthèse vocale dans l’apprentissage et le perfectionnement de la langue écrite. Paris: Presses Universitaires de France (L'éducateur)

GRAY, T (1984) "Talking Computers in the Classroom" in BRISTOW, G. (Ed) Electronic Speech Synthesis. Techniques, Technology and Applications. London: Granada pp. pp. 243-259.

HILLER, S.- ROONEY, E.- LAVER, J.- JACK, M. (1993) "SPELL; An automated system for computer-aided pronunciation teaching" Speech Communication 13, 3-4: 463-474

STRATIL, M.- WESTON, G.- BURKHARDT, D. (1987) " Exploration of foreign languages speech synthesis", Literary and Linguistic Computing 2,2: 116-119

TAMBAKAS, D.- EPITROPAKIS, N.- FAKOTAKIS, N.- KOKKINAKIS, G. (1993) "A voice interactive educational system" in Applications of Speech Technology. Proceedings of Joint ESCA-NATO/RSG 10 Tutorial and Workshop. Lautrach Conference Center, Bavaria, Germany, 17-17 September 1993. pp. 187-190

Sistemas de información y telecomunicaciones

GAGNOULET, C.- JOUVET, D.- DAMAY, J. (1991) " MARIEVOX: A voice-activated information system " , Speech Communication 10,1: 23-32

GAGNOULET, C.- SORIN, C. (1993) "CNET Speech Recognition and Text-to-Speech for Telecommunications Applications", in Applications of Speech Technology. Proceedings of Joint ESCA-NATO/RSG 10 Tutorial and Workshop. Lautrach Conference Center, Bavaria, Germany, 17-17 September 1993. pp. 31-34

RABINER, L.R. (1995) "The impact of voice processing on modern telecommunications", Speech Communication 17, 3-4: 217-226.

RODRíGUEZ CRESPO, M.A.- ESCALADA SARDINA, J.G.- MONZóN SERRANO, L.- MACARRóN LARUMBE, A. (1991) " Conversión texto-voz para el español en Telefónica I+D ", in Simposio de la Lengua Española. Ciencia y Tecnología. Pabellón de España, Barcelona 7-11 de octubre de 1991.

ROE, P. (1984) " Speech Synthesis in Telecommunications " in BRISTOW, G. (Ed) Electronic Speech Synthesis. Techniques, Technology and Applications. London: Granada pp.. 260-273.

1.2. Parámetros en el diseño y evaluación de un sistema de síntesis

Parámetros para la caracterización de los sistemas de síntesis:
naturalidad, calidad e inteligibilidad del habla sintetizada;

versatilidad del sistema: vocabulario limitado vs. generación de textos sin restricciones;

complejidad del procesamiento.

Condicionantes lingüísticos y condicionantes tecnológicos.

Relación entre el sistema y la aplicación.

La concepción de la síntesis como modelo de producción del habla y como aplicación tecnológica.

1.3. Las técnicas de síntesis

Las técnicas de codificación del habla como técnicas de grabación y reproducción de mensajes mediante procesamiento digital de señales.

La síntesis paramétrica: sistema de concatenación de unidades parametrizadas según un modelo del tracto vocal.

La síntesis por reglas mediante la determinación automática de las características acústicas de los sonidos y de las reglas de concatenación.

La conversión de texto a habla: transformación de un texto escrito en su manifestación oral.

Ventajas y limitaciones de cada técnica.

Referencias generales sobre la síntesis del habla

BAILLY, G.- BENOÎT, C. (Eds) (1992) Talking Machines. Theories, Models and Designs. Amsterdam: North-Holland / Elsevier Science Publishers.

BRISTOW, G. (Ed) (1984) Electronic Speech Synthesis. Techniques, Technology and Applications. London: Granada.

CATER, J.P. (1983) Electronically Speaking: Computer Speech Generation. Indianapolis: Howard W Sams & Co Inc.

Conference Proceedings of the Second ESCA/IEEE Workshop on Speech Synthesis. September 12-15, 1994. Mohonk Mountain House, New Paltz, New York, USA.

DOCHERTY, G.- SHOCKEY, L. (1988) "Speech Synthesis " in JACK, M.- LAVER, J. (Eds) (1988) Aspects of Speech Technology. Edinburgh: Edinburgh University Press pp. 144-183.

FANT, G.- GRANSTRÖM, B. - CARLSON, R. (1991) " La síntesis del habla como componente de la tecnología del habla y de los sistemas de información ", in VIDAL BENEYTO, J. ( Dir) Las industrias de la lengua. Trad. de M. Alvar et al. Salamanca / Madrid: Fundación Sánchez Ruipérez / Pirámide (Biblioteca del Libro, 5 ). pp. 313-325

FLANAGAN, J.L. (1972) "The synthesis of Speech", Scientific American 226,2: 45-58.

FLANAGAN, J.L. (1972) "Voices of Men and Machines", Journal of the Acoustical Society of America 51,5: 1375-1386; in FLANAGAN, J.L.- RABINER, L.R. (Eds) (1973) Speech Synthesis. Stroudsburg, Penn.: Dowden, Hutchinson & Ross Inc. pp.9-21; in BRISTOW, G. (Ed) Electronic Speech Synthesis. Techniques, Technology and Applications. London: Granada. pp. 48-69.

HOLMES, J.N. (1988) Speech Synthesis and Recognition. Wokingham: Van Nostrand Reinhold (Aspects of Information Technology )

Ressenya de J. Llisterri a Límits, Revista d'Assaig i d'Informació sobre les Ciències del Llenguatge (Barcelona) 8 (1990): 106-111

JAVKIN, H.R. (1996) "Speech analysis and synthesis", in LASS, N.J (Ed) Principles of Experimental Phonetics. St Louis: Mosby. pp. 245-276

KELLER, E. (Ed) (1994) Fundamentals of Speech Synthesis and Speech Recognition. Basic Concepts, State of the Art and Future Challenges. Chichester: John Wiley & Sons.

LIÉNARD, J.S. (1977) Les processus de la communication parlée. Introduction à l´analyse et à la synthèse de la parole. Paris: Masson.

LINGGARD, R. (1985) Electronic Synthesis of Speech. Cambridge: Cambridge University Press.

LLISTERRI, J. (1988) "La síntesis del habla: estado de la cuestión", Procesamiento del Lenguaje Natural, Boletín nº 6: 17-42.

LLISTERRI, J.- WEST, M. (1987) "Los sistemas de conversión de texto a voz mediante síntesis por reglas: una aproximación interdisciplinar", en C. MARTÍN VIDE (Ed) Lenguajes naturales y lenguajes formales II. Barcelona: PPU. pp. 183-196.

MARIÑO, J.B.- NADEU, C.- LLISTERRI, J. (1987) "Síntesis automática del habla", in J. MOMPIN (Coord) Inteligencia artificial. Conceptos, técnicas y aplicaciones. Barcelona: Marcombo. pp. 157-165.

MARTÍ, J. (1987) "Síntesis del habla: Evolución histórica y situación actual" in CASACUBERTA, F.- VIDAL, E. Reconocimiento automático del habla. Barcelona: Marcombo, Boixareu Editores. pp. 187-205.

MARTÍ, J. (1988) "Síntesis del habla (Evolución histórica y situación actual) in MARTÍN VIDE, C. (Ed) Lenguajes naturales y lenguajes formales III.1. Barcelona : PPU. pp. 213-237.

MARTÍ, J. (1990) "Estado actual de la síntesis de voz", Estudios de Fonética Experimental 4: 147-168

MORGAN, N. (1984) Talking Chips.IC Speech Synthesis. With special contributions from J. Buurma and L. Rice. New York: McGraw-Hill (National's Semiconductor Technology Series)

POULTON, A.S. (1983) Microcomputer Speech Synthesis and Recognition. Wilmslow: Sigma Technical Press.

Proceedings of the ESCA Tutorial Day and Research Workshop on Speech Synthesis. Autrans, France, 25-28 September 1990.

RODRIGUEZ, M.- OLABE, J.C.- SANTOS, A.- MUÑOZ, P.- VILLASECA, I.- MUÑOZ, E.- MARTINEZ, M.- QUILIS, A. (1984) "Visión panorámica de la respuestas oral de máquinas", Mundo Electrónico 144: 57-66.

SCLATER, N. (1983) Introduction to Electronic Speech Synthesis. Indianapolis: Howard W Sams & Co., Inc. (Blacksburg Continuing Education Series ).

SCULLY, C.- WHITESIDE, C. (1992) " Speech Production Modelling and Speech Synthesis" in ROACH, P. (Ed) Computing in Linguistics and Ponetics. London: Academic Press. pp.73-84

"Spoken Output Technologies", Chapter 5, in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds.) (1996) Survey of the State of the Art in Human Language Technology. pp. 189-226.

STELLA, M. (1985) " Speech Synthesis" in F. FALLSIDE- W.A. WOODS (Eds) Computer Speech Processing. Englewood Cliffs, N.J. : Prentice Hall International. pp. 421-460.

van SANTEN, J.P.H. - SPROAT, R.W.- OLIVE, J.P.- HIRSCHBERG. J. (Eds.) (1996) Progress in Speech Synthesis. New York: Springer.

This book comprises some 40 contributions by the leading researchers in the field of speech synthesis. Based on invited contributions presented at the Second ESCA/IEEE Speech Synthesis workshop in Mohonk, New York, in 1994, the contributions provide a complete picture of recent progress made in text-to-speech synthesis throughout the world (including all major European countries and Japan). Chapters are grouped by topic, with specially commissioned introductions for the papers in each section. Topics covered include: Signal processing and source modeling; Linguistic analysis; Articulatory synthesis and visual speech; Concatenative synthesis and automated segmentation; Prosodic analysis of natural speech; Synthesis of prosody; Evaluation and perception. Comprising some 40 contributions by the leading researchers in the field of speech synthesis, this book provides a complete picture of recent progress made in text-to-speech synthesis throughout the world. A CD-ROM included with the book provides samples of synthesized speech as well as video demonstrations.

WITTEN, I. (1986) Making Computers Talk. An Introduction to Speech Synthesis. Hemel Hempstead, Hertsf.: Prentice Hall.

WITTEN, I. H. (1982) Principles of Computer Speech. London: Academic Press (Computers and People Series).


line_red

Guión y bibliografía tema 1: La síntesis del habla - Tecnologies de la parla I (1996-1997)
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/speech_technology/Tecnol_parla_1996/Tema1/guion_y_bibl_tema_1.html
Last updated: 04/11/06 09:38

line_red