line_red

3. La síntesis de los elementos suprasegmentales

Tecnologies de la parla I (1996-1997)

line_red

3.1. La modelización de los elementos suprasegmentales para la síntesis
Referencias generales sobre la modelización de los elementos suprasegmentales para la síntesis
3.2. Representación de curvas melódicas
Referencias generales sobre la representación de curvas melódicas
3.3. Modelos entonativos
Referencias generales sobre modelos entonativos
line_red

3.1. La modelización de los elementos suprasegmentales para la síntesis

3.1.1. La síntesis de los elementos suprasegmentales

Módulos para la síntesis de los elementos suprasegmentales en la conversión de texto a habla. Módulos entonativos. Definición de modelo melódico.

3.1.2. Elaboración de modelos entonativos

Aproximaciones fonéticas y fonológicas. Etapas y tareas en la elaboración de un modelo entonativo.

3.2. Representación de curvas melódicas

3.2.1. La aproximación fonética: estilización

Concepto de estilización. Tipos de estilización: métodoss basados en criterios lingüísticos; métodos basados en criterios acústicos; métodos basados en criterios perceptivos. Métodos manuales y métodos automáticos. Ejemplos de estilización: close-copy stylization (IPO, MOMEL, La Salle).

3.2.2. Aproximaciones fonológicas: transcripción

Concepto de transcripción. Tipos de transcripción: basados en la forma de la curva melódica (notación musical, Bolinger, 1989); relacionados la descripción fonológica (INTSINT, ToBI). Ejemplos de transcripción: ToBI, INTSINT.

3.2.3. Herramientas de estilización y transcripción

Una herramienta de estilización: 'Pitch'. Una herramienta de transcripción: 'mes'.

3.3. Modelos entonativos

3.3.1. Tipos de modelos

Modelos lineales y jerárquicos. Modelos fonológicos y modelos fonéticos. Principales modelos fonéticos: IPO, Garrido (1996). Principales modelos fonológicos: Pierrehumbert, Aix-en-Provence.

line_red

Referencias

0. General

DUTOIT, T. (1997) "Automatic Prosody Generation", en DUTOIT, T. An Introduction to Text-to-Speech Synthesis. Boston: Kluwer Academic Publishers.

1. Modelización de los elementos suprasegmentales para la síntesis

1.1. Síntesis de los elementos suprasegmentales

KOHLER, K.J. (1991) "Prosody in speech synthesis: the interplay between basic research and TTS application", Journal of Phonetics, 19, 121-138.

LÓPEZ GONZALO, E. - ÁLVAREZ CERCADILLO, J. - HERNÁNDEZ GÓMEZ, L.A (1994).- "Metodología para el modelado prosódico de un sistema de conversión de texto a habla en castellano", Actas del X congreso S.E.P.L.N., Córdoba, 20-22 julio 1994, Servicio de Idiomas, Universidad de Córdoba.

PIERREHUMBERT, J. (1981) "Synthesizing Intonation", Journal of the Acoustical Society of America 70,4: 985-995.

1.2. Elaboración de modelos entonativos

CUTLER, A. - LADD, D.R. (1983) "Models and Measurements in the Study of Prosody", in CUTLER, A. - LADD, D.R. (Eds.) Prosody: Models and Measurements. Berlin: Springer Verlag, pp. 1-10.

2. Representación de curvas melódicas

2.1. Estilización

ESTRUCH, M.- MIMÓ, M. - RENOM, J. - RIERA, M. (1995) Validació perceptiva dels patrons melòdics del català, manuscrito no publicado, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.

HIRST, D.J. - ESPESSER, R. (1991) "Automatic modelling of fundamental frequency", Travaux de l'Institut de Phonetique d'Aix, 15: 71-85

HIRST, D.J. - ROMÉAS, P. - ESPESSER, R. (1991) "Coding the F0 of a continuous text in French: an experimental approach", Actes du XIIème Congrès International des Sciences Phonétiques, 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence, Université de Provence, Service des Publications. Vol. V. pp. 234-237.

JIMÉNEZ, J.M. (1994) Implementació d’un métode d’estilitzat de corbes melòdiques. Barcelona: EUITT 'La Salle', Universitat Ramon Llull, Proyecto Fin de Carrera.

MERTENS, P. - D'ALESSANDRO, Ch. (1995) "Pitch contour stylization using a tonal perception model", en ELENIUS, K.- BRANDERUD, P. (Eds.) Proceedings of the XIIIth International Congress of Phonetic Sciences. Stockholm, Sweden, 13-19 August, 1995. Vol. 4, pp. 228-231.

2.2. Transcripción

BOLINGER, D.l. (1989) Intonation and its uses. Melody in grammar and discourse. Londres: Edward Arnold.

LLISTERRI, J. (1994) Prosody Encoding Survey. WP 1 Specifications and Standards. T1.5. Markup Specifications. Deliverable 1.5.3. Final version, 15 September 1994. LRE Project 62-050 MULTEXT.

BECKMAN, M.E. - AYERS, G.M. (1994) Guidelines for ToBI Labelling (version 2.0, February 1994), manuscrito no publicado.

BECKMAN, M.E. -HIRSCHBERG, J. (inédito). The ToBI Annotation Conventions, manuscrito no publicado

PITRELLI, J. - BECKMAN, M. - HIRSCHBERG, J. (1994) "Evaluation of prosodic transcription labelling reliability in the tobi framework", en Proceedings of the third International Conference on Spoken Language Processing, Yokohama, ICSLP, Vol. 2, pp. 123-126.

SILVERMAN, K.- BECKMAN, M.- PITRELLI, J.- OSTENDORF, M.- WIGHTMAN, C.- PRICE, P.- PIERREHUMBERT, J.- HIRSCHBERG, J. (1992) "TOBI: A standard for labeling English prosody", in OHALA, J.J. et al. (Eds.) Proceedings of the Second International Conference on Spoken Language Processing, ICSLP-92. Banff, October 1992. pp. 867-870.

2.3. Herramientas de estilización y transcripción

MARTÍNEZ, D. (1995) Sistema d’anàlisi, tractament i síntesi de la melodia en entorn Windows. Manuscrito no publicado. Barcelona: Enginyeria La Salle, Universitat Ramon Llull.

3. Modelos entonativos

3.1. Tipos de modelos

BANNERT, R. (1991) "Some general remarks on designing linguistic models of intonation", en Actes du XIIème Congrès International des Sciences Phonétiques, 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence, Université de Provence, Service des Publications. Vol. 1, pp. 296- 299.

BECKMAN, M. (1995) "Local shapes and Global Trends", en ELENIUS, K.- BRANDERUD, P. (Eds.) Proceedings of the XIIIth International Congress of Phonetic Sciences. Stockholm, Sweden, 13-19 August, 1995. Vol. 2, pp. 100-107.

HIRST, D.J. (1991) "Intonation models: towards a third generation",en Actes du XIIème Congrès International des Sciences Phonétiques, 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence, Université de Provence, Service des Publications. Vol. I. pp. 305-310.

LADD, D.R. (1995) "'Linear' and 'Overlay' descriptions: an autosegmental-metrical middle way", en ELENIUS, K.- BRANDERUD, P. (Eds.) Proceedings of the XIIIth International Congress of Phonetic Sciences. Stockholm, Sweden, 13-19 August, 1995. Vol. 2, pp. 116-123.

3.2. Modelos fonéticos

FUJISAKI, H. - HIROSE, K. (1984).- "Analysis of voice fundamental frequency contours for declarative sentences for Japanese", Journal of the Acoustical Society of Japan, 5: 233-242.

GARRIDO, J.M. (1996) Modelling Spanish Intonation for Text-to-Speech Applications. Tesis doctoral. Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.

'T HART, J. - COLLIER, R. - COHEN, A. (1990) A Perceptual Study of Intonation. An Experimental - Phonetic Approach to Intonation. Cambridge: Cambridge University Press.

O´SHAUGHNESSY, D. (1979) "Linguistic features in fundamental frequency patterns", Journal of Phonetics, 7: 119-145.

TAYLOR, P.A. (1994) A Phonetic Model of Intonation in English. Bloomington: Indiana University Linguistics Club Publications.

THORSEN, N. (1983) "Standard Danish sentence intonation - Phonetic data and their representation", Folia Linguistica 17: 187-220.

3.3. Modelos fonológicos

BECKMAN, M. - PIERREHUMBERT, J.B. (1986) "Intonational structure in English and Japanese", Phonology Yearbook 3, pp. 255-310.

GÅRDING, E. (1983) "A generative model of intonation", en LADD, D.R. - CUTLER, A. (Eds.) (1983) Prosody: Models and Measurements. Berlin: Springer Verlag, pp. 11-25.

GUSSENHOVEN, C. - RIETVELD, T. (1992) "A target-interpolation model for the intonation of Dutch", en OHALA, JJ. et al. (Eds.) Proceedings of the Second International Conference on Spoken Language Processing, ICSLP-92. Banff, October 1992. pp. 1235-1238.

HIRST, D.J. (1983) "Structures and categories in Prosodic representations", in CUTLER, A. - LADD, D.R. (Eds.) Prosody: Models and Measurements. Berlin: Springer Verlag. pp. 93-109.

HIRST, D. - DI CRISTO, A. (1984) "French Intonation: A Parametric Approach", Die Neueren Sprachen 83, 5: 584-569.

HIRST, D. - DI CRISTO, A. (1986) "Unités tonales et unités rythmiques dans la representation de l’intonation", Actes des 15èmes Journées d'Études sur la Parole, Aix-en-Provence, 27-30 mai 1986, pp. 93-95.

LADD, D.R. (1983) "Peak features and overall slope", en LADD, D.R. - CUTLER, A. (Eds.) (1983) Prosody: Models and Measurements. Berlin: Springer Verlag. pp. 39-52.

LADD, D.R. (1992) "An introduction to intonational phonology", en DOCHERTY, G.J. - LADD, D.R. (Eds.) Papers in Laboratory Phonology II. Cambridge: Cambridge University Press. pp. 321-334.

LIBERMAN, M. - PIERREHUMBERT, J. (1984).- "Intonational Invariance under Changes in Pitch Range and Length", in ARONOFF, M. - OEHRLE, R.T. (Eds.) Language Sound Structure. Studies in Phonology Presented to Morris Halle by His Teacher and Students. Cambridge: The MIT Press. pp. 157-233.

PIERREHUMBERT, J.B. (1980) The Phonology and Phonetics of English Intonation. Bloomington: Indiana University Linguistics Club.

WATT. D.L.E. (1994) The Phonology and Semology of Intonation in English. Bloomington: Indiana University Linguistics Club Publications.


line_red

Guión y bibliografía tema 3: la síntesis de los elementos suprasegmentales - Tecnologies de la parla I (1996-1997)
Juan M. Garrido, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/speech_technology/Tecnol_parla_1996/Tema3/guion_y_bibl_tema_3.html
Last updated: 07/06/08 08:32

line_red