Fundación Duques de Soria
Curso de Industrias de la Lengua
"Proyectos actuales en procesamiento del lenguaje natural"
16 de julio de 1998

Corpus orales para la fonética y las tecnologías del habla

Joaquim Llisterri


UAB
Grup de Fonètica
Seminari de Filologia i Informàtica
Departament de Filologia Espanyola
Universitat Autònoma de Barcelona
Joaquim.Llisterri@uab.es
http:/liceu.uab.es/~joaquim/home.html
Instituto Cervantes

Observatorio Español de Industrias de la Lengua
Dirección Académica
Instituto Cervantes
joaquim.llisterri@cervantes.es
http://oesi.cervantes.es/


1. Corpus orales y corpus escritos

La lingüística de corpus

La fonética y las tecnologías del habla

Referencias
ATWELL, E. (1996) “Machine learning from corpus resources for speech and handwriting recognition”, in THOMAS, J.- SHORT, M. (Eds) Using Corpora for Language Research. Studies in Honour of Geoffrey Leech. London: Longman. pp. 151-166

CHURCH, K.W.- MERCER, R.L. (1993) “Introduction to the Special Issue on Computational Linguistics Using Large Corpora”, Computational Linguistics 19,1: 1-24.

LLISTERRI, J. (1996) Preliminary Recommendations on Spoken Texts. EAGLES Document EAG-TCWG-STP/P, May 1996. Publicación electrónica en
http://www.ilc.cnr.it/EAGLES96/spokentx/spokentx.html

MOORE, R.K. (1991) “User Needs in Speech Research”, Proceedings of the Workshop on European Textual Corpora. Pisa, Italy, 1991.

PAYNE, J. (1992) Speaking the Same Language? Listening to the Speech Community. Working Paper, Cobuild, Birmingham, NERC-132

POLS, L. C. W. (1987) “Speech Technology and Corpus Linguistics”, in W. MEIJS (Ed.), Corpus Linguistics and Beyond. Proceedings of the Seventh International Conference on English Language Research on Computerized Corpora.Amsterdam: Rodopi.

SINCLAIR, J. (1996) Preliminary Recommendations on Corpus Typology. EAGLES Document EAG-TCWG-CTYP/P, May 1996. Publicación electrónica en
http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html

Referencias generales sobre corpus orales

CARRÉ, R. (1992) “Speech Databases” in AINSWORTH, W.A. (Ed) Advances in Speech, Hearing and Language Processing. A Research Annual. Volume 2. London: Jai Press. pp. 199-216.

CASTAGNERI, G. (Ed) (1991) Proceedings of the Workshop on International Cooperation and Standardization of Speech Databases and Speech i/O Assessment Methods. Chiavari 26-28 September 1991 (Italy). Organized by CSELT in cooperation with CEC DGXIII, ESCA, ESPRIT PROJECT 2589 (SAM)

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design .Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

LAMEL, L.- COLE, R.A. (1997) "Spoken Language Corpora", in COLE, R.A.- MARIANI, J.- USZKOREIT, H.- ZAENEN, A.- ZUE, V. (Eds) Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press. pp. 450-454.

POLS, L.C.W. (Ed) (1990) Speech Input / Output Assessment and Speech Databases, Special Issue, Speech Communication 9,4.

Fuentes de infomación

ELRA, European Language Resources Association
http://www.elra.info

ELRA Catalogue - Speech and Related Resources
http://catalog.elra.info

LDC, Linguistic Data Consortium
http://www.ldc.upenn.edu

LDC Catalogue - Speech Corpora
http://www.ldc.upenn.edu/Catalog/byType.jsp#speech

COCOSDA, International Coordination Committee on Speech Databases and Speech I/O Assessment
http://www.cocosda.org

NESCA, the ESCA Newsletter
http://archives.limsi.fr/WkG/Nesca/

EAGLES Spoken Language Working Group
http://coral2.spectrum.uni-bielefeld.de/~gibbon//gibbon_handbook_1997/index.html

2. Características específicas de los corpus orales para la fonética y las tecnologías del habla

2.1. Características de la señal

Referencias
CHAN, D.S.F.- FOURCIN, A.J. (1993) “Automatic annotation using multi-sensor data”,in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 1 pp. 187-190

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Reference Materials. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume IV).

2.2. Características lingüísticas

Estilos de habla

Contenidos lingüísticos

Referencias
GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

Estilos de habla

BROWN, P.- FRASER, C. (1979) “Speech as a marker of situation” in SCHERER, K.R. - GILES, H. (Eds) (1979) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 33-62

ESKÉNAZI, M. (1993) “Trends in Speaking Styles Research” inEurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 1 pp. 501-512

LIÉNARD, J.-S. (1995) “From speech variability to pattern processing: a non-reductive view of speech processing”, in SORIN, C.- MARIANI, J.- MELONI, H.- SCHOENTGEN, J. (Eds.) Levels in Speech Communication. Relations and Interactions. A Tribute to Max Wajskop / Hommage à Max Wajskop. Amsterdam: Elsevier Science B.V. pp. 137-148

LLISTERRI, J. (1992) “Speaking Styles in Speech Research”, ELSNET/SALT/ESCA Workshop Integrating Speech and Natural Language , University College Dublin, 15-17 July 1992. pp. 17-37.

POLS, L.C.W. (1986) “Variation and Interaction in Speech”, in PERKELL, J.S.- KLATT, D.H. (Eds) Invariance and Variability in Speech Processes. Hillsdale: Lawrence Erlbaum. pp. 140-154

2.3. Características de los hablantes

Características relativamente estables

Características transitorias

Número de hablantes

Referencias
ESKÉNAZI, M.- FREDERKING, R. (1998) “Issues in Database design: recording and processing speech from new populations”, in Proceedings of the First International Conference on Language Resources and Evaluation. May 28 - 30, 1998, Granada, Spain.

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

HELFRICH, H. (1979) “Age markers in speech”, in SCHERER, K.R. - GILES, H. (Eds) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 63-108

LAVER, J.- TRUDGILL, P. (1979) “Phonetic and linguistic markers in speech”, in SCHERER, K.R. - GILES, H. (Eds) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 1-32; in LAVER, J. (1991) The Gift of Speech. Papers in the Analysis of Speech and Voice. Edinburgh: Edinburgh University Press. pp. 235-264

MILLAR, J.B.- HAWKINS, S.R. (1990) “Selecting representative speakers” Proceedings of the Tutorial and Research Workshop on Speaker Characterization in Speech Technology. Edinburgh, 26-28 June. Edinburgh: Center for Speech Technology Research.pp.161-166

ROBINSON, W.P. (1979) “Speech markers and social class”, in SCHERER, K.R. - GILES, H. (Eds) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 211-250

SACHS, J.- LIEBERMAN, P.- ERIKSON, D. (1973) “Anatomical and cultural determinants of male and female speech” in R. SHUY - R. FASOLD (Eds) Language Attitudes: Current Trends and Prospects. Washington: Georgetown University Press.pp. 74-84.

SCHERER, K. R. (1979) “Personality markers in speech”, in SCHERER, K.R. - GILES, H. (Eds) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 147-210

SMITH, P.M. (1979) “Sex markers in speech”, in SCHERER, K.R. - GILES, H. (Eds) Social Markers in Speech. Cambridge- Paris: Cambridge University Press - Editions de la Maisons des Sciences de l'Homme. pp. 109-146

2.4. Características de la adquisición

Entorno de adquisición

Procedimiento de recogida de datos

Referencias
GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Reference Materials. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume IV).

RIBEIRO, C.- TRANCOSO, I. - SERRALHEIRO, A. (1993) “A software tool for Speech Collection, Recognition and Reproduction” in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 1 pp. 179-182

UCL (1992) “Speech acquisition and Annotation Protocols and Index of Mnemonics (SAM-UCL-018)” in SAM User Guide to ETR Tools. ESPRIT PROJECT 2589 (SAM) Multilingual Speech Input/Output Assessment, Methodology and Standardisation. Ref, SAM-UCL-G007.

ZANTEN, E. van- DAMEN, L.W.M. - HOUTEN, E. van “Collecting data for a speech database”, in HEUVEN, V.J. van - POLS, L.C.W. (Eds) Analysis and synthesis of speech. Strategic research towards high quality text-to-speech generation. Berlin: Mouton de Gruyter (Speech Research Series)

ZEILIGER, J.- SERIGNAT, J.F. (1991) “Europec software V.4.1 User's Guide (SAM-ICP-045)” in SAM User Guide to ETR Tools .ESPRIT PROJECT 2589 (SAM) Multilingual Speech Input/Output Assessment, Methodology and Standardisation. Ref, SAM-UCL-G007, 1992

Elicitación de datos

ANDERSON, A.H. - BADER, M.- BARD, E.G.- BOYLE, E.- DOHERTY, G.- GARROD, S.- ISARD, S.- KOWTKO, J.- McALLISTER, J.- MILLER, J.- SOTILLO, C.- THOMPSON, H.S.- WEINERT, R. (1991) “The HCRC Map Task corpus”, Language and Speech 34,4: 351-366

Map Task Corpus
http://groups.inf.ed.ac.uk/maptask/

FRASER, N.- GILBERT, G.N. (1991) “Simulating speech systems”, Computer Speech and Language 5,1: 81-99

PÉAN, V.- WILLIAMS, S.- ESKÉNAZI, M. (1993) “The Design and Recording of ICY, a Corpus for the Study of Intraspeaker Variability” in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 1 pp. 627-630

SWERTS, M.- COLLIER, R. (1992) “On the controlled ellicitation of spontaneous speech”, Speech Communication 11, 4-5: 463-468

2.5. Características de la representación

Tipos de representación

Transcripción

Etiquetado y alineación

Referencias
GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Systems and Corpus Design. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume I).

LLISTERRI, J. (1997) Transcripción, etiquetado y codificación de corpus orales. Fundación Duques de Soria, Seminario de Industrias de la Lengua, 15 de julio de 1997. Publicación electrónica en
http://liceu.uab.cat/~joaquim/publicacions/FDS97.html

Representación fonética

HIERONYMUS, J.L. (1994) ASCII phonetic symbols for the world's languages: Worldbet. AT&T Bell Laboratories, Technical Memo. Publicación electrónica en
http://www.ling.ohio-state.edu/~edwards/WorldBet/worldbet.pdf

WELLS, J.C. (1989) “Computer-coded phonemic notation of individual languages of the European Community”, Journal of the International Phonetic Association 19,1: 31-54

WELLS, J.C. (1994) "Computer-coding the IPA: a proposed extension of SAMPA", Speech, Hearing and Language, Work in Progress, 1994 (University College London, Department of Phonetics and Linguistics) 8: 271-289. Publicación electrónica en
http://www.phon.ucl.ac.uk/home/sampa/x-sampa.htm

WELLS, J.C. (1995) SAMPA Computer Readable Phonetic Alphabet. Publicación electrónica en
http://www.phon.ucl.ac.uk/home/sampa/home.htm

WELLS, J.C. (1995) SAMPROSA (SAM Prosodic Transcription). Publicación electrónica en
http://www.phon.ucl.ac.uk/home/sampa/samprosa.htm

Etiquetado

AUTESSERRE, D.- PÉRENNOU, G.- ROSSI, M. (1989) “Methodology for the transcription and labeling of a speech corpus”, Journal of the International Phonetic Association 19,1: 2-15

BARRY, W.J.- FOURCIN, A.J. (1992) “Levels of Labelling”, Computer Speech and Language 6: 1-14

MARCHAL, A.- NGUYEN, N.- HARDCASTLE, W. (1995) “Multitiered phonetic approach to speech labelling”, in SORIN, C.- MARIANI, J.- MELONI, H.- SCHOENTGEN, J. (Eds.) Levels in Speech Communication. Relations and Interactions. A Tribute to Max Wajskop / Hommage à Max Wajskop. Amsterdam: Elsevier Science B.V. pp. 149-158

ROACH, P.- ROACH, H.- DEW, A.- ROWLANDS, P. (1990) “Phonetic analysis and the automatic segmentation and labeling of speech sounds”, Journal of the International Phonetic Association 20,1: 15-21

TILLMANN, H.G.- POMPINO-MARSCHALL, B. (1993) “Theoretical Principles Concerning Segmentation, Labelling Strategies and Levels of Categorical Annotation for Spoken Language Database Systems” in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 3 pp. 1691-1694

VORSTERMANS, A.- MARTENS, J.-P.- VAN COILE, B. (1996) “Automatic segmentation and labelling of multilingual speech data”, Speech Communication 19,4: 271-294. Guías de transcripción y etiquetado BECKMAN, M.E. - AYERS, G.M. (1994) Guidelines for ToBI Labelling. Version 2.0, February 1994. Publicación electrónica en
http://www.ling.ohio-state.edu/~tobi/

KEATING, P.- MacEACHERN, P.- SHRYOCK, A.- DOMINGUEZ, S. (1994) “A manual for phonetic transcription: Segmentation and labelling of words in spontaneous speech”, UCLA Working Papers in Phonetics 88: 91-120.

KROT, C.- TAYLOR, B. (1995) Criteria for Acoustic-Phonetic Segmentation and Word Labelling in the Australian National Database of Spoken Language. Publicación electrónica en
http://andosl.anu.edu.au/andosl/general_info/aue_criteria.html

LANDER, T. (1997) The CSLU Labeling Guide. Center for Spoken Language Understanding, Oregon Graduate Institute.

3. Proyectos desarrollados en España

Fuentes de información

INSTITUTO CERVANTES. (1996) Informe sobre recursos lingüísticos para el español (II): Corpus escritos y orales disponibles y en desarrollo en España aAlcalá de Henares: Observatorio Español de Industrias de la lengua, Instituto Cervantes.

LLISTERRI, J.- GARRIDO ALMIÑANA, J.M. (1998) "La ingeniería lingüística en España", in El español en el mundo. Anuario del Instituto Cervantes. 1988. Madrid: Instituto Cervantes - Arco/Libros SL., 1998. pp. 299-391. Publicación electrónica en
http://cvc.cervantes.es/lengua/anuario/anuario_98/llisterri/p01.htm

SEPLN-OEIL (1997) Grupos de investigación en procesamiento del lenguaje y del habla en España, 1997. Sociedad Española para el Procesamiento del Lenguaje Natural - Observatorio Español de Industrias de la Lengua, Instituto Cervantes.

3.1. Corpus nacionales coordinados

Albayzín, Base de datos para el reconocimiento del habla en español

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Departamento de Señales, Sistemas y Radiocomunicaciones, Escuela Técnica Superior de Ingenieros de Telecomunicación, Universidad Politécnica de Madrid
http://www.ssr.upm.es/

GPySC, Grupo de Investigación en Procesamiento de Señales y Comunicaciones, Departamento de Electrónica y Tecnología de Computadores, Facultad de Ciencias, Universidad de Granada
http://ceres.ugr.es

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

GTH, Grupo de Tecnología del Habla, Departamento de Ingeniería Electrónica, Escuela Técnica Superior de Ingenieros de Telecomunicación, Universidad Politécnica de Madrid
http://www-gth.die.upm.es

RFIA, Grupo de Reconocimiento de Formas e Inteligencia Artificial, Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia
https://prhlt.iti.upv.es

Referencias
CASACUBERTA, F. (1991) “Albayzin Project: The Task Dependent Speech Data Base”, in CASTAGNERI, G. (Ed) Proceedings of the Workshop on International Cooperation and Standardization of Speech Databases and Speech i/O Assessment Methods. Chiavari 26-28 September 1991 (Italy).

CASACUBERTA, F.- GARCIA, R.- LLISTERRI, J.- NADEU, C.- PARDO, J.M.- RUBIO, A. (1991) “Development of Spanish Corpora for Speech Research (Albayzin)”, in CASTAGNERI, G. (Ed) Proceedings of the Workshop on International Cooperation and Standardization of Speech Databases and Speech i/O Assessment Methods. Chiavari 26-28 September 1991 (Italy).

CASACUBERTA, F.- GARCÍA, R.- LLISTERRI, J.- NADEU, C.- PARDO, J.M.- RUBIO, A. (1992) “Desarrollo de corpus para investigación en tecnologías del habla (Albayzín)”, Procesamiento del Lenguaje Natural ,Boletín 12: 35-42

DÍAZ, J.- RUBIO, A.- PEINADO, A.- SEGARRA, E.- PRIETO, N.- CASACUBERTA, F. (1993) “Development of task-oriented Spanish speech corpora” in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993.

DÍAZ, J.E.- PEINADO, A.M.- RUBIO, A.J.- SEGARRA, E.- PRIETO, N.- CASACUBERTA, F. (1998) “Albayzín: a task-oriented Spanish speech corpus”, in Proceedings of the First International Conference on Language Resources and Evaluation. May 28 - 30, 1998, Granada, Spain.

LLISTERRI, J.- POCH, D. (1991) “Phonetic criteria for the development of a speech database in Spanish (the Albayzin project)”, in CASTAGNERI, G. (Ed) Proceedings of the Workshop on International Cooperation and Standardization of Speech Databases and Speech i/O Assessment Methods. Chiavari 26-28 September 1991 (Italy).

MORENO, A.- POCH, D.- BONAFONTE, A.- LLEIDA, E.- LLISTERRI, J.- MARIÑO, J.B.- NADEU, C. (1993) “ALBAYZIN Speech Database: Design of the Phonetic Corpus” in Eurospeech'93. 3rd European Conference on Speech Communication and Technology. Berlin, Germany, 21-23 September 1993. Vol. 1 pp. 175-178

NADEU, C. (1991) “Development of Spanish Databases for Speech Recognition”, in CASTAGNERI, G. (Ed) Proceedings of the Workshop on International Cooperation and Standardization of Speech Databases and Speech i/O Assessment Methods. Chiavari 26-28 September 1991 (Italy).

3.2. Corpus enmarcados en proyectos europeos

EUROM

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

EUROM_1

http://www.phon.ucl.ac.uk/shop/eurom1.php

Referencias
CHAN, D.- FOURCIN, A.- GIBBON, D.- GRANSTRÖM, B.- HUCKVALE, M.- KOKKINAKIS, G.- KVALE, K.- LAMEL, L.- LINDBERG, B.- MORENO, A.- MOUROPOULOS, J.- SENIA, F.- TRANCOSO, I.- VELD, C.- ZEILIGER, J. (1995) “EUROM- A Spoken Language Resource for the EU”, in Eurospeech'95. Proceedings of the 4th European Conference on Speech Communication and Speech Technology. Madrid, Spain, 18-21 September, 1995. Vol 1, pp. 867-870.

GIBBON, D. - MOORE, R.- WINSKI, R. (Eds.) (1998) Spoken Language Reference Materials. Berlin: Mouton De Gruyter. (Handbook of Standards and Resources for Spoken Language Systems, Volume IV).

EUROM 1 Spanish

http://gps-tsc.upc.es/veu/LR/LR_EuromI.php3

Referencias
LLISTERRI, J.- AGUILAR, L.- BLECUA, B.- MACHUCA, M.J.- DE LA MOTA, C.- RÍOS, A.- MORENO, A.- SALAVEDRA, J. (1993) Spanish EUROM 1: Phonetic Contents. Report D6 Appendix X. SAM-A/UPC/002. ESPRIT PROJECT 6819 (SAM-A) Speech Technology Assessment in Multilingual Applications.

MARIÑO, J.B. - LLISTERRI, J. (1993) Spanish adaptation of SAMPA and automatic phonetic transcription. SAM-A/UPC/001/v1 20th April 1993. ESPRIT PROJECT 6819 (SAM-A Speech Technology Assessment in Multilingual Applications).

MORENO, A. (1993) EUROM-1 Spanish Database. Report D6, SAM-A/UPC/003. September 1993

SpeechDat

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

SPEECHDAT, Spoken Language Resources

http://www.speechdat.org/

SPEECHDAT II, Speech Databases for the Creation of Voice Driven Teleservices

http://www.speechdat.org/SpeechDat.html

SpeechDat-Car, Speech Databases for Voice Driven Teleservices and Control in Automotive Environments

http://www.speechdat.org/SP-CAR/

Referencias
DRAXLER, C.- van den HEUVEL, H.- TROPF, H.S. (1998) “SpeechDat Experiences in creating Large Multilingual Speech Databases for Teleservices”, in Proceedings of the First International Conference on Language Resources and Evaluation. May 28 - 30, 1998, Granada, Spain.

WINSKI, R.- SENIA, F.- CONNER, P.- HÄe&Szlig;-ÜMBACH, R.- CONSTANTINESCU, A.- NIEDERMAIR, G.- MORENO, A.- TRANCOSO, I. (1996) Specification of Telephone Speech Data Collection. LRE-63314 SPEECHDAT, Deliverable D1.4.1. Publicación electrónica en
http://www.speechdat.org/speechdt/speechdat_m/deliverables/D141.pdf

The Sala Project - SpeechDat Across Latin America

http://gps-tsc.upc.es/veu/sala2/

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Telefónica I+D, Madrid

Referencias
MORENO, A.- HÖGE, H.- KÖLER, J. - MARIÑO, J.B. (1998) “SpeechDat Across Latin America”, in Proceedings of the First International Conference on Language Resources and Evaluation . May 28 - 30, 1998, Granada, Spain.

ONOMASTICA, Multilanguage Pronunciation Dictionary of Proper Names

GTH, Grupo de Tecnología del Habla, Departamento de Ingeniería Electrónica, Escuela Técnica Superior de Ingenieros de Telecomunicación, Universidad Politécnica de Madrid
http://www-gth.die.upm.es

ONOMASTICA, Multilanguage Pronunciation Dictionary of Proper Names

http://cordis.europa.eu/search/index.cfm?fuseaction=proj.document&PJ_RCN=337683&CFTOKEN=84426795&CFID=893263

Referencias
TRANCOSO, I. (1995) “The ONOMASTICA Interlanguage Pronunciation Lexicon”, in Eurospeech'95. Proceedings of the 4th European Conference on Speech Communication and Technology. Madrid, Spain, 18-21 September, 1995. Vol 1, pp. 829-832.

ROARS,Robust Analytical Speech Recognition System

RFIA, Grupo de Reconocimiento de Formas e Inteligencia Artificial, Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia
https://prhlt.iti.upv.es

ENA Telecomunicaciones

ROARS, Robust Analytical Speech Recognition System

http://www.sepln.org/revistaSEPLN/revista/10/10-7.pdf

ACCOR, Articulatory-Acoustic Correlations in Coarticulatory Processes - A Cross-Linguistic Investigation

RFIA, Grupo de Reconocimiento de Formas e Inteligencia Artificial, Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia
https://prhlt.iti.upv.es

Laboratori de Fonètica Institut d'Estudis Catalans
http://www.iec.cat/coneixement/entrada_c.asp?c_epigraf_num=155

ACCOR, Articulatory-Acoustic Correlations in Coarticulatory Processes - A Cross-Linguistic Investigation

http://www.cstr.ed.ac.uk/research/projects/artic/accor.html

Referencias
MARCHAL, A.- HARDCASTLE, W.- HOOLE, P. - FARNETANI, E.- NI CHASAIDE, A.- SCHMIDBAUER, O.- GALIANO-RONDA, I.- ENGSTRAND, O. - RECASENS, D. (EUR-ACCOR) (1991) “The design of a multichannel database”, in Actes du XIIème Congrès International des Sciences Phonétiques. 19-24 août 1991, Aix-en-Provence, France. Aix-en-Provence: Université de Provence, Service des Publications. Vol 5, pp. 422-425

MARCHAL, A.- HARDCASTLE, W.J. (1993) “ACCOR: Instrumentation and database for the cross-language study of coarticulation”, Language and Speech 36: 137-153

SCHMIDBAUER, O.- CASACUBERTA, F.- CASTRO, M.J.- HEGERL, G.- HÜGE, H.- SÁNCHEZ, J.A.- ZOLKARNIK, I. (1993) “Articulatory Representation and Speech Technology”, Language and Speech 36, 2,3: 331-351.

MULTEXT, Multilingual Text Tools and Corpora

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

MULTEXT, Multilingual Text Tools and Corpora

http://aune.lpl.univ-aix.fr/projects/multext/index.html

Referencias
HIRST, D.J.- IDE, N. - VÉRONIS, J. (1994) “Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project”, in Conference Proceedings of the Second ESCA/IEEE Workshop on Speech Synthesis. September 12-15, 1994. Mohonk Mountain House, New Paltz, New York, USA. pp. 77-80

LLISTERRI, J. (Ed.) (1996) Prosody Tools Efficiency and Failures. WP 4 Corpus. T4.6 Speech Markup and Validation. Deliverable 4.5.2. Final version. 15 October 1996. LRE Project 62-050 MULTEXT.

MATE, Multilevel Annotation, Tools Engineering

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

Telefónica I+D, Madrid

MATE, Multilevel Annotation, Tools Engineering

http://xml.coverpages.org/mate.html

2.3. Corpus desarrollados por empresas

Telefónica I+D, Madrid

CEUDEX, Corpus en español para entrenamiento de unidades dependientes del contexto

Referencias
DE LA TORRE MUNILLA, C.- HERNÁNDEZ-GÓMEZ, L.A.- TAPIAS, D. (1995) “CEUDEX: a Data Base Oriented to Context-Dependent Units Training in Spanish for Continuous Speech Recognition”, in Eurospeech'95. Proceedings of the 4th European Conference on Speech Communication and Technology. Madrid, Spain, 18-21 September, 1995. Vol 1, pp. 845-848.

SPATIS, Spanish Air Travel Information System

VESTEL, Voz en español por línea telefónica

Referencias
ESTEVE PRADERA, J.- TAPIAS MERINO, D.- TORRECILLA MERCHÁN, J.C. (1994) “La base de datos VESTEL”, Comunicaciones de Telefónica I+D , 5, 2: 44-54

TAPIAS, D.- ACERO, A.- ESTEVE, J.- TORRECILLA, C. (1993) “Dona tu voz a la ciencia”, Factores Humanos de Telefónica I+D 3 (diciembre)

TAPIAS, A.- ACERO, A.- ESTEVE, J. - TORRECILLA, J.C. (1994) “The VESTEL Telephone Speech Database”, in ICSLP'94. Proceedings of the International Conference on Spoken Language Processing 1994. pp. 1811-1814

VOCATEL y VOGATEL

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Grupo de Teoría de la Señal, Departamento de Tecnologías de las Comunicaciones, Universidade de Vigo
http://www.gts.tsc.uvigo.es/

Referencias
ESQUERRA, I.- NADEU, C.- VILLARRUBIA, L. (1998) “Design of a phonetic corpus for speech recognition in Catalan”, in Workshop on Language Resources for European Minority Languages , May 27 1998, Granada, Spain.

VILLARRUBIA, L.- LEÓN, P.- HERNÁNDEZ, L.- NADEU, C,- ESQUERRA, I.- HERNANDO, J.- GARCÍA MATEO, C.- DOCIO, L. (1998) “VOCATEL and VOGATEL: Two Telephone Speech Databases of Spanish Minority Languages (Catalan and Galician)”, Workshop on Language Resources for European Minority Languages , May 27 1998, Granada, Spain.

IBM España

http://www.ibm.es/

TANGORA, Sistema de dictado automático en español

IBM VoiceType / ViaVoice Index España

http://www-01.ibm.com/software/pervasive/viavoice.html

3.4. Corpus desarrollados por grupos de investigación

GPySC, Grupo de Investigación en Procesamiento de Señales y Comunicaciones, Departamento de Electrónica y Tecnología de Computadores, Facultad de Ciencias, Universidad de Granada

http://ceres.ugr.es

Albayzín, Base de datos para el reconocimiento del habla en español

Corpus para el desarrollo de sistemas de diálogo

Referencias
LÓPEZ CÓZAR R. - RUBIO, A.J.- GARCÍA, P.- SEGURA, J.C. (1998) “A Spoken Dialogue System based on Dialogue Corpus Analysis”, in Proceedings of the First International Conference on Language Resources and Evaluation. May 28 - 30, 1998, Granada, Spain.

Interfaces multimodales en comunicación hombre-máquina

Proyecto financiado por la Comisión Interministerial de Ciencia y Tecnología, 1996.

GRAH-MEAT, Grupo de Reconocimiento del Habla, Departamento de Electricidad y Electrónica, Universidad del País Vasco

http://grah.ehu.es/

Base de datos oral en vasco

Referencias
LÓPEZ DE IPIÑA, K.- TORRES, I.- OÑEDERRA, L. (1995) “Design of a Phonetic Corpus for a Speech Database in Basque Language”, in Eurospeech'95. Proceedings of the 4th European Conference on Speech Communication and Technology. Madrid, Spain, 18-21 September, 1995. Vol 1, pp. 851-854.

LÓPEZ DE IPIÑA, K.- TORRES, I.- OÑEDERRA, L. (1998) “A speech database in Basque language”, Workshop on Language Resources for European Minority Languages , May 27 1998, Granada, Spain.

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona

http://liceu.uab.cat

Albayzín, Base de datos para el reconocimiento del habla en español

EUROM

SPEECHDAT, Spoken Language Resources

MULTEXT, Multilingual Text Tools and Corpora

MATE, Multilevel Annotation, Tools Engineering

CREL, Centre de Referència en Enginyeria Lingüística, Generalitat de Catalunya

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya

http://gps-tsc.upc.es/veu/

Albayzín, Base de datos para el reconocimiento del habla en español

EUROM

SPEECHDAT, Spoken Language Resources

SPEECHDAT II, Speech Databases for the Creation of Voice Driven Teleservices

SpeechDat-CAR, Speech Databases for Voice Driven Teleservices and Control in Automotive Environments

The Sala Project - SpeechDat Across Latin America

Vocatel

Número

Telémaco

CREL, Centre de Referència en Enginyeria Lingüística, Generalitat de Catalunya

Referencias
ESQUERRA, I.- BONAFONTE, A.- VALLVERDÚ, F.- FEBRER, A. (1998) “A bilingual Spanish-Catalan database of units for concatenative synthesis”, Workshop on Language Resources for European Minority Languages , May 27 1998, Granada, Spain.

Grupo de Teoría de la Señal, Departamento de Tecnologías de las Comunicaciones, Universidade de Vigo

http://www.gts.tsc.uvigo.es/

Vogatel

Referencias
GARCÍA MATEO, C.- GONZÁLEZ GONZÁLEZ, M. (1998) “An overview of the existing language resources for ‘Gallego’”, in Workshop on Language Resources for European Minority Languages , May 27 1998, Granada, Spain.

GTH, Grupo de Tecnología del Habla, Departamento de Ingeniería Electrónica, Escuela Técnica Superior de Ingenieros de Telecomunicación, Universidad Politécnica de Madrid

http://www-gth.die.upm.es

Albayzín, Base de datos para el reconocimiento del habla en español

ONOMASTICA, Multilanguage Pronunciation Dictionary of Proper Names

Ahumada, Corpus para el reconocimiento de locutor

Referencias
ORTEGA GARCÍA, J.- GONZÁLEZ RODRÍGUEZ, J.- MARRERO AGUIAR, V.- DÍAZ GÓMEZ, .J.- GARCÍA JIMÉNEZ, R.- LUCENA MOLINA, J.- SÁNCHEZ MOLERO, J.A.G. (1998) “Speaker recognition-oriented 'Ahumada' large speech corpus”, inProceedings of the First International Conference on Language Resources and Evaluation. May 28 - 30, 1998, Granada, Spain.

RFIA, Grupo de Reconocimiento de Formas e Inteligencia Artificial, Departamento de Sistemas Informáticos y Computación, Facultad de Informática, Universidad Politécnica de Valencia

https://prhlt.iti.upv.es

Albayzín, Base de datos para el reconocimiento del habla en español

ACCOR, Articulatory-Acoustic Correlations in Coarticulatory Processes - a Cross-Linguistic Investigation

ROARS, Robust Analytical Speech Recognition System

Construcción de un sistema de reconocimiento de habla mediante técnicas de aprendizaje automático - corpus de frases

Reconocimiento automático del habla - Corpus de dígitos

Reconocimiento automático del habla - Corpus de letras

CREL, Centre de Referència en Enginyeria Lingüística, Generalitat de Catalunya

Grup de Processament de la Veu, Departament de Teoria del Senyal i Comunicacions, Escola Tècnica Superior d'Enginyers de Telecomunicació, Universitat Politènica de Catalunya
http://gps-tsc.upc.es/veu/

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona
http://liceu.uab.cat

Corpus SpeechDat en catalán

Corpus para la extracción de unidades de síntesis en catalán

Corpus prosódico para la conversión de texto a habla en catalán

Corpus de diálogo para el diseño de un sistema de diálogo en catalán


Corpus orales para la fonética y las tecnologías del habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim/language_resources/FDS98/Guion_Bib_FDS_98.html
Last updated: 16/07/98

Creative Commons License
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.