O catalán nas industrias da lingua

Joaquim Llisterri

UAB

Grup de Fonètica
Seminari de Filologia i Informàtica
Departament de Filologia Espanyola
Universitat Autònoma de Barcelona
Edifici B, 08193 Bellaterra, Barcelona
Joaquim.Llisterri@uab.es
http://liceu.uab.cat/~joaquim

Universidad de Vigo

Lingua e cultura catalanas
Cursos de extensión universitaria
Universidade de Vigo

5-7 de xullo de 2000Indústries de la llengua i enginyeria lingüística

Enginyeria lingüística

"Aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar el lenguaje humano en todas sus formas"

Ingeniería lingüística. Cómo aprovechar la fuerza del lenguaje. Luxembourg: Anite Systems. Versión española: Observatorio Español de Industrias de la Lengua, Instituto Cervantes.
http://www.hltcentral.org/le/es/broch/harness.html

Indústries de la llengua

"Abarca una serie de actividades comerciales en las que el tratamiento del lenguaje, por personas, por máquinas o por una combinación de unas y otras, forma una parte fundamental del producto o servicio"

Lenguaje y tecnología. De la torre de Babel a la aldea global. Luxemburgo: Oficina de Publicaciones Oficiales de las Comunidades Europeas, 1997.
principi

Enginyeria lingüística: els recursos

Corpus textuals

CTILC, Corpus Textual Informatitzat de la Llengua Catalana

Oficines Lexicogràfiques, Secció Filològica, Institut d’Estudis Catalans
http://www.iec.es/cat/recerca/programes/Filologica/dcccat.htm

Lligat al desenvolupament del Diccionari del Català Contemporani (DCC)

3.339 textos entre 1832 i 1998
52,3 milions de mots (1998)
56% llengua no literària
44% llengua literària

Corpus lematitzat i amb etiquetat morfosintàctic dels lemes

Diccionari de freqüències

RAFEL i FONTANALS, J. (Dir.) (1996) Diccionari de freqüències. Volum 1: Llengua no literària. Barcelona: Institut d’Estudis Catalans.

RAFEL i FONTANALS, J. (Dir.) (1998) Diccionari de freqüències. Volum 2: Llengua literària. Barcelona: Institut d’Estudis Catalans.

RAFEL i FONTANALS, J. (Dir.) (1998) Diccionari de freqüències. Volum 3: Dades globals. Barcelona: Institut d’Estudis Catalans. CD-ROM de l’obra completa.

RAFEL, J. (1996) "El Diccionari del català contemporani i el Corpus textual informatitzat de la llengua catalana", in PAYRATÓ, Ll.- BOIX, E.- LLORET, M.-R.- LORENTE, M. (Eds.) Corpus, Corpora. Actes del 1er i 2on Col·loquis Lingüístics de la Universitat de Barcelona (CLUB-1, CLUB-2). Barcelona: Promociones y Publicaciones Universitarias SA. pp. 71-92.

RAFEL, J. (1992-93) "El ’Diccionari del català contemporani’: Treballs realitzats i previsions de futur", Llengua i Literatura 5: 733-737.

SOLER i BOU, J. (1998) Los corpus textuales en lengua catalana. Curso de Industrias de la Lengua "Proyectos actuales en procesamiento de lenguaje natural", Fundación Duques de Soria, Soria, 13-17 de julio de 1998.

PAROLE, Corpus català

Oficines Lexicogràfiques, Secció Filològica, Institut d’Estudis Catalans
http://www.iec.es/cat/recerca/programes/Filologica/dcccat.htm
http://www.HLTCentral.org/hlt/projects/parole/summary.asp

PAROLE

Desenvolupat en el marc del projecte LE-PAROLE (LE-4017) (1996-1998)

21,11 milions de paraules
20% extret de llibres
67,5% extret de diaris
5% extret de publicacions periòdiques
7,5% miscel·lània

Codificat segons el CES (Corpus Encoding Standard) dels projectes MULTEXT i EAGLES

Anotació morfosintàctica de cada ocurrència

Adaptació al català de les etiquetes definides en el projecte EAGLES per a categories i subcategories morfosintàctiques

SOLER i BOU, J. (1998) Los corpus textuales en lengua catalana. Curso de Industrias de la Lengua "Proyectos actuales en procesamiento de lenguaje natural", Fundación Duques de Soria, Soria, 13-17 de julio de 1998.

CECA, Corpus escrit de català actual

Secció de Lingüística, Departament de Filologia Catalana, Universitat de Barcelona
http://www.ub.es/filling/cub.htm

Textos corresponents a 120 dies consecutius del diari Avui, entre febrer i juny de 1993

7.000.000 de formes (1996)

Marques de pàgina, secció, tipogràfiques i altres delimitadors

Versió etiquetada sense desambiguar i versió parcialment desambiguada

CABRÉ, M.T.- DE YZAGUIRRE, Ll.- LORENTE, M. (1996) "El projecte CECA (Corpus escrit del català)", in PAYRATÓ, Ll.- BOIX, E.- LLORET, M.-R.- LORENTE, M. (Eds.) Corpus, Corpora. Actes del 1er i 2on Col·loquis Lingüístics de la Universitat de Barcelona (CLUB-1, CLUB-2). Barcelona: Promociones y Publicaciones Universitarias SA. pp. 115-126.

Corpus textual plurilingüe especialitzat

Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
http://www.iula.upf.edu/corpus/corpus.htm

Textos en català, castellà, francès, anglès i alemany

Especialitzat en les àrees de dret, economia, informàtica, medi ambient i medicina

1.400.000 paraules en català (maig del 97)

Marcat en SGML, lematitzat, desambiguat i amb etiquetat morfològic

IULA

Text original amb marcatge estructural
http://www.iula.upf.edu/corpus/D154CatOrig.html

IULA

Text etiquetat morfològicament
http://www.iula.upf.edu/corpus/D154CatAna.html

IULA

Text etiquetat morfològicament i desambiguat
http://www.iula.upf.edu/corpus/D154CatDeS.html

IULA

Exemple d’etiquetes morfosintàctiques
http://www.iula.upf.edu/corpus/etqfrmca.htm

BACH, C.- SAURÍ, R.- VIVALDI, J.- CABRÉ, M.T. (1997) El corpus de l’IULA: descripció. Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra (Papers de l’IULA, Sèrie Informes, 17).

MOREL, J.- TORNER, S.- VIVALDI, J.- CABRÉ, M.T. (1997) El corpus de l’IULA: Etiquetari. Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra (Papers de l’IULA, Sèrie Informes, 18).

VIVALDI, J.- de YZAGUIRRE, Ll.- SOLÉ, X. (1996) Marcatge estructural i morfosintàctic del corpus tècnic amb l’estàndard SGML. Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra (Papers de l’IULA, Sèrie Informes, 1).

http://www.iula.upf.edu/corpus/corpubca.htm

Corpus per a l’estudi de la llengua oral

COCA, Corpus oral del català actual

Secció de Lingüística, Departament de Filologia Catalana, Universitat de Barcelona
http://lincat.ub.es/bdlincat/

UB

COD, Corpus oral de variació geogràfica

http://lincat.ub.es/bdlincat/Geograf.htm

Qüestionaris lingüístics

Elicitació de textos lliures d’un mínim de cinc minuts de durada

Sectors de classe mitjana de totes les capitals de comarca

Tres franges d’edat: 15-19, 30-45 i 55-70

490 enquestes dialectològiques

Bases de dades amb informació sobre

Transcripció ortogràfica i fonètica de:

Marcatge morfològic

Transcripció ortogràfica

Transcripció ortogràfica
http://lincat.ub.es/bdlincat/Textual.htm

Transcripció fonètica

Transcripció fonètica
http://lincat.ub.es/bdlincat/Textual.htm

COR, Corpus oral de registres

Mostres de llengua oral representatives de diversos gèneres característics de l’entorn social de l’àrea metropolitana de Barcelona

Enregistrament de 50 converses i 30 textos de registres diferents

Transcripció ortogràfica i amb marques discursives revisada i corregida de 12 de les converses enregistrades que pertanyen a diversos registres lingüístics

COC, Corpus oral de conversa

http://lincat.ub.es/bdlincat/funcio.htm

50 mostres de conversa col·loquial

30 minuts per conversa

Marcat dels grups tonals en 55 hores del corpus de registres i conversa

COP, Corpus oral de publicitat

443 anuncis publicitaris
20 de ràdio
423 de televisió
151 anuncis transliterats

CIO, Corpus d’informatius orals

240 minuts de programes informatius de ràdio

Etiquetat i lematitzat de 90 minuts del corpus

COS, Corpus oral de variació social

http://lincat.ub.es/bdlincat/Social.htm

Estudi de la variació social del català de l’àrea metropolitana de Barcelona

78 entrevistes semidirigides de final obert (història de vida)

20 interaccions, d’una durada aproximada d’entre 30 i 45 minuts

Transcripció ortogràfica i amb marques discursives revisada i corregida

Correcció, sincronització i marcatge de grups tonals de 310 hores d’enregistrament

BOIX, E. (1996) "Els materials de llengua oral dels corpus de català contemporani de la UB (CUB)", in PAYRATÓ, Ll.- BOIX, E.- LLORET, M.-R.- LORENTE, M. (Eds.) Corpus, Corpora. Actes del 1er i 2on Col·loquis Lingüístics de la Universitat de Barcelona (CLUB-1, CLUB-2). Barcelona: Promociones y Publicaciones Universitarias SA. pp. 93-114.

VIAPLANA, J. (2000) Corpus oral de variació, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://www.crel.net/Jornades/UB/cvo.zip

Corpus orals per al desenvolupament d’aplicacions en tecnologies de la parla

Corpus prosòdic del CREL

Grup de Fonètica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Orientat a la recerca bàsica i al desenvolupament de sistemes de conversió de text a parla

Lectura de 114 textos

2 locutors masculins de nivell cultural alt

Dissenyat en funció de variables prosòdiques

Anotació de 2.000 grups fònics (50.000 segments) per a cada locutor per a l’estudi de la durada

Anotació de 100 textos (5.000 grups fònics) per a cada locutor per a l’estudi de les pauses

Anotació de límits i de tons en 1200 grups d’entonació per a cada locutor

RIERA, M.- JIMÉNEZ, E. (2000) Corpus prosòdic, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://liceu.uab.cat/publicacions/SFI_UAB_Corpus_Prosodic.pdf

GARRIDO, J.M.- RÍOS, A.- JIMÉNEZ, E.- LLISTERRI, J. (2000) Models prosòdics per a la conversió de text a parla, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://liceu.uab.cat/publicacions/SFI_UAB_Models_prosodics.pdf

Corpus SpeechDat

Grup de Tractament de la Parla, Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya

Base de dades oral per al desenvolupament de sistemes de tecnologies de la parla en català a través de telèfon

Especificacions del projecte europeu SpeechDat II

Equivalent a les existents per a d’altres llengües europees

Els fitxers de veu s’acompanyen amb un fitxer amb la transcripció de l’enregistrament

Enregistrament de 1000 parlants

80% de parlants de la varietat oriental
50% de parlants entre 16 i 30 anys
95% de trucades telefòniques des de casa o de la feina

40 texts per locutor, des de dígits aïllats fins a frases

3 comandes d’aplicació
Seqüència de 10 dígits
Número de formulari
Número de telèfon
Número de targeta de crèdit
Codi PIN
Data espontània
Data dictada
Data relativa
Frase amb comandes
Dígit aïllat
Lletreig del cognom
Lletreig de ciutat
Lletreig artificial
Quantitat monetària
Nombre natural
Cognom
Ciutat del locutor
Ciutat
Nom d’una empresa
Nom + cognom
Pregunta per obtenir "sí"
Pregunta per obtenir "no"
9 frases fonèticament riques
Hora de la trucada
Frase horària
4 paraules fonèticament riques

Frases fonèticament riques

Recordo que fa un parell d’anys vam tenir un hivern glaçat.
Has de fer més esport, no pot ser que tinguis un bleix així de dèbil.
Va fer un dibuix tan real que li van donar un premi.
Omples la gerra d’aigua i ningú t’ho agraeix.
Aquelles flors són d’un color groc especial.
Ja fa força temps que pertany a un gremi de pintors.
El metge m’ha dit que el mal de coll que tinc és d’un gangli inflat.

Frases fonèticament riques

R@-k’OR-Du k@ f’a ’um p@-r’EL D’aJz B’am t@-n’i ’un i-B’ERN gl@-s’at.
’az D@ f’eR m’ez @s-p’oRt, n’o p’Ot s’eR k@ t’iN-giz ’um bl’eS @-s’i D@ D’E-Bil.
b’a f’eR ’un di-B’uS t’an Re-’al k@ li B’an du-n’a ’um pr’E-mi. ’om-pl@z l@ Z’e-R@ D’aj-Gw@ i niN-g’u t’o @-Gr@-’eS.
@-k’E-L@s fl’ORs s’on d’uN ku-l’o Gr’Ok @s-p@-si-’al.
Z’a f’a f’OR-s@ t’ems k@ p@R-t’aJ @ ’uN gr’E-mi D@ pin-t’os.
@l m’e-dZ@ m’a D’it k@ @l m’al d@ k’oL k@ t’iNk ’ez D’uN g’aN-gli im-fl’at.

ESQUERRA, I.- HERNANDO, J. (2000) SpeechDat: disseny del corpus en català, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://www.crel.net/Jornades/upc/crel00ie.zip

HERNANDO, J.- ESQUERRA, I. (2000) SpeechDat Catalan Database for Fixed Telephone Network, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000
. http://www.crel.net/Jornades/upc/speechdat.zip

MARIÑO, J.B.- PADRELL, J.- MORENO, A.- NADEU, C. (2000) "Monolingual and bilingual Spanish-Catalan speech recognizers developed from SpeechDat databases", in Proceedings of the International Workshop on Very Large Telephone Speech Databases, pp. 57-61, Athens, May 2000
http://gps-tsc.upc.es/veu/pubs/download/mar00a.pdf

Corpus de diàleg del CREL

Grup de Fonètica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Creat per al desenvolupament d’un sistema per obtenir informació telefònica dels Ferrocarrils de la Generalitat de Catalunya

Recollida d’un corpus persona-persona

Creació d’escenaris per situar els usuaris que trucaran al servei d’informació simulat

Creació d’unes estratègies de diàleg per al sistema

Recollida d’un corpus persona-Mag d’Oz

Corpus persona - persona

<usuari home><demanar informació>Miri, jo trucava per preguntar si <dia>demà</dia> hi ha un <tren>tren</tren> que surti de <estació d’origen>Barcelona</estació d’origen> a <estació destí>Igualada</estació destí> a les <hora digital><número>deu</número> i <número>trenta-sis<\número></hora digital> de la <franja>nit</franja></demanar informació>?

<operadora><confirmació explícita>A les <hora digital><número>deu</número> i <número>trenta-sis</número></hora digital>, <dia>demà dia laborable</dia></confirmació explícita>?
<usuari home><confirmació>Sí</confirmació>.

Corpus persona - Mag d’Oz

<oz>Quin tipus de consulta desitja realitzar?

<usuari dona><demanar informació>Doncs miri és que jo sé que de <estació d’origen>Sabadell</estació d’origen> a <estació destí>l’Autònoma</estació destí> hi ha molts <tren>trens</tren> però ara he d’anar a <estació destí>l’Autònoma</estació destí> i he de ser-hi allà a les <hora digital><número>onze</número></hora digital> del <franja>matí</franja> i m’agradaria saber quant dura el trajecte des de <estació d’origen>Sabadell</estació d’origen> a <estació destí>l’Autònoma</estació destí> perquè tampoc no vull fer tard</demanar informació>. <silenci>3</silenci>

<oz><confirmació explícita>M’està demanant informació de durada d’un trajecte</confirmació explícita>?

MACHUCA, M.J.- BUENO, L.- CALONGE, R.- ESTRUCH, M.- RIERA, M. (2000) Corpus de diàleg, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://liceu.uab.cat/publicacions/SFI_UAB_Corpus_Dialeg.pdf

MACHUCA, M.J.- BUENO, L.- CALONGE, R.- ESTRUCH, M.- RIERA, M. (2000) Eines de reconeixement i prototip de conversa oral, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://liceu.uab.cat/publicacions/SFI_UAB_Disseny_prototip.pdf

NADEU, C.- PADRELL, J.- ESTRUCH, M.- LLISTERRI, J.- MACHUCA, M-J.- DE LA MOTA, C.- RIERA, M. (2000) Prototip de conversa oral, , Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://www.crel.net/Jornades/upc/prototip-conv.zip

NADEU, C.- PADRELL, J.- NOGUEIRAS, A.- MARIÑO, J..B.- BONAFONTE, A.- HERNANDO, J.- RODRÍGUEZ, A.- ESQUERRA, I.- SESMA, A.- OLIVER, J. (2000) Eines de reconeixement i prototip de conversa oral, , Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://www.crel.net/Jornades/upc/prototip-conv.zip

principi

Indústries de la llengua: les aplicacions i els productes

Conversió de text a parla

Grup de Tractament de la Parla, Departament de Teoria del Senyal i Comunicacions

http://gps-tsc.upc.es/veu/demos/tts.html

Conversió automàtica a veu de qualsevol text escrit en català

BONAFONTE, A.- ESQUERRA, I.- FEBRER, A.- FONOLLOSA, J.A.- VALLVERDÚ, F. (1999) "The UPC Text-to-Speech System for Spanish and Catalan", in Proceedings of the 5th International Conference on Spoken Language Processing, ICSLP’98, Sydney, Australia, 30th November-4th December 1998.
http://gps-tsc.upc.es/veu/pubs/download/Bon98b.ps.gz

BONAFONTE, A. - FEBRER, A. (2000) Eines de conversió text-parla, Jornades del Centre de Referència en Enginyeria Lingüística (CREL), Institut d’Estudis Catalans, Barcelona, 4 i 5 d’abril de 2000.
http://www.crel.net/Jornades/upc/tts.zip

Telefónica I+D

http://www.tid.es/trabajo/nuestrosproductos/pdfs/servtelefonicos/IV/habla/ctv.pdf

TID

Conversió automàtica en veu de qualsevol text escrit en català

Desenvolupat en el marc d’un sistema multilingüe de conversió de text a parla que inclou també el castellà, el gallec i l’euskera

Català: en col·laboració amb el Grup de Fonètica, Universitat Autònoma de Barcelona

Dictat automàtic

Philips FreeSpeech 2000

http://www.speech.philips.com/ud/get/Pages/h0721ca.htm

FreeSpeech

Converteix en text escrit un text dictat oralment

Sistema multilingüe (13 llengües o variants) que inclou el català

Entrenament previ del sistema i aprenentatge continuat

Dictat natural

Integració amb Word

Possibilitat de navegació per la web

Control per veu de les comandes del sistema

Permet dictar números, dates i lletrejar

Facilitat de correcció dels errors

Pentium, Windows 95/98, SoundBlaster

Desenvolupat com a projecte del Comissionat per a la Societat de la Informació de la Generalitat de Catalunya

Grup de Tractament de la Parla, Universitat Politècnica de Catalunya
Grup de Fonètica, Universitat Autònoma de Barcelona
Secció de Lingüística Catalana, Universitat de Barcelona

Correctors ortogràfics i gramaticals

Word Correct, DGC Desarrollo Gramatical Computarizado

http://www.dgc.es/ca/descriap.htm

WordCorrect

Corrector ortogràfic i gramatical en català

Correcció ortogràfica

Correcció ortogràfica

Diccionari ortogràfic

Diccionari ortogràfic

Ajuda gramatical

Ajuda

Diccionari de sinònims

Diccionari de sinònims

Diccionari personalitzat

Diccionari usuari

Escriu, Inèdit

http://www.inedit.com/escriu.html

Escriu

Traducció automàtica

Traductor català-castellà / castellà-català, Incyta, Ingeniería, Consultoría y Traducción automática

http://www.incyta.es/demo.html

Sistemes de traducció automàtica de la Secretaria per a la Societat de la Informació Utilitzats a la premsa (La Vanguardia, Segre, EFE), l’administració (Departament d’Indústria, Comerç i Turisme, Programa d’Informàtica Educativa) i altres centres (Universitat Oberta de Catalunya, Fundació Catalana per a la Recerca)

No tradueixen paraula per paraula

Consideren el context de tota la frase

Tenen en compte criteris sintàctics i semàntics rellevants a fi de traduir paraules i grups de paraules

Incyta

Incyta

Incyta

El Traductor de El Periódico de Catalunya, Soft Library;

https://www.softly.es/transacciones/traductor/index.htm

Traducció de 80 planes de text diàries del castellà al català en 30 minuts des de 1997

Revisió manual a càrrec de lingüistes i editors Sistema català - castellà disponible el 1999

El Periódico

Diccionaris en línia

Diccionari de la Llengua Catalana, Institut d’Estudis Catalans

http://www.iec.es/cat/llengcat/diccionari/inici.htm

Enciclopèdia Catalana

http://www.grec.net/home/cel/dicc.htm

Enciclopèdia Catalana

Diccionaris en CD-ROM

Diccionari de la Llengua Catalana, Institut d’Estudis Catalans, 1997

Versió electrònica de l’edició de 1995 del Diccionari

Hiperdiccionari català - castellà - anglès, Enciclopèdia Catalana, 1993

Diccionari de la Llengua Catalana, 1993
Diccionari ortogràfic i de pronúncia, 1993
Diccionari català-castellà, 1987
Diccionari català-anglès, 1986

principi

El context de desenvolupament

Universitats

Grup de Fonètica, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat

UAB

Tecnologies de la parla: conversió de text a parla, sistemes de diàleg

Grup de Lexicografia i Diacronia, Seminari de Filologia i Informàtica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
http://liceu.uab.cat

UAB

Recursos lèxics, diccionaris, corpus diacrònics

CLiC - Centre de Lingüística i Computació, Parc Científic i Tecnològic de Barcelona, Universitat de Barcelona
http://www.ub.es/ling/clic.htm

CLIC

Recursos lingüístics textuals, eines d’anàlisi morfològica i sintàctica, xarxes lexico-semàntiques

GILCUB - Grup d’Investigació en Lingüística Computacional, Parc Científic i Tecnològic de Barcelona, Universitat de Barcelona
http://www.ub.es/gilcub/

GILCUB

Traducció automàtica, recursos lingüístics textuals, eines d’anàlisi morfosintàctica

LaReLC-UB - Laboratori de Lingüística Computacional, Departament de Lingüística, Universitat de Barcelona
http://www.ub.es/ling/labcat.htm

UB

Recursos lingüístics textuals, eines d’anàlisi morfològica i sintàctica, xarxes lexico-semàntiques

Grup de Processament de Llenguatge Natural, Departament de Llenguatges i Sistemes Informàtics, Universitat Politècnica de Catalunya
http://www.lsi.upc.es/~nlp/

LSI

Xarxes lexico-semàntiques, analitzadors morfològics i sintàctics

Grup de Tractament de la Parla, Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya
http://gps-tsc.upc.es/veu/

UPC

Tecnologies de la parla: conversió de text a parla, reconeixement de la parla, sistemes de diàleg

TALP - Centre de Tecnologia i Aplicacions del Llenguatge i de la Parla, Universitat Politècnica de Catalunya
http://www.talp.upc.es/

TALP

Tecnologies del llenguatge i de la parla: Grup del Tractament de la Parla i Grup de Tractament del Llenguatge Natural

IULA- Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
http://www.iula.upf.edu/

IULA

Recursos lingüístics textuals, recursos lèxics, recursos terminològics, eines d’anàlisi morfològica

Centres

CREL - Centre de Referència en Enginyeria Lingüística, Generalitat de Catalunya
http://www.crel.net/

CREL

Recursos lingüístics orals i textuals, eines de tractament de la parla i de l’escrit, prototips d’aplicacions

Oficines Lexicogràfiques, Secció Filològica, Institut d’Estudis Catalans
http://www.iec.es/cat/institucio/organitzaciÛ/seccions/filologica/oficines_sfilo/ofilexicografiques.htm

IEC

Recursos lingüístics textuals, recursos lèxics, diccionaris

TERMCAT, Centre de Terminologia
http://www.termcat.es/

TERMCAT

Recursos terminològics, recursos lèxics

Administració

Secretaria per a la Societat de la Informació, Departament d’Universitats, Recerca i Societat de la Informació, Generalitat de Catalunya
http://www.gencat.es/csi/cat/societat_informacio/

Societat de la Informació

Direcció General de Recerca, Departament d’Universitats, Recerca i Societat de la Informació, Generalitat de Catalunya
http://www.gencat.es/dursi/

Generalitat

Direcció General de Política Lingüística, Departament de Cultura, Generalitat de Catalunya
http://cultura.gencat.es/llengcat/organi/index.htm

Generalitat

Consorci per a la Normalització Lingüística
http://www.cpnl.org/

Empreses

Empreses de serveis lingüístics

Incyta, Ingeniería, Consultoría y Traducción Automática, Barcelona
http://www.incyta.es

Incyta

Traducció automàtica

DGC, Desarrollo Gramatical Computerizado, Barcelona
http://www.dgc.es/ca/welcome.htm

Corrector ortogràfic i gramatical

Empreses editorials

Enciclopèdia Catalana
http://www.enciclopedia-catalana.com/

Enciclopèdia catalana

Obres lexicogràfiques

Biblograf, Grupo Anaya
http://www.vox.es/

Vox

Obres lexicogràfiques

Empreses de tecnologies de la informació

Philips, Eindohven
http://www.speech.philips.com/ud/get/Pages/072fr.htm

Philips

Tecnologies de la parla: dictat automàtic

Empreses de comunicacions

Telefónica I+D, Telefónica, Madrid
http://www.tid.es/

TID

Tecnologies de la parla: conversió de text a parla, reconeixement de la parla

principi


O catalán nas industrias da lingua
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: 7 July 2000