Las aplicaciones de los sistemas de diálogo

Los sistemas de diálogo

Sistemas de información

Información sobre viajes en tren

Prototipo de un sistema de acceso a la información sobre los Ferrocarrils de la Generalitat


Prototipo de un sistema de diálogo para acceder a información sobre los Ferrocarrils de la Generalitat (2001).

CREL, Centre de Referència en Enginyeria Lingüística de la Generalitat de Catalunya.


Consulta de la información deseada y verificación por parte del sistema.


Reconocimiento automático del habla y comprensión del habla.


Proceso de extracción de la información relevante en la consulta.


Proceso de generación de la respuesta.


Respuesta a la consulta.

ARISE, Automatic Railway Information Systems for Europe

Proyecto IST - Information Society Technologies (1996-1997).


BASURDE, Sistema de diálogo oral en dominios restringidos

BASURDE (1998-2001), Speech Interactive Research Group, Universidad del País Vasco - Grupo de Aprendizaje Computacional, Reconocimiento Automático y Traducción del Habla, Universitat Jaume I - Grupo de Tratamiento del Lenguaje Natural, Grupo de Tratamiento del Habla, Universitat Politècnica de Catalunya - Grupo de Reconocimiento de Formas e Inteligencia Artificial, Universitat Politècnica de València - Grupo de Tecnologías de las Comunicaciones, Universidad de Zaragoza.

“Reconocimiento: Para conseguir una tasa de reconocimiento aceptable es deseable que la frase se pronuncie evitando ruidos y a una velocidad de locución normal.”

Comprensión: Limitada a información telefónica de horarios y precios de trenes regionales y de grandes líneas.

Salida vocal:

MASK, Multimodal-Multimedia Automated Service Kiosk

MASK, Groupe Traitement du Langage Parlé, LIMSI - Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur.

MASK : Le systeme MASK vous écoute
USER : Euh... je voudrais aller demain de Paris à Bordeaux...
MASK : A quelle heure voulez-vous partir?
USER : Vers 12:30
MASK : Il y a un train a 12:43, voulez-vous réserver?
USER : Oui en première classe

Información sobre vuelos

ATIS, Air Travel Information System

STAR, Speech Technology and Research Laboratory, SRI International.


Información sobre horarios y tarifas de vuelos.

Incluye comprensión del lenguaje natural.


PEGASUS, Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

Pegasus: United flight 9 from Kennedy is expected in Los Angeles at 11:43 a.m. local time. It is 47 minutes ahead of schedule. What else would you like to know?
Pegasus: There are 2 flights from Chicago arriving in Boston at 12 o’clock pm local time, United flight 506 scheduled to arrive at 11:53 a.m. and American flight 744 scheduled to arrive at 11:59 a.m. Please select one.
Pegasus: American flight 744 from O’Hare landed in Boston at 11:42 a.m. local time, 17 minutes ahead of schedule. Is there something else you’d like to know?

Información ciudadana


Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

“VOYAGER can engage in verbal dialogues with users about a geographical region within Cambridge, Massachusetts, in the USA. It can provide users with information about distances, travel times, or directions between objects located within this area (e.g., restaurants, hotels, post offices, subway stops), as well as information such as addresses or telephone numbers of the objects themselves.

As of the present time, VOYAGER operates in a trilingual mode, where the user can select among the three choices, English, Japanese, or Italian, for the communication language.”


WAXHOLM, Department of Speech, Music and Hearing, KTH, Stockholm.

Información de tráfico marítimo en el archipiélago de Estocolmo.

Entrada mediante reconocimiento automático del habla.

Información proporcionada mediante síntesis del habla complementada por síntesis visual y una interfaz gráfica.


AdApt - August

AdApt, August, Department of Speech, Music and Hearing, KTH, Stockholm.

Información sobre la ciudad de Estocolmo.

Agentes conversacionales para ayudar en el proceso de obtención de información.

Síntesis visual.


Información meteorológica

aTTemps, Acceso telefónico a información sobre el tiempo

aTTemps, Grup de Tractament de la Parla, Universitat Politècnica de Catalunya - Grup de Fonètica, Universitat Autònoma de Barcelona - Servei Meteorològic de Catalunya, Generalitat de Catalunya.


Servicio dado de baja en octubre de 2011.

SAM, hombre del tiempo virtual

SAM, hombre del tiempo virtual


JUPITER, Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

“When you call, you will be connected with Jupiter (the connection will take about 5 sec.), and the system will greet you with something like “Welcome to Jupiter - the automated weather service from MIT. How may I help you?”
At this point, you will hear a brief high pitch beep, indicating that the computer is listening. You can now ask your question, e.g., what’s the forecast in Boston, will it rain tomorrow, when will the sun rise, etc.
When you are done asking the question, you will hear a brief low pitch beep, indicating that the machine has detected an endpoint.
It will entertain you with music and then respond (hopefully with the right answer!). If it doesn’t do well, you may want to change your speaking rate a bit, or try not to trail off at the end of a sentence. You might also want to simplify your query, if you are having trouble with longer queries. The system does not do as well if you are in a noisy environment or if you use cell phones.
When it is done, then it will say “can I help you with something else” and go to step 2 again. When you are done, simply hang up.”

Información académica

SACC, Sistema Automático de Consulta de Calificaciones

Grupo de Investigación en Señales, Telemática y Comunicaciones, Universidad de Granada.


Consulta del correo electrónico


Lectura del correo electrónico mediante el sistema Cotovía.

Grupo de Tecnologías Multimedia de la Universidad de Vigo y Centro Ramón Piñeiro para a Investigación en Humanidades.

Portales de voz


Portales de voz.


Consulta de información a un portal de voz.


Proceso de consulta a un sistema con respuestas mediante plantillas previamente grabadas (Ydilo).


Forma de onda y curva melódica en un sistema con respuestas pregrabadas (Ydilo).


Proceso de consulta a un sistema con respuestas mediante conversión de texto en habla (Terra).


Comparación entre las técnicas utilizadas en dos portales de voz (Ydilo y Terra).

up arrow

Sistemas de transacciones

Venta de entradas


Voice Ticketing, Ydilo.


Banca telefónica

Banca telefónica

IVR Banca telefónica, Natural Vox.


Servicios de atención al usuario

Cita previa

IVR IMSALUD, Natural Vox.


Sistemas de ayuda

TRAINS, Natural Spoken Dialogue and Interactive Planning

TRAINS, Conversational Interaction and Spoken Dialogue Research Group, Rochester University.

Gestión de itinerarios de trenes.

TRIPS, The Rochester Interactive Planning System

TRIPS, Conversational Interaction and Spoken Dialogue Research Group, Rochester University.

Asistentes interactivos para la planificación.

Interacción mediante un sistema conversacional y una interfaz gráfica.

Asistentes virtuales

IPA, Intelligent Personal Assistant
IVA, Intelligent Virtual Assistant
PDA, Personal Digital Assistant


Respuestas correctas sobre un total de 5000 preguntas en distintos asistentes virtuales.

Hollander, R. (2017, 27 de septiembre). Apple’s Siri ditches Bing for Google. Business insider. Consultado en


Gruber, T. R., Cheyer, A. J., Kittlaus, D., Guzzoni, D. R., Brigham, C. D., Giuli, R. D., . . . Saddler, H. J. (2011). Intelligent automated assistant (WO 2011/088053 A2). Geneva: World Intellectual Property Organization, International Bureau. Retrieved from

Siri para iPhone 4S y modelos posteriores.

Apple Inc., Cupertino, CA

Cendrowski, M. (2012). The Beta Test Initiation, The Big Bang Theory, Season 5, Episode 14. United States: Chuck Lorre Productions, Warner Bros Television. Consultado en


Susan Bennet

CNET. (16/05/2013). Google Now vs. Siri: The results speak for themselves. San Francisco, CA: CBS Interactive. Consultado en

Siri Team (2017). Hey Siri: An on-device DNN-powered voice trigger for Apple’s personal assistant. Apple Machine Learning Journal, 1(6). Consultado en


Cortana, Microsoft Windows



Huang, X. (20 de agosto de 2017). Microsoft researchers achieve new conversational speech recognition milestone. Microsoft Research Blog. Consultado en


Google app


Google app

Artificial Solutions

Artificial Solutions, Stockholm.



Asistente personal para teléfonos inteligentes, tabletas y ordenadores de sobremesa.

Disponible en versiones en inglés para Android y Windows.

Asistente personal Indigo de Artificial Solutions.

Hello Indigo. (18/04/2013). Indigo: The ubiquitous virtual assistant for Android and WP8. Stockholm: Artificial Solutions.


Asistentes virtuales interactivos para páginas web y teléfonos móviles.

Conversión de texto en habla basada en la tecnología de Nuance - Loquendo sincronizada con movimientos labiales.

Sonia, asistente digital interactivo para teléfonos móviles.

Umanify, Barcelona.

Asistente digital interactivo para teléfonos móviles.

Umanify, Barcelona.

Asistente digital personalizado para teléfonos móviles.

Umanify, Barcelona.

up arrow

Los sistemas de diálogo

Las aplicaciones de los sistemas de diálogo
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: