Las aplicaciones de los sistemas de diálogo


Los sistemas de diálogo


Sistemas de información

Información sobre viajes en tren

Prototipo de un sistema de acceso a la información sobre los Ferrocarrils de la Generalitat

fgc.jpg

Prototipo de un sistema de diálogo para acceder a información sobre los Ferrocarrils de la Generalitat (2001).

CREL, Centre de Referència en Enginyeria Lingüística de la Generalitat de Catalunya.

CREL_Consulta.jpg

Consulta de la información deseada y verificación por parte del sistema.

CREL_Dialeg.jpg

Reconocimiento automático del habla y comprensión del habla.

CREL_Comprensio.jpg

Proceso de extracción de la información relevante en la consulta.

CREL_Generacio.jpg

Proceso de generación de la respuesta.

CREL_Resposta.jpg

Respuesta a la consulta.

ARISE, Automatic Railway Information Systems for Europe

Proyecto IST - Information Society Technologies (1996-1997).

../arise.gif

BASURDE, Sistema de diálogo oral en dominios restringidos

BASURDE (1998-2001), Speech Interactive Research Group, Universidad del País Vasco - Grupo de Aprendizaje Computacional, Reconocimiento Automático y Traducción del Habla, Universitat Jaume I - Grupo de Tratamiento del Lenguaje Natural, Grupo de Tratamiento del Habla, Universitat Politècnica de Catalunya - Grupo de Reconocimiento de Formas e Inteligencia Artificial, Universitat Politècnica de València - Grupo de Tecnologías de las Comunicaciones, Universidad de Zaragoza.

“Reconocimiento: Para conseguir una tasa de reconocimiento aceptable es deseable que la frase se pronuncie evitando ruidos y a una velocidad de locución normal.”

Comprensión: Limitada a información telefónica de horarios y precios de trenes regionales y de grandes líneas.

Salida vocal:

MASK, Multimodal-Multimedia Automated Service Kiosk

MASK, Groupe Traitement du Langage Parlé, LIMSI - Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur.

../mask.gif
MASK : Le systeme MASK vous écoute
USER : Euh... je voudrais aller demain de Paris à Bordeaux...
MASK : A quelle heure voulez-vous partir?
USER : Vers 12:30
MASK : Il y a un train a 12:43, voulez-vous réserver?
USER : Oui en première classe

Información sobre vuelos

ATIS, Air Travel Information System

STAR, Speech Technology and Research Laboratory, SRI International.

../atis.gif

Información sobre horarios y tarifas de vuelos.

Incluye comprensión del lenguaje natural.

PEGASUS

PEGASUS, Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

USER: CAN YOU TELL ME THE STATUS OF UNITED FLIGHT NINE?
Pegasus: United flight 9 from Kennedy is expected in Los Angeles at 11:43 a.m. local time. It is 47 minutes ahead of schedule. What else would you like to know?
USER: ARE THERE ANY FLIGHTS FROM CHICAGO TO BOSTON ARRIVING AROUND NOON?
Pegasus: There are 2 flights from Chicago arriving in Boston at 12 o’clock pm local time, United flight 506 scheduled to arrive at 11:53 a.m. and American flight 744 scheduled to arrive at 11:59 a.m. Please select one.
USER: WILL THE SECOND ONE BE ON TIME?
Pegasus: American flight 744 from O’Hare landed in Boston at 11:42 a.m. local time, 17 minutes ahead of schedule. Is there something else you’d like to know?

Información ciudadana

VOYAGER

Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

“VOYAGER can engage in verbal dialogues with users about a geographical region within Cambridge, Massachusetts, in the USA. It can provide users with information about distances, travel times, or directions between objects located within this area (e.g., restaurants, hotels, post offices, subway stops), as well as information such as addresses or telephone numbers of the objects themselves.

As of the present time, VOYAGER operates in a trilingual mode, where the user can select among the three choices, English, Japanese, or Italian, for the communication language.”

WAXHOLM

WAXHOLM, Department of Speech, Music and Hearing, KTH, Stockholm.

Información de tráfico marítimo en el archipiélago de Estocolmo.

Entrada mediante reconocimiento automático del habla.

Información proporcionada mediante síntesis del habla complementada por síntesis visual y una interfaz gráfica.

../waxholm.gif

AdApt - August

AdApt, August, Department of Speech, Music and Hearing, KTH, Stockholm.

Información sobre la ciudad de Estocolmo.

Agentes conversacionales para ayudar en el proceso de obtención de información.

Síntesis visual.

../adapt.gif

Información meteorológica

aTTemps, Acceso telefónico a información sobre el tiempo

aTTemps, Grup de Tractament de la Parla, Universitat Politècnica de Catalunya - Grup de Fonètica, Universitat Autònoma de Barcelona - Servei Meteorològic de Catalunya, Generalitat de Catalunya.

../Meteocat.jpg

Servicio dado de baja en octubre de 2011.

SAM, hombre del tiempo virtual

SAM, hombre del tiempo virtual

JUPITER

JUPITER, Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

“When you call, you will be connected with Jupiter (the connection will take about 5 sec.), and the system will greet you with something like “Welcome to Jupiter - the automated weather service from MIT. How may I help you?”
At this point, you will hear a brief high pitch beep, indicating that the computer is listening. You can now ask your question, e.g., what’s the forecast in Boston, will it rain tomorrow, when will the sun rise, etc.
When you are done asking the question, you will hear a brief low pitch beep, indicating that the machine has detected an endpoint.
It will entertain you with music and then respond (hopefully with the right answer!). If it doesn’t do well, you may want to change your speaking rate a bit, or try not to trail off at the end of a sentence. You might also want to simplify your query, if you are having trouble with longer queries. The system does not do as well if you are in a noisy environment or if you use cell phones.
When it is done, then it will say “can I help you with something else” and go to step 2 again. When you are done, simply hang up.”

Información académica

SACC, Sistema Automático de Consulta de Calificaciones

Grupo de Investigación en Señales, Telemática y Comunicaciones, Universidad de Granada.

sacc.jpg

Consulta del correo electrónico

TelCorreo.jpg

Lectura del correo electrónico mediante el sistema Cotovía.

Grupo de Tecnologías Multimedia de la Universidad de Vigo y Centro Ramón Piñeiro para a Investigación en Humanidades.

Portales de voz

Terra.jpg
Ydilo.jpg

Portales de voz.

Portal_Consulta.jpg

Consulta de información a un portal de voz.

Ydilo_Consulta.jpg

Proceso de consulta a un sistema con respuestas mediante plantillas previamente grabadas (Ydilo).

Ydilo_Formadeonda_F0.jpg

Forma de onda y curva melódica en un sistema con respuestas pregrabadas (Ydilo).

Terra_Consulta.jpg

Proceso de consulta a un sistema con respuestas mediante conversión de texto en habla (Terra).

Ydilo_Terra.jpg

Comparación entre las técnicas utilizadas en dos portales de voz (Ydilo y Terra).

up arrow

Sistemas de transacciones

Venta de entradas

CineEntradas

Voice Ticketing, Ydilo.

../ydilo.jpg

Banca telefónica

Banca telefónica

IVR Banca telefónica, Natural Vox.

../NaturalVox_logo.jpg
NaturalVox_Demo.jpg

Servicios de atención al usuario

Cita previa

IVR IMSALUD, Natural Vox.

../NaturalVox_logo.jpg
NaturalVox_Demo_2.jpg

Sistemas de ayuda

TRAINS, Natural Spoken Dialogue and Interactive Planning

TRAINS, Conversational Interaction and Spoken Dialogue Research Group, Rochester University.

Gestión de itinerarios de trenes.

TRIPS, The Rochester Interactive Planning System

TRIPS, Conversational Interaction and Spoken Dialogue Research Group, Rochester University.

Asistentes interactivos para la planificación.

Interacción mediante un sistema conversacional y una interfaz gráfica.

Asistentes virtuales

IPA, Intelligent Personal Assistant
IVA, Intelligent Virtual Assistant
PDA, Personal Digital Assistant

voice_assistant_accuracy.png

Respuestas correctas sobre un total de 5000 preguntas en distintos asistentes virtuales.

Hollander, R. (2017, 27 de septiembre). Apple’s Siri ditches Bing for Google. Business insider. Consultado en http://www.businessinsider.com/apple-siri-google-bing-2017-9

Apple

Gruber, T. R., Cheyer, A. J., Kittlaus, D., Guzzoni, D. R., Brigham, C. D., Giuli, R. D., . . . Saddler, H. J. (2011). Intelligent automated assistant (WO 2011/088053 A2). Geneva: World Intellectual Property Organization, International Bureau. Retrieved from http://www.unwiredview.com/wp-content/uploads/2011/10/iPhone-Siri.pdf

Siri para iPhone 4S y modelos posteriores.

Apple Inc., Cupertino, CA

Cendrowski, M. (2012). The Beta Test Initiation, The Big Bang Theory, Season 5, Episode 14. United States: Chuck Lorre Productions, Warner Bros Television. Consultado en https://www.youtube.com/watch?v=WXqRmBrBboA

../Susan_Bennet_Siri.jpg

Susan Bennet
https://susancbennett.com/

CNET. (16/05/2013). Google Now vs. Siri: The results speak for themselves. San Francisco, CA: CBS Interactive. Consultado en https://www.youtube.com/watch?v=z4LvJOFTlGo

Siri Team (2017). Hey Siri: An on-device DNN-powered voice trigger for Apple’s personal assistant. Apple Machine Learning Journal, 1(6). Consultado en https://machinelearning.apple.com/2017/10/01/hey-siri.html

Microsoft

Cortana, Microsoft Windows

../Cortana_es.jpg

Cortana

Huang, X. (20 de agosto de 2017). Microsoft researchers achieve new conversational speech recognition milestone. Microsoft Research Blog. Consultado en https://www.microsoft.com/en-us/research/blog/microsoft-researchers-achieve-new-conversational-speech-recognition-milestone/

Google

Google app

../GoogleNow_ca.jpg

Google app

Artificial Solutions

Artificial Solutions, Stockholm.

../Indigo_en.jpg

Indigo

Asistente personal para teléfonos inteligentes, tabletas y ordenadores de sobremesa.

Disponible en versiones en inglés para Android y Windows.

Asistente personal Indigo de Artificial Solutions.

Hello Indigo. (18/04/2013). Indigo: The ubiquitous virtual assistant for Android and WP8. Stockholm: Artificial Solutions.

Umanify

Asistentes virtuales interactivos para páginas web y teléfonos móviles.

Conversión de texto en habla basada en la tecnología de Nuance - Loquendo sincronizada con movimientos labiales.

Sonia, asistente digital interactivo para teléfonos móviles.

Umanify, Barcelona.

Asistente digital interactivo para teléfonos móviles.

Umanify, Barcelona.

Asistente digital personalizado para teléfonos móviles.

Umanify, Barcelona.

up arrow

Los sistemas de diálogo


Las aplicaciones de los sistemas de diálogo
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: