Las aplicaciones del reconocimiento automático del habla


El reconocimiento automático del habla


Reconocimiento de palabras aisladas

Control del sistema operativo de un ordenador.

Utilización de Windows Vista con control vocal en español.

mochiteco. (28/12/2006). Windows VISTA - reconocimiento de voz en español [Archivo de video]. Consultado en https://www.youtube.com/watch?v=SKm-g7hUSag

Navegación vocal.

Navegación mediante el habla por una página web.

Proyecto Edecán, sistEma de Diálogo multidominio con adaptación al contExto aCústico y de AplicacióN (2005-2008). Grupo de Tecnologías de las Comunicaciones, Universidad de Zaragoza; Grup d’Enginyeria del Llenguatge Natural i Reconeixement de Formes, Universidad Politécnica de Valencia; Speech Interactive Research Group, Universidad del País Vasco; Grupo de Tecnología del Habla, Universidad Politécnica de Madrid.

Aplicaciones industriales y comerciales:

Entrada de datos.

SpeeData, Speech Recognition for Data Entry Applications, LE11999 (1995-1998), Telematics Applications Programme, FP4.

Aplicaciones domésticas:

“A new study by the Virginia Tech Transportation Institute found that interactive voice systems used for outbound text messaging reduced levels of driver distraction compared to manually texting on a smartphone. The study was commissioned for telematics services provider ATX Group of Dallas, which developed the in-vehicle voice technology system.”

Speech Technology Magazine, 11 April, 2011.

Control vocal del sistema de navegación de un automóvil.

VODIS, Advanced Speech Technologies for Voice Operated Driver Information Systems, LE12277 (1995-1997), Telematics Applications Programme, FP4.

Interacción oral con un sistema de navegación en vehículos.

Spoken Language Systems Group, MIT Computer Science and Artificial Intelligence Laboratory.

Control vocal de una cadena de música.

Proyecto Edecán, sistEma de Diálogo multidominio con adaptación al contExto aCústico y de AplicacióN (2005-2008). Grupo de Tecnologías de las Comunicaciones, Universidad de Zaragoza; Grup d’Enginyeria del Llenguatge Natural i Reconeixement de Formes, Universidad Politécnica de Valencia; Speech Interactive Research Group, Universidad del País Vasco; Grupo de Tecnología del Habla, Universidad Politécnica de Madrid.

Barra, H. y Burke, D. (2010). Just speak it: Introducing voice actions for Android. Google Mobile blog. Mountain View, CA: Google. Consultado en http://googlemobile.blogspot.com.es/2010/08/just-speak-it-introducing-voice-actions.html

Control vocal de teléfonos inteligentes.

Barra, H. y Burke, D. (2010). Just speak it: Introducing voice actions for Android. Google mobile blog. Mountain View, CA: Google. Consultado en http://googlemobile.blogspot.com.es/2010/08/just-speak-it-introducing-voice-actions.html

Búsqueda de información mediante el habla en teléfonos inteligentes.

Google. (s.d.). Voice search. Inside search. Mountain View, CA: Google.

Aplicaciones telefónicas:

Aplicaciones a usuarios con necesidades especiales:

up arrow

Dictado automático

“Máquina de escribir vocal”.

Usuarios profesionales específicos:

Usuarios profesionales generales:

Dragon Naturally Speaking, Nuance

Nuance. (2016). Dragon Speech Recognition Software. Burlington, MA: Nuance Communications, Inc. Consultado en https://www.nuance.com/dragon.html

Nuance Dragon

Ediciones diferentes para distintos usos personales y profesionales.

Dragon Naturally Speaking 13.

Nuance Dragon. (22/07/2014). See Dragon NaturallySpeaking 13 in Action [Archivo de video]. Consultado en https://www.youtube.com/watch?v=ImlKOA1MhlI

Versión en español

Nuance. (2016). Software de reconocimiento de voz Dragon. Burlington, MA: Nuance Communications, Inc. Consultado en http://www.nuance.es/dragon/index.htm

Dragon NaturallySpeaking 13 Home.

../DragonNaturallyspeaking_home.jpg

Dragon NaturallySpeaking 13 Premium.

../DragonNaturallyspeaking_premium.jpg

Dragon NaturallySpeaking 13 Professional Individual.

../DragonNaturallyspeaking_profesional.jpg

Dragon Naturally Speaking en español.

Gustafson, N. (16/08/2007). Demostración Dragon Naturally Speaking [Archivo de video]. Consultado en https://www.youtube.com/watch?v=S5Jf9tmaGWQ

Dragon Mobile

Nuance. (2016). Nuance Mobile Apps. Burlington, MA: Nuance Communications, Inc. Consultado en https://www.nuance.com/mobile/mobile-applications.html

Dragon Dictation

Nuance. (2016). Dragon dictation. Burlington, MA: Nuance Communications, Inc. Consultado en https://www.nuance.com/mobile/mobile-applications/dragon-dictation.html

https://itunes.apple.com/us/app/dragon-dictation/id341446764

../Dragon_Dictate.jpg

Nuance. (2016). Dragon dictation. Burlington, MA: Nuance Communications, Inc. . Consultado en https://www.nuance.com/mobile/mobile-applications/dragon-dictation.html

Dragon Go!

Nuance. (2016). Dragon Go!. Burlington, MA: Nuance Communications, Inc. Consultado en hhttps://www.nuance.com/mobile/mobile-applications/dragon-go.html

https://itunes.apple.com/us/app/dragon-go!/id442975871

../Dragon_Search.jpg

Nuance. (2016). Dragon Go!. Burlington, MA: Nuance Communications, Inc. Consultado en https://www.nuance.com/mobile/mobile-applications/dragon-go.html

Mac OS X Dictation, Apple

Apple. (2016). Use your voice to enter text on your Mac. Apple support. Cupertino, CA: Apple Inc. Retrieved from https://support.apple.com/en-us/HT202584

Control vocal del sistema operativo.

Dictado automático.

Disponible en inglés (británico, americano, canadiense y australiano), francés (de Francia, de Suiza y canadiense), español (de España, de México y de Estados Unidos), italiano (de Italia y de Suiza), alemán (de Alemania y de Suiza), portugués (de Portugal y de Brasil), chino (de China, de Hong-Kong y de Taiwán), árabe, catalán, coreano, croata, danés, eslovaco, griego, hebreo, húngaro, indonesio, japonés, malayo, neerlandés, noruego, polaco, rumano, ruso, checo, ucraniano y vietnamita.

Versión en español

Versiones en español de España, de México y de Estados Unidos.

../Mac_dictado_LibreOffice.jpg

Dictado automático en LibreOffice mediante Mac OS X 10 (Mavericks).

Versión en catalán

../Mac_dictado.jpg

Configuración del dictado automático en catalán en Mac OS X 10.12 (Sierra).

Microsoft

Windows Speech Recognition, Microsoft

Microsoft. (2016). Use speech recognition. Microsoft Windows 10 - Ease of access. Redmond, WA: Microsoft Corporation. Consultado en https://support.microsoft.com/en-us/help/17208/windows-10-use-speech-recognition

Control vocal del sistema operativo.

Dictado automático.

Disponible en inglés (de Estados Unidos, del Reino Unido, de Canadá, de la India y de Australia), francés, español, alemán, japonés y mandarín (chino simplificado y chino tradicional).

Dictado automático en Windows Vista.

Mocrosoft. (2014). Windows speech recognition. Windows Vista demos - Microsoft accessibility. Redmond, WA: Microsoft Corporation.

Presentación del dictado automático en Windows Vista.

NilEinne. (02/08/2006). Windows Vista speech recognition - the whole story [Archivo de video]. Consultado en https://www.youtube.com/watch?v=kX8oYoYy2Gc

../Windows7_Comandos.jpg

Reconocimiento de comandos en Windows 7 en español.

López Gambino, M. S. (2012). An evaluation of automatic speech recognition in the Spanish version of Windows 7®: Effects of language variety, speaking style and gender. MA Dissertation. International Master in Natural Language Processing and Human Language Technology, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve - Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona.

../Windows7_Dictat.jpg

WER (Word Error Rate) en dos tareas de dictado en Windows 7 en español.

López Gambino, M. S. (2012). An evaluation of automatic speech recognition in the Spanish version of Windows 7®: Effects of language variety, speaking style and gender. MA Dissertation. International Master in Natural Language Processing and Human Language Technology, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve - Facultat de Filosofia i Lletres, Universitat Autònoma de Barcelona.

Dictate, a Microsoft Garage project

Dictate, a Microsoft Garage project. (2017). Microsoft Corporation. Consultado en http://dictate.ms

Microsoft (20 de junio de 2017). Dictate, a Microsoft Garage project. Consultado en https://www.youtube.com/watch?v=AKs-cIfGCQc

up arrow

Corrección fonética y enseñanza de la pronunciación

up arrow

Recuperación de información en documentos sonoros

Audio Information Retrieval.
Spoken Document Retrieval.

Búsqueda y recuperación de información en archivos o documentos sonoros.

Selección de mensajes en el contestador de voz.

Selección de correos electrónicos en video.

Selección en archivos de videoconferencias.

Tareas:

Transcrigal

Transcripción automática y recuperación de contenido en telediarios en castellano y en gallego.

García Mateo, C., Diéguez, J., Docío, L. y Cardenal, A. (2004). Transcrigal: A bilingual system for automatic indexing of broadcast news. En LREC 2004. Proceedings of the 4th international conference on Language Resources and Evaluation. Lisbon, Portugal. May 24-30, 2004. Consultado en http://www.lrec-conf.org/proceedings/lrec2004/summaries/382.htm

../Transcrigal_acceso.jpg
../Transcrigal_noticia.jpg

Interfaz de acceso y resultados de la búsqueda en Transcrigal.

GTM. (s.d.). Acceso a los contenidos de TranscrigalDB. Vigo: Grupo de Tecnología Multimedia, Escola de Enxeñaría de Telecomunicación, Universidade de Vigo. Consultado en http://firewall.teleco.uvigo.es:16241/Transcrigal/

DALI, Digital Audio Library Indexing

Recuperación de información audiovisual a partir de búsquedas en lenguaje natural.

Reconocimiento del habla realizado mediante el programa Media Mining Indexer de Sail Labs.

Demostración de búsqueda en canales de vídeo.

Daedalus. (2013). Búsqueda multimedia - Búsqueda de videos. Daedalus Showroom. Madrid: Daedalus - Data, Decisions and Language, S.A.

iWebTV

Transcripción automática, segmentación de locutor (Speaker Diarisation) y búsquedas a partir de palabras clave.

Delgado, H., Serrano, J. y Carrabina, J. (2010). Automatic metadata extraction from spoken content using speech and speaker recognition techniques. En FALA 2010. VI jornadas en tecnología del habla - II Iberian SLTech workshop. (pp. 201-4). Centro Social Caixanova, Vigo, Spain. 10-12 November, 2010. Consultado en http://lorien.die.upm.es/~lapiz/rtth/JORNADAS/VI/pdfs/0043.html

Segmentación automática de locutor y transcripción automática de una sesión del parlamento de Cataluña.

iWebTV, Multimedia Content Acquisition and Management Platform, CEPHIS, Centre de Prototips i Solucions Hardware i Software, Universitat Autònoma de Barcelona.

up arrow

El reconocimiento automático del habla


Las aplicaciones del reconocimiento automático del habla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

Last updated: