Sistema de diálogo de voz con proceso para evitar rechazos.
Proceso para operar con un sistema de diálogo de voz, que puede ser controlado sobre un enlace de telecomunicaciones por un terminal de comunicaciones,
comprendiendo el proceso los pasos de: recibir un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz y analizar el elemento de habla en cuanto a contenido de la expresión en una unidad de proceso, siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso, y siendo analizado por la unidad de proceso después de haberse interrumpido el enlace de telecomunicaciones, en una unidad de síntesis de texto que convierte el elemento de habla en texto y analiza este texto en cuanto al contenido de la expresión, teniendo lugar el análisis de tal forma que se examina el elemento de habla convertido para ver si ocurre al menos un cierto término, y es asignado a un cierto asunto en el caso en que se encuentre el término, transmitiendo por el sistema de diálogo de voz un compromiso de servicio al terminal de comunicaciones, después de la conversión del elemento de habla en texto, estableciendo por el sistema de diálogo de voz, después del análisis del elemento de habla, un enlace de telecomunicaciones al terminal de comunicaciones y conectando el terminal de comunicaciones a un servicio, un responsable del servicio o nuevamente al sistema de diálogo de voz.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/005704.
Solicitante: DEUTSCHE TELEKOM AG.
Nacionalidad solicitante: Alemania.
Dirección: FRIEDRICH-EBERT-ALLEE 140 53113 BONN ALEMANIA.
Inventor/es: LIEDTKE,KLAUS-DIETER, MARKEFKA,GUNTBERT.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L15/22 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › Procedimientos utilizados durante el proceso de reconocimiento de la voz, p. ej. diálogo hombre-máquina.
- H04M3/493 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04M COMUNICACIONES TELEFONICAS (circuitos para el control de otros aparatos vía cable telefónico y que no implican aparatos de conmutación telefónica G08). › H04M 3/00 Centrales automáticas o semiautomáticas. › Servicios de información interactivos, p. ej. petición de información del directorio telefónico.
- H04M3/50 H04M 3/00 […] › Disposiciones centralizadas para responder a las llamadas; Dispositivos centralizados para registrar mensajes para abonados ausentes u ocupados (H04M 3/487 tiene prioridad; sistemas de dictado centralizado H04M 11/10).
PDF original: ES-2513831_T3.pdf
Fragmento de la descripción:
Sistema de diálogo de voz con proceso para evitar rechazos
La invención está relacionada con un proceso para operar con un sistema de diálogo de voz que puede ser controlado sobre un enlace de telecomunicaciones por medio de un terminal de comunicaciones, un elemento de habla transmitido por el terminal de comunicaciones que es recibido por una unidad receptora del sistema de diálogo de voz y que es analizado en cuanto a contenido del enunciado en una unidad de proceso. Además, la invención está relacionada con el sistema de diálogo de voz en el cual se utiliza este proceso genérico.
En la publicación del documento US 272846 A1 se divulga un proceso para operar con tal sistema de diálogo de voz. Este documento se refiere a un método en el cual se devuelve la llamada al llamador por medio de un agente de servicio que depende de la cantidad de tiempo que transcurrirá antes de que el agente sea capaz de devolver la llamada al llamador, debido a otros llamadores en la cola. Además, la publicación EP 1 575 31 A2 describe una solución para el problema de tratar con pronunciaciones no reconocidas de un usuario, comparando primero el elemento de habla con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y se transmite otro elemento de habla por el terminal de comunicaciones y se convierte a texto solamente en ausencia de concordancia- En los documentos US 23 64716 A1 y US 27 2857 A1 se describen sistemas de diálogo de voz adicionales.
Generalmente, los sistemas de diálogo de voz se utilizan en las redes de telecomunicaciones, especialmente en el dominio de la red fija y de la red de teléfonos móviles, para encaminar a un llamador de una manera exclusiva a través de una oferta de servicios compleja. El llamador puede utilizar por ejemplo un teléfono de la red fija o un teléfono móvil como terminal de comunicaciones. El sistema de diálogo de voz acepta una llamada del llamador y se procesa del tal forma que el llamador hace las preguntas de manera totalmente automática utilizando el habla natural, con el fin de determinar lo que desea el llamador. El llamador puede llevar a cabo diálogos automáticos parcial o totalmente, con el sistema de diálogo de voz que es denominado también como portal de voz.
Es común una forma especialmente sencilla del sistema de diálogo de voz en forma de reconocimiento de palabras individuales, que es denominado también como respuesta interactiva de voz (IVR). Es posible utilizar la navegación de voz sencilla de IVR en los sistemas de telefonía. Por ejemplo, el sistema de diálogo de voz pregunta al llamador de la manera siguiente:
Si su solicitud está relacionada con una factura, por favor diga factura
Si su solicitud está relacionada con una queja, por favor diga queja
Si desea hablar con un responsable, por favor diga responsable
Después de que el sistema de diálogo de voz haya hecho todas las preguntas, espera una entrada de voz del llamador. Acto seguido, el llamador se expresa verbalmente desvelando al sistema de diálogo de voz, a través del teléfono, un elemento de habla en forma de una palabra. En ese momento tiene lugar un proceso de reconocimiento del habla automáticamente.
El proceso de reconocimiento del habla está basado en la comparación de la señal de la expresión acústica específica del llamador con palabras almacenadas como elementos de habla. SI se averigua que el elemento de habla transmitido es concordante con la palabra almacenada, se considera que la expresión es reconocida y se puede disparar una acción fija en el sistema de diálogo de voz. Por ejemplo, el sistema de diálogo de voz puede pasar a un submenú y, desde él, otros encabezamientos del submenú pueden hacer las preguntas pertinentes. Alternativamente, el sistema de diálogo de voz puede iniciar también directamente un cierto servicio después del reconocimiento de la expresión, y el llamador abandona el sistema de diálogo de voz.
Cuando se reconoce la expresión del llamador, en el actual sistema de diálogo de voz se ejecuta un rechazo no amistoso para el usuario, que se refleja en una expresión desde el sistema de diálogo de voz de la forma siguiente: Desafortunadamente, no pude comprenderle, repita por favor. El sistema de diálogo de voz solicita una entrada de voz repetida. Para el llamador, la expresión repetida es pesada y le conduce a permanecer más tiempo en el sistema de diálogo. El llamador se pone entonces impaciente e insatisfecho; esto puede conducir a que el operador del portal de habla pierda al llamador como cliente o como cliente potencial.
Es por tanto el objeto de la invención hacer disponible un proceso para operar con un sistema de diálogo de voz y un sistema de diálogo de voz que, en el caso de expresiones de un cliente que sean difíciles de comprender, asegure un proceso fiable y atinado de la solicitud del llamador, sin tener que hacer necesariamente que el usuario repita su expresión, y por tanto que permanezca involuntaria y desagradablemente mucho tiempo en el sistema de diálogo de voz.
Este objeto se consigue con las características de las reivindicaciones 1 y 8. En las respectivas reivindicaciones dependientes se describen desarrollos ventajosos de la invención.
Como se reivindica en la invención, se sugiere un proceso para operar con un sistema de diálogo de voz que, por medio del enlace de telecomunicaciones, se puede conectar a un terminal de comunicaciones y puede ser controlado por el terminal de comunicaciones, siendo recibido un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz, y siendo analizado en cuanto al contenido de la expresión en una unidad de proceso, y siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso y, después de interrumpir el enlace de telecomunicaciones, se analiza en la unidad de proceso.
La idea básica de esta invención consiste en que el sistema de diálogo de voz analiza la solicitud de un llamador en su ausencia. Esto tiene lugar en un proceso en segundo plano y se consigue analizando el mensaje de voz después de interrumpir el enlace de telecomunicaciones. Como contraste a la operación de diálogo del sistema de diálogo de voz, que se caracteriza por un escenario de pregunta-respuesta llamado también funcionamiento síncrono, en el cual el análisis del elemento de habla transmitido por el llamador tiene lugar directamente, es decir, mientras está conectado al sistema de diálogo de voz, el análisis del elemento de habla recibido como se reivindica en la invención, tiene lugar solamente después de que se interrumpa el enlace de las comunicaciones, es decir, en funcionamiento asincrono. Este empleo del tiempo para el análisis en este caso no molesta al llamador. Por tanto, no necesita esperar a que el sistema de diálogo de voz haya encontrado una concordancia con el fin de contestar después una pregunta repetida del sistema de diálogo de voz. En lugar de eso, el reconocimiento de la solicitud del llamador tiene lugar analizando el mensaje de voz sin la presencia del llamador. Así ahorra tiempo y, por tanto, queda satisfecho y contento por la aceptación de su solicitud.
En un ventajoso desarrollo de la invención, el elemento de habla es convertido en texto, en una unidad de síntesis de texto, siendo analizado este texto en cuanto a contenido de la expresión. Al hacer disponible un análisis orientado a un alto éxito, se puede conseguir calidad por medio de este análisis basado en texto del elemento de habla. Esto se facilita mediante la conversión del elemento de habla en texto (habla-a-texto). Tal conversión de texto-a-habla facilita un tratamiento más sencillo del mensaje de voz y la aplicación de algoritmos de búsqueda para el análisis. Además, el mensaje de voz convertido en texto puede procesarse fácilmente, por ejemplo, transferido como mensaje SMS (servicio de mensajes cortos) a un correspondiente medio de análisis.
Como se reivindica en la invención, el elemento de habla puede ser convertido en texto directamente tras depositarse en la memoria. Se evitan por tanto otros pasos de análisis y se procesa rápidamente el proceso de reconocimiento de una manera eficiente en cuanto al tiempo.
Alternativamente, se puede comparar primero el elemento de habla con un elemento de habla depositado en una memoria asignada a la unidad de proceso y se puede convertir en texto solamente en ausencia de concordancia. Después, se efectúa primero el análisis del elemento de habla por medios convencionales, por ejemplo con reconocimiento acústico de palabras y expresiones, y la conversión en texto se hace solamente cuando no se puede asegurar la asignación a un término almacenado. La conversión puede tener... [Seguir leyendo]
Reivindicaciones:
1. Proceso para operar con un sistema de diálogo de voz, que puede ser controlado sobre un enlace de telecomunicaciones por un terminal de comunicaciones, comprendiendo el proceso los pasos de:
recibir un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz y analizar el elemento de habla en cuanto a contenido de la expresión en una unidad de proceso, siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso, y siendo analizado por la unidad de proceso después de haberse interrumpido el enlace de telecomunicaciones, en una unidad de síntesis de texto que convierte el elemento de habla en texto y analiza este texto en cuanto al contenido de la expresión, teniendo lugar el análisis de tal forma que se examina el elemento de habla convertido para ver si ocurre al menos un cierto término, y es asignado a un cierto asunto en el caso en que se encuentre el término, transmitiendo por el sistema de diálogo de voz un compromiso de servicio al terminal de comunicaciones, después de la conversión del elemento de habla en texto, estableciendo por el sistema de diálogo de voz, después del análisis del elemento de habla, un enlace de telecomunicaciones al terminal de comunicaciones y conectando el terminal de comunicaciones a un servicio, un responsable del servicio o nuevamente al sistema de diálogo de voz.
2. El proceso como se reivindica en la reivindicación 1, en el que el elemento de habla se compara primero con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y es convertido en texto solamente en ausencia de concordancia.
3. El proceso como se reivindica en la reivindicación 1 o 2, en el que el elemento de habla es un mensaje de voz que comprende varias palabras habladas.
4. El proceso como se reivindica en la reivindicación 1, en el que el elemento de habla se compara primero con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y se transmite otro elemento de habla por el terminal de comunicaciones y se convierte en texto solamente en ausencia de concordancia.
5. El proceso como se reivindica en la reivindicación 4, en el que el otro elemento de habla es un mensaje de voz que comprende varias palabras habladas.
6. El proceso como se reivindica en la reivindicación 5 en el que, tras establecer una falta de concordancia, el sistema de diálogo de voz indica la posibilidad de transmitir un mensaje de voz.
7. El proceso como se reivindica en la reivindicación 6, en el que el sistema de diálogo de voz espera una entrada de voz tras indicar la posibilidad de transmitir un mensaje de voz, teniendo lugar la grabación del mensaje de voz solamente cuando se obtiene una entrada de voz confirmativa.
8. Sistema de diálogo de voz que puede ser controlado sobre el enlace de telecomunicaciones por un terminal de comunicaciones, con una unidad receptora para recibir un elemento de habla transmitido desde el terminal de comunicaciones, una unidad de síntesis de texto para convertir el elemento de habla en texto, y con una unidad de proceso para analizar el elemento de habla en cuanto a contenido de la expresión, teniendo asignada la unidad de proceso una memoria en la cual puede depositarse el elemento de habla, y estando dispuesta la unidad de proceso para analizar el elemento de habla recibido, después de haberse interrumpido el enlace de telecomunicaciones, donde el sistema de diálogo de voz está dispuesto para ejecutar el proceso como se reivindica en una de las reivindicaciones 1 a 7.
Patentes similares o relacionadas:
Servicios sensibles al contexto, del 24 de Junio de 2020, de Nokia Technologies OY: Un método que comprende: recibir, en un dispositivo inalámbrico , señales de sensor que caracterizan una o más condiciones ambientales, […]
Método y aparato de intercambio de información, del 20 de Mayo de 2020, de Advanced New Technologies Co., Ltd: Un método de intercambio de información, realizado en un dispositivo terminal, caracterizado porque el método comprende: determinar […]
Exhibición de voz, del 20 de Marzo de 2019, de Alibaba Group Holding Limited: Método que comprende: establecer una conexión de llamada mediante un sistema de respuesta de voz interactiva (IVR), proporcionando […]
Procedimiento y sistema para introducir información en un terminal móvil y terminal móvil, del 22 de Octubre de 2018, de TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED: Un procedimiento para introducir información en un terminal móvil, comprendiendo el procedimiento: el envío a un servidor por un móvil de una […]
Sistema para dejar y recuperar mensajes, del 23 de Mayo de 2018, de Google LLC: Un sistema para acceder a mensajes en una ubicación particular, el sistema comprende: un receptor configurado para recibir señales de identificación desde […]
Direccionamiento universal de un interlocutor de una comunicación mediante asignación estática transparente de un número de teléfono, del 19 de Julio de 2017, de DEUTSCHE TELEKOM AG: Método para establecer una conexión de comunicación entre un abonado que hace la llamada A y un abonado que recibe la llamada B de un sistema de comunicación, en particular […]
Sistema y método de diálogo de múltiples intervalos, del 22 de Febrero de 2017, de 24/7 Customer, Inc: Un sistema para construir y procesar un diálogo de múltiples intervalos con un usuario, que comprende: un procesador; e instrucciones de software que cuando se ejecutan […]
Procedimiento y producto de programa de ordenador para la reproducción acústica configurable de manera automatizada y el procesamiento de contenidos de páginas de Internet, del 9 de Febrero de 2016, de Bayar, Seher: Procedimiento para la reproducción acústica configurable de manera automatizada de fuentes de texto accesibles a través de Internet, comprendiendo los siguientes pasos: […]