Sistema de diálogo de voz con proceso para evitar rechazos.

Proceso para operar con un sistema de diálogo de voz, que puede ser controlado sobre un enlace de telecomunicaciones por un terminal de comunicaciones

, comprendiendo el proceso los pasos de: recibir un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz y analizar el elemento de habla en cuanto a contenido de la expresión en una unidad de proceso, siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso, y siendo analizado por la unidad de proceso después de haberse interrumpido el enlace de telecomunicaciones, en una unidad de síntesis de texto que convierte el elemento de habla en texto y analiza este texto en cuanto al contenido de la expresión, teniendo lugar el análisis de tal forma que se examina el elemento de habla convertido para ver si ocurre al menos un cierto término, y es asignado a un cierto asunto en el caso en que se encuentre el término, transmitiendo por el sistema de diálogo de voz un compromiso de servicio al terminal de comunicaciones, después de la conversión del elemento de habla en texto, estableciendo por el sistema de diálogo de voz, después del análisis del elemento de habla, un enlace de telecomunicaciones al terminal de comunicaciones y conectando el terminal de comunicaciones a un servicio, un responsable del servicio o nuevamente al sistema de diálogo de voz.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/005704.

Solicitante: DEUTSCHE TELEKOM AG.

Nacionalidad solicitante: Alemania.

Dirección: FRIEDRICH-EBERT-ALLEE 140 53113 BONN ALEMANIA.

Inventor/es: LIEDTKE,KLAUS-DIETER, MARKEFKA,GUNTBERT.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > COMUNICACIONES TELEFONICAS (circuitos para el control... > Centrales automáticas o semiautomáticas > H04M3/493 (Servicios de información interactivos, p. ej. petición de información del directorio telefónico)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > COMUNICACIONES TELEFONICAS (circuitos para el control... > Centrales automáticas o semiautomáticas > H04M3/50 (Disposiciones centralizadas para responder a las llamadas; Dispositivos centralizados para registrar mensajes para abonados ausentes u ocupados (H04M 3/487 tiene prioridad; sistemas de dictado centralizado H04M 11/10))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Reconocimiento de la voz (G10L 17/00 tiene prioridad) > G10L15/22 (Procedimientos utilizados durante el proceso de reconocimiento de la voz, p. ej. diálogo hombre-máquina)

PDF original: ES-2513831_T3.pdf

 

google+ twitter facebookPin it
Sistema de diálogo de voz con proceso para evitar rechazos.
Sistema de diálogo de voz con proceso para evitar rechazos.
Sistema de diálogo de voz con proceso para evitar rechazos.

Fragmento de la descripción:

Sistema de diálogo de voz con proceso para evitar rechazos

La invención está relacionada con un proceso para operar con un sistema de diálogo de voz que puede ser controlado sobre un enlace de telecomunicaciones por medio de un terminal de comunicaciones, un elemento de habla transmitido por el terminal de comunicaciones que es recibido por una unidad receptora del sistema de diálogo de voz y que es analizado en cuanto a contenido del enunciado en una unidad de proceso. Además, la invención está relacionada con el sistema de diálogo de voz en el cual se utiliza este proceso genérico.

En la publicación del documento US 272846 A1 se divulga un proceso para operar con tal sistema de diálogo de voz. Este documento se refiere a un método en el cual se devuelve la llamada al llamador por medio de un agente de servicio que depende de la cantidad de tiempo que transcurrirá antes de que el agente sea capaz de devolver la llamada al llamador, debido a otros llamadores en la cola. Además, la publicación EP 1 575 31 A2 describe una solución para el problema de tratar con pronunciaciones no reconocidas de un usuario, comparando primero el elemento de habla con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y se transmite otro elemento de habla por el terminal de comunicaciones y se convierte a texto solamente en ausencia de concordancia- En los documentos US 23 64716 A1 y US 27 2857 A1 se describen sistemas de diálogo de voz adicionales.

Generalmente, los sistemas de diálogo de voz se utilizan en las redes de telecomunicaciones, especialmente en el dominio de la red fija y de la red de teléfonos móviles, para encaminar a un llamador de una manera exclusiva a través de una oferta de servicios compleja. El llamador puede utilizar por ejemplo un teléfono de la red fija o un teléfono móvil como terminal de comunicaciones. El sistema de diálogo de voz acepta una llamada del llamador y se procesa del tal forma que el llamador hace las preguntas de manera totalmente automática utilizando el habla natural, con el fin de determinar lo que desea el llamador. El llamador puede llevar a cabo diálogos automáticos parcial o totalmente, con el sistema de diálogo de voz que es denominado también como portal de voz.

Es común una forma especialmente sencilla del sistema de diálogo de voz en forma de reconocimiento de palabras individuales, que es denominado también como respuesta interactiva de voz (IVR). Es posible utilizar la navegación de voz sencilla de IVR en los sistemas de telefonía. Por ejemplo, el sistema de diálogo de voz pregunta al llamador de la manera siguiente:

Si su solicitud está relacionada con una factura, por favor diga factura

Si su solicitud está relacionada con una queja, por favor diga queja

Si desea hablar con un responsable, por favor diga responsable

Después de que el sistema de diálogo de voz haya hecho todas las preguntas, espera una entrada de voz del llamador. Acto seguido, el llamador se expresa verbalmente desvelando al sistema de diálogo de voz, a través del teléfono, un elemento de habla en forma de una palabra. En ese momento tiene lugar un proceso de reconocimiento del habla automáticamente.

El proceso de reconocimiento del habla está basado en la comparación de la señal de la expresión acústica específica del llamador con palabras almacenadas como elementos de habla. SI se averigua que el elemento de habla transmitido es concordante con la palabra almacenada, se considera que la expresión es reconocida y se puede disparar una acción fija en el sistema de diálogo de voz. Por ejemplo, el sistema de diálogo de voz puede pasar a un submenú y, desde él, otros encabezamientos del submenú pueden hacer las preguntas pertinentes. Alternativamente, el sistema de diálogo de voz puede iniciar también directamente un cierto servicio después del reconocimiento de la expresión, y el llamador abandona el sistema de diálogo de voz.

Cuando se reconoce la expresión del llamador, en el actual sistema de diálogo de voz se ejecuta un rechazo no amistoso para el usuario, que se refleja en una expresión desde el sistema de diálogo de voz de la forma siguiente: Desafortunadamente, no pude comprenderle, repita por favor. El sistema de diálogo de voz solicita una entrada de voz repetida. Para el llamador, la expresión repetida es pesada y le conduce a permanecer más tiempo en el sistema de diálogo. El llamador se pone entonces impaciente e insatisfecho; esto puede conducir a que el operador del portal de habla pierda al llamador como cliente o como cliente potencial.

Es por tanto el objeto de la invención hacer disponible un proceso para operar con un sistema de diálogo de voz y un sistema de diálogo de voz que, en el caso de expresiones de un cliente que sean difíciles de comprender, asegure un proceso fiable y atinado de la solicitud del llamador, sin tener que hacer necesariamente que el usuario repita su expresión, y por tanto que permanezca involuntaria y desagradablemente mucho tiempo en el sistema de diálogo de voz.

Este objeto se consigue con las características de las reivindicaciones 1 y 8. En las respectivas reivindicaciones dependientes se describen desarrollos ventajosos de la invención.

Como se reivindica en la invención, se sugiere un proceso para operar con un sistema de diálogo de voz que, por medio del enlace de telecomunicaciones, se puede conectar a un terminal de comunicaciones y puede ser controlado por el terminal de comunicaciones, siendo recibido un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz, y siendo analizado en cuanto al contenido de la expresión en una unidad de proceso, y siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso y, después de interrumpir el enlace de telecomunicaciones, se analiza en la unidad de proceso.

La idea básica de esta invención consiste en que el sistema de diálogo de voz analiza la solicitud de un llamador en su ausencia. Esto tiene lugar en un proceso en segundo plano y se consigue analizando el mensaje de voz después de interrumpir el enlace de telecomunicaciones. Como contraste a la operación de diálogo del sistema de diálogo de voz, que se caracteriza por un escenario de pregunta-respuesta llamado también funcionamiento síncrono, en el cual el análisis del elemento de habla transmitido por el llamador tiene lugar directamente, es decir, mientras está conectado al sistema de diálogo de voz, el análisis del elemento de habla recibido como se reivindica en la invención, tiene lugar solamente después de que se interrumpa el enlace de las comunicaciones, es decir, en funcionamiento asincrono. Este empleo del tiempo para el análisis en este caso no molesta al llamador. Por tanto, no necesita esperar a que el sistema de diálogo de voz haya encontrado una concordancia con el fin de contestar después una pregunta repetida del sistema de diálogo de voz. En lugar de eso, el reconocimiento de la solicitud del llamador tiene lugar analizando el mensaje de voz sin la presencia del llamador. Así ahorra tiempo y, por tanto, queda satisfecho y contento por la aceptación de su solicitud.

En un ventajoso desarrollo de la invención, el elemento de habla es convertido en texto, en una unidad de síntesis de texto, siendo analizado este texto en cuanto a contenido de la expresión. Al hacer disponible un análisis orientado a un alto éxito, se puede conseguir calidad por medio de este análisis basado en texto del elemento de habla. Esto se facilita mediante la conversión del elemento de habla en texto (habla-a-texto). Tal conversión de texto-a-habla facilita un tratamiento más sencillo del mensaje de voz y la aplicación de algoritmos de búsqueda para el análisis.... [Seguir leyendo]

 


Reivindicaciones:

1. Proceso para operar con un sistema de diálogo de voz, que puede ser controlado sobre un enlace de telecomunicaciones por un terminal de comunicaciones, comprendiendo el proceso los pasos de:

recibir un elemento de habla transmitido por el terminal de comunicaciones por una unidad receptora del sistema de diálogo de voz y analizar el elemento de habla en cuanto a contenido de la expresión en una unidad de proceso, siendo depositado el elemento de habla en una memoria asignada a la unidad de proceso, y siendo analizado por la unidad de proceso después de haberse interrumpido el enlace de telecomunicaciones, en una unidad de síntesis de texto que convierte el elemento de habla en texto y analiza este texto en cuanto al contenido de la expresión, teniendo lugar el análisis de tal forma que se examina el elemento de habla convertido para ver si ocurre al menos un cierto término, y es asignado a un cierto asunto en el caso en que se encuentre el término, transmitiendo por el sistema de diálogo de voz un compromiso de servicio al terminal de comunicaciones, después de la conversión del elemento de habla en texto, estableciendo por el sistema de diálogo de voz, después del análisis del elemento de habla, un enlace de telecomunicaciones al terminal de comunicaciones y conectando el terminal de comunicaciones a un servicio, un responsable del servicio o nuevamente al sistema de diálogo de voz.

2. El proceso como se reivindica en la reivindicación 1, en el que el elemento de habla se compara primero con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y es convertido en texto solamente en ausencia de concordancia.

3. El proceso como se reivindica en la reivindicación 1 o 2, en el que el elemento de habla es un mensaje de voz que comprende varias palabras habladas.

4. El proceso como se reivindica en la reivindicación 1, en el que el elemento de habla se compara primero con un elemento de habla depositado en una memoria asignada a la unidad de proceso, y se transmite otro elemento de habla por el terminal de comunicaciones y se convierte en texto solamente en ausencia de concordancia.

5. El proceso como se reivindica en la reivindicación 4, en el que el otro elemento de habla es un mensaje de voz que comprende varias palabras habladas.

6. El proceso como se reivindica en la reivindicación 5 en el que, tras establecer una falta de concordancia, el sistema de diálogo de voz indica la posibilidad de transmitir un mensaje de voz.

7. El proceso como se reivindica en la reivindicación 6, en el que el sistema de diálogo de voz espera una entrada de voz tras indicar la posibilidad de transmitir un mensaje de voz, teniendo lugar la grabación del mensaje de voz solamente cuando se obtiene una entrada de voz confirmativa.

8. Sistema de diálogo de voz que puede ser controlado sobre el enlace de telecomunicaciones por un terminal de comunicaciones, con una unidad receptora para recibir un elemento de habla transmitido desde el terminal de comunicaciones, una unidad de síntesis de texto para convertir el elemento de habla en texto, y con una unidad de proceso para analizar el elemento de habla en cuanto a contenido de la expresión, teniendo asignada la unidad de proceso una memoria en la cual puede depositarse el elemento de habla, y estando dispuesta la unidad de proceso para analizar el elemento de habla recibido, después de haberse interrumpido el enlace de telecomunicaciones, donde el sistema de diálogo de voz está dispuesto para ejecutar el proceso como se reivindica en una de las reivindicaciones 1 a 7.