AURICULARES INALAMBRICOS PARA SU UTILIZACION EN UN ENTORNO DE RECONOCIMIENTO POR VOZ.

Un sistema para comunicaciones inalámbricas que usa reconocimiento del habla y comprende un dispositivo (10,

20) para recibir señales de habla, un auricular (16) con un micrófono (70) para captar señales de audio, comprendiendo dicho auricular circuitos de digitalización (42) dispuestos para formar representaciones digitalizadas de las señales de audio, y circuitos de proceso (30) dispuestos para procesar las representaciones digitalizadas usando circuitos de reconocimiento del habla y transmitir inalámbricamente al dispositivo (10, 20), caracterizado por el hecho de que los circuitos de proceso (30) ejecutan el proceso de reconocimiento del habla de etapa final, siendo los circuitos de proceso operables para formar representaciones espectrales muestreadas de las representaciones digitalizadas y después procesar las representaciones espectrales muestreadas para determinar que las señales de audio captadas incluyen el habla del usuario, incluyendo los circuitos de proceso (30) circuitos conversores (48) dispuestos para controlar la transmisión al dispositivo (10, 20), siendo las representaciones espectrales muestreadas transmitidas al dispositivo (10, 20) solo cuando se detecta el habla del usuario, y no transmitiendo los circuitos de proceso (30) al dispositivo cuando no es detectada el habla del usuario, y en que el dispositivo (10, 20) incluye circuitos de proceso de reconocimiento del habla de etapa final (62) para procesar además las representaciones espectrales transmitidas por el auricular (16) para completar el reconocimiento del habla

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2004/007891.

Solicitante: VOCOLLECT, INC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 703 RODI ROAD,PITTSBURGH, PENNSYLVANIA 15235.

Inventor/es: LOGAN, JAMES RANDALL, BYFORD,ROGER,GRAHAM, MCNAIR,ARTHUR,EUGENE, ZOSCHG,RYAN,ANTHONY.

Fecha de Publicación: .

Fecha Concesión Europea: 21 de Abril de 2010.

Clasificación Internacional de Patentes:

  • H04M1/60T2B2

Clasificación PCT:

  • H04M1/05 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04M COMUNICACIONES TELEFONICAS (circuitos para el control de otros aparatos vía cable telefónico y que no implican aparatos de conmutación telefónica G08). › H04M 1/00 Equipos de subestaciones, p. ej. para utilización por el abonado (servicios de abonado o instalaciones proporcionadas en las centrales H04M 3/00; aparatos con fichas de pago previo H04M 17/00; disposiciones de suministro de corriente H04M 19/08). › adaptados para el uso sobre la cabeza, la garganta o el pecho.
  • H04M1/27 H04M 1/00 […] › Dispositivos en los cuales varias señales pueden ser registradas simultáneamente.
  • H04M1/60 H04M 1/00 […] › incluyendo amplificadores de voz.
  • H04M9/08 H04M […] › H04M 9/00 Disposiciones de interconexión no comprendiendo conmutación centralizada. › Sistemas telefónicos con altavoz de doble dirección con medios para acondicionara la señal, p. ej. para suprimir ecos para uno u otra dirección de tráfico.

Clasificación antigua:

  • H04M1/05 H04M 1/00 […] › adaptados para el uso sobre la cabeza, la garganta o el pecho.
  • H04M1/27 H04M 1/00 […] › Dispositivos en los cuales varias señales pueden ser registradas simultáneamente.
  • H04M1/60 H04M 1/00 […] › incluyendo amplificadores de voz.
  • H04M9/08 H04M 9/00 […] › Sistemas telefónicos con altavoz de doble dirección con medios para acondicionara la señal, p. ej. para suprimir ecos para uno u otra dirección de tráfico.
AURICULARES INALAMBRICOS PARA SU UTILIZACION EN UN ENTORNO DE RECONOCIMIENTO POR VOZ.

Fragmento de la descripción:

Auriculares inalámbricos para su utilización en un entorno de reconocimiento por voz.

Campo de la invención

Esta invención se refiere generalmente a los terminales de ordenador móviles o portátiles y a los auriculares utilizados en los sistemas activados por voz que tengan capacidades de reconocimiento de voz.

Antecedentes de la invención

Los terminales o dispositivos informáticos llevables, móviles y/o portátiles se usan para una amplia variedad de tareas. Dichos dispositivos o terminales permiten a los trabajadores que los usan mantener la movilidad, proporcionando al mismo tiempo al trabajador funciones deseables de computación y proceso de datos. Además, dichos terminales pueden proporcionar un enlace de comunicación a un sistema informático mayor más centralizado, que además maneje la organización de las tareas a ejecutar. Un sistema integrado global puede implicar una combinación de un sistema informático central para seguir y gestionar las tareas, una pluralidad de dispositivos o terminales móviles o y periféricos asociados y las personas ("usuarios") que usen los terminales y la interfaz con los terminales y/o el sistema informático.

Para proporcionar una interfaz entre el sistema informático central y los trabajadores, los terminales llevables y los sistemas a los que están conectados a menudo son activados por voz; esto es, activados mediante el habla humana. Como tal, el ordenador central y los terminales incorporan tecnología de reconocimiento de voz. Para comunicarse en un sistema activado por voz, por ejemplo, deben pasar señales de habla hacia dentro y hacia fuera de los dispositivos o terminales portátiles para proporcionar el interfaz de habla adecuado con un usuario. Mediante la interfaz de habla, los trabajadores son capaces de recibir instrucciones de voz, hacer preguntas, informar del progreso de sus tareas e informar de las condiciones de trabajo, por ejemplo de escasez de inventario. Usando dichas terminales, el trabajo se hace prácticamente sin manos, sin tener que cargar equipos ni llevar papeles encima.

Hay varias formas de hacer pasar las señales de habla hacia dentro y hacia fuera de un terminal u otro dispositivo. Por ejemplo, pueden usarse un micrófono y un altavoz ubicados en el terminal portátil actual. Sin embargo, un dispositivo así puede no resultar práctico en muchos entornos. Como puede apreciarse, dichos sistemas a menudo son utilizados en ambientes ruidosos donde los trabajadores están expuestos a diversos ruidos extraños que pueden afectar a la calidad de su comunicación de voz con su terminal y el sistema informático central. Un terminal portátil, montado sobre una cinturón u otro dispositivo para asegurarlo al usuario, podría quedar demasiado lejos de la boca del usuario para una comunicación efectiva. Por tanto, tienen que utilizarse técnicas de captación de voz más aisladas o direccionales, como auriculares.

Los auriculares con cable tradicionales son bastante populares para terminales o dispositivos portátiles y requieren un cable que vaya desde el auricular hasta el terminal. Un auricular normalmente incluye un micrófono y uno o más hablantes.

El terminal incluye una toma apropiada a acoplar con un conector o clavija del cable del auricular, y también incluye electrónica de proceso de audio para procesar las señales de habla enviadas desde/a el auricular. Una configuración tradicional como esta presenta algunos inconvenientes. Por ejemplo, el cable desde el terminal hasta el auricular resulta a menudo incómodo, pues puede enredarse o engancharse, interrumpiendo el curso del trabajo. Además, el terminal debe estar configurado específicamente para el auricular y, por tanto, está limitado a usarse con un auricular específico, y viceversa.

Más aún, si la electrónica de proceso de audio del terminal es limitada, el rendimiento del terminal estará igualmente limitado como dispositivo interfaz activado por voz, porque el auricular proporciona solo un micrófono y altavoces para gestionar señales de audio puras.

Para enfrentarse a algunas de estas cuestiones, como el cable auricular-terminal, se propone usar un periférico inalámbrico, como un auricular inalámbrico, para comunicarse con el terminal. Un auricular inalámbrico (p. ej., que use hardware WPAN Blue Tooth) elimina la necesidad de un conector específico y de un cable para el auricular. Sin embargo, dicho sistema inalámbrico también tiene varios inconvenientes.

Por ejemplo, dicho auricular que usa tecnología inalámbrica tradicional, como Blue Tooth, debe transmitir señales continuamente al terminal móvil. Esto requiere que se envíen cantidades sustanciales de datos y ciclos de transmisión. Por eso comporta ciertas implicaciones.

La transmisión constante consume rápidamente la necesariamente pequeña batería que debería utilizarse en un auricular inalámbrico.

Además, dicha transmisión continua expone a un usuario a jornada completa (esto es, cuarenta horas por semana) a continuas transmisiones RF cercanas a la cabeza del usuario. Cosa que no es muy conveniente.

Además, usar la tecnología de auricular inalámbrico existente para un sistema activado por voz requiere que el terminal esté configurado para gestionar la considerable tarea de procesar todo el audio, además del proceso de reconocimiento de voz.

Por tanto, los auriculares inalámbricos no serán útiles con terminales que no tengan ciertas capacidades de audio o potencia de procesado. Como tales, los auriculares inalámbricos con la tecnología actual no son adecuados en sistemas activados por voz que utilizan tecnología de reconocimiento del habla. Además, dicha transmisión continua entre el auricular inalámbrico y el terminal inalámbrico todavía es necesaria con los sistemas existentes, ya que no es práctico poner un reconocedor y sintetizador del habla completo a nivel industrial en el interior de un auricular.

Por tanto, hay una particular necesidad de superar los diversos inconvenientes de la técnica anterior. Y además hay otra necesidad de conseguir las ventajas de un auricular inalámbrico dentro de un sistema activado por voz sin las características de transmisión a tiempo completo ahora requeridas. Hay una necesidad de proporcionar comunicación mediante auricular inalámbrico de forma asequible que asegure un funcionamiento adecuado de las prestaciones de reconocimiento por voz. La patente estadounidense publicada 2003/118.197 muestra un dispositivo auricular que recibe tanto habla como, a través de comunicaciones de radio de onda corta, sonidos externos que son captados por un micrófono de detección de sonido. Los sonidos externos se consideran sonidos directos. El auricular recibe tanto el habla como los sonidos directos, y está configurado para ajustar selectivamente la proporción de sonidos directos y el habla a usar por el auricular.

DE-A-2628259 muestra un sistema de intercomunicación para transportar señales de habla entre hablantes cuando hay mucho ruido ambiental de fondo. Específicamente, el sistema de intercomunicación utiliza un diplexor cuya frecuencia separa aquellas señales que pueden considerarse dentro de la banda normal del habla (p. ej. 300 Hz - 3000 Hz) de las de fuera del ruido de banda.

Por tanto, en base a la frecuencia, el sistema de intercomunicación determina que las señales entre 300 Hz y 3000 Hz pueden ser habla, y todas las demás señales fuera de esta banda pueden ser ruido.

La presente invención proporciona un auricular para la comunicación con un dispositivo, estando el auricular configurado para procesar señales de audio captadas por el auricular y para transmitir al dispositivo representaciones muestreadas de las señales de audio captadas, caracterizado por el hecho de que el auricular está configurado para procesar representaciones muestreadas de señales de audio captadas por el auricular y para usar circuitos de detección del habla para determinar que las señales de audio incluyen el habla del usuario, y por que el auricular además está configurado para transmitir representaciones muestreadas de las señales de audio captadas hacia el dispositivo, basándose en la determinación de que el habla del usuario es detectada en las señales de audio.

La presente invención también proporciona un método para comunicación inalámbrica entre un auricular y al menos un dispositivo, comprendiendo este método la captura de señales de audio con un auricular, el proceso de las señales de audio en el auricular y la transmisión de representaciones muestreadas de las señales de audio al dispositivo,...

 


Reivindicaciones:

1. Un sistema para comunicaciones inalámbricas que usa reconocimiento del habla y comprende un dispositivo (10, 20) para recibir señales de habla, un auricular (16) con un micrófono (70) para captar señales de audio, comprendiendo dicho auricular circuitos de digitalización (42) dispuestos para formar representaciones digitalizadas de las señales de audio, y circuitos de proceso (30) dispuestos para procesar las representaciones digitalizadas usando circuitos de reconocimiento del habla y transmitir inalámbricamente al dispositivo (10, 20), caracterizado por el hecho de que los circuitos de proceso (30) ejecutan el proceso de reconocimiento del habla de etapa final, siendo los circuitos de proceso operables para formar representaciones espectrales muestreadas de las representaciones digitalizadas y después procesar las representaciones espectrales muestreadas para determinar que las señales de audio captadas incluyen el habla del usuario, incluyendo los circuitos de proceso (30) circuitos conversores (48) dispuestos para controlar la transmisión al dispositivo (10, 20), siendo las representaciones espectrales muestreadas transmitidas al dispositivo (10, 20) solo cuando se detecta el habla del usuario, y no transmitiendo los circuitos de proceso (30) al dispositivo cuando no es detectada el habla del usuario, y en que el dispositivo (10, 20) incluye circuitos de proceso de reconocimiento del habla de etapa final (62) para procesar además las representaciones espectrales transmitidas por el auricular (16) para completar el reconocimiento del habla.

2. El sistema de la reivindicación 1, en el que el auricular (16) comprende circuitos de filtro de audio (44) configurados para formar las representaciones espectrales de las señales de audio.

3. El sistema de la reivindicación 1 o 2, en el que el auricular (16) comprende filtros (44) para crear las representaciones espectrales de las señales de audio captadas en forma de cuadros de señal, estando el auricular (16) configurado para transmitir los cuadros de señal.

4. El sistema de la reivindicación 3, en el que los filtros incluyen filtros de escala Mel (44) para generar los cuadros de señal.

5. El sistema de cualquiera de las reivindicaciones precedentes, en el que el dispositivo es un terminal portátil (10).

6. El sistema de cualquiera de las reivindicaciones 1 a 4 en el que el dispositivo es un ordenador (20).

7. El sistema de cualquiera de las reivindicaciones precedentes, que comprende además un segundo micrófono, estando el primer y segundo micrófonos (70) configurados para generar señales con el primer micrófono (70) para detectar una mayor proporción de sonidos del habla de un usuario que el segundo micrófono, estando los circuitos de proceso (30) configurados para procesar señales generadas por el primer y segundo micrófonos (70) para determinar si el usuario está hablando.

8. El sistema de cualquiera de las reivindicaciones precedentes en el que los circuitos de reconocimiento del habla de etapa final (62) comprenden circuitos de referencia de libro de encriptación.

9. El sistema de cualquiera de las reivindicaciones precedentes en el que los circuitos de reconocimiento del habla de etapa final comprenden circuitos de coincidencia de patrón.

10. Un método para comunicación inalámbrica entre un auricular (16) y un dispositivo (10, 20), comprendiendo el método los pasos de captar señales de audio con un auricular (16) que tiene un micrófono (70), formando representaciones digitalizadas de las señales de audio, procesando las representaciones digitalizadas usando circuitos de reconocimiento del habla y transmitiendo inalámbricamente al dispositivo (10, 20), caracterizado por el hecho de que el método comprende ejecutar reconocimiento del habla de etapa final en el auricular incluyendo la formación de representaciones espectrales muestreadas de las representaciones digitalizadas y el proceso de las representaciones espectrales muestreadas incluye el habla del usuario, y después usando circuitos conversores (48) para controlar la transmisión al dispositivo (10, 20) para transmitir las representaciones espectrales muestreadas al dispositivo (10, 20) solo cuando se detecta el habla del usuario, y en que el método además comprende proceso de reconocimiento del habla de etapa final en el dispositivo (10, 20) de las representaciones espectrales transmitidas por el auricular (16) para completar el reconocimiento del habla.

11. El método de la reivindicación 10, que comprende además el paso para formar las representaciones espectrales como cuadros de señal y transmitir los cuadros de señal.

12. El método de la reivindicación 11, que comprende además usar filtros de escala Mel (44) en el auricular (16) para generar los cuadros de señal.

13. El método de cualquiera de las reivindicaciones 10 a 12 en el que el dispositivo es un terminal portátil (10).

14. El método de cualquiera de las reivindicaciones 10 a 12 en el que el dispositivo es un ordenador (20).

15. El método de cualquiera de las reivindicaciones de 10 a 14, que comprende además el paso de captar señales de audio con un segundo micrófono ubicado en el auricular (16), detectando el primer micrófono (70) una mayor proporción de sonidos del habla de un usuario que el segundo micrófono, procesando las señales generadas por el primer y segundo micrófonos (70) para determinar si el usuario está hablando.

16. El método de cualquiera de las reivindicaciones de 10 a 15, en el que el proceso de reconocimiento del habla de etapa final comprende activar circuitos de referencia del libro de encriptación para producir valores del libro de encriptación.

17. El método de la reivindicación 16 en el que el proceso de reconocimiento del habla de etapa final comprende ejecutar un proceso de coincidencia de patrón con los valores del libro de encriptación.


 

Patentes similares o relacionadas:

Imagen de 'AURICULAR AUDITIVO'AURICULAR AUDITIVO, del 15 de Junio de 2010, de CELLPOINT CONNECT AB: Auricular para acoplamiento en la oreja de un usuario sin acoplamiento con el canal auditivo, incluyendo el auricular: - medios de altavoz […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Método para gestionar un acoplamiento de un dispositivo accesorio electrónico móvil, en particular unos cascos, con un terminal electrónico, del 8 de Abril de 2020, de DEUTSCHE TELEKOM AG: Método para la gestión de un acoplamiento de un dispositivo accesorio electrónico con un teléfono inteligente a través de una conexión […]

Dispositivo terminal de usuario y procedimiento de control del mismo, del 1 de Enero de 2020, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento de control de un dispositivo terminal de usuario que comprende: cuando se recibe un mensaje de solicitud de llamada (S115) […]

Método de control, unidad secundaria y equipo terminal de radio, del 25 de Diciembre de 2019, de Nokia Technologies OY: Un método para controlar un sistema de comunicación, comprendiendo el sistema de comunicación al menos un equipo terminal de radio y una o […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Equipos de comunicación para comunicación segura, del 11 de Septiembre de 2019, de SAVOX COMMUNICATIONS OY AB (LTD): Un dispositivo (101, 201, 201a) de interfaz de usuario que comprende: - una interfaz de usuario para recibir acciones de comando de un usuario, - un procesador […]

Procedimiento y dispositivo para determinar estado de terminal, y terminal, del 14 de Agosto de 2019, de Guangdong OPPO Mobile Telecommunications Corp., Ltd: Un procedimiento de control de una pantalla de un terminal, que comprende: transmitir (S101, S201), por un generador acústico de conducción ósea, una señal de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .