Procedimiento de selección de un micrófono entre dos o más micrófonos, para un sistema de tratamiento de la palabra, como un dispositivo telefónico "manos libres" que opera en un entorno ruidoso.
Un procedimiento de selección de un micrófono entre dos o más micrófonos,
para un sistema multimicrófono de tratamiento de la palabra que opera en un entorno ruidoso, estando cada uno de los micrófonos asociado a un canal y siendo apto para captar una señal acústica ruidosa que comprende una componente útil de palabra procedente de una fuente principal (s(t)) de señal acústica mezclada con una componente de ruido difusa, comprendiendo este procedimiento las etapas siguientes:
- digitalización de las señales acústicas captadas simultáneamente por los dos micrófonos (N, M);
- transformación de las señales (xn(t), xm(t)) captadas sobre los dos canales, de forma que se produzca una sucesión de tramas en una serie de bandas de frecuencias;
- aplicación de un algoritmo de cálculo de un índice de presencia de palabra sobre cada canal;
- selección de uno de los dos micrófonos por aplicación a las tramas sucesivas de cada uno de los canales de una regla de decisión en función tanto de un criterio de selección de canal como de dicho índice de presencia de palabra; e
- implementación del tratamiento de la palabra a partir de la señal acústica captada por el único micrófono seleccionado, procedimiento caracterizado por que:
- dicha transformación de las señales (xn(t), xm(t)) captadas sobre los dos canales es una transformación de Fourier a corto plazo;
- dicho índice de presencia de palabra es un índice de confianza calculado para cada banda de frecuencias de cada trama; y
- dicho criterio de selección se calcula por bandas de frecuencias sobre las únicas bandas de frecuencias cuyo índice de confianza es superior a un primer canal dado.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2010/050888.
Solicitante: PARROT.
Nacionalidad solicitante: Francia.
Dirección: 174 QUAI DE JEMMAPES 75010 PARIS FRANCIA.
Inventor/es: Pinto,Guillaume, Vitte,Guillaume, BRIOT,ALEXANDRE.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04M9/08 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04M COMUNICACIONES TELEFONICAS (circuitos para el control de otros aparatos vía cable telefónico y que no implican aparatos de conmutación telefónica G08). › H04M 9/00 Disposiciones de interconexión no comprendiendo conmutación centralizada. › Sistemas telefónicos con altavoz de doble dirección con medios para acondicionara la señal, p. ej. para suprimir ecos para uno u otra dirección de tráfico.
PDF original: ES-2433100_T3.pdf
Fragmento de la descripción:
Procedimiento de selección de un micrófono entre dos o más micrófonos, para un sistema de tratamiento de la palabra, como un dispositivo telefónico “manos libres” que opera en un entorno ruidoso La invención se refiere al tratamiento de la palabra en un medio ruidoso.
Se refiere, en particular, pero de forma no limitativa, al tratamiento de las señales de palabra captadas por
dispositivos de tipo “manos libres” para vehículos automóviles.
Estos aparatos incorporan un micrófono (“micro”) sensible que capta no solamente la voz del usuario, sino igualmente el ruido circundante, ruido que constituye un elemento perturbador hasta el punto de que, en ciertos casos, puede hacer incomprensibles las palabras del locutor. Lo mismo sucede si se quieren emplear técnicas de reconocimiento de voz, pues es muy difícil efectuar un reconocimiento de forma sobre palabras ahogadas en un nivel de ruido intenso.
Esta dificultad conectada con el ruido ambiente es particularmente restringente en el caso de los dispositivos “manos libres” para vehículos automóviles. En particular, la distancia considerable entre el micro y el locutor provoca un nivel
relativo de ruido intenso que hace difícil la extracción de la señal útil ahogada en el ruido. Asimismo, el medio muy ruidoso típico del entorno automovilístico presenta características espectrales no constantes, es decir que evolucionan de manera imprevisible en función de las condiciones de la conducción: paso por calzadas deformadas o adoquinadas, radio del coche en funcionamiento, etc.
Algunos de estos dispositivos prevén la utilización de varios micros, generalmente dos micros, y utilizan la media de las señales captadas, u otras operaciones más complejas, para obtener una señal con un nivel de perturbaciones menor. En particular, una técnica llamada beamforming emplea una red de micrófonos para crear, por medios software relativamente simples, una directividad que permite mejorar la relación señal/ruido. Esta técnica presupone, sin embargo, que la posición del locutor con relación a los micros sea casi constante, lo que generalmente es el caso respecto de un teléfono de coche utilizado por el conductor (pero no por el pasajero) .
Con carácter general, en todas las técnicas referidas de beamforming, para obtener una eficacia casi satisfactoria se requiere un número importante (al menos superior a cuatro) de micrófonos, lo que no es el caso en la mayoría de las aplicaciones industriales.
Por esta razón, se utilizan más a menudo técnicas que implementan un solo micro.
En este caso es preferible utilizar un micro unidireccional, que ofrezca una mejor relación señal/ruido, pero en una sola dirección fija y, por tanto, para una sola posición del locutor.
Dicho dispositivo “manos libres” para vehículo automóvil se describe por ejemplo en el documento WO 2008/049982 A1 (Parrot SA) , que describe los diversos tratamientos de anulación y de supresión de eco, de supresión de ruido, etc., aplicados a una señal captada por un único micro que recoge la señal acústica (ruidosa) del locutor próximo.
La invención tiene por objetivo dicho sistema de tratamiento de la palabra que no utiliza más que un solo micro (por tanto, diferente de los sistemas de tipo beamforming u otros) , pero en el que este (único) micro se selecciona automáticamente entre dos micros distintos, o entre varios micros de una red de micrófonos.
El objetivo de la invención consiste en proponer un procedimiento que permita determinar entre estos dos micros o entre todos los micros de la red, aquel que capte la señal de palabra menos ruidosa, para poder activar luego diversos tratamientos (eliminación del ruido, anulación del eco, etc.) sobre la señal captada por el micro así determinado, designado a continuación como “micro de referencia”.
Se conocen diversas técnicas de selección de un micrófono entre varios, por ejemplo en un dispositivo de teleconferencia como el que se describe en el documento EP 1 564 980 A1, que comprende varios micros dirigidos hacia los participantes instalados alrededor del dispositivo. Este documento describe medios de selección dinámica susceptibles de discriminar entre palabra y ruido para no activar en un instante dado más que el micro situado frente al locutor activo.
En el caso de un dispositivo de tipo “manos libres” para vehículo automóvil indicado con anterioridad, la situación más frecuente (aunque no limitativa) es la de un sistema de dos micros. Se contemplan entonces diversas configuraciones.
Una primera configuración consiste en prever dos micros direccionales situados bastante próximos uno de otro, por ejemplo en los dos extremos del frontal de una radio de automóvil situada en la parte central del habitáculo del vehículo, teniendo uno de los micros el lóbulo principal de su diagrama de directividad orientado hacia el conductor y el otro micro hacia el pasajero.
Otra configuración consiste en prever dos micros alejados, por ejemplo situados en la parte alta, en los ángulos extremos de la luz cenital del vehículo, o en los dos extremos del salpicadero del vehículo.
En uno u otro caso, el micro más eficaz para ser seleccionado es la mayor parte de las veces el que está dirigido hacia el locutor activo (ya sea el conductor o el pasajero) . Pero a veces puede ser necesario tener en cuenta situaciones particulares: así, en el caso de un motorista que adelantara al vehículo por la izquierda, podría ser preferible seleccionar el micro derecho, incluso si el locutor es el conductor.
El objetivo de la invención es proponer un sistema robusto de selección automática de micrófono para un sistema de dos micros (pudiendo evidentemente la invención aplicarse a la conmutación de un micro entre más de dos micros para la aplicación de los mismos algoritmos a cada par de micros posibles) .
La idea subyacente es que, cualquiera que sea la configuración de los micros (próximos o alejados) , es posible diferenciar las tomas de sonido efectuadas por cada uno de los micros partiendo de la hipótesis de que la señal captada por uno de los dos micros será mejor que la otra, es decir que uno de los micros estará en mejores condiciones de captar la señal deseada con menos perturbaciones o menos pérdidas que el otro micro.
Uno de los principios de base de la invención consiste en derivar a este efecto un índice de confianza de presencia de una palabra para cada uno de los dos canales correspondientes a los dos micros, y en condicionar la selección de uno o del otro de estos micros a una regla de decisión en función, entre otros factores, de este índice de confianza de presencia de una palabra.
Este principio permite acrecentar de forma sustancial la robustez de la selección del micro de referencia en el curso del tiempo, en función de los resultados calculados sin interrupción, adaptando esta selección a la evolución de las diversas desviaciones y a las variaciones del entorno acústico.
Los objetivos mencionados se obtienen mediante un procedimiento de tipo general divulgado en el documento EP 1 564 980 A1 precitado, es decir, mediante un procedimiento de selección de un micrófono entre dos o más micrófonos, para un sistema multimicrófono de tratamiento de la palabra que opera en un entorno ruidoso, estando cada uno de los micrófonos asociado a un canal y siendo cada uno de los micrófonos apto para captar una señal acústica ruidosa que comprende un componente útil de palabra emitida por una fuente principal de señal acústica mezclada con un componente de ruido difuso. Este procedimiento comprende las etapas de:
-digitalización de las señales acústicas captadas simultáneamente por los dos micrófonos:
-ejecución de una transformación de las señales captadas sobre los dos canales, para producir una sucesión de tramas en una serie de bandas de frecuencias:
-aplicación de un algoritmo de cálculo de un índice de presencia de palabra sobre cada canal;
-selección de uno de los dos micrófonos por aplicación a las tramas sucesivas de cada uno de los canales de una regla de decisión en función tanto de un criterio de selección de canal como de dicho índice de presencia de palabra; e
-implementación del tratamiento de la palabra a partir de la señal acústica captada por el único micrófono seleccionado.
De manera característica de la invención:
-la transformación de las señales captadas por los dos canales es una transformación de Fourier a corto plazo;
-el índice de presencia de palabra es un índice de confianza calculado para cada banda... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento de selección de un micrófono entre dos o más micrófonos, para un sistema multimicrófono de tratamiento de la palabra que opera en un entorno ruidoso, estando cada uno de los micrófonos asociado a un canal y siendo apto para captar una señal acústica ruidosa que comprende una componente útil de palabra procedente de una fuente principal (s (t) ) de señal acústica mezclada con una componente de ruido difusa, comprendiendo este procedimiento las etapas siguientes:
-digitalización de las señales acústicas captadas simultáneamente por los dos micrófonos (N, M) ;
-transformación de las señales (xn (t) , xm (t) ) captadas sobre los dos canales, de forma que se produzca una sucesión de tramas en una serie de bandas de frecuencias;
-aplicación de un algoritmo de cálculo de un índice de presencia de palabra sobre cada canal;
-selección de uno de los dos micrófonos por aplicación a las tramas sucesivas de cada uno de los canales de una regla de decisión en función tanto de un criterio de selección de canal como de dicho índice de presencia de palabra; e
-implementación del tratamiento de la palabra a partir de la señal acústica captada por el único micrófono seleccionado,
procedimiento caracterizado por que:
-dicha transformación de las señales (xn (t) , xm (t) ) captadas sobre los dos canales es una transformación de Fourier a corto plazo;
-dicho índice de presencia de palabra es un índice de confianza calculado para cada banda de frecuencias de cada trama; y
-dicho criterio de selección se calcula por bandas de frecuencias sobre las únicas bandas de frecuencias cuyo índice de confianza es superior a un primer canal dado.
2. El procedimiento de la reivindicación 1, que comprende también una etapa de eliminación, en las tramas sucesivas, de las bandas de frecuencias situadas por debajo de un segundo umbral dado.
3. El procedimiento de la reivindicación 1, en el que el índice de confianza de presencia de palabra es una probabilidad de presencia de palabra.
4. El procedimiento de la reivindicación 1, en el que el índice de confianza de presencia de palabra se calcula para cada banda de frecuencias y dicha selección se aplica si el índice es superior a un tercer umbral dado, en un número de bandas de frecuencias superior a un cuarto umbral dado.
5. El procedimiento de la reivindicación 1, en el que:
-dicho sistema multimicrófono de tratamiento de la palabra es un sistema con micrófonos directivos próximos, y
-dicho criterio de selección de canal es un criterio angular basado en una comparación de las fases respectivas de las señales captadas de forma simultánea sobre los dos canales, siendo el micrófono que hay que seleccionar aquel para el que la señal se capta antes que el otro.
6. El procedimiento de la reivindicación 1, en el que:
-dicho sistema multimicrófono de tratamiento de la palabra es un sistema con micrófonos directivos o no directivos alejados, y
-dicho criterio de selección de canal es un criterio energético basado en una comparación de los valores de relación señal/ruido respectivos de las señales captadas de forma simultánea sobre los dos canales, siendo el micrófono que hay que seleccionar aquel para el que la relación señal/ruido es superior al otro.
7. El procedimiento de la reivindicación 1, en el que la selección de uno de los dos micrófonos se aplica condicionalmente sólo si dicha regla de decisión se verifica sobre un número de tramas sucesivas superior a un quinto umbral dado.
8. El procedimiento de la reivindicación 1, en el que si se ha decidido una selección de uno de los micrófonos, ésta se aplica de forma progresiva durante un periodo de tiempo de transición dado, por aplicación de una ganancia creciente en el canal del micrófono que hay que seleccionar y de una ganancia decreciente en el canal del micrófono que no hay que seleccionar.
Patentes similares o relacionadas:
Procedimiento para realizar una función y dispositivo electrónico que soporta el mismo, del 10 de Abril de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento para realizar una función en un dispositivo electrónico que incluye una pantalla , comprendiendo el procedimiento: […]
Teléfono móvil y método para procesar señal de llamadas del mismo, del 23 de Enero de 2019, de Huizhou Tcl Mobile Communication Co., Ltd: Un método para procesar una señal de llamada de un teléfono móvil, comprendiendo el teléfono móvil un micrófono principal , un submicrófono , un […]
Procesamiento de la señal de audio en un sistema de comunicación, del 14 de Marzo de 2018, de KONINKLIJKE PHILIPS N.V: Equipo de comunicaciones para uso por un centro de llamadas para permitir las comunicaciones entre el centro de llamadas y uno o más dispositivos […]
Cancelador de eco y procedimiento de cancelación de eco, del 16 de Agosto de 2017, de ZTE CORPORATION: Cancelador de eco, que comprende: un filtro autoadaptativo , una parte de detección de señal de voz y una parte de detección de cambio de trayectoria, […]
Determinar la distancia y/o calidad acústica entre un dispositivo móvil y una unidad de base, del 2 de Agosto de 2017, de KONINKLIJKE PHILIPS N.V: Un método de determinación de la distancia y/o calidad acústica entre un dispositivo móvil que tiene un micrófono y un altavoz y una unidad de base que […]
Aparato, procedimiento y programa para computar la información de control para un filtro de supresión de eco, del 12 de Julio de 2017, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para computar información de control para un filtro de supresión para filtrar una segunda señal de audio para suprimir un eco […]
Cálculo de una respuesta de impulso de sala para cancelación de eco acústico, del 12 de Octubre de 2016, de Microsoft Technology Licensing, LLC: Un método para calcular una respuesta de impulso de sala entre una fuente de audio y una disposición de micrófonos , que comprende: recibir […]
Aparato y método para calcular coeficientes de filtro para supresión de eco, del 1 de Junio de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para el calculo de coeficientes de filtro para un filtro adaptativo para filtrar una senal de microfono con el fin de suprimir un eco debido […]