PROCEDIMIENTO Y DISPOSITIVO DE REDUCCION DE RUIDO.

Procedimiento de reducción de ruido en sucesivas tramas de una señal de entrada x(n),

que incluye las siguientes etapas para por lo menos algunas de las tramas: - calcular un espectro X(k,f) de la señal de entrada mediante transformación en el ámbito frecuencial; - obtener un estimador de nivel de ruido &gamma (k,f) del espectro X(k,f) en función de la frecuencia; - calcular un primer estimador de nivel de señal útil &gamma (k,f) en la trama en función de la frecuencia; - calcular la función de transferencia {H (k,f) de un primer filtro reductor de ruido sobre la base del primer estimador de nivel de señal útil gamma (k,f) y del estimador de nivel de ruido gamma (k,f); - calcular un segundo estimador de nivel de señal útil &gamma (k,f) en la trama en función de la frecuencia, combinando el espectro X(k,f) de la señal de entrada y la función de transferencia H (k,f) del primer filtro reductor de ruido; - calcular la función de transferencia H (k,f) de un segundo filtro reductor de ruido sobre la base del segundo estimador de nivel de señal útil &gamma (k,f) y del estimador de nivel de ruido &gamma (k,f); y - utilizar la función de transferencia H (k,f) del segundo filtro reductor de ruido en una operación de filtrado de la trama para producir una señal con ruido reducido

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2001/003624.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY, 75015 PARIS.

Inventor/es: MARRO, CLAUDE, MAUUARY,LAURENT, SCALART,PASCAL.

Fecha de Publicación: 4 de Noviembre de 2010.

Fecha Concesión Europea: 30 de Junio de 2010.

Clasificación Internacional de Patentes:

G10L21/02A1

Clasificación PCT:

G10L21/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Clasificación antigua:

G10L21/02 G10L 21/00 […] › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PROCEDIMIENTO Y DISPOSITIVO DE REDUCCION DE RUIDO.

Fragmento de la descripción:

Procedimiento y dispositivo de reducción de ruido.

La presente invención se refiere a las técnicas de procesamiento de señal que sirve para reducir el nivel de ruido presente en una señal de entrada.

Un importante ámbito de aplicación es el del procesamiento de la señal de audio (voz o música), incluyendo de manera no limitativa:

• teleconferencia y videoconferencia en medio ruidoso (en sala dedicada o bien a partir de ordenadores multimedia, etc.);

• telefonía: procesamiento a nivel de los terminales, fijos o móviles y/o en las redes de transporte;

• terminales manos libres, especialmente de oficina, de vehículo o móviles;

• toma de sonido en lugares públicos (estación, aeropuerto, etc.);

• toma de sonido manos libres en vehículos;

• reconocimiento de voz robusta en el entorno acústico;

• toma de sonido para cine y en los medios de comunicación (radio y televisión, por ejemplo para periodismo deportivo o conciertos, etc.).

La invención se puede aplicar asimismo a cualquier ámbito en el que se desee extraer una información útil a partir de una observación con ruido. Se pueden mencionar especialmente los siguientes ámbitos: imagen submarina, teledetección submarina, procesamiento de señales biomédicas (EEG, ECG, imagen biomédica, etc.).

Un problema característico de la toma de sonido se refiere al entorno acústico en el que se coloca el micrófono de toma de sonido y, más concretamente, el hecho de que, debido a la imposibilidad de controlar totalmente dicho entorno, una señal perturbadora (calificada de ruido) está asimismo presente dentro de la señal de observación.

Con objeto de mejorar la calidad de la señal, se desarrollan sistemas de reducción de ruido con objeto de extraer la información útil efectuando un procesamiento de la señal de observación con ruido. Cuando la señal de audio es una señal de voz transmitida a distancia, estos sistemas permiten incrementar su inteligibilidad y reducir la fatiga del interlocutor. Además de dichas aplicaciones de comunicación hablada, la mejora de la calidad de la señal de voz se revela asimismo útil para el reconocimiento de voz, cuyas prestaciones quedan fuertemente alteradas cuando el utilizador se encuentra en un entorno ruidoso.

La elección de una técnica de procesamiento de la señal para realizar la operación de reducción de ruido depende, en primer lugar, del número de observaciones disponibles en la entrada del procesamiento. En la presente descripción, se considerará el caso en que está disponible una única señal de observación. Los métodos de reducción de ruido adaptados a esta problemática monosensor se basan principalmente en técnicas de procesamiento de la señal tales como el filtrado adaptativo mediante adelanto/retraso, el filtrado paramétrico de Kalman o también el filtrado mediante modificación espectral a corto plazo.

Esta última familia (filtrado mediante modificación espectral a corto plazo) agrupa prácticamente el conjunto de soluciones utilizadas en los equipos industriales debido a la sencillez de los conceptos en juego y a la gran disponibilidad de herramientas básicas (por ejemplo, la transformada de Fourier discreta) necesarias para su programación. Sin embargo, el desarrollo de dichas técnicas de reducción de ruido se basa en gran medida en la posibilidad de efectuar con facilidad dichos procesamientos en tiempo real en un dispositivo de procesamiento de la señal, sin introducir distorsiones relevantes en la señal disponible a la salida del procesamiento. En los métodos de dicha familia, el procesamiento consiste la mayoría de las veces en evaluar una función de transferencia de un filtro reductor de ruido, y en realizar el filtrado a partir de una multiplicación en el ámbito espectral, lo que permite operar la reducción de ruido mediante atenuación espectral a corto plazo, mediante un procesamiento por bloques.

Se escribe x(n) la señal de observación con ruido procedente de la mezcla de la señal deseada s(n) y el ruido de perturbación b(n), designando n el índice temporal en tiempo discreto. La elección de una representación en tiempo discreto está unida a una aplicación orientada al procesamiento digital de la señal, pero se observará que los métodos descritos más adelante se aplican asimismo a las señales en tiempo continuo. Se analiza la señal por segmentos sucesivos o tramas de índice k de longitud constante. Algunas formas de anotación habitualmente utilizadas para representaciones en los ámbitos discretos tiempo y frecuencia son:

• X(k,f): transformada de Fourier (f es el índice de frecuencia de la k-ésima trama (k es el índice de trama) de la señal analizada x(n);

• S(k,f): transformada de Fourier de la k-ésima trama de la señal deseada s(n);

• hat{ν}: estimación de una magnitud (temporal o frecuencial) v; por ejemplo, hat{S}(k,f) es la estimación de la transformada de Fourier de la señal deseada;

• γ_uu(f): densidad espectral de potencia (DSP) de una señal u(n).

En la mayoría de las técnicas de reducción de ruido, la señal con ruido x(n) soporta un filtrado en el ámbito frecuencial para producir una señal útil estimada hat{s}(n) lo más próxima posible a la señal original s(n) desprovista de cualquier perturbación. Como se ha indicado anteriormente, esta operación de filtrado consiste en reducir cada componente frecuencial f de la señal con ruido habida cuenta de la relación señal/ruido (RSB) estimada en dicha componente. Dicha RSB función de la frecuencia f se escribe en este caso η(k,f) para la trama k.

Para cada una de las tramas, se multiplica primero la señal por una ventana de ponderación que permite mejorar la estimación posterior de las magnitudes espectrales necesarias para el cálculo del filtro reductor de ruido. Cada trama así ventaneada se analiza a continuación en el ámbito espectral (generalmente con la ayuda de la transformada de Fourier discreta en su versión rápida). Esta operación se denomina transformación de Fourier a corto plazo (TFCT). Esta representación frecuencial X(k,f) de la señal observada permite al mismo tiempo estimar la función de transferencia H(k,f) del filtro reductor de ruido, y aplicar dicho filtro en el ámbito espectral mediante simple multiplicación entre dicha función de transferencia y el espectro a corto plazo de la señal con ruido, es decir:

El regreso en el ámbito temporal de la señal así obtenida se efectúa a continuación mediante simple transformada espectral inversa. La síntesis de la señal a la que se ha quitado el ruido se efectúa generalmente mediante una técnica de solapamiento e incorporación de bloques (OLA, "overlap add") o una técnica de salvaguarda de bloques (OLS, "overlap save"). Esta operación de reconstrucción de la señal en el ámbito temporal se denomina transformación de Fourier a corto plazo inverso (TFCTI).

Se encontrará una descripción detallada de los métodos de atenuación espectral a corto plazo en las referencias: J.S. Lim, A.V. Oppenheim, "Enhancement and bandwidth compression of noisy speech", Proceedeings of the IEEE, vol. 67, pp. 1586-1604, 1979; y R.E. Crochiere, L.R. Rabiner, "Multirate digital signal processing", Prentice Hall, 1983.

Las principales tareas realizadas por dicho sistema de reducción de ruido son:

• la detección de actividad vocal (DAV);

• la estimación de la densidad espectral de potencia (DSP) de ruido durante los instantes de actividad vocal;

• la aplicación de una atenuación espectral a corto plazo evaluada a partir de una regla de supresión de las componentes espectrales de ruido;

• la síntesis de la señal procesada a partir de una técnica del tipo OLS u OLA.

La elección de la regla de supresión de las componentes de ruido es importante, ya que determina la calidad de la señal transmitida. Generalmente, dichas reglas de supresión sólo modifican la amplitud |X(k,f)| de las componentes espectrales de la señal con ruido, no su fase. Generalmente, se realizan las siguientes hipótesis:

•...

Reivindicaciones:

1. Procedimiento de reducción de ruido en sucesivas tramas de una señal de entrada x(n), que incluye las siguientes etapas para por lo menos algunas de las tramas:

- calcular un espectro X(k,f) de la señal de entrada mediante transformación en el ámbito frecuencial;

- obtener un estimador de nivel de ruido hat{γ}_bb(k,f) del espectro X(k,f) en función de la frecuencia;

- calcular un primer estimador de nivel de señal útil hat{γ}_ss(k,f) en la trama en función de la frecuencia;

- calcular la función de transferencia hat{H}₁(k,f) de un primer filtro reductor de ruido sobre la base del primer estimador de nivel de señal útil hat{γ}_ss1(k,f) y del estimador de nivel de ruido hat{γ}_bb(k,f);

- calcular un segundo estimador de nivel de señal útil hat{γ}_ss(k,f) en la trama en función de la frecuencia, combinando el espectro X(k,f) de la señal de entrada y la función de transferencia hat{H}₁(k,f) del primer filtro reductor de ruido;

- calcular la función de transferencia hat{H}(k,f) de un segundo filtro reductor de ruido sobre la base del segundo estimador de nivel de señal útil hat{γ}_ss(k,f) y del estimador de nivel de ruido hat{γ}_bb(k,f); y

- utilizar la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido en una operación de filtrado de la trama para producir una señal con ruido reducido.

2. Procedimiento según la reivindicación 1, en el que el cálculo del espectro X(k,f) incluye una ponderación de la trama de señal de entrada mediante una función de ventaneo w(n) y una transformación de la trama ponderada hacia el ámbito frecuencial, siendo la función de ventaneo asimétrica de manera a aplicar una ponderación más fuerte a la mitad más reciente de la trama que a la mitad menos reciente de la trama.

3. Procedimiento según la reivindicación 1 o 2, en el que se determina una respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) para la trama actual a partir de una transformación hacia el ámbito temporal de la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido, y se realiza la operación de filtrado de la trama en el ámbito temporal por medio de la respuesta impulsional determinada para dicha trama.

4. Procedimiento según la reivindicación 3, en el que la determinación de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) para la trama actual incluye las siguientes etapas:

- transformar hacia el ámbito temporal la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido para obtener una primera respuesta impulsional; y

- truncar la primera respuesta impulsional a una longitud de truncado correspondiente a un número de muestras sensiblemente menor que el número de puntos de la transformación hacia el ámbito temporal.

5. Procedimiento según la reivindicación 4, en el que la determinación de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) para la trama actual incluye además la siguiente etapa:

- ponderar la respuesta impulsional truncada mediante una función de ventaneo w_filt(n) en un número de muestras correspondiente a dicha longitud de truncado.

6. Procedimiento según una cualquiera de las reivindicaciones 3 a 5, en el que se subdivide la trama actual en varias subtramas y se calcula para cada subtrama una respuesta impulsional interpolada hat{h}_w⁽ⁱ⁾(k,n) a partir de una respuesta impulsional de filtro reductor de ruido determinada para la trama actual y de la respuesta impulsional de filtro reductor de ruido determinada para por lo menos una trama anterior, y en el que la operación de filtrado de la trama incluye un filtrado de la señal de cada subtrama en el ámbito temporal, de conformidad con la respuesta impulsional interpolada calculada para dicha subtrama.

7. Procedimiento según la reivindicación 6, en el que las respuestas impulsionales interpoladas hat{h}_w⁽ⁱ⁾(k,n) se calculan para las distintas subtramas de la trama actual como sumas ponderadas de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) determinada para la trama actual y de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k-1,n) determinada para la trama anterior.

8. Procedimiento según la reivindicación 7, en el que la respuesta impulsional interpolada hat{h}_w⁽ⁱ⁾(k,n) calculada para la i-ésima subtrama de la trama actual (1 ≤q i < N) es igual a (N-i)/N veces la respuesta impulsional de filtro reductor de ruido hat{h}_w(k-1,n) determinada para la trama anterior más i/N veces la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) determinada para la trama actual, siendo N el número de subtramas de la trama actual.

9. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que la señal de entrada x(n) es una señal de audio.

10. Dispositivo de reducción de ruido en una señal de entrada x(n) que incluye:

- medios (1-3) de cálculo de un espectro X(k,f) de una trama de la señal de entrada mediante transformación en el ámbito frecuencial;

- medios (5) de obtención de un estimador de nivel de ruido hat{γ}_bb(k,f) del espectro X(k,f) en función de la frecuencia;

- medios (11) de cálculo de un primer estimador de nivel de señal útil hat{γ}_ss1(k,f) en la trama en función de la frecuencia;

- medios (13) de cálculo de la función de transferencia hat{H}₁(k,f) de un primer filtro reductor de ruido sobre la base del primer estimador de nivel de señal útil hat{γ}_ss1(k,f) y del estimador de nivel de ruido hat{γ}_bb(k,f);

- medios (14-15) de cálculo de un segundo estimador de nivel de señal útil hat{γ}_ss(k,f) en la trama en función de la frecuencia, combinando el espectro X(k,f) de la señal de entrada y la función de transferencia hat{H}₁(k,f) del primer filtro reductor de ruido;

- medios (16) de cálculo de la función de transferencia hat{H}(k,f) de un segundo filtro reductor de ruido sobre la base del segundo estimador de nivel de señal útil hat{γ}_ss(k,f) y del estimador de nivel de ruido _bb(k,f); y

- medios (7-9) de filtrado de la trama por medio de la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido para producir una señal con ruido reducido.

11. Dispositivo según la reivindicación 10, en el que los medios de cálculo de espectro incluyen medios (2) de ponderación de la trama de señal de entrada x(n) mediante una función de ventaneo w(n), y medios (3) de transformación de la trama ponderada hacia el ámbito frecuencial, siendo la función de ventaneo asimétrica de manera a aplicar una ponderación más fuerte a la mitad más reciente de la trama que a la mitad menos reciente de la trama.

12. Dispositivo según la reivindicación 10 u 11, que incluye medios (7-8) de determinación de una respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) para la trama actual a partir de una transformación hacia el ámbito temporal de la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido, en el que los medios de filtrado (9) operan en el ámbito temporal por medio de la respuesta impulsional determinada para la trama actual.

13. Dispositivo según la reivindicación 12, en el que los medios de determinación de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) incluyen medios (7) de transformación hacia el ámbito temporal de la función de transferencia hat{H}(k,f) del segundo filtro reductor de ruido, para obtener una primera respuesta impulsional, y medios (8) de truncado de la primera respuesta impulsional a una longitud de truncado correspondiente a un número de muestras sensiblemente menor que el número de puntos de la transformación hacia el ámbito temporal.

14. Dispositivo según la reivindicación 13, en el que los medios de determinación de la respuesta impulsional de filtro reductor de ruido incluyen medios (8) de ponderación de la respuesta impulsional truncada mediante una función de ventaneo w_filt(n) en un número de muestras correspondiente a dicha longitud de truncado.

15. Dispositivo según una cualquiera de las reivindicaciones 12 a 14, que incluye medios para subdividir la trama actual en varias subtramas , y medios (21) de cálculo de una respuesta impulsional interpolada hat{h}_w⁽ⁱ⁾(k,n) para cada subtrama a partir de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) determinada para la trama actual y de la respuesta impulsional de filtro reductor de ruido determinada para por lo menos una trama anterior, en el que los medios de filtrado (9) incluyen un filtro (23) para filtrar la señal de cada subtrama en el ámbito temporal, de conformidad con la respuesta impulsional interpolada calculada para dicha subtrama.

16. Dispositivo según la reivindicación 15, en el que los medios de cálculo de respuesta impulsional interpolada están dispuestos para calcular las respuestas impulsionales interpoladas hat{h}_w⁽ⁱ⁾(k,n) para las distintas subtramas de la trama actual como sumas ponderadas de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) determinada para la trama actual y de la respuesta impulsional de filtro reductor de ruido hat{h}_w(k-1,n) determinada para la trama ante- rior.

17. Dispositivo según la reivindicación 16, en el que la respuesta impulsional interpolada hat{h}_w⁽ⁱ⁾(k,n) calculada para la i-ésima subtrama de la trama actual (1 ≤q i ≤q N) es igual a (N-i)/N veces la respuesta impulsional de filtro reductor de ruido hat{h}_w(k-1,n) determinada para la trama anterior más i/N veces la respuesta impulsional de filtro reductor de ruido hat{h}_w(k,n) determinada para la trama actual, siendo N el número de subtramas de la trama actual.

18. Dispositivo según una cualquiera de las reivindicaciones 10 a 17, en el que la señal de entrada x(n) es una señal de audio.

Patentes similares o relacionadas:

PROCEDIMIENTO DE ESTIMACIÓN DE RUIDO USANDO APRENDIZAJE INCREMENTAL BAYESIANO, del 5 de Enero de 2012, de MICROSOFT CORPORATION: Un procedimiento para estimar el ruido en una señal ruidosa, comprendiendo el procedimiento: dividir la señal ruidosa en tramas; y determinar […]

PROCESAMIENTO DIGITAL DIFERENCIADO DE LA VOZ Y DE LA MUSICA, LA FILTRACION DEL RUIDO, LA CREACION DE EFECTOS ESPECIALES ASI COMO UN DISPOSITIVO PARA LA APLICACION DE DICHO PROCEDIMIENTO, del 9 de Julio de 2010, de CREBOUW, JEAN-LUC: Procedimiento para el tratamiento numérico diferenciado de una señal acústica, constituido en el intervalo de una trama por la suma de seno de amplitud fija […]

PROCEDIMIENTO DE MEDIDA DE LA MOLESTIA DEBIDA AL RUIDO DE UNA SEÑAL DE AUDIO, del 2 de Diciembre de 2009, de FRANCE TELECOM: Procedimiento de cálculo de una puntuación objetiva (NOB) de la molestia debida al ruido en una señal de audio procesada mediante una función […]

PROCEDIMIENTO Y DISPOSITIVO PARA LA MEJORA DE VOZ EN PRESENCIA DE RUIDO DE FONDO, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para la supresión de ruido de una señal de voz, que comprende: llevar a cabo un análisis de frecuencia para generar una representación de dominio […]

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]