POST-TRATAMIENTO DE REDUCCIÓN DEL RUIDO DE CUANTIFICACIÓN DE UN CODIFICADOR EN LA DECODIFICACIÓN.

Procedimiento de tratamiento de una señal audio digital, habiendo sido dicha señal:



- codificada para su compresión (COD) de acuerdo con un tipo de codificado predeterminado, aplicando una operación de cuantificación, y después

- decodificada (DEC),

comprendiendo el procedimiento de tratamiento:

- una estimación (S4) de un ruido de cuantificación que introduce el codificado de compresión a partir de la información (INF) obtenida a priori sobre el tipo de codificación de compresión, y

- una determinación (S5) de una función de filtrado a aplicar a la señal decodificada para aplicar (S6) un tratamiento de reducción del ruido de cuantificación estimado (TRC), y caracterizado porque:

- se estima, a partir de dicha información (INF), una variación (figura 4) del ruido de cuantificación (RSR) en función de al menos un parámetro relativo a un parámetro de carga (Γ) de la señal decodificada, y

- en función de un valor actual de dicho parámetro (Γ) en la señal decodificada (S52, S53), se estima (S55; S56) el ruido de cuantificación para determinar la función de filtrado (S57) a aplicar (S58) en la señal decodificada que tiene dicho valor actual de parámetro (Γ).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2008/051057.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY 75015 PARIS FRANCIA.

Inventor/es: KOVESI, BALAZS, MARRO, CLAUDE, GARCIA,Jean-Luc.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/14
  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2376178_T3.pdf

 


Fragmento de la descripción:

Post-tratamiento de reducción del ruido de cuantificación de un codificador en la decodificación La presente invención se refiere a un tratamiento de señales, en particular de señales audio digitales en el ámbito de las telecomunicaciones, pudiendo ser dichas señales, por ejemplo, señales de voz, de música, u otras.

En general, el flujo necesario para hacer transitar una señal audio y/o vídeo con suficiente calidad es un parámetro importante en telecomunicaciones. A fin de reducir dicho parámetro y aumentar el número de comunicaciones posibles a través de una misma red, se han desarrollado codificadores de audio, concretamente para comprimir la cantidad de información necesaria para transmitir una señal.

Ciertos codificadores permiten alcanzar tasas particularmente altas de compresión de la información. Tales codificadores utilizan en general técnicas avanzadas de modelización y cuantificación de la información. De esta manera, tales codificadores sólo transmiten modelos o datos parciales de la señal.

La señal decodificada, aunque no sea idéntica a la señal original (puesto que una parte de la información no se ha transmitido debido a la operación de cuantificación) sigue siendo, sin embargo, muy similar a la señal original. La diferencia, desde el punto de vista matemático entre la señal decodificada y la señal original se denomina entonces "ruido de cuantificación". También puede hablarse de "distorsión" introducida por la codificación/decodificación.

Los tratamientos de compresión de señales, con frecuencia se conciben de manera que minimicen el ruido de cuantificación y, en particular, para volver dicho ruido de cuantificación lo menos audible posible a la hora de tratar una señal audio. Existen, pues, técnicas que toman en consideración las características psicoacústicas de la audición con objeto de "enmascarar" dicho ruido. No obstante, para obtener flujos lo más débiles posible, a veces, el ruido puede permanecer audible lo que, en ciertas circunstancias, degrada la inteligibilidad de la señal.

A fin de reducir dicho ruido, habitualmente se utilizan dos familias de técnicas.

Es posible, en un principio, utilizar un post-filtro perceptual, como los que se utilizan, por ejemplo, en los decodificadores de voz de tipo CELP (de "Code Excited Linear Prediction") . Se trata de efectuar un filtrado que mejore la calidad subjetiva al precio de una distorsión. De hecho, se aplica una atenuación de la señal en las zonas en las que el ruido de cuantificación es más audible (concretamente entre los formantes) . Los post-filtros perceptuales modernos procuran buenos resultados para las señales de voz, pero peores resultados para otro tipo de señales (por ejemplo, las señales musicales) .

En efecto, se describe un post-filtro de mejora de voz codificada en el documento Chen et al: “Adaptive Postfiltering for Quality Enhancement of Coded Speech”, Chen J.H., Gersho A., IEEE Trans. On Speech and Audio Proc., (enero de 1995) .

El modelo descrito se basa en una división en dos secciones:

- una sección a "largo plazo" refuerza los harmónicos (harmónicos de la frecuencia fundamental) y acentúa los

valles espectrales entre dichos harmónicos, y 45

- una sección a "corto plazo" refuerza los formantes y también acentúa los valles espectrales entre dichos formantes.

Los harmónicos y los formantes son características espectrales bien conocidas de la voz, pero aplicar este tipo de tratamiento en otra señal distinta a la de la voz genera fuertes distorsiones. Por ejemplo, la riqueza espectral de una señal musical no puede tratarse con un modelo sencillo de señal como éste.

De esta manera, los post-filtros perceptuales pueden generar distorsiones, debido a que se basan sobre un modelo que no es lo suficientemente preciso. Además, el post-filtro perceptual generalmente es ineficaz en los periodos de 55 silencio. La solicitante ha podido observar estos problemas experimentalmente, ya que en un primer momento buscaba integrar este tipo de post-filtros perceptuales en decodificadores que no son de tipo CELP, por ejemplo en decodificadores de acuerdo con la norma G.711 o la norma G.722.

El documento US 2003/0182104 describe la modificación de una señal audio digital en una etapa de decodificación en base a un modelo psicoacústico. Una modificación como ésta sería aplicable a las señales codificadas de acuerdo con un modelo perceptual, siempre y cuando la distribución del ruido de cuantificación pueda deducirse a partir de los datos codificados.

Otra familia de tratamiento se refiere a los tratamientos clásicos de reducción de ruido para distinguir la señal útil de 65 los ruidos parásitos. Este tipo de tratamiento permite por lo tanto reducir el ruido vinculado al entorno de captura de la señal y con frecuencia se utiliza para las señales de voz. Sin embargo, en este caso, es imposible volver transparente el tratamiento con respecto al ruido vinculado al entorno de la toma de sonido, lo que plantea un problema, en concreto para la decodificación de las señales musicales. De esta manera, cuando se codifica/decodifica es posible que se quiera transmitir el ruido ambiente y entonces sería deseable que la reducción de ruido no se aplicara a este tipo de ruido.

La presente invención viene a mejorar la situación.

A tal efecto, propone un procedimiento para tratar una señal codificada para su compresión de acuerdo con un tipo de codificación predeterminada, aplicando una operación de cuantificación, y que después se descodifica. El procedimiento en el sentido de la invención se define en la reivindicación 1.

En el presente documento se entiende por el término "tratamiento de reducción de ruido" a una operación del tipo descrito más adelante, que consiste en extraer la señal útil de la señal a tratar, filtrando las señales parásitas, por ejemplo definiendo una función de ganancia que interviene en un filtro aplicado a la señal decodificada. En este documento, el ruido de cuantificación se filtra de esta manera.

Se trata por lo tanto de una eliminación de ruidos clásica pero que se aplica en este documento para reducir el ruido de cuantificación. Dicha eliminación de ruidos, no se emparenta de ninguna manera con un post-filtrado perceptual del tipo descrito en Chen et al, el cual se apoya completamente en las características y la dinámica de la señal, mientras que el tratamiento de reducción de ruido, de acuerdo con la invención, se apoya más bien en la determinación del ruido de cuantificación.

De esta manera, se prevé un tipo de tratamiento de reducción de ruido propio de cada tipo de codificación y compresión realizada. La manera misma de estimar las características del filtro de reducción de ruido (tipo de función de ganancia, parámetros de la función de ganancia, etc.) depende del tipo de codificación que se realice.

Se verá, en particular en los ejemplos de realización que se aportan mas adelante, que el ruido de cuantificación en si mismo depende en gran medida del tipo de codificación que se realice. Se verá que es posible establecer una variación del ruido de cuantificación en función de una variación de la señal decodificada, y que dicha variación del ruido de cuantificación es propia del tipo de codificación puesto en práctica.

De esta manera:

- se estima, a partir de la información sobre el tipo de codificación, una variación del ruido de cuantificación en 35 función de al menos un parámetro de la señal de codificada, y

- en función de un valor actual de dicho parámetro en la señal decodificada, se estima el ruido de cuantificación para determinar la función de filtrado a aplicar a la señal decodificada que tenga dicho valor actual de parámetro.

Se entenderá por lo tanto que la información sobre el tipo de codificación de compresión sea información a priori, independiente de las características de la señal y que ventajosamente puede deducirse que:

- un modelo de variación de la relación señal a ruido de cuantificación, en función de al menos un parámetro de la

señal decodificada, y/o 45

- una coloración espectral del ruido de cuantificación (es decir, una variación espectral del ruido de cuantificación en función de las características de la señal decodificada) .

En un posible modo de realización, la información a priori sobre el tipo de codificación de compresión se obtiene a... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento de tratamiento de una señal audio digital, habiendo sido dicha señal:

- codificada para su compresión (COD) de acuerdo con un tipo de codificado predeterminado, aplicando una operación de cuantificación, y después

- decodificada (DEC) , comprendiendo el procedimiento de tratamiento:

- una estimación (S4) de un ruido de cuantificación que introduce el codificado de compresión a partir de la información (INF) obtenida a priori sobre el tipo de codificación de compresión, y

- una determinación (S5) de una función de filtrado a aplicar a la señal decodificada para aplicar (S6) un tratamiento de reducción del ruido de cuantificación estimado (TRC) , y caracterizado porque:

- se estima, a partir de dicha información (INF) , una variación (figura 4) del ruido de cuantificación (RSR) en función de al menos un parámetro relativo a un parámetro de carga (Γ) de la señal decodificada, y

- en función de un valor actual de dicho parámetro (Γ) en la señal decodificada (S52, S53) , se estima (S55; S56) el

ruido de cuantificación para determinar la función de filtrado (S57) a aplicar (S58) en la señal decodificada que tiene 25 dicho valor actual de parámetro (Γ) .

2. Procedimiento de acuerdo con la reivindicación 1, caracterizado porque se deduce de dicha información a priori un modelo de variación (figura 4) de una relación señal a ruido de cuantificación (RSR) , en función de dicho parámetro (Γ) de la señal decodificada.

3. Procedimiento de acuerdo con la reivindicación 2, caracterizado porque se deduce de dicha información a priori, una coloración espectral del ruido de cuantificación, y que además se toma en consideración dicha coloración espectral para determinar la función de filtrado a aplicar a la señal decodificada.

4. Procedimiento de acuerdo con una de las reivindicaciones 1 a 3, caracterizado porque dicha información a priori se obtiene durante un procedimiento de declaración del codificador.

5. Procedimiento de acuerdo con una de las reivindicaciones 1 a 4, caracterizado porque el tipo de codificación de compresión es una codificación de acuerdo con la norma G.711.

6. Dispositivo (TRC) de tratamiento de una señal audio digital que inicialmente se codifica para su compresión, de acuerdo con un tipo de codificación predeterminada, y luego se decodifica, comprendiendo el dispositivo (TRC) de tratamiento:

45. medios para la estimación de un ruido de cuantificación (RC) introducido por la codificación de compresión, a partir de la señal decodificada e información (INF) obtenida a priori sobre el tipo de codificación de compresión, y

- medios para la determinación de una función de filtrado a aplicar a la señal decodificada para aplicar (S6) un tratamiento de reducción del ruido de cuantificación estimado (FIL) ,

y caracterizado porque los medios de estimación estiman:

- a partir de dicha información (INF) , una variación (figura 4) del ruido de cuantificación (RSR) en función de al

menos un parámetro relativo a un parámetro de carga (Γ) de la señal decodificada, y 55

- en función de un valor actual de dicho parámetro (Γ) en la señal decodificada (S52, S53) , el ruido de cuantificación para determinar la función de filtrado (S57) a aplicar (S58) a la señal decodificada que tiene dicho valor actual de parámetro (Γ) .

7. Dispositivo de acuerdo con la reivindicación 6, caracterizado porque se integra en un decodificador, a la salida de una unidad de decodificación (DEC) .

8. Programa informático, destinado a almacenarse en la memoriza de un dispositivo (TRC) de tratamiento de una

señal audio digital que inicialmente se codifica para su compresión, de acuerdo con un tipo de codificación 65 predeterminado, y que luego se descodifica, caracterizado porque comprende instrucciones que se adaptan para la puesta en práctica del procedimiento, de acuerdo con una de las reivindicaciones 1 a 5, cuando estas instrucciones las ejecuta un procesador del dispositivo de tratamiento.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .