Limitación de distorsión introducida por un post-tratamiento en la decodificación de una señal digital.
Procedimiento de tratamiento de una señal digital, procedente de un decodificador (14) y de un post-tratamientode reducción de ruido (16),
en el que:
- una señal recibida (I'Mic) es decodificada para entregar una señal decodificada (S'Mic),
- la señal decodificada (S'Mic) es post-tratada para entregar una señal post-tratada (SPOST),comprendiendo el procedimiento una limitación (26) de una distorsión introducida por el post-tratamiento paraentregar una señal de salida corregida (SOUT), asignando a dicha señal de salida corregida (SOUT):
- una amplitud actual que tiene un valor intermedio entre un valor de amplitud actual de la señal post-tratada (SPOST)y un correspondiente valor de amplitud actual de la señal decodificada (S'Mic), si la desviación entre los respectivosvalores de amplitud de la señal post-tratada (SPOST) y de la señal decodificada (S'Mic) es superior a un umbral (EMAX),o
- la amplitud actual de la señal post-tratada (SPOST), en caso contrario,
según los respectivos valores de amplitud actual de la señal decodificada (S'Mic) y de la señal post-tratada (SPOST),comprendiendo el procedimiento las etapas:
- definición (32, 33) de un intervalo de amplitudes admitidas, incorporando el intervalo un extremo inferior (LimINF) yun extremo superior (LimSUP) que son función de un valor de amplitud actual (S'Mic) de la señal decodificada, y
- para una correspondiente amplitud actual de la señal post-tratada (SPOST), asignación (34, 35) de un valor deamplitud actual a la señal de salida (SOUT), igual al valor de:
* el límite inferior si la amplitud actual de la señal post-tratada es inferior al valor del extremo inferior,
* el extremo superior si la amplitud actual de la señal post-tratada es superior al valor del extremo superior,
* la amplitud actual de la señal post-tratada si el valor de la amplitud actual de la señal post-tratada está incluidodentro de dicho intervalo,
asignándose un margen de valores de amplitud a cada posible valor de amplitud de la señal decodificada (S'Mic),eligiéndose los extremos superior e inferior de modo que la desviación entre el extremo superior y el extremo inferiorsea igual a dicho margen de valores,
el procedimiento, en el que el post-tratamiento (16) está encaminado a una reducción de ruido de cuantificación,habiendo sido codificada la señal recibida mediante una codificación con cuantificación escalar, entregando eldecodificador unos valores de amplitud cuantificados (QV), que varían entre sí de manera discreta, definiendo lassucesivas desviaciones entre los valores cuantificados unos pasos de cuantificación.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2008/051246.
Solicitante: FRANCE TELECOM.
Nacionalidad solicitante: Francia.
Dirección: 6 place d''Alleray 75015 Paris FRANCIA.
Inventor/es: KOVESI, BALAZS, RAGOT,STEPHANE.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/14
- G10L21/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
PDF original: ES-2394738_T3.pdf
Fragmento de la descripción:
Limitación de distorsión introducida por un post-tratamiento en la decodificación de una señal digital
La presente invención concierne a un tratamiento de señal, especialmente de señales digitales en el ámbito de las telecomunicaciones, pudiendo ser estas señales, por ejemplo, señales de voz, de música, señales de vídeo, u otras.
Generalmente, un parámetro importante en telecomunicaciones es la velocidad de transmisión necesaria para hacer transitar una señal de audio y/o de vídeo con una suficiente calidad. Con objeto de reducir este parámetro y de aumentar entonces el número de comunicaciones posibles a través de una misma red, se han desarrollado codificadores de audio, en particular para comprimir la cantidad de información necesaria para transmitir una señal.
Determinados codificadores permiten alcanzar tasas de compresión de la información particularmente elevadas. Tales codificadores utilizan en general técnicas avanzadas de modelización y de cuantificación de la información. Así, estos codificadores tan sólo transmiten modelos o datos parciales de la señal.
La señal decodificada, si bien no es idéntica a la señal original (ya que una parte de la información no ha sido transmitida debido a la operación de cuantificación) , no se aleja mucho sin embargo de la señal original (al menos desde el punto de vista de la percepción) . La diferencia, en sentido matemático, entre la señal decodificada y la señal original se denomina entonces «ruido de cuantificación».
Los tratamientos en compresión de señales se conciben muchas veces en orden a reducir al mínimo el ruido de cuantificación y, especialmente, a hacer este ruido de cuantificación lo menos audible posible cuando es cuestión de tratar una señal de audio. Existen entonces técnicas que toman en cuenta las características psico-acústicas de la audición, con el propósito de «enmascarar» ese ruido. No obstante, para obtener velocidades de transmisión todo lo bajas que sea posible, en ocasiones el ruido de cuantificación puede ser difícil (cuando no imposible) de enmascarar totalmente, lo cual, en determinadas circunstancias, degrada la inteligibilidad y/o la calidad de la señal.
Con objeto de reducir este ruido de cuantificación y mejorar por lo tanto la calidad, se pueden utilizar en la decodificación dos familias de técnicas.
Es posible, en primer lugar, utilizar un post-filtro adaptativo, del tipo descrito en el artículo de Chen y Gersho:
"Adaptive postfiltering for quality enhancement of coded speech", IEEE Transactions on Speech and Audio Processing, vol. 3, nº 1, enero de 1995, páginas 59 - 71) ,
y empleado en particular en los decodificadores de voz de tipo CELP (por «Code Excited Linear Prediction») .
Se trata de efectuar un filtrado que mejora la calidad subjetiva atenuando la señal en las zonas en las que es más audible el ruido de cuantificación (en particular entre formantes y los armónicos de período fundamental o "pitch") . Los actuales post-filtros adaptativos brindan buenos resultados para señales de voz, pero no tan buenos resultados para otros tipos de señales (señales de música, por ejemplo) .
Otra familia de tratamiento está orientada a los tratamientos clásicos de reducción de ruido que distinguen la señal útil de los ruidos parásitos y que pueden ser aplicados como post-tratamiento para reducir el ruido de cuantificación después de una decodificación. Este tipo de tratamiento permite en un principio reducir el ruido relacionado con el entorno de la captura de la señal y se utiliza a menudo para señales de voz. Con todo, es imposible hacer transparente el tratamiento ante el ruido relacionado con el entorno de toma de sonido, lo cual es problemático para codificación de señal de música, en particular. Así, en codificación / decodificación, se puede querer transmitir el ruido ambiental y, entonces, es deseable que la reducción de ruido no se aplique a este tipo de ruido ambiental sino únicamente al ruido de cuantificación, especialmente en el contexto del post-tratamiento en la decodificación encaminado a reducir el ruido de cuantificación.
No obstante, estos diferentes tipos de procedimientos de reducción de ruido de cuantificación deforman la señal en mayor o menor medida. Por ejemplo, la utilización de un post-filtro (eliminación de ruido) que fuera demasiado agresivo para la señal de voz permitiría eliminar por completo el ruido de cuantificación, pero el sonido de voz obtenido parecería menos natural y/o apagado. La optimización de estos diferentes tipos de procedimientos es, pues, difícil y conviene encontrar sistemáticamente un compromiso entre:
- la eficacia de supresión del ruido de cuantificación, y
- la conservación de las propiedades de la señal inicial, en particular en términos de aspecto natural o no.
Es conocido por otra parte un post-tratamiento por umbralización descrito en el documento US 2009/214054, aunque en ningún caso aplicado a un tratamiento de ruido de cuantificación.
La presente invención viene a mejorar la situación.
A tal efecto, propone un procedimiento de acuerdo con la reivindicación 1.
Ventajosamente, se ha previsto una línea de retardo para asegurar una correspondencia temporal entre la amplitud actual de la señal post-tratada y la correspondiente amplitud actual de la señal decodificada.
En una realización particular, el procedimiento comprende las etapas:
- definición de un intervalo de amplitudes admitidas, incorporando el intervalo un extremo inferior y un extremo superior que son función de un valor de amplitud actual de la señal decodificada (pero no post-tratada) , y
-para una correspondiente amplitud actual de la señal post-tratada, asignación a la señal de salida de un valor de amplitud actual igual al valor de:
• el extremo inferior si la amplitud actual de la señal post-tratada es inferior al valor del extremo inferior,
• el extremo superior si la amplitud actual de la señal post-tratada es superior al valor del extremo superior,
• la amplitud actual de la señal post-tratada si el valor de la amplitud actual de la señal post-tratada está incluido dentro de dicho intervalo.
Así, la presente invención propone no apartarse de la señal decodificada, más allá de una cierta tolerancia, en el post-tratamiento de la señal decodificada.
Entonces se puede, en una realización, asignar un margen de valores de amplitud a cada posible valor de amplitud de la señal decodificada para definir cuantitativamente esa tolerancia, de modo que los citados extremos inferior y superior se eligen para que la diferencia entre el extremo superior y el extremo inferior sea igual a este margen de valores.
Esta realización se puede poner en práctica ventajosamente en el caso en que la señal recibida ha sido codificada mediante una codificación con cuantificación escalar, entregando el decodificador unos valores de amplitud cuantificados que varían entre sí de manera discreta, definiendo las sucesivas desviaciones entre los valores cuantificados sucesivos pasos de cuantificación. Así:
- el extremo superior puede venir dado por la suma de sensiblemente la mitad del paso de cuantificación al valor cuantificado asignado a la amplitud actual de la señal decodificada, y
- el extremo inferior puede venir dado por la resta de sensiblemente la mitad del paso de cuantificación al valor cuantificado asignado a la amplitud actual de la señal decodificada.
Un ejemplo de codificación con cuantificación escalar es la codificación llamada «de modulación por impulso y codificación», que entrega un índice codificado. En tal caso, es posible determinar respectivos valores actuales de los extremos inferior y superior basándose simplemente en el índice codificado actual, recibido en el decodificador. Se puede prever por otra parte una tabla de consulta que da, para un índice recibido actual, un valor cuantificado correspondiente y una mitad de paso de cuantificación correspondiente, a partir de los cuales se pueden determinar entonces los respectivos valores actuales de los extremos inferior y superior.
Otras características y ventajas de la invención se pondrán de manifiesto conforme se examine la descripción detallada que sigue y los dibujos que se acompañan, en los que:
- la figura 1 ilustra muy esquemáticamente la constitución general de un códec (codificador-decodificador) de cuantificación escalar, cuyo decodificador viene seguido de un post-tratamiento y de un módulo, en el sentido de la invención, de limitación de distorsión introducida por el post-tratamiento,
-... [Seguir leyendo]
Reivindicaciones:
1. Procedimiento de tratamiento de una señal digital, procedente de un decodificador (14) y de un post-tratamiento de reducción de ruido (16) , en el que:
- una señal recibida (I'Mic) es decodificada para entregar una señal decodificada (S'Mic) ,
- la señal decodificada (S'Mic) es post-tratada para entregar una señal post-tratada (SPOST) ,
comprendiendo el procedimiento una limitación (26) de una distorsión introducida por el post-tratamiento para entregar una señal de salida corregida (SOUT) , asignando a dicha señal de salida corregida (SOUT) :
- una amplitud actual que tiene un valor intermedio entre un valor de amplitud actual de la señal post-tratada (SPOST) y un correspondiente valor de amplitud actual de la señal decodificada (S'Mic) , si la desviación entre los respectivos valores de amplitud de la señal post-tratada (SPOST) y de la señal decodificada (S'Mic) es superior a un umbral (EMAX) , o
- la amplitud actual de la señal post-tratada (SPOST) , en caso contrario,
según los respectivos valores de amplitud actual de la señal decodificada (S'Mic) y de la señal post-tratada (SPOST) , comprendiendo el procedimiento las etapas:
- definición (32, 33) de un intervalo de amplitudes admitidas, incorporando el intervalo un extremo inferior (LimINF) y un extremo superior (LimSUP) que son función de un valor de amplitud actual (S'Mic) de la señal decodificada, y
- para una correspondiente amplitud actual de la señal post-tratada (SPOST) , asignación (34, 35) de un valor de amplitud actual a la señal de salida (SOUT) , igual al valor de:
• el límite inferior si la amplitud actual de la señal post-tratada es inferior al valor del extremo inferior,
• el extremo superior si la amplitud actual de la señal post-tratada es superior al valor del extremo superior,
• la amplitud actual de la señal post-tratada si el valor de la amplitud actual de la señal post-tratada está incluido dentro de dicho intervalo,
asignándose un margen de valores de amplitud a cada posible valor de amplitud de la señal decodificada (S'Mic) , eligiéndose los extremos superior e inferior de modo que la desviación entre el extremo superior y el extremo inferior sea igual a dicho margen de valores,
el procedimiento, en el que el post-tratamiento (16) está encaminado a una reducción de ruido de cuantificación, habiendo sido codificada la señal recibida mediante una codificación con cuantificación escalar, entregando el decodificador unos valores de amplitud cuantificados (QV) , que varían entre sí de manera discreta, definiendo las sucesivas desviaciones entre los valores cuantificados unos pasos de cuantificación,
caracterizado porque:
- el extremo superior viene dado por la suma de un parámetro función del paso de cuantificación (EMAX) al valor cuantificado (QV) asignado a la amplitud actual de la señal decodificada (S'Mic) , y
- el extremo inferior viene dado por la resta de un parámetro función del paso de cuantificación (EMAX) al valor cuantificado (QV) asignado a la amplitud actual de la señal decodificada (S'Mic) .
2. Procedimiento según la reivindicación 1, en el que la señal recibida se ha decodificado mediante una codificación de modulación por impulso y codificación que entrega un índice codificado (IMic) , caracterizado porque se determinan (25) unos respectivos valores actuales de los extremos inferior y superior (25) basándose en un índice codificado actual (I'Mic_DEL) , recibido en el decodificador.
3. Procedimiento según la reivindicación 2, caracterizado porque se prevé una tabla de consulta (24) que da, para un índice recibido actual (I'Mic_DEL) , un valor cuantificado correspondiente (QV) y una mitad de paso de cuantificación correspondiente (EMAX) , a partir de los cuales se determinan (25) los respectivos valores actuales de los extremos inferior y superior.
4. Procedimiento según una de las anteriores reivindicaciones, caracterizado porque está prevista una línea de retardo (23) para asegurar una correspondencia temporal entre dicha amplitud actual de la señal post-tratada (SPOST) y dicha correspondiente amplitud actual de la señal decodificada (S'Mic) .
5. Procedimiento según una de las anteriores reivindicaciones, caracterizado porque es puesto en práctica para señales decodificadas y post-tratadas (SPOST) cuya amplitud es superior a un valor umbral predeterminado (Se) .
6. Módulo de tratamiento de una señal digital, siendo decodificada (14) la señal y pasando ésta por un post
tratamiento de reducción de ruido (16) , caracterizado porque incorpora unos medios (23, 24, 25, 26) para la puesta en práctica del procedimiento según una de las anteriores reivindicaciones, a efectos de una limitación de una distorsión introducida por el post-tratamiento.
7. Módulo según la reivindicación 6, caracterizado porque viene integrado dentro de un módulo de post-tratamiento 10 de reducción de ruido (16) .
8. Programa informático destinado a ser almacenado en una memoria de un módulo (20) según una de las reivindicaciones 6 y 7, caracterizado porque incorpora instrucciones para la puesta en práctica del procedimiento según una de las reivindicaciones 1 a 5, cuando son ejecutadas por un procesador de dicho módulo (20) .
Patentes similares o relacionadas:
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]
Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]
Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]
Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]
Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]
Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]