CODIFICACIÓN DE SEÑALES AUDIO-DIGITALES.

Método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y que comprende una etapa de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada,

proporcionando una trama binaria de índices de cuantificación (IE) de un caudal de transmisión predeterminado, que comprende, además, las etapas siguientes: - cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior (IMIC) al caudal predeterminado, para determinar así una señal reconstruida - determinación (94) de un ruido de cuantificación (QMIC(z)) generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa; - determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida ; - aplicación (33) de dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2008/051059.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY 75015 PARIS FRANCIA.

Inventor/es: KOVESI, BALAZS, RAGOT,STEPHANE, LE GUYADER,Alain.

Fecha de Publicación: 26 de Julio de 2011.

Fecha Solicitud PCT: 13 de Junio de 2008.

Clasificación Internacional de Patentes:

G10L19/02Q
G10L19/14P1
H04B14/04 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04B TRANSMISION. › H04B 14/00 Sistemas de transmisión no caracterizados por el medio utilizado para la transmisión (sus detalles H04B 1/00). › que utilizan la modulación por impulsos codificados.

Clasificación PCT:

G10L19/14

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2363190_T3.pdf

Fragmento de la descripción:

**(Ver fórmula)**

La presente invención se refiere a un procesamiento de datos acústicos.

Este procesamiento está adaptado, en particular, para la transmisión y/o el almacenamiento de señales digitales, tales como señales de audiofrecuencias (voz, música u otras).

La presente invención se refiere, más en particular, a la codificación de formas de onda tal como la codificación MIC (Modulación por Impulsos Codificados) al que corresponde el acrónimo inglés PCM (Pulse Code Modulation).

El principio general de codificación/decodificación MIC, especificado por la recomendación UIT-T G.711, es tal como se describe haciendo referencia a la Figura 1.

El codificador MIC 13 comprende un módulo de cuantificación QMIC 10 que recibe, a la entrada, la señal de entrada S(z). El índice de cuantificación IMIC, a la salida del módulo de cuantificación 10, se transmite por intermedio del canal de transmisión 11 al decodificador 14.

El decodificador MIC 14 recibe, a la entrada, los índices I'MIC procedentes del canal de transmisión, versión posiblemente perturbada por errores binarios de IMIC y realiza una cuantificación inversa por el módulo de cuantificación inversa Q-1 MIC

12 para obtener la señal codificada

La codificación MIC normalizada UIT-T G.711 (en adelante, denominada G.711) realiza una compresión de la amplitud de las señales – que se definen con un ancho de banda mínimo de [300–3400 Hz] y muestreadas a 8 kHz – mediante una curva logarítmica que permite obtener una relación de señal a ruido casi constante para una gran dinámica de señales. El paso de cuantificación, en el dominio de la señal original, es proporcional a la amplitud de las señales.

La señal comprimida está cuantificada en 8 bits, o sea, 256 niveles. En la red telefónica conmutada (RTC) denominada Public Switched Telephone Network (PSTN) en inglés, estos 8 bits se transmiten a una frecuencia de 8 kHz para proporcionar un caudal de transmisión de 64 kbits/s.

Una trama de señal cuantificada, según la norma G.711, está constituida por índices de cuantificación codificados en 8 bits. Así, si la cuantificación inversa es implantada por tabla, consiste simplemente en un apuntamiento por el índice de uno de los 256 valores decodificados posibles.

En la norma G.711 según la “Ley A” en Europa o la “Ley mu (µ)” en América del Norte y Japón, los 8 bits están distribuidos de la forma siguiente, tal como se representa en 15 en la Figura 1:

1 bit de signo S, 3 bits para indicar el segmento y 4 bits para indicar el emplazamiento en el segmento.

La etapa de cuantificación del codificador genera un ruido de cuantificación que es la diferencia entre la señal original y la señal decodificada.

Con un gran número de niveles de cuantificación (256), el ruido de cuantificación presenta un espectro relativamente plano, tal como se puede observar en la Figura 2 bajo la referencia 20. El espectro de la señal está representado en 22 en la Figura 2 (en esta representación, un bloque de señal vocalizada) que presenta una gran dinámica (40 dB). Se puede ver que, en las zonas de energía débil, el ruido es muy próximo a la señal y por lo tanto, ya no está forzosamente enmascarado. Puede, entonces, hacerse audible en estas zonas (de 2300 a 3500 Hz).

En el caso de los codificadores predictivos adaptativos de voz, técnicas de conformación del ruido de cuantificación se han puesto en práctica para enmascarar este ruido y en la medida de lo posible, hacerlo inaudible. En efecto, debido a las propiedades de enmascaramiento frecuencial simultáneo del oído humano, es posible inyectar más ruido de cuantificación en las zonas en donde la señal es más energética. La conformación del ruido consiste en distribuir mejor, desde el punto de vista espectral, el ruido de cuantificación disminuyendo el nivel de ruido de cuantificación en las zonas poco energéticas para redistribuirlo en las zonas más energéticas.

Dicha técnica se describe, por ejemplo, en el documento “Adaptive noise spectral shaping and entropy coding in predictive coding of speech” de J. Makhoul, M. Berouti en IEEE ASSP, Vol. 27-3, junio 1979.

Este documento describe la utilización de filtros lineales teniendo en cuenta la señal reconstruida. El filtro de conformación del ruido de cuantificación se deriva del filtro de predicción lineal de síntesis, denominado filtro de síntesis de codificación predictiva lineal (LPC). De este modo, la trama obtenida a la salida de este tipo de codificador contiene índices de coeficientes de predicción lineal de los filtros, un índice de factor de normalización de ganancia y los índices de cuantificación.

Otros ejemplos de métodos de conformación del ruido en un codificador predictivo se describen en los documentos EP0331405, EP0466190 y EP0632597.

Además, en la referencia precedente, el filtro de conformación del ruido se calcula a partir del filtro de síntesis reconstruido a partir de los índices de coeficientes de predicción lineal. El filtro de conformación del ruido estará, por lo tanto, viciado con el ruido de codificación de los coeficientes de predicción lineal. Además, en la referencia citada, la función de transferencia del filtro de conformación solamente posee coeficientes en el numerador, calculados mediante dos predicciones lineales en cascada. Las dos predicciones lineales en cascada, que aportan cada una su parte de imprecisión, dan lugar, según se indica claramente en la referencia citada, a que la conformación del ruido solamente sea efectiva para un número de coeficientes como máximo igual a 2.

El artículo de Makhoul y Berouti demuestra que la conformación del ruido de cuantificación es posible en los sistemas predictivos adaptativos caracterizados por un modelo de síntesis constituido por un cuantificador inverso y por un filtro predictor a corto plazo. Los filtros de síntesis se utilizan en la estructura de codificación para obtener la conformación adecuada.

Por lo tanto, esta técnica no está adaptada a los codificadores no predictivos que no presentan filtros de síntesis como el codificador MIC (en particular G.711). En efecto, la cuantificación que incluye una conformación, tal como se describe en el artículo de Makhoul y Berouti, se realiza en el dominio del residuo de predicción lineal (o excitación), es decir, después del filtrado de la señal original por un filtro predictor A(z). Los coeficientes del filtro A(z) deben, por lo tanto, transmitirse al

decodificador para realizar un filtrado de síntesis 1/A(z) después de la cuantificación inversa. Además, la conformación del ruido se realiza mediante una función B(z) reducida al orden 2 y deducida de la función A(z) transmitida.

La observación precedente se aplica en el artículo de J.H. Chen “Nuevas estructuras codec para la codificación de realimentación de ruido de la voz”. Proc Of ICASSP, 2006, PP.I-681:I-684, que hace referencia al artículo de Makhoul y Berouti incorporando un predictor a largo plazo y una conformación del ruido de cuantificación por un filtro de conformación a largo plazo. Además, en el artículo de Chen et al, la cuantificación puesta en práctica es del tipo vectorial.

La presente invención ofrece una solución que no presenta los inconvenientes de la técnica anterior.

A este efecto, la invención da a conocer un método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción, que forma una señal de entrada modificada y que presenta una etapa de cuantificación escalable en caudal de transmisión de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación de un caudal de transmisión predeterminado, tal que comprende, además, las etapas siguientes:

- cuantificación inversa de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior al caudal predeterminado, para determinar una señal reconstruida;

- determinación de un ruido de cuantificación generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa;

- determinación de una función de filtrado del ruido de cuantificación a partir... [Seguir leyendo]

Reivindicaciones:

1. Método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y que comprende una etapa de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación (IE) de un caudal de transmisión predeterminado, que comprende, además, las etapas siguientes:

- cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior (IMIC) al caudal predeterminado, para determinar así una señal

reconstruida

- determinación (94) de un ruido de cuantificación (QMIC(z)) generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa;

determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida

;

- aplicación (33) de dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.

2. Método según la reivindicación 1, caracterizado porque la etapa de cuantificación escalable, en caudal de transmisión, proporciona como mínimo índices de cuantificación de caudal de transmisión base que corresponde a una codificación base de tipo codificación MIC interoperable con la norma UIT-T G.711 Ley A o Ley mu.

3. Método, según la reivindicación 1 o 2, caracterizado porque dicha señal intermedia de contra-reacción se calcula a partir de una predicción (42) del ruido de cuantificación (QMIC) y de una predicción (44) del ruido de cuantificación filtrado (QfMIC), obteniéndose el ruido de cuantificación filtrado mediante la adición (43) de la señal intermedia y del ruido de cuantificación (QMIC).

4. Método, según una cualquiera de las reivindicaciones 1 a 3 caracterizado porque la función de filtrado del ruido de cuantificación se calcula, además, a partir de características de periodicidad de la señal de entrada.

5. Método de codificación, según la reivindicación 1, caracterizado porque la etapa de cuantificación escalable de un caudal de transmisión predeterminado es una cuantificación escalar MIC interoperable con la norma UIT-T G.711 Ley A

o Ley mu, la etapa de cuantificación inversa de los índices de caudal de transmisión inferior al caudal de transmisión

**(Ver fórmula)**

predeterminado se aplica sobre 8-K bits de la trama binaria para determinar una señal reconstruida

y porque se efectúa, además, una etapa de inserción de K bits de datos.

6. Método de decodificación escalable de una señal de audio que comprende: -una primera etapa de cuantificación inversa (105) que decodifica índices de cuantificación de un primer caudal

**(Ver fórmula)**

de transmisión denominado caudal base de transmisión, para formar una señal reconstruida ; -una segunda etapa de cuantificación inversa (101) que decodifica índices de cuantificación de un segundo

caudal de transmisión superior al caudal base de transmisión, puesta en práctica en función del caudal de

**(Ver fórmula)**

transmisión recibido en la decodificación, para formar una señal reconstruida

de caudal superior, que comprende, además:

**(Ver fórmula)**

- una etapa de obtención de una señal diferencia entre dicha señal

**(Ver fórmula)**

reconstruida de caudal de

transmisión base y dicha señal

reconstruida de caudal de transmisión superior;

- una etapa de determinación (108) de una función de filtrado de corrección a partir de la señal reconstruida de caudal de transmisión base;

**(Ver fórmula)**

- una etapa de aplicación (106) de dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;

- una etapa de síntesis de una señal corregida reconstruida de caudal de transmisión superior combinando dicho

**(Ver fórmula)**

término correctivo y una de las señales reconstruida

7. Método, según la reivindicación 6, caracterizado porque dicho término correctivo se aplica a dicha señal reconstruida de caudal base de transmisión.

8. Método, según la reivindicación 6, caracterizado porque dicho término correctivo se aplica a dicha señal reconstruida de caudal de transmisión superior.

9. Método de decodificación, según la reivindicación 6, caracterizado porque comprende una etapa de recepción de información de inserción de bits en la codificación y porque, en caso de información de inserción de K bits, se efectúa una etapa de enmascaramiento de los K bits insertados antes de la primera etapa de cuantificación inversa de caudal base de transmisión.

10. Codificador de señal de audio de entrada (S(z)) que comprende un módulo de combinación que combina la señal de audio de entrada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y un módulo de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación de un caudal de transmisión predeterminado que comprende, además:

- un módulo de cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior al caudal de transmisión predeterminado,

**(Ver fórmula)**

para determinar una señal

reconstruida; -un módulo de determinación (94) de un ruido de cuantificación (QMIC(z)) procedente al menos de los módulos de cuantificación y de cuantificación inversa dispuestos en cascada; -un módulo de determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal

**(Ver fórmula)**

reconstruida

- un módulo de filtrado adecuado para aplicar (33) dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.

11. Decodificador de una señal de audio que comprende:

- un primer módulo de cuantificación inversa (105) que decodifica índices de cuantificación de un primer caudal

**(Ver fórmula)**

de transmisión denominado caudal base de transmisión, para formar una señal

reconstruida;

- un segundo módulo de cuantificación inversa que decodifica índices de cuantificación de un segundo caudal superior de transmisión al caudal base de transmisión, puesto en práctica en función del caudal de transmisión recibido en la decodificación, para formar una señal reconstruida de caudal de transmisión superior,

que comprende, además:

- un módulo de obtención de una señal diferencia (QF(z)) entre dicha señal reconstruida

**(Ver fórmula)**

de caudal base de transmisión y dicha señal reconstruida

**(Ver fórmula)**

de caudal superior de transmisión;

- un módulo de determinación (108) de una función de filtrado de corrección a partir de la señal reconstruida de caudal base de transmisión;

**(Ver fórmula)**

- un módulo de filtrado adecuado para aplicar (106) dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;

- un módulo de síntesis de una señal corregida reconstruida con caudal superior de transmisión adecuado para

**(Ver fórmula)**

combinar dicho término correctivo y una de las señales reconstruidas .

12. Programa de ordenador destinado a almacenarse en una memoria de un codificador o de un decodificador y/o sobre un soporte de memoria adecuado para cooperar con un lector del codificador o del decodificador, que comprende instrucciones de código adaptadas para la puesta en práctica de las etapas del método de codificación según una de las reivindicaciones 1 a 5 y/o del método de decodificación, según una de las reivindicaciones 6 a 8, cuando dicho programa se ejecuta por un procesador del codificador o del decodificador.

Patentes similares o relacionadas:

Intercalador y desintercalador para su uso en un sistema de comunicaciones de transmisión de diversidad, del 6 de Septiembre de 2017, de QUALCOMM INCORPORATED: Un aparato para transmitir una señal de información, comprendiendo dicho aparato: un primer medio de intercalación para reordenar símbolos de […]

Generador de códigos y descodificador basados en campos múltiples para sistemas de comunicaciones, del 14 de Marzo de 2016, de Digital Fountain, Inc: Un procedimiento de codificación de datos para su transmisión desde un origen a un destino por un canal de comunicaciones , comprendiendo […]

Método y dispositivo para la puesta en práctica de una intercalación intratrama, del 30 de Julio de 2014, de Core Wireless Licensing S.a.r.l: Método, que comprende: - intercalar mediante una permutación entre columnas para una matriz de permutación cuyas columnas y filas contienen bits de un flujo […]

Método y aparato para la comprensión y transmisión de datos de alta velocidad, del 25 de Diciembre de 2013, de INTERDIGITAL TECHNOLOGY CORPORATION: Unidad de comunicaci6n inalambrica que oamprende: medios para generar datos para la transmision a una segunda unidad de comunicación; medios para codificar los […]

Intercalador y desintercalador para su uso en un sistema de comunicaciones de transmisión de diversidad, del 9 de Octubre de 2013, de QUALCOMM INCORPORATED: Un aparato para un sistema de comunicaciones, comprendiendo dicho aparato: un medio de distribución de símbolos de datos de transmisión en una […]

Método y aparato para mantener una calidad de transmisión predefinida en una red MAN inalámbrica, del 25 de Septiembre de 2013, de WI-LAN, INC.: Un método de comunicación de datos entre redes 302 de área local sobre trayectos de comunicación establecidosentre pares de redes 302 de área local, en el que cada trayecto […]

Método y aparato para mantener una calidad de transmisión predefinida en una red MAN inalámbrica, del 28 de Agosto de 2013, de WI-LAN, INC.: Un método de comunicación de datos entre redes de área local en una red de área metropolitana, comprendiendo el método: establecer un trayecto de comunicación para la transmisión […]

Procesador de señal de modulación en capas de baja complejidad, del 14 de Marzo de 2013, de THE DIRECTV GROUP, INC.: Un procedimiento de transmisión de una señal codificada que tiene una señal de datos de capa superior y unaseñal de datos de capa inferior, […]