CODIFICACIÓN POR TRANSFORMADA, UTILIZANDO VENTANAS DE PONDERACIÓN Y CON RETARDO PEQUEÑO.

Método de decodificación, por transformada, de una señal representada por una sucesión de tramas que han sido codificadas utilizando al menos dos tipos de ventanas de ponderación,

de longitudes respectivas distintas, en donde, en caso de recepción de una información de paso desde una ventana larga a una ventana corta y para compensar una transición directa desde la ventana larga a la ventana corta: - se determina (63) muestras (b) a partir de una decodificación aplicando un tipo de ventana de síntesis corta (61) a una trama dada (T'i+1 ) que fue codificada utilizando una ventana de análisis corta y - se obtienen muestras complementarias (67, 69): • decodificando parcialmente (DCT -1 ) una trama (T'i) que precede a la trama dada y que fue codificada utilizando un tipo de ventana de análisis larga y • aplicando una combinación de al menos dos valores: - procedentes de muestras, respectivamente, de la trama dada (T'i+1 ) y de al menos una trama (T'i) que precede a la trama dada (T'i+1 ), - y ponderadas mediante funciones de ponderación respectivas (w1,n, w2,n; w'1,n, w'2,n) tabuladas y almacenadas en memoria de un decodificador

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2007/052541.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY 75015 PARIS FRANCIA.

Inventor/es: KOVESI, BALAZS, VIRETTE,DAVID, PHLIPPE,Pierrick.

Fecha de Publicación: .

Fecha Solicitud PCT: 18 de Diciembre de 2007.

Clasificación Internacional de Patentes:

  • G10L19/02B

Clasificación PCT:

  • G10L19/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.

PDF original: ES-2360898_T3.pdf

 


Fragmento de la descripción:

La presente invención se refiere a la decodificación de señales audiodigitales.

En un esquema de codificación por transformada, para una reducción del caudal informativo, se busca habitualmente reducir la precisión convenida para la codificación de las muestras, asegurando que el oyente sólo pueda, sin embargo, percibir lo menos posible de degradaciones.

A este fin, la reducción de precisión, efectuada por una operación de cuantificación, se controla a partir del modelo psicoacústico. Este modelo, basado en un conocimiento de las propiedades del oído humano, permite dosificar el ruido de cuantificación en las frecuencias auditivas menos perceptibles.

Con el fin de utilizar las informaciones derivadas del modelo psicoacústico, esencialmente datos en el dominio frecuencial, es clásico realizar una transformación de tiempo/frecuencia, efectuándose la cuantificación en este dominio frecuencial.

La Figura 1 ilustra, de forma esquemática, la estructura de un codificador por transformada, con:

- un banco BA de filtros de análisis FA1,… FAn, que incide sobre la señal de entrada X,

- un módulo de cuantificación Q, seguido de un módulo de codificación COD,

- y un banco BS de filtros de síntesis FS1,…, FSn, que proporciona la señal codificada X'.

Para reducir también el caudal antes de la transmisión, las muestras frecuenciales cuantificadas son codificadas, a menudo con la ayuda de una codificación denominada “entrópica” (codificación sin pérdida). La cuantificación se realiza, de forma clásica, por un cuantificador escalar, uniforme o no, o también por un cuantificador vectorial.

El ruido introducido en la etapa de cuantificación se conforma por el banco de filtros de síntesis (denominado, también, “transformación inversa”). La transformación inversa vinculada a la transformada de análisis debe elegirse, por lo tanto, con el fin de concentrar adecuadamente el ruido de cuantificación, de forma frecuencial o temporal, con el fin de evitar que se haga audible.

La transformación de análisis debe concentrar, lo mejor posible, la energía de la señal con el fin de permitir una codificación fácil de las muestras en el dominio transformado. En particular, la ganancia de codificación de la transformada, que depende de la señal de entrada, debe maximizarse en la medida de lo posible. Se utiliza, a este efecto, una relación del tipo:

SNR = GTC + K - R

En donde K es un término constante que puede, ventajosamente, asumir un valor de 6,02.

De este modo, la relación de señal a ruido obtenida (SNR) es proporcionar al número de bits por muestra seleccionada (R) aumentado en la componente Gτc que representa la ganancia de codificación de la transformada. Cuanto más importante es la ganancia de codificación, tanto mejor será la calidad de la reconstrucción.

Se comprende, por lo tanto, la importancia que reviste la transformación en codificación. Garantiza una codificación fácil de las muestras, gracias a su aptitud para concentrar, a la vez, la energía de la señal (por la parte de análisis y el ruido de cuantificación por la parte de síntesis).

Al ser las señales de audio notoriamente no estacionarias, conviene adaptar la transformación de tiempo/frecuencia en el curso del tiempo, en función de la naturaleza de la señal de audio.

Se describe, a continuación, algunas aplicaciones a técnicas de codificación usuales.

En el caso de transformadas moduladas, las técnicas de codificación de audio normalizadas integran bancos de filtros, modulados en la función trigonométrica del coseno, que permiten poner en práctica estas técnicas de codificación con la ayuda de algoritmos rápidos, basados en transformadas en la función coseno o transformada de Fourier rápidas.

Entre las transformadas de este tipo, la transformada más frecuentemente utilizada (en codificación MP3, MPEG-2 y MPEG-4 AAC, en particular) es la transformada MDCT (“Transformada de coseno discreta modificada”) cuya expresión se presenta a continuación:

**(Ver fórmula)**

con las notaciones siguientes:

 M representa la magnitud de la transformada  χn+tM son las muestras del sonido digitalizado con un periodo 1 (inverso de la frecuencia de muestreo) en

Fe

el instante n + tM,  t es el índice de trama.

es una función de base de la transformada, cuyo h(n) se denomina filtro prototipo de magnitud 2M.

Para restituir las muestras temporales iniciales, la transformación inversa siguiente se aplica con el fin de reconstituir las muestras 0 < n < M - 1:

**(Ver fórmula)**

**(Ver fórmula)**

En referencia a la Figura 1a, la reconstrucción se realiza como sigue:

t

 transformada DCT inversa (denominada a continuación DCT-1) de las muestras Xk que proporcionan 2M muestras,

t1

 transformada DCT inversa de las muestras Xk que dan 2M muestras, presentando las M primeras muestras un soporte temporal idénticas a las M últimas muestras de la trama precedente.

 Ponderación por la ventana de síntesis h(M+n) para la segunda mitad de la trama Ti (M últimas muestras) y por la ventana de síntesis h(n) para la primera mitad de la trama siguiente Ti+1 (M primeras muestras) y

 Adiciones de las componentes en ventanas sobre el soporte común.

Con el fin de asegurar la reconstrucción exacta (denominada “perfecta”) de la señal (según la condición xn+tM = χn+tM), conviene elegir una ventana prototipo h(n) que satisfaga algunas limitaciones.

En condiciones típicas, las relaciones siguientes son satisfactorias con el fin de permitir una reconstrucción perfecta:

**(Ver fórmula)**

presentando las ventanas una simetría par con respecto a una muestra central.

Es relativamente sencillo satisfacer estas dos limitaciones simples y, a este respecto, un filtro prototipo clásico está constituido por una ventana sinusoidal que se escribe como sigue:

**(Ver fórmula)**

Por supuesto, existen otras formas de filtro prototipo, tales como las ventanas definidas en la norma MPEG-4 bajo la denominación de “Derivadas de Kaiser Bessel Dérivées” (o KBD) o también las ventanas de solapamiento débil (Low Overlap).

Un ejemplo de tratamiento por una transformada MDCT, con ventanas largas, se representa en la Figura 1a. En esta Figura:

- las flechas en líneas de trazos ilustran una sustracción,

- las flechas en líneas continuas ilustran una adición,

- las flechas en líneas de trazos mixtas ilustran un tratamiento DCT a la codificación y DCT-1 a la decodificación DEC, correspondiendo este término DCT al término en coseno de la función de base presentada anteriormente,

- las muestras de la señal a codificar están en un flujo denominado xin y se sigue la evolución de los tratamientos de codificación/decodificación de algunas muestras marcadas y referidas como a y b en la Figura 1b y como e y f en la Figura 1c,

- las muestras xin están reagrupadas por tramas, siendo indicada una trama actual como Ti, mientras las tramas precedente y siguiente se indican, respectivamente por Ti-1 y Ti+1,

- la referencia DEC es propia del tratamiento realizado por el decodificador (utilizando ventanas de síntesis FS con adición – solapamiento),

- las ventanas de análisis se indican como FA y las ventanas de síntesis se indican como FS,

- n es la distancia entre la parte central de la ventana y la muestra a.

La referencia calc T'i es propia para el cálculo de la trama codificada T'i con utilización de la ventana de análisis FA y las muestras respectivas de las tramas Ti-1 y Ti. Se trata simplemente, en este caso, de un ejemplo de convenio ilustrado en la Figura 1a. Podría también decidirse, por ejemplo, indexar las tramas Ti y Ti+1 para el cálculo de una trama codificada T'i. Prosiguiendo el ejemplo de la Figura 1a, la referencia calc T'i+1 es propia del cálculo de la trama codificada T'i+1 utilizando las muestras respectivas... [Seguir leyendo]

 


Reivindicaciones:

1. Método de decodificación, por transformada, de una señal representada por una sucesión de tramas que han sido codificadas utilizando al menos dos tipos de ventanas de ponderación, de longitudes respectivas distintas, en donde, en caso de recepción de una información de paso desde una ventana larga a una ventana corta y para compensar una transición directa desde la ventana larga a la ventana corta:

- se determina (63) muestras (b) a partir de una decodificación aplicando un tipo de ventana de síntesis corta

(61) a una trama dada (T'i+1 ) que fue codificada utilizando una ventana de análisis corta y -se obtienen muestras complementarias (67, 69):  decodificando parcialmente (DCT-1) una trama (T'i) que precede a la trama dada y que fue codificada utilizando un tipo de ventana de análisis larga y  aplicando una combinación de al menos dos valores: -procedentes de muestras, respectivamente, de la trama dada (T'i+1 ) y de al menos una trama (T'i) que precede a la trama dada (T'i+1 ),

- y ponderadas mediante funciones de ponderación respectivas (w1,n, w2,n; w'1,n, w'2,n) tabuladas y almacenadas en memoria de un decodificador.

2. Método según la reivindicación 1, caracterizado porque: -se determina primero (63) las muestras (b) derivadas de la trama dada (T'i+1 ) y -se deduce de ello (65-67) muestras (a) que corresponden temporalmente al inicio de la trama precedente

(T'i), siendo estas muestras resultado de una decodificación que aplica una ventana de síntesis larga.

3. Método según la reivindicación 2, en donde: -una trama presenta M muestras, -una ventana larga presenta 2M muestras, -una ventana corta presenta 2Ms muestras, siendo Ms inferior a M,

caracterizado porque las muestras xˆ , para n comprendido entre 0 y (M/2-Ms/2) correspondiendo n=0 al inicio de

n

una trama en curso de decodificación, vienen dadas por una combinación de dos términos ponderados del tipo: caracterizado porque las muestras xˆ , para n comprendida entre (M/2-Ms/2) y (M/2+Ms/2), correspondiendo n=0

**(Ver fórmula)**

- nl ~ son valores (v1) derivados de la trama precedente (T'i), - son muestras (b) ya decodificadas utilizando ventanas de síntesis cortas aplicadas a la trama dada (T'i+1 ) y - nw1, y nw2, son funciones de ponderación cuyos valores tomados, en función de n, son tabulados y almacenados en la memoria del decodificador. 4. Método, según una de las reivindicaciones 1 a 3, en donde: - una trama presenta M muestras, - una ventana larga presenta 2M muestras, - una ventana corta presenta 2Ms muestras, siendo Ms inferior a M,

n

al inicio de una trama en curso de decodificación, vienen dadas por una combinación de dos términos ponderados del tipo:

**(Ver fórmula)**

~

- l son valores (v1) derivados de la trama precedente (T'i),

n

~

- s son valores (v2) derivados de la trama dada (T'i+1 ) y

m

- w'1,n y w'2,n son funciones de ponderación cuyos valores tomados, en función de n, son tabulados y

almacenados en la memoria del decodificador.

5. Método según una de las reivindicaciones 1 a 4, caracterizado porque, para una decodificación de tramas codificadas por una codificación por transformada con solapamiento, con miras a reducir una influencia de muestras pasadas, la señal a decodificar se reconstruye a partir de una combinación entre:

- una ponderación de muestras reconstruidas a partir de ventanas cortas, - una ponderación de muestras parcialmente reconstruidas a partir de una ventana larga y - una ponderación de muestras de la señal decodificada pasada. 6. Método según la reivindicación 5, caracterizado porque, con: - una trama que presenta M muestras, - una ventana larga que presenta 4M muestras, - una ventana corta que presenta 2Ms muestras, siendo Ms inferior a M

para un índice de muestra n comprendida entre 0 y M/2-Ms/2, correspondiendo n=0 al inicio de una trama en curso

~

de decodificación, las muestras x a decodificar vienen dadas por una combinación de cuatro términos ponderados

n

del tipo:

**(Ver fórmula)**

**(Ver fórmula)**

designa muestras incompletamente decodificadas de la trama (T'i) que precede a la trama dada (T'i+1 ) utilizando una ventana de síntesis larga con adición, sin

corrección, a elementos de memoria precedentes denominados

índice t un índice de trama,

- s representa muestras completamente decodificadas con la ayuda de una sucesión de ventanas cortas

n

de síntesis (FCS) de la trama dada (T'i+1), para M / 2 + Ms / 2 < n < M y muestras completamente decodificadas de tramas precedentes (T'i , T'i-1, T'i-2 ,…) para -2M < n<M y

- w, w, w y wson, respectivamente, primera, segunda, tercera y cuarta funciones de

1,n 2,n 3,n 4,n

ponderación dependientes del índice de muestra n y los valores tomados al menos por la primera y segunda funciones de ponderación w y w, en función de n, son tabuladas y almacenadas en la

1,n 2,n

memoria del decodificador.

7. Método, según una de las reivindicaciones 5 y 6, caracterizado porque, con:

**(Ver fórmula)**

- una trama que presenta M muestras, 5 - -una ventana larga que presenta 4M muestras, una ventana corta que presenta 2Ms muestras, siendo Ms inferior a M, 10para n comprendida entre M/2-Ms/2 y M/2+Ms/2, combinación de cuatro términos ponderados del tipo: las muestras nxˆ a decodificar vienen dadas por una

**(Ver fórmula)**

~

- l son muestras incompletamente decodificadas de la trama (T'i) que precede a la trama dada (T'i+1),

n

~

15 -s son muestras incompletamente decodificadas de la primera ventana corta de la trama dada (T'i+1), con

m

m = n –M/2+Ms/2,

- s representa las muestras completamente decodificadas de tramas precedentes (T'i , T'i-1, T'i-2 ,…),

n

20 -w'1,n , w'2,n , w'3,n y w'4,n son respectivamente, primera, segunda, tercera y cuarta funciones de ponderación dependientes de n y los valores tomados al menos por las primera y segunda funciones de ponderación w'1,n y w'2,n , en función de n, son tabuladas y almacenadas en la memoria del decodificador.

25 8.

cuarta funciones de ponderación son despreciadas en el cálculo de las muestras xˆ , de modo que solamente los valores tomados por la primera y segunda funciones de ponderación

n

**(Ver fórmula)**

en función de n, son tabuladas y almacenadas en la memoria del decodificador.

30 9. Método, según una de las reivindicaciones 6 y 7, caracterizado porque la tercera y cuarta funciones de

10. Método según las reivindicaciones 6 y 7, caracterizado porque:

~~

- se calcula para n, que varía de 0 a (M+Ms)/2, una expresión primaria x de la señal x a decodificar,

nn

40 según una combinación ponderada del tipo:

**(Ver fórmula)**

imagen8

**(Ver fórmula)**

- para n comprendida entre 0 y M/2-Ms/2, correspondiendo n=0 al inicio de una trama en curso de decodificación, se plantea:

imagen9

- para n comprendida entre M/2-Ms/2 y M/2+Ms/2 se plantea:

imagen10

11. Decodificador por transformada, de una señal representada por una sucesión de tramas derivadas de un codificador que utilizan al menos dos tipos de ventanas de ponderación, de longitudes respectivas distintas, caracterizado porque presenta al menos:

- medios de recepción de una información de paso desde una ventana larga a una ventana corta y, para compensar una transición directa desde la ventana larga a la ventana corta:

- medios de determinación de muestras (b) a partir de una decodificación que aplica un tipo de ventana de síntesis corta (61) a una trama dada (T'i+1) que fue codificada utilizando una ventana de análisis corta, así como:

- medios de obtención de muestras complementarias (67, 69) que son capaces de:

 decodificar parcialmente (DCT-1) una trama (T'i) que precede a la trama dada y que fue codificada utilizando un tipo de ventana de análisis larga y

 aplicar una combinación de al menos dos valores:

- derivados de muestras, respectivamente, de la trama dada (T'i+1) y de al menos una trama (T'i) que precede a la trama dada (T'i+1),

- y ponderados por funciones de ponderación respectivas tabuladas y almacenadas en la memoria de un decodificador.

**(Ver fórmula)**

12. Programa informático, destinado a almacenarse en memoria de un decodificador por transformada, caracterizado porque comprende instrucciones para la puesta en práctica del método de decodificación según una de las reivindicaciones 1 a 10, cuando se ejecuta por un procesador de un tal decodificador.

13. Decodificador por transformada, según la reivindicación 11, caracterizado porque comprende una memoria que almacena las instrucciones de un programa informático, según la reivindicación 12.

 

Patentes similares o relacionadas:

BANCO DE FILTROS DE ANÁLISIS, BANCO DE FILTROS DE SÍNTESIS, CODIFICADOR, DESCODIFICADOR, MEZCLADOR Y SISTEMA DE CONFERENCIA, del 13 de Febrero de 2012, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Banco de filtros de síntesis para filtrar una pluralidad de tramas de entrada, comprendiendo cada trama de entrada M valores de entrada ordenados yk ,...,yk(M-1), […]

Imagen de 'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

PROCEDIMIENTO PARA LA TRASMISION DE SEÑALES DE AUDIO SEGUN EL PROCEDIMEINTO DE TRANSMISION DE PIXELS SEGUN PRIORIDAD, del 18 de Mayo de 2010, de T-MOBILE DEUTSCHLAND GMBH: Procedimiento para la transmisión de señales de audio entre un transmisor y, como mínimo, un receptor, mediante un método de transmisión de píxels según priorización, […]

Imagen de 'CODIFICACION DE AUDIO CON DIFERENTES LONGITUDES DE TRAMA DE CODIFICACION'CODIFICACION DE AUDIO CON DIFERENTES LONGITUDES DE TRAMA DE CODIFICACION, del 4 de Mayo de 2010, de NOKIA CORPORATION: Procedimiento para soportar una codificación de una señal de audio, en el que al menos una sección de dicha señal de audio va a codificarse con un modelo de codificación que […]

Imagen de 'APARATO Y METODO PARA GENERAR VALORES DE SUBBANDA DE AUDIO Y…'APARATO Y METODO PARA GENERAR VALORES DE SUBBANDA DE AUDIO Y APARATO YMETODO PARA GENERAR MUESTRAS DE AUDIO DE DOMINIO DE TIEMPO, del 10 de Noviembre de 2009, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar valores de subbanda de audio en canales de subbanda de audio, que comprende: un divisor en ventanas de análisis para dividir en ventanas una trama […]

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .