Compartición adaptativa de la velocidad de ganancia-forma.

Método en un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el método:

- determinar

(S1) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por

- identificar (S2) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y

- aplicar (S3) la asignación de bits identificada cuando se codifica el vector de ganancia-forma.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2011/051238.

Solicitante: TELEFONAKTIEBOLAGET L M ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: 164 83 STOCKHOLM SUECIA.

Inventor/es: NORVELL,ERIK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))

PDF original: ES-2545623_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Compartición adaptativa de la velocidad de ganancia-forma Campo técnico

Realizaciones de la presente invención se refieren a métodos y dispositivos usados para la codificación y decodificación de audio, y en particular a cuantificadores de ganancia-forma de los codificadores y decodificadores de audio.

Antecedentes

Se espera que los servicios actuales de telecomunicaciones gestionen muchos tipos diferentes de señales de audio. Aunque el contenido de audio principal es señales de voz, existe un deseo por gestionar señales más generales, tales como música y mezclas de música y voz. Aunque la capacidad de las redes de telecomunicaciones está creciendo continuamente, sigue existiendo un gran interés en limitar el ancho de banda requerido por canal de comunicaciones. En las redes de comunicaciones móviles, unos anchos de banda de transmisión más pequeños para cada llamada producen un menor consumo de potencia tanto en el dispositivo móvil como en la estación base. Esto se traduce en un ahorro de energía y de costes para el operador de las comunicaciones móviles, mientras que el usuario final experimentará un aumento de la vida de la batería y un incremento del tiempo de habla. Además, con un consumo menor de ancho de banda por cada usuario, la red de telecomunicaciones móviles puede prestar servicio a un número mayor de usuarios en paralelo.

En la actualidad, la tecnología de compresión dominante para servicios de voz móviles es la Predicción Lineal con Excitación por Código (CELP), la cual logra una buena calidad de audio en cuanto a calidad de la voz con anchos de banda bajos. La misma se usa ampliamente en codees desplegados, tales como la Velocidad Completa Mejorada GSM (GSM-EFR), la MultIVelocIdad Adaptativa (AMR) y la Banda Ancha de AMR (AMR-WB). No obstante, para señales de audio generales, tales como música, la tecnología CELP presenta un rendimiento deficiente. Normalmente, estas señales se pueden representar mejor usando una codificación basada en transformadas a frecuencia, por ejemplo los codees G.722.1 y G.719 de la ITU-T. No obstante, los codees en el dominio de las transformadas trabajan generalmente con una velocidad de bits mayor que los codees de voz. Existe un vacío entre los dominios de la voz y del audio en general en términos de codificación, y es deseable aumentar el rendimiento de los codees en el dominio de las transformadas con velocidades de bits inferiores.

Los codees en el dominio de las transformadas requieren una representación compacta de los coeficientes de transformadas en el dominio de la frecuencia. Normalmente, estas representaciones se basan en una cuantificación vectorial (VQ), en la que los coeficientes se codifican en grupos. Un ejemplo de cuantificación vectorial es la VQ de ganancia-forma. Este planteamiento aplica una normalización a los vectores antes de codificar los coeficientes Individuales. Al factor de normalización y a los coeficientes normalizados se les hace referencia como ganancia y forma del vector, las cuales se pueden codificar por separado. La estructura de ganancia-forma tiene muchas ventajas. Al dividir la ganancia y la forma, el códec se puede adaptar fácilmente a niveles de entrada variables de las fuentes diseñando el cuantlflcador de ganancia. También resulta beneficioso desde la perspectiva de la percepción, en la que la ganancia y la forma pueden conllevar una importancia diferente en regiones de frecuencia diferentes. Finalmente, la división de ganancia-forma simplifica el diseño del cuantificador y lo hace menos complejo en términos de memoria y recursos computacionales en comparación con un cuantificador vectorial sin restricciones. En la figura 1, que ¡lustra un lado de codificador 40 y un lado de decodificador 50, puede observarse una vista general y funcional de un cuantlflcador de ganancia-forma para un vector según la técnica anterior. En la figura 1, un vector de datos de entrada arbitrario x 100 de longitud í se alimenta a un esquema de cuantificación de ganancia-forma. En este caso, el factor de ganancia se define como la norma euclídea (norma 2) del vector, lo cual implica que los términos ganancia y norma se usan de forma intercambiable en la totalidad del presente documento. En primer lugar, un módulo 110 de cálculo de normas calcula una norma g que representa el tamaño total del vector. Habltualmente, se usa la norma euclídea

A continuación, la norma se cuantifica por medio de un cuantificador 120 de normas para formar^ y un índice de cuantificación que representa la norma cuantificada. El vector de entrada se escala usando 1/^ con el fin de formar un vector de forma normalizado n, el cual a su vez se alimenta al cuantificador 130 de formas. El índice de cuantificador 7$ del cuantificador 130 de formas y el cuantificador 120 de normas se multiplexan por medio de un multiplexor 140 de flujos continuos de bits para su almacenamiento o transmisión a un decodificador 50. El decodificador 50 recupera los índices e 7^ a partir del flujo continuo de bits demultiplexado, y constituye un vector reconstruido í 190 recuperando el vector de forma cuantificado ti a partir del decodificador 150 de formas y la norma cuantificada a partir del decodificador 160 de normas, y escalando la forma cuantificada, con ^ 180. Generalmente, el cuantificador de ganancia-forma actúa sobre vectores de longitud limitada, aunque se pueden usar para gestionar

**(Ver fórmula)**

( í )

secuencias más largas fraccionando en primer lugar la señal en vectores más cortos y aplicando los cuantificadores de ganancia-forma a cada vector. Normalmente, esta estructura se usa en codees de audio basados en transformadas. La figura 2 ejemplifica un sistema de codificación basado en transformadas para cuantificación de ganancia y forma, para una secuencia de vectores según la técnica anterior. Debe observarse que la figura 1 ¡lustra un cuantificador de ganancia-forma para un vector, mientras que la cuantificación de ganancia-forma de la figura 2 se aplica en paralelo sobre una secuencia de vectores, en donde los vectores constituyen conjuntamente un espectro de frecuencia. La secuencia de los valores de ganancia (norma) constituye la envolvente espectral. El audio 200 de entrada se fracciona en primer lugar en segmentos de tiempo o tramas como preparación para la transformada 210 a frecuencia. Cada trama se transforma al dominio de la frecuencia para constituir un espectro en el dominio de la frecuencia Y. Esto se puede realizar usando cualquier transformada adecuada, tal como MDCT, DCT o DFT. La elección de la transformada puede depender de las características de la señal de entrada, de tal manera que con esa transformada se modelen adecuadamente propiedades importantes. También puede incluir consideraciones para otras etapas de procesado, en caso de que la transformada se reutilice para otras etapas de procesado, tales como un procesado estéreo. El espectro de frecuencia se fracciona en vectores de fila más cortos indicados como ,Y(áJ. En este momento, cada vector representa los coeficientes de una banda de frecuencia &. Desde una perspectiva de la percepción, resulta beneficioso fraccionar el espectro usando una estructura de bandas no uniforme que sigue la resolución frecuencial del sistema auditivo humano. Esto significa en general que se usan anchos de banda estrechos para frecuencias bajas, mientras que para frecuencias altas se usan anchos de banda mayores.

A continuación, la norma de cada banda se calcula 230 tal como en la ecuación (1) con el fin de constituir una secuencia de valores de ganancia Efe) que constituyen la envolvente espectral. A continuación, estos valores se cuantifican usando el cuantificador 240 de envolventes para constituir la envolvente cuantificada É(b). La cuantificación 240 de la envolvente se puede realizar usando... [Seguir leyendo]

 


Reivindicaciones:

1. Método en un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el método:

- determinar (S1) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por

- identificar (S2) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y

- aplicar (S3) la asignación de bits identificada cuando se codifica el vector de ganancia-forma.

2. Método según la reivindicación 1, en el que la primera propiedad de la señal es el ancho de banda.

3. Método en un decodificador de audio para asignar bits a un decuantificador de ajuste de ganancia y a un

decuantificador de forma para su uso con el fin de decodificar un vector de ganancia-forma, comprendiendo el método:

- determinar (S4) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por

- identificar (S5) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y

- aplicar (S6) la asignación de bits identificada cuando se decodifica el vector de ganancia-forma.

4. Método según la reivindicación 3, en el que la primera propiedad de la señal es el ancho de banda.

5. Codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de

forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el codificador una entidad 403 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, caracterizado por que la entidad 403 de compartición adaptativa de bits está configurada para identificar una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla 404 que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y un ajuste de ganancia, comprendiendo además el codificador un cuantificador 403 de forma configurado para aplicar la asignación de bits identificada cuando se codifica el vector de ganancia-forma.

6. Codificador de audio según la reivindicación 5, en el que la primera propiedad de la señal es el ancho de banda.

7. Codificador de audio según la reivindicación 5, en el que la primera propiedad de la señal es la longitud de la señal.

8. Codificador de audio según la reivindicación 6, en el que el ancho de banda es fijo y conocido en el codificador.

9. Codificador de audio según cualquiera de las reivindicaciones 5 a 8, en el que el codificador es un codificador de audio en el dominio de las transformadas.

10. Decodificador de audio para asignar bits aun decuantificador de ajuste de ganancia y un decuantificador de forma para su uso con el fin de decodificar un vector de ganancia-forma, comprendiendo el decodificador una entidad 505 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, caracterizado por que la entidad 505 de compartición adaptativa de bits está configurada para usar información de una tabla 406 que indica por lo menos una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y para identificar, usando dicha tabla 406, una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, y un ajuste de ganancia, y el decodificador comprende además un decuantificador 405 de forma configurado para aplicar la asignación de bits identificada cuando se decodifica el vector de ganancia-forma.

11. Decodificador de audio según la reivindicación 10, en el que la primera propiedad de la señal es el ancho de banda.

12. Decodificador de audio según la reivindicación 10, en el que la primera propiedad de la señal es la longitud de la señal.

5 13. Decodificador de audio según la reivindicación 11, en el que el ancho de banda es fijo y conocido en el

codificador.

14. Decodificador de audio según cualquiera de las reivindicaciones 10 a 13, en el que el decodificador es un decodificador de audio en el dominio de las transformadas.

15. Dispositivo móvil que comprende un codificador de audio según cualquiera de las reivindicaciones 5 a 9.

10 16. Dispositivo móvil que comprende un decodificador de audio según cualquiera de las reivindicaciones 10 a

14.