CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA APLICACIONES DE BAJA VELOCIDAD DE TRANSFERENCIA DE BITS.

Método para codificar una envolvente espectral de potencia de una señal de audio estereofónica o de una señal de audio multicanal que tiene dos canales,

teniendo los dos canales un conjunto de bandas de frecuencia, que comprende:

calcular un parámetro de equilibrio de la señal de audio estereofónica o de los dos canales para cada banda de frecuencia y un parámetro de nivel que representa la potencia total de los dos canales para cada banda de frecuencia

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E05017007.

Solicitante: CODING TECHNOLOGIES SWEDEN AB.

Nacionalidad solicitante: Suecia.

Dirección: DOBELNSGATAN 64,113 52 STOCKHOLM.

Inventor/es: KJORLING, KRISTOFER, LILJERYD, LARS, ENGDEGARD, JONAS, RODEN,JONAS, HENN,FREDERIK.

Fecha de Publicación: 19 de Agosto de 2010.

Fecha Solicitud PCT: 10 de Julio de 2002.

Fecha Concesión Europea: 14 de Abril de 2010.

Clasificación Internacional de Patentes:

G10L19/00M
H04S1/00D
H04S3/00A

Clasificación PCT:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S1/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas con dos canales (H04S 5/00, H04S 7/00 tienen prioridad).
H04S5/00 H04S […] › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.

Clasificación antigua:

G10L19/02 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
H04S5/00 H04S […] › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Finlandia, Chipre.

CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA APLICACIONES DE BAJA VELOCIDAD DE TRANSFERENCIA DE BITS.

Fragmento de la descripción:

Codificación estereofónica paramétrica eficaz y ampliable para aplicaciones de baja velocidad de transferencia de bits.

La presente invención se refiere a sistemas de codificación de fuentes de audio con baja velocidad de transferencia de bits. Se introducen diversas representaciones paramétricas de propiedades estereofónicas de una señal de entrada y se explica la aplicación de las mismas en el lado del decodificador, abarcando desde codificación pseudo estereofónica a codificación estereofónica total de envolventes espectrales, siendo la última de éstas especialmente adecuada para codificadores-decodificadores basados en HFR.

Las técnicas de codificación de fuentes de audio pueden dividirse en dos clases: codificación de audio natural y codificación de voz. A las velocidades de transferencia de bits medias a altas, la codificación de audio natural se utiliza normalmente para señales de música y voz, y es posible la transmisión y reproducción estereofónica. En aplicaciones en las que sólo se dispone de bajas velocidades de transferencia de bits, por ejemplo, en transmisiones de audio por Internet dirigidas a usuarios con conexiones telefónicas por módem lentas, o en los sistemas radiodifusión digital AM emergentes, es inevitable la codificación monofónica del material del programa de audio. Sin embargo, todavía puede desearse una sensación estereofónica, en particular, cuando se escucha con auriculares, en cuyo caso se percibe una señal monofónica pura como si proviniese de "dentro de la cabeza", lo cual puede resultar una experiencia desagradable.

Un enfoque para tratar este problema es sintetizar una señal estereofónica en el lado del decodificador a partir de una señal monofónica pura recibida. A través de los años se han propuesto varios generadores "pseudo estereofónicos" diferentes. Por ejemplo, en la patente estadounidense 5.883.962 se describe la mejora de señales monofónicas por medio de la adición de versiones desfasadas/retardadas de una señal a la señal sin procesar, creando con ello una ilusión estereofónica. Con ello, la señal procesada se añade a la señal original para cada una de las dos salidas a niveles iguales pero con signos opuestos, garantizando que las señales de mejora se cancelen si los dos canales se añaden posteriormente a la trayectoria de la señal. En el documento PCT WO 98/57436 se muestra un sistema similar, aunque sin la compatibilidad monofónica anterior de la señal mejorada. Los métodos de la técnica anterior tienen en común que se aplican como procesos únicamente posteriores. En otras palabras, no se facilita al decodificador información alguna acerca del grado de amplitud estereofónica, dejando a un lado la posición en la etapa de sonido estereofónica. De esta manera, la señal pseudo estereofónica puede asemejarse o no al carácter estereofónico de la señal original. Una situación particular en la que los sistemas de la técnica anterior resultan deficientes es cuando la señal original es una señal monofónica pura, lo cual es a menudo el caso en las grabaciones de voz. Esta señal monofónica se convierte a ciegas en una señal estereofónica sintética en el decodificador, lo cual en el caso de la voz origina artefactos perturbadores y puede reducir la claridad y la inteligibilidad de la voz. El documento J. Herre et al. "Intensity Stereo Coding", preimpresión n.º 3799 presentada en la AES Convention, 26 de febrero de 1994, da a conocer un método de codificación de audio para una fuente estereofónica que implica la determinación del parámetro direccional a partir del cual pueden obtenerse factores de escala de una banda de frecuencia dada en cada canal. Este documento no indica cómo puede reconstruirse una señal codificada de banda limitada en una señal de audio estereofónica decodificada de banda más amplia.

Otros sistemas de la técnica anterior dirigidos a la transmisión estereofónica real a bajas velocidades de transferencia de bits emplean normalmente un esquema de codificación de sumas y restas. De esta manera, las señales originales izquierda (L) y derecha (R) se convierten en una señal de suma, S = (L+R)/2, y una señal de resta, D = (L-R)/2, y seguidamente se codifican y tramiten. El receptor decodifica las señales S y D, recreándose la señal L/R original a través de las operaciones L = S + D, y R = S - D. La ventaja de esto es que con gran frecuencia se encuentra una redundancia entre L y R, siendo menos la información en D que debe codificarse, requiriendo menos bits, que en S. Claramente, el caso extremo es una señal monofónica pura, es decir, L y R son idénticas. Un codificador-decodificador L/R convencional codifica esta señal monofónica dos veces, mientras que un codificador-decodificador S/D detecta esta redundancia, y la señal D no requiere (de forma ideal) ningún bit en absoluto. Otro extremo lo representa la situación en la que R = -L, correspondiente a señales "fuera de fase". Ahora, la señal S es cero, mientras que la señal D computa para L. Nuevamente, el esquema S/D tiene una clara ventaja respecto a la codificación L/R estándar. Sin embargo, considérese la situación en la que, por ejemplo, R = 0 durante una transición, lo cual no era poco frecuente en los primeros tiempos de las grabaciones estereofónicas. S y D son iguales a L/2, y el esquema S/D no ofrece ninguna ventaja. Por el contrario, la codificación L/R trata esto muy bien: la señal R no requiere ningún bit. Por esta razón, los codificadores-decodificadores de la técnica anterior emplean conmutación adaptativa entre estos dos esquemas de codificación, dependiendo de qué método es más beneficioso para usarlo en un momento dado. Los ejemplos anteriores son meramente teóricos (excepto en el caso monofónico dual, que es común en los programas de sólo voz). De esta manera, el material de los programas estereofónicos del mundo real contiene importantes cantidades de información estereofónica, e incluso si se lleva a cabo la conmutación anterior, la velocidad de transferencia de bits resultante a menudo es aún demasiado alta para muchas aplicaciones. Además, tal como puede observarse de las relaciones de resintetización anteriores, no es factible una cuantificación muy poco precisa de la señal D en un intento de reducir adicionalmente la velocidad de transferencia de bits dado que los errores de cuantificación se traducen en errores de nivel que no pueden descuidarse en las señales L y R.

Es un objeto de la presente invención proporcionar un concepto mejorado para codificar una envolvente espectral de potencia o decodificar una corriente de bits codificada.

Este objeto se alcanza mediante un método de codificación según la reivindicación 1, un aparato de codificación según la reivindicación 11, un decodificador según la reivindicación 19 o un método de decodificación de una corriente de bits codificada según la reivindicación 24. En realizaciones, se utiliza una detección de propiedades estereofónicas de señales antes de la codificación y transmisión. En la forma más simple, un detector mide la cantidad de perspectiva estereofónica que se presenta en la señal estereofónica de entrada. Esta cantidad se transmite entonces como un parámetro de amplitud estereofónica, junto con una suma monofónica codificada de la señal original. El receptor decodifica la señal monofónica y aplica la cantidad adecuada de amplitud estereofónica empleando un generador pseudo estereofónico que se controla mediante dicho parámetro. Como un caso especial, una señal de entrada monofónica se señaliza como amplitud estereofónica cero y, de forma correspondiente, no se aplica síntesis estereofónica en el decodificador. Según la invención, pueden obtenerse medidas útiles de la amplitud estereofónica, por ejemplo, a partir de la señal diferencial o de la correlación cruzada del canal izquierdo y derecho original. El valor de estos cálculos puede representarse en un pequeño número de estados que se transmiten a una velocidad fija adecuada en el tiempo, o sobre una base de acuerdo con la necesidad. La invención también enseña cómo filtrar los componentes estereofónicos sintetizados para reducir el riesgo de desenmascarar artefactos de codificación que normalmente están asociados con señales de codificación de baja velocidad de transferencia de bits.

De forma alternativa, el equilibrio estereofónico global o localización en el campo estereofónico se detecta en el codificador. Esta información, opcionalmente junto con el parámetro de amplitud anterior, se transmite eficazmente como un parámetro de equilibrio, junto con la señal monofónica codificada. De esta manera, los desplazamientos a cualquier lado de la etapa de...

Reivindicaciones:

1. Método para codificar una envolvente espectral de potencia de una señal de audio estereofónica o de una señal de audio multicanal que tiene dos canales, teniendo los dos canales un conjunto de bandas de frecuencia, que comprende:

calcular un parámetro de equilibrio de la señal de audio estereofónica o de los dos canales para cada banda de frecuencia y un parámetro de nivel que representa la potencia total de los dos canales para cada banda de frecuencia.

2. Método según la reivindicación 1, que comprende además la siguiente etapa: cuantificar los parámetros de nivel y los parámetros de equilibrio, en el que la etapa de cuantificación se realiza de tal manera que el parámetro de equilibrio se cuantifica con menos precisión que el parámetro de nivel.

3. Método según la reivindicación 1 ó 2, en el que el parámetro de equilibrio para una banda de frecuencia se obtiene basándose en un cociente de potencias de señal de los dos canales para la banda de frecuencia.

4. Método según una cualquiera de las reivindicaciones precedentes, que comprende además la siguiente etapa:

calcular de manera adaptativa un nivel del primer canal y un nivel del segundo canal en lugar de calcular el parámetro de nivel y el parámetro de equilibrio.

5. Método según una de las reivindicaciones precedentes, que comprende además la siguiente etapa:

convertir el parámetro de nivel en una representación en dB usando una potencia de referencia arbitraria y convertir el parámetro de equilibrio en una representación en dB.

6. Método según la reivindicación 5, en el que la representación en dB del parámetro de nivel se define por L_dB = 10 log₁₀P/P_ref y la representación en dB del parámetro de equilibrio se define por B_dB = 10 log₁₀(B),

en el que L_dB es la representación en dB del parámetro de nivel;

en el que B_db es la representación en dB del parámetro de equilibrio;

en el que P es una representación no logarítmica del parámetro de nivel;

en el que B es una representación no logarítmica del parámetro de equilibrio;

en el que P_ref es la potencia de referencia arbitraria, y

en el que log₁₀ es un operador logarítmico de base 10.

7. Método según una de las reivindicaciones precedentes, que comprende además las siguientes etapas:

codificar a modo delta y codificar a modo Huffman los parámetros de equilibrio y los parámetros de nivel; y transmitir y almacenar los parámetros con codificación delta y con codificación Huffman.

8. Método según una de las reivindicaciones precedentes, en el que el parámetro de equilibrio se cuantifica de manera progresiva.

9. Método según una de las reivindicaciones precedentes, en el que el parámetro de nivel no se cuantifica de manera progresiva.

10. Método según una de las reivindicaciones precedentes, que comprende además la siguiente etapa:

codificar a modo delta el parámetro de equilibrio de manera adaptativa en tiempo o en frecuencia, en el que la codificación delta en tiempo se usa cuando una fuente tiene una característica en tiempo más estacionaria y una mayor radiación no uniforme, y

en el que la codificación delta en frecuencia se usa cuando la fuente tiene una característica en tiempo menos estacionaria y una menor radiación no uniforme.

11. Aparato para codificar una envolvente espectral de potencia de una señal de audio estereofónica o una señal de audio multicanal o la señal que tiene dos canales, teniendo los dos canales un conjunto de bandas de frecuencia, que comprende:

un calculador para calcular un parámetro de equilibrio para cada banda de frecuencia y un parámetro de nivel que representa la potencia total de la señal estereofónica o los dos canales para cada banda de frecuencia.

12. Codificador que comprende:

un codificador de banda baja para codificar la señal de audio estereofónica o una señal de audio multicanal que tiene dos canales para obtener una señal de salida codificada de banda baja; y

un codificador estereofónico paramétrico para estimar una envolvente espectral de potencia de banda alta de la señal, teniendo el codificador estereofónico paramétrico un aparato para codificar según la reivindicación 11.

13. Codificador según la reivindicación 12, que es operativo para alimentar los parámetros de nivel en una corriente primaria de bits y para alimentar los parámetros de equilibrio en una corriente secundaria de bits.

14. Codificador según la reivindicación 13, que comprende además:

un multiplexor de corriente primaria de bits para multiplexar la señal de salida del codificador de banda baja y el parámetro de nivel en la corriente primaria de bits; y

un multiplexor de corriente secundaria de bits para multiplexar el parámetro de equilibrio en la corriente secundaria de bits.

15. Codificador según una de las reivindicaciones 12 a 14, en el que el codificador de banda baja es operativo para generar una señal de suma que va a enviarse a una corriente primaria de bits y una señal de resta que va a enviarse a una corriente secundaría de bits, y

en el que el codificador estereofónico paramétrico es además operativo para enviar uno o más parámetros estereofónicos a la corriente primaria de bits.

16. Codificador según la reivindicación 15, que es operativo para incluir información de banda baja adicional en la corriente secundaria de bits que, cuando se combina con una señal de salida de banda baja de la corriente primaria de bits, produce una señal de salida del decodificador de banda baja de mayor calidad.

17. Codificador según una de las reivindicaciones 12 a 16, en el que el codificador estereofónico paramétrico está dispuesto para generar el parámetro de amplitud y para alimentar el parámetro de amplitud y el parámetro de equilibrio a la corriente primaria de bits.

18. Método de codificación, que comprende:

codificar la señal estereofónica de audio o una señal de audio multicanal que tiene dos canales para obtener una señal de salida codificada de banda baja; y estimar una envolvente espectral de potencia de banda alta de la señal, en el que en la etapa de estimación se realiza un método según una de las reivindicaciones 1 a 10.

19. Decodificador para decodificar una corriente de bits de audio codificada, que comprende:

un demultiplexor para demultiplexar la corriente de bits codificada para obtener una señal de decodificador central de banda baja y un parámetro de nivel de banda alta, representando el parámetro de nivel de banda alta la potencia total de dos canales de una señal en una banda de frecuencia de la banda alta de la señal que tiene los dos canales;

un decodificador central de banda baja para producir una señal de salida de banda baja, teniendo la señal de salida de banda baja una señal monofónica de banda baja o una señal estereofónica de banda baja; y

una unidad de reconstrucción de alta frecuencia para generar una banda alta sintética usando la señal de salida de banda baja y el parámetro de nivel de banda alta y para combinar la banda alta sintética y la señal de salida de banda baja.

20. Decodificador según la reivindicación 19, en el que la unidad de reconstrucción de alta frecuencia comprende además un generador pseudo estereofónico para mejorar la señal de salida de banda baja o la banda alta sintética.

21. Decodificador según la reivindicación 19 ó 20, en el que una señal de entrada del decodificador incluye una corriente primaria de bits y una corriente secundaria de bits, comprendiendo la corriente secundaria de bits además un parámetro de equilibrio para cada banda de frecuencia de la señal, y

en el que la unidad de reconstrucción de alta frecuencia es operativa para recibir el parámetro de equilibrio.

22. Decodificador según la reivindicación 19, en el que la corriente de bits incluye una señal de suma de los dos canales y el decodificador central de banda baja es operativo para generar la señal de salida de banda baja como una señal monofónica.

23. Decodificador según la reivindicación 22, en el que la corriente de bits incluye además uno o más parámetros estereofónicos, y

en el que la unidad de reconstrucción de alta frecuencia es operativa además para generar una salida pseudo estereofónica usando un generador pseudo estereofónico controlado por el uno o más parámetros estereofónicos.

24. Método para decodificar una corriente de bits de audio codificada, que comprende:

demultiplexar la corriente de bits codificada para obtener una señal de decodificador central de banda baja y un parámetro de nivel de banda alta, representando el parámetro de nivel de banda alta la potencia total de dos canales de una señal en una banda de frecuencia de la banda alta de la señal que tiene los dos canales;

decodificar la señal de decodificador central de banda baja para producir una señal de salida de banda baja, teniendo la señal de salida de banda baja una señal monofónica de banda baja o una señal estereofónica de banda baja; y

generar mediante reconstrucción de alta frecuencia una banda alta sintética usando la señal de salida de banda baja y el parámetro de nivel de banda alta y combinando la banda alta sintética y la señal de salida de banda baja.

Patentes similares o relacionadas:

MÉTODO, DISPOSITIVO, APARATO CODIFICADOR, APARATO DECODIFICADOR Y SISTEMA DE AUDIO, del 8 de Febrero de 2012, de Koninklijke Philips Electronics N.V. Dolby International AB: Método de procesamiento de una señal de mezcla descendente estéreo que comprende señales estéreo primera y segunda (L0, R0), codificando la señal de mezcla […]

SISTEMA Y PROCEDIMIENTO PARA LA TRANSMISIÓN INALÁMBRICA DE SEÑALES DE AUDIO DIGITALES, del 20 de Diciembre de 2011, de GRUNDIG MULTIMEDIA B.V.: Sistema para la transmisión inalámbrica de señales de audio digitales con una unidad central , con un dispositivo para la selección […]

DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL, del 13 de Mayo de 2011, de DOLBY LABORATORIES LICENSING CORPORATION: Método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada, en el que dichas señales de audio de entrada pueden incluir componentes […]

PROCEDIMIENTO Y APARATO PARA EL REALZADO DEL ESTEREO EN GRABACIONES DE AUDIO, del 23 de Junio de 2010, de UNIVERSIDAD POLITECNICA DE VALENCIA: Procedimiento y aparato para el realzado del estéreo en grabaciones de audio. La presente invención se enmarca dentro del campo de sistemas de procesado digital de la señal […]

CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA, del 13 de Mayo de 2010, de CODING TECHNOLOGIES AB: Unidad de reverberación para generar un primer canal y un segundo canal de una señal estereofónica o una señal multicanal, que comprende: un detector para detectar terminaciones […]

CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AJUSTABLE A ESCALA PARA APLICACIONES DE CODIFICACION DE AUDIO A BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 18 de Febrero de 2010, de DOLBY SWEDEN AB: Método para decodificar una envolvente espectral de potencia codificada de una señal estereofónica o una señal multicanal que tiene dos canales, teniendo los dos canales un […]

PROCEDIMIENTO Y DISPOSITIVO DE ESPACIALIZACION SONORA BINAURAL EFICAZ EN EL DOMINIO TRANSFORMADO, del 7 de Diciembre de 2009, de FRANCE TELECOM: Procedimiento de espacialización sonora de una escena de audio que comprende un primer conjunto que comprende un número, superior o igual a la unidad, […]

PROCEDIMIENTO Y APARATO PARA CODIFICAR Y DECODIFICAR SEÑALES DIGITALES, del 13 de Enero de 2012, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento de codificación de señales digitales compuestas de al menos dos canales, comprendiendo el procedimiento: dividir las señales digitales […]