Decodificación de señal de audio multicanal usando señales de-correlacionadas.

Decodificador de audio (400; 500; 600) multi-canal para generar una reconstrucción de una señal multi-canal

(412; 508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multicanal original, teniendo la reconstrucción de la señal multi-canal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende:

un de-correlador (402; 502; 602; 700) para obtener un conjunto de señales de-correlacionadas usando una regla de de-correlación, en el que la regla de de-correlación es de manera que se obtiene una primera señal de correlacionada y una segunda señal de-correlacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal de-correlacionada y la segunda señal de-correlacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales de-correlacionadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de-correlacionados entre sí.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/011664.

Solicitante: DOLBY INTERNATIONAL AB.

Nacionalidad solicitante: Países Bajos.

Dirección: Apollo Building, 3E, Herikerbergweg 1-35 1101 CN Amsterdam Zuid-Oost PAISES BAJOS.

Inventor/es: ENGDEGARD, JONAS, PURNHAGEN,HEIKO, BREEBAART,JEROEN, SCHUIJERS,ERIK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > Sistemas seudoestereofónicos, p. ej. en los que... > H04S5/02 (del tipo seudocuadrafónico, p. ej. en los que las señales de los canales de llegada son derivados de señales estereofónicas de dos canales)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2544946_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

La presente Invención se refiere a codificación de señales de audio multl-canal usando parámetros espaciales y en particular a nuevos conceptos mejorados para generar y usar señales de-correlaclonadas.

En la actualidad, las técnicas de reproducción de audio multl-canal se están haciendo más y más Importantes. En vista de una transmisión eficaz de señales de audio multl-canal que tengan 5 o más canales de audio separados, se han desarrollado varias maneras de comprimir una señal estéreo o multl-canal. Enfoques recientes para la codificación paramétrlca de señales de audio multl-canal (estéreo paramétrlco (PS), "Codificación de Indicación Blnaural" (BCC) etc.) representan una señal de audio multl-canal por medio de una señal de sub-mezcla (podría ser monofònica o comprender varios canales) e Información de lado paramétrlco, también denominada como "Indicaciones espaciales", que caracterizan su etapa de sonido espacial percibido.

Un dispositivo de codificación multl-canal generalmente recibe - como entrada - al menos dos canales, y emite uno o más canales de portadora y datos paramétrlcos. Los datos paramétrlcos se obtienen de manera que, en un decodlflcador, puede calcularse una aproximación de la señal multl-canal original. Normalmente, el canal (canales) de portadora Incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio de tiempo, etc., que proporcionan una representación comparativamente precisa de la señal subyacente, mientras que los datos paramétrlcos no Incluyen tales muestras de coeficientes espectrales pero Incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción en su lugar. Una reconstrucción de este tipo podría comprender la ponderación mediante multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, desplazamiento de fase, etc. Por lo tanto, los datos paramétrlcos Incluyen únicamente una representación comparativamente aproximada de la señal o del canal asociado.

La técnica codificación de Indicación blnaural (BCC) se describe en un número de publicaciones, como en "Binaural Cue Codlng applled to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention artículo 5574, mayo de 2002, Múnlch, en las publicaciones del 2 ICASSP "Estimation of auditory spatial cues for blnaural cue codlng", y "Blnaural cue codlng: a normal and efficient representaron of spatial audio", ambas escritas por C. Faller, y F. Baumgarte, Orlando, FL, mayo de 2002.

En la codificación BCC, un número de canales de entrada de audio se convierten a una representación espectral usando una DFT (Transformada Discreta de Fourier) basada en la transformación con ventanas solapantes. El espectro uniforme resultante a continuación se divide en particiones no solapantes. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB). A continuación, los parámetros espaciales denominados ICLD (Diferencia de Nivel Inter-Canal) e ICTD (Diferencia de Tiempo Inter-Canal) se estiman para cada partición. El parámetro ICLD describe una diferencia de nivel entre dos canales y el parámetro ICTD describe la diferencia de tiempo (desplazamiento de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se proporcionan normalmente para cada canal con respecto a un canal de referencia. Después de la derivación de estos parámetros, los parámetros se cuantifican y finalmente se codifican para la transmisión.

Aunque los parámetros ICLD y ICTD representan los parámetros de localización de fuente de sonido más importantes, una representación espacial que use estos parámetros puede mejorarse introduciendo parámetros adicionales.

Una técnica relacionada, denominada "estéreo paramétrico" describe la codificación paramétrica de una señal estéreo de dos canales basándose en una señal mono transmitida más información del lado de parámetro. En este contexto, se introducen 3 tipos de parámetros espaciales, denominados como diferencia de intensidad ínter-canal (IID), diferencias de fase inter-canal (IPD) y coherencia ínter-canal (ICC). El alcance del parámetro espacial establecido con un parámetro de coherencia (parámetro de correlación) posibilita una parametrización de la "difusión" espacial percibida o "compacidad" espacial de la etapa de sonido. El estéreo paramétrico se describe en más detalle en: "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, páginas 1305-1322)", en "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116th Convention, preimpresión 6072, Berlín, mayo de 2004, y en "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, preimpresión 6073, Berlín, mayo de 2004.

La presente invención se refiere a codificación paramétrica de las propiedades espaciales de una señal de audio. Los decodificadores de audio multi-canal paramétricos reconstruyen N canales basándose en M canales transmitidos, donde N > M, y datos de control adicional. Los datos de control adicional representan una velocidad de datos significativamente inferior a transmitir todos los N canales, haciendo la codificación muy eficaz mientras que al mismo tiempo asegura la compatibilidad con al menos tanto dispositivos de M canales como dispositivos de N canales. Los parámetros típicos usados para describir propiedades espaciales son diferencias de intensidad inter

canal (IID), diferencias de tiempo ¡nter-canal (ITD) y coherencias ¡nter-canal (ICC). Para reconstruir las propiedades espaciales basándose en estos parámetros, se requiere un método que pueda reconstruir el nivel correcto de correlación entre dos o más canales, de acuerdo con los parámetros IC. Esto se consigue por medio de un método de de-correlación, es decir, un método para obtener señales decorrelacionadas desde señales transmitidas para combinar señales decorrelaclonadas con señales transmitidas en algún proceso de premezcla. Los métodos para premezclar basándose en una señal transmitida, una señal decorrelacionada y parámetros de IID/ICC se describen en las referencias anteriormente proporcionadas.

Existen un par de métodos disponibles para creación de señales de-correlacionadas. Preferentemente, las señales decorrelaclonadas tienen envolventes temporales y espectrales similares o ¡guales a las señales de entrada originales. Idealmente, se desea una función Invariante en el tiempo lineal (LTI) con respuesta de frecuencia de paso-todo. Un método evidente para conseguir esto es usar un retardo constante. Sin embargo, usar un retardo, o cualquier otra función LTI paso-todo, dará como resultado respuesta no paso-todo después de la adición de la señal no procesada. En el caso de un retardo, el resultado será típicamente filtro de peine. El filtro de peine a menudo proporciona un sonido "metálico" Indeseable que, Incluso aunque el efecto de ampliación de estéreo puede ser eficaz, reduce mucha naturaleza del original. El método de retardo constante y otros métodos de la técnica anterior sufren de la Incapacidad para crear más de una señal de-correlaclonada mientras conservan la calidad y la de- correlaclón mutua.

La calidad perceptual de una señal de audlo multl-canal reconstruida por lo tanto depende fuertemente de un concepto eficaz que permite la generación de una señal de-correlaclonada desde una señal transmitida, en el que Idealmente la señal de-correlaclonada es ortogonal a la señal desde la que se obtiene, es decir perfectamente de- correlaclonada. Incluso si está disponible una señal perfectamente de-correlacionada,... [Seguir leyendo]

 


Reivindicaciones:

1. Decodificador de audio (400; 500; 600) multi-canal para generar una reconstrucción de una señal multl-canal (412; 508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multi- canal original, teniendo la reconstrucción de la señal multl-canal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende:

un de-correlador (402; 502; 602; 700) para obtener un conjunto de señales de-correlaclonadas usando una regla de de-correlación, en el que la regla de de-correlaclón es de manera que se obtiene una primera señal decorrelacionada y una segunda señal de-correlacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal de-correlacionada y la segunda señal de-correlaclonada son ortogonales entre sí en un Intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales de-correlaclonadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de-correlacionados entre sí.

2. Decodlflcador de audio (400; 500; 600) multi-canal de acuerdo con la reivindicación 1 en el que la regla de de- correlaclón es de manera que el intervalo de tolerancia de ortogonalidad incluye valores de ortogonalidad <0,5 cuando un valor de ortogonalidad de 0 indica ortogonalidad perfecta y un valor de ortogonalidad de 1 indica correlación perfecta.

3. Decodlflcador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 2, en el que cada uno de dichos uno o más filtros (800) IIR tiene un primer sumador en una trayectoria de predicción directa del filtro para añadir una porción real del canal de audio y una porción anterior del canal de audio que está ponderada con un primer factor de ponderación; y un segundo sumador en una trayectoria de predicción hacia atrás para añadir la porción anterior del canal de audio a la porción real que está ponderada con un segundo factor de ponderación de la señal de audio; y en el que los valores absolutos del primero y el segundo factores de ponderación son ¡guales.

4. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con la reivindicación 3, en el que cada uno de dichos uno o más filtros (704; 800) IIR es operativo para usar un primer y un segundo factores de ponderación que se obtienen a partir de secuencias de ruido aleatorio.

5. Decodiflcador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 4, en el que la regla de de-correlación es de manera que la primera señal de-correlacionada y la segunda señal de-correlacionada se obtienen usando una versión retardada en tiempo de la señal de submezcla (405; 505a, b; 605; 620).

6. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 5, operativo para obtener la primera y la segunda señales de-correlacionadas usando una porción de la señal de submezcla obtenida desde la señal de submezcla (405; 505a, b; 605; 620) mediante un banco de filtros con valores reales o complejos.

7. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 6, en el que el calculador de canal de salida es operativo para generar cinco canales de salida desde una señal de submezcla (405; 505a, b; 605; 620) que tiene información sobre un canal de audio y desde cuatro señales de-correlacionadas.

8. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 7, en el que el calculador de canal de salida es operativo para generar cinco canales de salida desde la señal de submezcla (405; 505a, b; 605; 620) que tiene información sobre dos canales de audio y desde dos señales de-correlacionadas.

9. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 8, en el que el calculador de canal de salida (403; 503; 603) es operativo para usar la información premezclada que comprende al menos un parámetro que indica una correlación deseada de un primer y un segundo canal de salida.

10. Método para generar una reconstrucción de una señal de audio multi-canal usando una señal de submezcla obtenida desde una señal multi-canal original, teniendo la reconstrucción de la señal multi-canal al menos tres canales, comprendiendo el método:

obtener un conjunto de señales de-correlacionadas usando una regla de de-correlación, en el que la regla de decorrelación es de manera que la primera señal de-correlacionada y la segunda señal de-correlacionada se obtienen usando la señal de submezcla y que la primera señal de-correlacionada y la segunda señal decorrelacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales de-correlacionadas comprende el filtrado de un canal de audio (406; 506; 607)

extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

generar canales de salida usando la señal de submezcla, la primera y la segunda señales de de-correlaclón y la Información de premezcla de modo que los al menos tres canales están al menos parcialmente de- 5 correlacionados entre sí.

11. Receptor o reproductor de audio, teniendo el receptor o el reproductor de audio un decodlflcador multl-canal (400; 500; 600) de acuerdo con la reivindicación 1.

10 12. Método para recibir o reproducir audio, teniendo el método un método para generar una reconstrucción de una

señal multl-canal de acuerdo con la reivindicación 10.

13. Programa Informático para realizar, cuando se ejecuta en un ordenador, un método de acuerdo con cualquiera de las reivindicaciones del método 10 o 12.