Decodificación de señal de audio multicanal usando señales de-correlacionadas.

Decodificador de audio (400; 500; 600) multi-canal para generar una reconstrucción de una señal multi-canal (412;

508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multicanal original, teniendo la reconstrucción de la señal multi-canal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende:

un de-correlador (402; 502; 602; 700) para obtener un conjunto de señales de-correlacionadas usando una regla de de-correlación, en el que la regla de de-correlación es de manera que se obtiene una primera señal de correlacionada y una segunda señal de-correlacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal de-correlacionada y la segunda señal de-correlacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales de-correlacionadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de-correlacionados entre sí.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/011664.

Solicitante: DOLBY INTERNATIONAL AB.

Nacionalidad solicitante: Países Bajos.

Dirección: Apollo Building, 3E, Herikerbergweg 1-35 1101 CN Amsterdam Zuid-Oost PAISES BAJOS.

Inventor/es: ENGDEGARD, JONAS, PURNHAGEN,HEIKO, BREEBAART,JEROEN, SCHUIJERS,ERIK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/008 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
  • H04S5/02 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.H04S 5/00 Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación. › del tipo seudocuadrafónico, p. ej. en los que las señales de los canales de llegada son derivados de señales estereofónicas de dos canales.

PDF original: ES-2544946_T3.pdf

 


Fragmento de la descripción:

La presente Invención se refiere a codificación de señales de audio multl-canal usando parámetros espaciales y en particular a nuevos conceptos mejorados para generar y usar señales de-correlaclonadas.

En la actualidad, las técnicas de reproducción de audio multl-canal se están haciendo más y más Importantes. En vista de una transmisión eficaz de señales de audio multl-canal que tengan 5 o más canales de audio separados, se han desarrollado varias maneras de comprimir una señal estéreo o multl-canal. Enfoques recientes para la codificación paramétrlca de señales de audio multl-canal (estéreo paramétrlco (PS), "Codificación de Indicación Blnaural" (BCC) etc.) representan una señal de audio multl-canal por medio de una señal de sub-mezcla (podría ser monofònica o comprender varios canales) e Información de lado paramétrlco, también denominada como "Indicaciones espaciales", que caracterizan su etapa de sonido espacial percibido.

Un dispositivo de codificación multl-canal generalmente recibe - como entrada - al menos dos canales, y emite uno o más canales de portadora y datos paramétrlcos. Los datos paramétrlcos se obtienen de manera que, en un decodlflcador, puede calcularse una aproximación de la señal multl-canal original. Normalmente, el canal (canales) de portadora Incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio de tiempo, etc., que proporcionan una representación comparativamente precisa de la señal subyacente, mientras que los datos paramétrlcos no Incluyen tales muestras de coeficientes espectrales pero Incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción en su lugar. Una reconstrucción de este tipo podría comprender la ponderación mediante multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, desplazamiento de fase, etc. Por lo tanto, los datos paramétrlcos Incluyen únicamente una representación comparativamente aproximada de la señal o del canal asociado.

La técnica codificación de Indicación blnaural (BCC) se describe en un número de publicaciones, como en "Binaural Cue Codlng applled to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention artículo 5574, mayo de 2002, Múnlch, en las publicaciones del 2 ICASSP "Estimation of auditory spatial cues for blnaural cue codlng", y "Blnaural cue codlng: a normal and efficient representaron of spatial audio", ambas escritas por C. Faller, y F. Baumgarte, Orlando, FL, mayo de 2002.

En la codificación BCC, un número de canales de entrada de audio se convierten a una representación espectral usando una DFT (Transformada Discreta de Fourier) basada en la transformación con ventanas solapantes. El espectro uniforme resultante a continuación se divide en particiones no solapantes. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB). A continuación, los parámetros espaciales denominados ICLD (Diferencia de Nivel Inter-Canal) e ICTD (Diferencia de Tiempo Inter-Canal) se estiman para cada partición. El parámetro ICLD describe una diferencia de nivel entre dos canales y el parámetro ICTD describe la diferencia de tiempo (desplazamiento de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se proporcionan normalmente para cada canal con respecto a un canal de referencia. Después de la derivación de estos parámetros, los parámetros se cuantifican y finalmente se codifican para la transmisión.

Aunque los parámetros ICLD y ICTD representan los parámetros de localización de fuente de sonido más importantes, una representación espacial que use estos parámetros puede mejorarse introduciendo parámetros adicionales.

Una técnica relacionada, denominada "estéreo paramétrico" describe la codificación paramétrica de una señal estéreo de dos canales basándose en una señal mono transmitida más información del lado de parámetro. En este contexto, se introducen 3 tipos de parámetros espaciales, denominados como diferencia de intensidad ínter-canal (IID), diferencias de fase inter-canal (IPD) y coherencia ínter-canal (ICC). El alcance del parámetro espacial establecido con un parámetro de coherencia (parámetro de correlación) posibilita una parametrización de la "difusión" espacial percibida o "compacidad" espacial de la etapa de sonido. El estéreo paramétrico se describe en más detalle en: "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, páginas 1305-1322)", en "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116th Convention, preimpresión 6072, Berlín, mayo de 2004, y en "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, preimpresión 6073, Berlín, mayo de 2004.

La presente invención se refiere a codificación paramétrica de las propiedades espaciales de una señal de audio. Los decodificadores de audio multi-canal paramétricos reconstruyen N canales basándose en M canales transmitidos, donde N > M, y datos de control adicional. Los datos de control adicional representan una velocidad de datos significativamente inferior a transmitir todos los N canales, haciendo la codificación muy eficaz mientras que al mismo tiempo asegura la compatibilidad con al menos tanto dispositivos de M canales como dispositivos de N canales. Los parámetros típicos usados para describir propiedades espaciales son diferencias de intensidad inter

canal (IID), diferencias de tiempo ¡nter-canal (ITD) y coherencias ¡nter-canal (ICC). Para reconstruir las propiedades espaciales basándose en estos parámetros, se requiere un método que pueda reconstruir el nivel correcto de correlación entre dos o más canales, de acuerdo con los parámetros IC. Esto se consigue por medio de un método de de-correlación, es decir, un método para obtener señales decorrelacionadas desde señales transmitidas para combinar señales decorrelaclonadas con señales transmitidas en algún proceso de premezcla. Los métodos para premezclar basándose en una señal transmitida, una señal decorrelacionada y parámetros de IID/ICC se describen en las referencias anteriormente proporcionadas.

Existen un par de métodos disponibles para creación de señales de-correlacionadas. Preferentemente, las señales decorrelaclonadas tienen envolventes temporales y espectrales similares o ¡guales a las señales de entrada originales. Idealmente, se desea una función Invariante en el tiempo lineal (LTI) con respuesta de frecuencia de paso-todo. Un método evidente para conseguir esto es usar un retardo constante. Sin embargo, usar un retardo, o cualquier otra función LTI paso-todo, dará como resultado respuesta no paso-todo después de la adición de la señal no procesada. En el caso de un retardo, el resultado será típicamente filtro de peine. El filtro de peine a menudo proporciona un sonido "metálico" Indeseable que, Incluso aunque el efecto de ampliación de estéreo puede ser eficaz, reduce mucha naturaleza del original. El método de retardo constante y otros métodos de la técnica anterior sufren de la Incapacidad para crear más de una señal de-correlaclonada mientras conservan la calidad y la de- correlaclón mutua.

La calidad perceptual de una señal de audlo multl-canal reconstruida por lo tanto depende fuertemente de un concepto eficaz que permite la generación de una señal de-correlaclonada desde una señal transmitida, en el que Idealmente la señal de-correlaclonada es ortogonal a la señal desde la que se obtiene, es decir perfectamente de- correlaclonada. Incluso si está disponible una señal perfectamente de-correlacionada, no puede obtenerse una premezcla multl-canal en la que los canales Individuales se de-correlacionan mutuamente usando una única señal de-correlaclonada. Durante la premezcla se genera un canal de audio reconstruido combinando una señal transmitida con la señal de-correlaclonada generada, mientras que el alcance al que la señal de-correlacionada se mezcla a la señal transmitida se controla típicamente mediante un parámetro de audio espacial (ICC) transmitido. No pueden conseguirse por lo tanto señales de-correlaclonadas mutuamente de manera perfecta, puesto que cada canal de audlo reconstruido tiene una fracción de la misma señal de-correlacionada.

Ya que la reconstrucción multl-canal gana más y más Interés, se conoce un número de publicaciones en relación con esta materia. Por ejemplo, la solicitud de patente Internacional N° W02005/101370 A1 se refiere a un aparato para la generación de un parámetro de nivel para generar una representación multi-canal a partir... [Seguir leyendo]

 


Reivindicaciones:

1. Decodificador de audio (400; 500; 600) multi-canal para generar una reconstrucción de una señal multl-canal (412; 508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multi- canal original, teniendo la reconstrucción de la señal multl-canal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende:

un de-correlador (402; 502; 602; 700) para obtener un conjunto de señales de-correlaclonadas usando una regla de de-correlación, en el que la regla de de-correlaclón es de manera que se obtiene una primera señal decorrelacionada y una segunda señal de-correlacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal de-correlacionada y la segunda señal de-correlaclonada son ortogonales entre sí en un Intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales de-correlaclonadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de-correlacionados entre sí.

2. Decodlflcador de audio (400; 500; 600) multi-canal de acuerdo con la reivindicación 1 en el que la regla de de- correlaclón es de manera que el intervalo de tolerancia de ortogonalidad incluye valores de ortogonalidad <0,5 cuando un valor de ortogonalidad de 0 indica ortogonalidad perfecta y un valor de ortogonalidad de 1 indica correlación perfecta.

3. Decodlflcador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 2, en el que cada uno de dichos uno o más filtros (800) IIR tiene un primer sumador en una trayectoria de predicción directa del filtro para añadir una porción real del canal de audio y una porción anterior del canal de audio que está ponderada con un primer factor de ponderación; y un segundo sumador en una trayectoria de predicción hacia atrás para añadir la porción anterior del canal de audio a la porción real que está ponderada con un segundo factor de ponderación de la señal de audio; y en el que los valores absolutos del primero y el segundo factores de ponderación son ¡guales.

4. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con la reivindicación 3, en el que cada uno de dichos uno o más filtros (704; 800) IIR es operativo para usar un primer y un segundo factores de ponderación que se obtienen a partir de secuencias de ruido aleatorio.

5. Decodiflcador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 4, en el que la regla de de-correlación es de manera que la primera señal de-correlacionada y la segunda señal de-correlacionada se obtienen usando una versión retardada en tiempo de la señal de submezcla (405; 505a, b; 605; 620).

6. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 5, operativo para obtener la primera y la segunda señales de-correlacionadas usando una porción de la señal de submezcla obtenida desde la señal de submezcla (405; 505a, b; 605; 620) mediante un banco de filtros con valores reales o complejos.

7. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 6, en el que el calculador de canal de salida es operativo para generar cinco canales de salida desde una señal de submezcla (405; 505a, b; 605; 620) que tiene información sobre un canal de audio y desde cuatro señales de-correlacionadas.

8. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 7, en el que el calculador de canal de salida es operativo para generar cinco canales de salida desde la señal de submezcla (405; 505a, b; 605; 620) que tiene información sobre dos canales de audio y desde dos señales de-correlacionadas.

9. Decodificador de audio (400; 500; 600) multi-canal de acuerdo con las reivindicaciones 1 a 8, en el que el calculador de canal de salida (403; 503; 603) es operativo para usar la información premezclada que comprende al menos un parámetro que indica una correlación deseada de un primer y un segundo canal de salida.

10. Método para generar una reconstrucción de una señal de audio multi-canal usando una señal de submezcla obtenida desde una señal multi-canal original, teniendo la reconstrucción de la señal multi-canal al menos tres canales, comprendiendo el método:

obtener un conjunto de señales de-correlacionadas usando una regla de de-correlación, en el que la regla de decorrelación es de manera que la primera señal de-correlacionada y la segunda señal de-correlacionada se obtienen usando la señal de submezcla y que la primera señal de-correlacionada y la segunda señal decorrelacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales de-correlacionadas comprende el filtrado de un canal de audio (406; 506; 607)

extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y

generar canales de salida usando la señal de submezcla, la primera y la segunda señales de de-correlaclón y la Información de premezcla de modo que los al menos tres canales están al menos parcialmente de- 5 correlacionados entre sí.

11. Receptor o reproductor de audio, teniendo el receptor o el reproductor de audio un decodlflcador multl-canal (400; 500; 600) de acuerdo con la reivindicación 1.

10 12. Método para recibir o reproducir audio, teniendo el método un método para generar una reconstrucción de una

señal multl-canal de acuerdo con la reivindicación 10.

13. Programa Informático para realizar, cuando se ejecuta en un ordenador, un método de acuerdo con cualquiera de las reivindicaciones del método 10 o 12.


 

Patentes similares o relacionadas:

Aparato y procedimiento para el procesamiento de señales estéreo para la reproducción en automóviles, para lograr un sonido tridimensional individual por los altavoces frontales, del 6 de Febrero de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Procesador digital para un sistema de reproducción de altavoces , con exactamente tres o cuatro altavoces frontales, comprendiendo el procesador digital […]

Imagen de 'Medio de grabación, dispositivo de reproducción, programa, método…'Medio de grabación, dispositivo de reproducción, programa, método de reproducción y circuito integrado, del 20 de Agosto de 2014, de PANASONIC CORPORATION: Un medio de grabación en el que se graban una aplicación, un sonido de clic, y un flujo digital que incluye un flujo de vídeo y un flujo de audio multiplexados […]

Convertidor estéreo de múltiples canales para derivar una señal envolvente estéreo y/o central de audio, del 23 de Abril de 2014, de KONINKLIJKE PHILIPS N.V: Convertidor estéreo de múltiples canales, que comprende medios estéreo para generar una señal de información a partir de señales de audio […]

Imagen de 'Codificación de señales de múltiples canales'Codificación de señales de múltiples canales, del 23 de Octubre de 2013, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificar señales de audio de múltiples canales (c1 - cN) que comprende al menos un canal primeroy un segundo, que comprende las […]

Imagen de 'Sistema de altavoces para un ordenador personal'Sistema de altavoces para un ordenador personal, del 23 de Septiembre de 2013, de GIBSON GUITAR CORP: Un sistema multicanal de altavoces para su uso con un ordenador personal de sobremesa que comprende: un soporte dotado de una superficie inferior […]

Método y codificador para combinar conjuntos de datos digitales, método para descodificar y descodificador para tales conjuntos de datos digitales combinados y soporte de grabación para almacenar tales conjuntos de datos digitales combinados, del 2 de Abril de 2013, de AURO TECHNOLOGIES: Un método para reducir un conjunto de datos digitales de muestras (A0, A1, A2, A3, A4, A5, A6, A7, A8, A9)con un primer tamaño en un segundo conjunto […]

Imagen de 'MÉTODO Y CODIFICADOR PARA COMBINAR CONJUNTOS DE DATOS DIGITALES,…'MÉTODO Y CODIFICADOR PARA COMBINAR CONJUNTOS DE DATOS DIGITALES, MÉTODO PARA DESCODIFICAR Y DESCODIFICADOR PARA TALES CONJUNTOS DE DATOS DIGITALES COMBINADOS Y SOPORTE DE GRABACIÓN PARA ALMACENAR TALES CONJUNTOS DE DATOS DIGITALES COMBINADOS, del 14 de Enero de 2011, de GALAXY STUDIOS NV: Un método para combinar un primer conjunto de datos digitales de muestras (A0, A1, A2, A3, A4, A5, A6, A7, A8, A9) con un primer tamaño y un segundo conjunto […]

DISPOSITIVO Y PROCEDIMIENTO PARA GENERAR UNA SEÑAL MULTICANAL CON UN PROCESAMIENTO DE SEÑAL DE VOZ, del 16 de Septiembre de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para generar una señal multicanal con un número de señales de canal de salida, que es mayor que un número de señales de canal de entrada de una señal […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .