CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA.

Codificador de audio adaptado para codificar una señal de audio multicanal,

comprendiendo el codificador:

- un módulo de combinación de codificador (ECM) para generar una parte de señal dominante (m) y una parte de señal residual (s) que son una representación combinada de señales de audio primera y segunda (x1, x2), obteniéndose las partes de señal dominante y residual (m, s) aplicando un procedimiento matemático a las señales de audio primera y segunda (x1, x2), en el que el procedimiento matemático implica un primer parámetro espacial (SP1) que comprende una descripción de propiedades espaciales de las señales de audio primera y segunda (x1, x2),

- un generador de parámetros (PG) para generar

- un primer conjunto de parámetros (PS1) que comprende un segundo parámetro espacial (SP2), y

- un segundo conjunto de parámetros (PS2) que comprende un tercer parámetro espacial (SP3), y

caracterizado porque el codificador comprende

- un generador de salida para generar una señal de salida codificada que comprende

- una primera parte de salida (OP1) que comprende la parte de señal dominante (m) y el primer conjunto de parámetros (PS1), y

- una segunda parte de salida (OP2) que comprende la parte de señal residual (s) y el segundo conjunto de parámetros (PS2)

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2006/050819.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1,5621 BA EINDHOVEN.

Inventor/es: SCHUIJERS, ERIK, G., P., MYBURG,FRANCOIS,P.

Fecha de Publicación: 27 de Octubre de 2010.

Fecha Concesión Europea: 9 de Junio de 2010.

Clasificación Internacional de Patentes:

G10L19/00M
G10L19/14A1R

Clasificación PCT:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/14
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA.

Fragmento de la descripción:

Codificación de audio multicanal ajustable a escala.

La invención se refiere al campo de la codificación de audio de alta calidad. Especialmente, la invención se refiere al campo de la codificación de alta calidad de datos de audio multicanal. Más específicamente, la invención define codificadores y decodificadores y procedimientos para codificar y decodificar datos de audio multicanal.

Aunque son posibles numerosas disposiciones/configuraciones multicanal, la disposición/configuración 5.1 es la más popular (véase también la figura 1). La configuración 5.1 multicanal típica consiste en cinco altavoces, concretamente altavoces frontal izquierdo (Lf), frontal derecho (Rf), central (C), envolvente izquierdo (Ls) y envolvente derecho (Rs) complementados por un altavoz LFE (mejora de baja frecuencia) adicional que se colocará en un ángulo arbitrario. En el pasado se consideraron diversos enfoques para comprimir datos de audio multicanal, tal como los datos de audio multicanal 5.1. A continuación se da una breve visión general.

En la norma de audio MPEG-2, ISO/IEC 13818-3:1998 Information technology -- Generic coding of moving pictures and associated audio information -- Part 3: Audio, se realiza una provisión para codificación de audio multicanal mientras se mantiene la retrocompatibilidad con la norma de audio MPEG-1, ISO/IEC 11172-3:1993 Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio, que se centra únicamente en la codificación de audio mono y estéreo. La retrocompatibilidad se logra formando una señal estéreo básica, derivada a partir del contenido multicanal, que se coloca en la parte de datos del flujo de bits de MPEG-1. Tres señales adicionales se colocan entonces en la parte de datos auxiliares del flujo de bits de MPEG-1. Esta técnica se denomina matrización. Un decodificador de audio MPEG-1 puede generar una señal estéreo significativa (Lo, Ro) a partir del flujo de bits, mientras que un decodificador de audio MPEG-2 puede extraer los canales adicionales y reconstruir una versión decodificada de los cinco canales de entrada. La retrocompatibilidad se consigue a costa de una alta tasa de transmisión de bits. Normalmente, se requiere una tasa de transmisión de bits de 640 kbit/s para obtener una alta calidad de audio para material de cinco canales con MPEG-2 Capa II.

En la codificación de audio avanzada (AAC) de MPEG-2, norma ISO/IEC TR 13818-5:1997/Amd 1:1999 Advanced Audio Coding (AAC), se codifica audio multicanal en un formato no retrocompatible. Esto permite más libertad al codificador y tiene la ventaja de que puede conseguirse una calidad de audio superior (transparente) a una tasa de transmisión de bits de 320 kbit/s, en comparación con MPEG-2 Capa II a 640 kbit/s. En una configuración de 5(.1) canales, AAC puede codificar los pares de canales que son simétricos respecto al oyente empleando la herramienta Mid-Side (MS) stereo: (Lf, Rf) y (Ls, Rs). Los canales central (C) y (opcionalmente) LFE se codifican por separado. Alternativamente, la codificación estéreo de intensidad (IS) puede emplearse para combinar varios canales de audio en un canal y, adicionalmente, proporcionar información de ajuste a escala para cada canal.

En la codificación de audio multicanal paramétrica, indicaciones (o parámetros espaciales) perceptivamente relevantes, tales como diferencias de intensidad entre canales (IID), diferencias de tiempo entre canales (ITD) y coherencia entre canales (ICC), se miden entre canales en una señal multicanal. Una descripción más detallada de los parámetros espaciales puede encontrarse en Christof Faller: "Coding of Spatial Audio Compatible with Different Playback Formats", AES Convention Paper, AES 117th Convention, San Francisco, EE.UU., 28-31 de octubre de 2004. Además, la representación multicanal se mezcla de manera descendente para dar una señal estéreo o mono que puede codificarse con un codificador convencional mono o estéreo. Un requisito importante es que la mezcla descendente estéreo o mono debe tener una calidad de audio suficiente, por ejemplo al menos comparable con la Recomendación de la ITU-R BS.775-1 sobre mezcla descendente. La información transmitida comprende por tanto una versión codificada de la señal mono o estéreo y de los parámetros espaciales. La mezcla descendente mono o estéreo se codifica a una tasa de transmisión de bits sustancialmente inferior que la requerida para codificar la señal de audio multicanal original, y los parámetros espaciales requieren un ancho de banda de transmisión muy pequeño. Por tanto, la mezcla descendente y los parámetros espaciales pueden codificarse a una tasa de transmisión de bits total que es tan sólo una fracción de la tasa de transmisión de bits requerida cuando se codifican todos los canales. El decodificador paramétrico genera una aproximación de alta calidad de la señal de audio multicanal original a partir de la mezcla descendente mono o estéreo transmitida y los parámetros espaciales.

Un enfoque de codificación/decodificación de audio estéreo ajustable a escala se describe en la solicitud de patente europea publicada con el número EP 0918407 A2.

Puede considerarse que un objeto de la presente invención es proporcionar un codificador de señal de audio multicanal ajustable a escala que proporcione una gran eficacia, que proporcione una alta calidad de señal y, al mismo tiempo, que proporcione una señal codificada que sea retrocompatible.

Según un primer aspecto, la invención proporciona un codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador:

- un módulo de combinación de codificador para generar una parte de señal dominante y una parte de señal residual que son una representación combinada de señales de audio primera y segunda, obteniéndose las partes de señal dominante y residual aplicando un procedimiento matemático a las señales de audio primera y segunda, en el que el procedimiento matemático implica un primer parámetro espacial que comprende una descripción de propiedades espaciales de las señales de audio primera y segunda,

- un generador de parámetros para generar

- un primer conjunto de parámetros que comprende un segundo parámetro espacial, y

- un segundo conjunto de parámetros que comprende un tercer parámetro espacial, y

- un generador de salida para generar una señal de salida codificada que comprende

- una primera parte de salida que comprende la parte de señal dominante y el primer conjunto de parámetros, y

- una segunda parte de salida que comprende la parte de señal residual y el segundo conjunto de parámetros.

En el módulo de combinación de codificador, se combinan señales de audio primera y segunda en partes de señal dominante y residual. Por "partes de señal dominante y residual" se entienden dos señales de audio en las que la señal dominante contiene las partes dominantes o principales de las señales de audio primera y segunda, mientras que la señal residual contiene una parte residual o menos importante de las señales de audio primera y segunda. Por "parámetro espacial" se entiende un parámetro que puede expresarse matemáticamente y estar basado en o derivarse de una o más propiedades espaciales de un par de señales. Una lista no exhaustiva de tales propiedades espaciales que es posible calcular es: diferencias de intensidad entre canales (IID), diferencias de tiempo entre canales (ITD) y coherencia entre canales (ICC). El módulo de combinación de codificador preferiblemente genera las partes de señal dominante y residual de tal manera que estas partes de señal están menos correlacionadas que las señales de audio primera y segunda. Preferiblemente, las partes de señal dominante y residual se generan de modo que no están correlacionadas, es decir son ortogonales, o al menos deben estar lo menos correlacionadas posible.

La parte de señal residual puede filtrarse paso bajo antes de convertirse en un flujo de bits de salida, con el fin de representarse en un flujo de bits que requiera de este modo sólo una cantidad muy limitada de tasa de transmisión de bits. Una frecuencia de corte para tal filtrado paso bajo puede estar en el intervalo de 500 Hz a 10 kHz, por ejemplo 2 kHz.

El módulo de combinación de codificador puede estar adaptado para combinar señales de audio primera, segunda...

Reivindicaciones:

1. Codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador:

- un módulo de combinación de codificador (ECM) para generar una parte de señal dominante (m) y una parte de señal residual (s) que son una representación combinada de señales de audio primera y segunda (x1, x2), obteniéndose las partes de señal dominante y residual (m, s) aplicando un procedimiento matemático a las señales de audio primera y segunda (x1, x2), en el que el procedimiento matemático implica un primer parámetro espacial (SP1) que comprende una descripción de propiedades espaciales de las señales de audio primera y segunda (x1, x2),

- un generador de parámetros (PG) para generar

- un primer conjunto de parámetros (PS1) que comprende un segundo parámetro espacial (SP2), y

- un segundo conjunto de parámetros (PS2) que comprende un tercer parámetro espacial (SP3), y

caracterizado porque el codificador comprende

- un generador de salida para generar una señal de salida codificada que comprende

- una primera parte de salida (OP1) que comprende la parte de señal dominante (m) y el primer conjunto de parámetros (PS1), y

- una segunda parte de salida (OP2) que comprende la parte de señal residual (s) y el segundo conjunto de parámetros (PS2).

2. Codificador de audio según la reivindicación 1, en el que el tercer parámetro espacial (SP3) comprende una diferencia entre el segundo parámetro espacial (SP2) y el primer parámetro espacial (SP1).

3. Codificador de audio según la reivindicación 1, en el que el segundo parámetro espacial (SP2) comprende un parámetro basado en coherencia.

4. Codificador de audio según la reivindicación 1, en el que el tercer parámetro espacial (SP3) comprende una diferencia entre un parámetro basado en coherencia y un parámetro basado en correlación.

5. Codificador de audio según la reivindicación 1, en el que la parte de señal residual (s) comprende una diferencia entre las señales de audio primera y segunda (x1, x2).

6. Codificador de audio según la reivindicación 1, en el que el módulo de combinación de codificador (ECM) está adaptado para generar las partes de señal dominante y residual (m, s) de tal manera que estas partes de señal (m, s) estén menos correlacionadas que las señales de audio primera y segunda (x1, x2).

7. Codificador de audio según la reivindicación 1, que está adaptado además para recibir señales de audio tercera, cuarta, quinta y sexta y mezclar de manera descendente estas señales junto con las señales de audio primera y segunda (x1, x2) y para generar las partes de salida primera y segunda en respuesta a ello.

8. Decodificador de audio para generar una señal de audio multicanal basándose en una señal codificada, comprendiendo el decodificador:

- una unidad de combinación de decodificador (DU) para generar señales de audio primera y segunda basándose en una parte de señal dominante, una parte de señal residual y conjuntos de parámetros primero y segundo, comprendiendo los conjuntos de parámetros primero y segundo una descripción de propiedades espaciales de las señales de audio primera y segunda, en el que la parte de señal residual y el segundo conjunto de parámetros están implicados en la determinación de una matriz de mezclado (MM) que se usa para generar las señales de audio primera y segunda.

9. Decodificador de audio según la reivindicación 8, comprendiendo el decodificador un decorrelacionador (Dec) para recibir la parte de señal dominante y generar una parte de señal dominante decorrelacionada en respuesta a ello.

10. Decodificador de audio según reivindicación 9, en el que una suma de la parte de señal residual y la parte de señal dominante decorrelacionada está implicada en la determinación de la matriz de mezclado (MM).

11. Decodificador de audio según la reivindicación 10, comprendiendo el decodificador un atenuador (Att) para atenuar la parte de señal dominante decorrelacionada antes de sumarla a la parte de señal residual.

12. Decodificador de audio según la reivindicación 8, adaptado para recibir una pluralidad de conjuntos de conjuntos de parámetros primero y segundo y una pluralidad de partes de señal residual para generar una pluralidad de conjuntos de señales de audio primera y segunda en respuesta a ello.

13. Decodificador de audio según la reivindicación 12, estando adaptado el decodificador para recibir tres conjuntos de conjuntos de parámetros primero y segundo y tres partes de señal residual para generar tres conjuntos de señales de audio primera y segunda en respuesta a ello.

14. Procedimiento de codificación de una señal de audio multicanal que comprende las etapas de:

1) generar una parte de señal dominante (m) y una parte de señal residual (s) que son una representación combinada de señales de audio primera y segunda (x1, x2), obteniéndose las partes de señal dominante y residual (m, s) aplicando un procedimiento matemático a las señales de audio primera y segunda (x1, x2), en el que el procedimiento matemático implica un primer parámetro espacial que comprende una descripción de propiedades espaciales de las señales de audio primera y segunda (x1, x2),

2) generar un primer conjunto de parámetros que comprende un segundo parámetro espacial,

3) generar un segundo conjunto de parámetros que comprende un tercer parámetro espacial, y

caracterizado por

4) generar una señal de salida codificada que comprende una primera parte de salida que comprende la parte de señal dominante (m) y el primer conjunto de parámetros, y una segunda parte de salida que comprende la parte de señal residual (s) y el segundo conjunto de parámetros.

15. Procedimiento de generación de una señal de audio multicanal basándose en una señal codificada, comprendiendo el procedimiento las etapas de:

1) recibir la señal codificada que comprende una parte de señal dominante, una parte de señal residual, y conjuntos de parámetros primero y segundo que comprenden una descripción de propiedades espaciales de señales de audio primera y segunda,

2) determinar una matriz de mezclado (MM) basándose en la parte de señal residual y el segundo conjunto de parámetros,

3) generar las señales de audio primera y segunda basándose en la matriz de mezclado determinada.

16. Procedimiento según la reivindicación 15, que comprende la etapa de decorrelacionar la parte de señal dominante y generar una parte de señal dominante decorrelacionada en respuesta a ello.

17. Procedimiento según la reivindicación 16, que comprende además la etapa de sumar la parte de señal residual y la parte de señal dominante decorrelacionada.

18. Procedimiento según la reivindicación 17, en el que la determinación de la matriz de mezclado (MM) se basa en la parte de señal residual y la parte de señal dominante decorrelacionada sumadas.

19. Procedimiento según la reivindicación 15, que comprende recibir una pluralidad de conjuntos de conjuntos de parámetros primero y segundo y una pluralidad de partes de señal residual para generar una pluralidad de conjuntos de señales de audio primera y segunda en respuesta a ello.

20. Procedimiento según la reivindicación 19, que comprende recibir tres conjuntos de conjuntos de parámetros primero y segundo y tres partes de señal residual para generar tres conjuntos de señales de audio primera y segunda en respuesta a ello.

21. Señal de audio multicanal codificada que comprende:

- una primera parte de señal (OP1) que comprende una parte de señal dominante (m) y un primer conjunto de parámetros (PS1) que comprende una descripción de propiedades espaciales de señales de audio primera y segunda (x1, x2), y

- una segunda parte de señal (OP2) que comprende una parte de señal residual (s) y un segundo conjunto de parámetros (PS2) que comprende una descripción de propiedades espaciales de las señales de audio primera y segunda (x1, x2).

22. Medio de almacenamiento que tiene almacenada en el mismo una señal según la reivindicación 21.

23. Código de programa ejecutable por ordenador adaptado para realizar el procedimiento según la reivindicación 14 cuando se ejecuta en un ordenador.

24. Medio de almacenamiento legible por ordenador que comprende un código de programa ejecutable por ordenador según la reivindicación 23.

25. Código de programa ejecutable por ordenador adaptado para realizar el procedimiento según la reivindicación 15 cuando se ejecuta en un ordenador.

26. Medio de almacenamiento legible por ordenador que comprende un código de programa ejecutable por ordenador según la reivindicación 25.

27. Dispositivo que comprende un codificador según la reivindicación 1.

28. Dispositivo que comprende un decodificador según la reivindicación 8.

Patentes similares o relacionadas:

CODEC AUDIO SIN PÉRDIDA ESCALABLE Y HERRAMIENTA DE AUTORÍA, del 19 de Agosto de 2011, de DTS, INC: Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable; […]

CÓDEC DE AUDIO MULTI-CANAL SIN PÉRDIDAS, del 1 de Agosto de 2011, de DTS, INC: Un método para codificar sin pérdidas datos de audio de PCM, que comprende: poner en bloques la señal de audio multicanal en tramas de igual tiempo de duración; procesar […]

MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA, del 8 de Abril de 2011, de FRANCE TELECOM: Método de conmutación de tasas de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión, […]

DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES ESPECTRALES Y CODIFICADOR Y DECODIFICADOR PARA SEÑALES DE AUDIO, del 17 de Marzo de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio, que comprende: un dispositivo para el procesamiento posterior de valores espectrales basándose en un primer […]

VOCODIFICADOR DE VELOCIDAD VARIABLE, del 2 de Diciembre de 2010, de QUALCOMM INCORPORATED: - Un procedimiento de procesamiento de una señal de voz que comprende una pluralidad de tramas, comprendiendo el procedimiento: calcular un nivel de energía […]

METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

CUANTIFICACION DE VECTORES CON UN UNICO LIBRO DE CODIGOS PARA APLICACIONES DE MULTIPLES TASAS DE TRANSMISION, del 2 de Febrero de 2010, de NOKIA CORPORATION: Un procedimiento de cuantificación de vectores representativos de datos de voz/audio, comprendiendo dicho procedimiento: - proporcionar un […]

MÉTODO, DISPOSITIVO, APARATO CODIFICADOR, APARATO DECODIFICADOR Y SISTEMA DE AUDIO, del 8 de Febrero de 2012, de Koninklijke Philips Electronics N.V. Dolby International AB: Método de procesamiento de una señal de mezcla descendente estéreo que comprende señales estéreo primera y segunda (L0, R0), codificando la señal de mezcla […]