Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal.

Sintetizador (104) de audio para generar datos de salida usando una señal (95,

97) de objeto de audio codificada, que comprende:

un sintetizador (100) de datos de salida para generar los datos de salida que pueden usarse para reproducir una pluralidad de canales de salida de una configuración de salida de audio predefinida que representa la pluralidad de objetos de audio, siendo el sintetizador de datos de salida operativo para usar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, información de potencia, información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales (93) de mezcla descendente, y parámetros de objeto de audio para los objetos de audio, en el que el sintetizador (100) de datos de salida es operativo para transcodificar (502) los parámetros de objeto de audio en parámetros espaciales para la configuración de salida de audio predefinida usando además un posicionamiento previsto de los objetos (90) de audio en la configuración de salida de audio.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09004406.

Solicitante: DOLBY INTERNATIONAL AB.

Nacionalidad solicitante: Países Bajos.

Dirección: Apollo Building, 3E Herikerbergweg 1-35 1101 CN Amsterdam Zuid-oost PAISES BAJOS.

Inventor/es: VILLEMOES, LARS, ENGDEGARD, JONAS, PURNHAGEN,HEIKO, Resch,Barbara.

Fecha de Publicación: 17 de Abril de 2012.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S7/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2378734_T3.pdf

Fragmento de la descripción:

Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal

CAMPO TÉCNICO

La presente invención se refiere a la decodificación de múltiples objetos a partir de una señal multiobjeto codificada basándose en una mezcla descendente multicanal disponible y datos de control adicionales.

ANTECEDENTES DE LA INVENCIÓN

El desarrollo reciente en audio facilita la recreación de una representación multicanal de una señal de audio basándose en una señal estéreo (o mono) y datos de control correspondientes. Estos métodos de codificación envolvente paramétrica habitualmente comprenden una parametrización. Un decodificador de audio multicanal paramétrico, (por ejemplo, el decodificador de MPEG Surround definido en la norma ISO/IEC 23003-1 [1], [2]) , reconstruye M canales basándose en K canales transmitidos, donde M>K, mediante el uso de los datos de control adicionales. Los datos de control consisten en una parametrización de la señal multicanal basada en IID (Inter channel Intensity Difference; diferencia de intensidad entre canales) e ICC (Inter Channel Coherence; coherencia entre canales) . Estos parámetros se extraen normalmente en la fase de codificación y describen relaciones de potencia y correlación entre pares de canales usados en el proceso de mezcla ascendente. Usar un esquema de codificación de este tipo permite la codificación a una tasa de transmisión de datos significativamente inferior a la de la transmisión de todos los M canales, haciendo la codificación muy eficaz mientras al mismo tiempo garantiza una compatibilidad tanto con dispositivos de K canales como con dispositivos de M canales.

Un sistema de codificación muy relacionado es el codificador de objetos de audio correspondiente [3], [4] en el que varios objetos de audio se mezclan de manera descendente en el codificador y más tarde se mezclan de manera ascendente de manera guiada mediante los datos de control. El proceso de mezcla ascendente también puede considerarse como una separación de los objetos que se mezclan en la mezcla descendente. La señal de mezcla ascendente resultante puede reproducirse en uno o más canales de reproducción. De manera más precisa, [3, 4] presenta un método para sintetizar canales de audio a partir de una mezcla descendente (denominada señal suma) , información estadística acerca de los objetos fuente y datos que describen el formato de salida deseado. En casos de que se usen varias señales de mezcla descendente, estas señales de mezcla descendente consisten en diferentes subconjuntos de los objetos, y la mezcla ascendente se realiza para cada canal de mezcla descendente de manera individual.

En el nuevo método introducimos un método en el que la mezcla ascendente se realiza conjuntamente para todos los canales de mezcla descendente. Los métodos de codificación de objetos, antes de la presente invención, no presentaban una solución para la decodificación conjunta de una mezcla descendente con más de un canal.

Referencias:

[1] L. Villemoes, J. Herre, J. Breebaart, G. Hotho, S. Disch, H. Pumhagen y K. Kjörling, "MPEG Surround: The Forthcoming ISO Standard for Spatial Audio Coding", en 28th International AES Conference, The Future of Audio Technology Surround and Beyond, PiteÃ¥, Suecia, 30 de junio - 2 de julio, 2006.

[2] J. Breebaart, J. Herre, L. Villemoes, C. Jin, K. Kjörling, J. Plogsties y J. Koppens, "Multi-Channels goes Mobile: MPEG Surround Binaural Rendering", en 29th International AES Conference, Audio for Mobile and Handheld Devices, Seúl, 2-4 de septiembre de 2006.

[3] C. Faller, "Parametric Joint-Coding of Audio Sources", Convention Paper 6752 presentado en 120th AES Convention, París, Francia, 20-23 de mayo de 2006.

[4] C. Faller, "Parametric Joint-Coding of Audio Sources", solicitud de patente PCT/EP2006/050904, 2006.

El documento WO 2006/048203 A2 da a conocer conceptos para el rendimiento mejorado de la reconstrucción multicanal basada en predicción. Particularmente, una pérdida de energía introducida mediante un proceso de mezcla ascendente predictivo se tiene en cuenta en una reconstrucción multicanal. Particularmente, un canal original izquierdo, un canal original central y un canal original derecho se mezclan de manera descendente en un canal de mezcla descendente izquierdo y un canal de mezcla descendente derecho, en los que el canal de mezcla descendente izquierdo sólo contiene el canal original izquierdo y una parte del canal central original, y el canal de mezcla descendente derecho sólo contiene el canal original derecho y una parte del canal central original. Esto está definido en una matriz de mezcla descendente. Los dos canales base se transmiten junto con dos parámetros de mezcla ascendente diferentes a un mezclador ascendente que cumple una regla de mezcla ascendente de no conservación de energía. Se generan los canales izquierdo, derecho y central originales reconstruidos y estos canales se someten a una corrección de energía para obtener canales izquierdo, derecho y central corregidos.

Es un objeto de la presente invención proporcionar un esquema de codificación/decodificación de objetos de audio mejorado.

Este objeto se logra mediante un sintetizador de audio según la reivindicación 1, un método de sintetización de audio según la reivindicación 6, un codificador de objetos de audio según la reivindicación 7, un método de codificación de objetos de audio según la reivindicación 10, una señal de objeto de audio codificada según la reivindicación 11 o un programa informático según la reivindicación 13.

SUMARIO DE LA INVENCIÓN

Un primer aspecto de la invención se refiere a un codificador de objetos de audio para generar una señal de objeto de audio codificada usando una pluralidad de objetos de audio, que comprende: un generador de información de mezcla descendente para generar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente; un generador de parámetro de objeto para generar parámetros de objeto para los objetos de audio; y una interfaz de salida para generar la señal de objeto de audio codificada usando la información de mezcla descendente y los parámetros de objeto.

Un segundo aspecto de la invención se refiere a un método de codificación de objetos de audio para generar una señal de objeto de audio codificada usando una pluralidad de objetos de audio, que comprende: generar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente; generar parámetros de objeto para los objetos de audio; y generar la señal de objeto de audio codificada usando la información de mezcla descendente y los parámetros de objeto.

Un tercer aspecto de la invención se refiere a un sintetizador de audio para generar datos de salida usando una señal de objeto de audio codificada, que comprende: un sintetizador de datos de salida para generar los datos de salida que pueden usarse para crear una pluralidad de canales de salida de una configuración de salida de audio predefinida que representa la pluralidad de objetos de audio, siendo el sintetizador de datos de salida operativo para usar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, y parámetros de objeto de audio para los objetos de audio.

Un cuarto aspecto de la invención se refiere a un método de sintetización de audio para generar datos de salida usando una señal de objeto de audio codificada, que comprende: generar los datos de salida que pueden usarse para crear una pluralidad de canales de salida de una configuración de salida de audio predefinida que representa la pluralidad de objetos de audio, siendo el sintetizador de datos de salida operativo para usar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, y parámetros de objeto de audio para los objetos de audio.

Un quinto aspecto de la invención se refiere a una señal de objeto de audio codificada que incluye una información de mezcla descendente que indica una distribución de una pluralidad de objetos de audio en al menos dos canales de mezcla descendente y parámetros de objeto, siendo los parámetros de objeto de manera que es posible la reconstrucción de los objetos de audio usando los parámetros de objeto... [Seguir leyendo]

Reivindicaciones:

1. Sintetizador (104) de audio para generar datos de salida usando una señal (95, 97) de objeto de audio codificada, que comprende:

un sintetizador (100) de datos de salida para generar los datos de salida que pueden usarse para reproducir una pluralidad de canales de salida de una configuración de salida de audio predefinida que representa la pluralidad de objetos de audio, siendo el sintetizador de datos de salida operativo para usar información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, información de potencia, información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales (93) de mezcla descendente, y parámetros de objeto de audio para los objetos de audio, en el que el sintetizador (100) de datos de salida es operativo para transcodificar (502) los parámetros de objeto de audio en parámetros espaciales para la configuración de salida de audio predefinida usando además un posicionamiento previsto de los objetos (90) de audio en la configuración de salida de audio.

2. Sintetizador de audio según la reivindicación 1, en el que el sintetizador (100) de datos de salida es operativo para convertir una pluralidad de canales de mezcla descendente en la mezcla descendente estéreo para la configuración de salida de audio predefinida usando una matriz de conversión derivada del posicionamiento previsto de los objetos de audio.

3. Sintetizador de audio según la reivindicación 1, en el que los parámetros espaciales incluyen el primer grupo de parámetros para una mezcla ascendente de dos a tres y un segundo grupo de parámetros de energía para una mezcla ascendente de tres a seis, y

en el que el sintetizador (100) de datos de salida es operativo para calcular los parámetros de predicción para la matriz de predicción de dos a tres usando una matriz de reproducción determinada mediante un posicionamiento previsto de los objetos (90) de audio, describiendo una matriz de mezcla descendente parcial la mezcla descendente de los canales de salida a tres canales generados por un hipotético proceso de mezcla ascendente de dos a tres, y la matriz de mezcla descendente.

4. Sintetizador de audio según la reivindicación 3, en el que los parámetros de objeto son parámetros de objeto de predicción, y en el que el sintetizador (100) de datos de salida es operativo para calcular previamente una matriz de energía basándose en los parámetros de objeto de predicción, la información de mezcla descendente y la información de energía correspondiente a los canales de mezcla descendente.

5. Sintetizador de audio según la reivindicación 1, en el que el sintetizador (100) de datos de salida es operativo para generar (165) dos canales estéreo para una configuración de salida estéreo calculando una matriz de reproducción estéreo parametrizada y una matriz de conversión dependiendo de la matriz de reproducción estéreo parametrizada.

6. Método de sintetización de audio para generar datos de salida usando una señal (95, 97) de objeto de audio codificada, que comprende:

generar los datos de salida que pueden usarse para crear una pluralidad de canales de salida de una configuración de salida de audio predefinida que representa la pluralidad de objetos (90) de audio, en el que se usan información de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, información de potencia, información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales (93) de mezcla descendente, y parámetros de objeto de audio para los objetos de audio, y en el que los parámetros de objeto de audio se transcodifican (502) en parámetros espaciales para la configuración de salida de audio predefinida usando además un posicionamiento previsto de los objetos (90) de audio en la configuración de salida de audio.

7. Codificador (101) de objetos de audio para generar una señal de objeto de audio codificada usando una pluralidad de objetos (90) de audio, que comprende:

un generador (96) de información de mezcla descendente para generar información (97) de mezcla descendente que indica una distribución de la pluralidad de objetos de audio en al menos dos canales de mezcla descendente, en el que el generador (96) de información de mezcla descendente está configurado para generar (150) una información de potencia y una información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales (93) de mezcla descendente;

un generador (94) de parámetro de objeto para generar parámetros (95) de objeto para los objetos de audio; y una interfaz (98) de salida para generar la señal (99) de objeto de audio codificada, comprendiendo la señal de objeto codificada la información de mezcla descendente, la información de potencia, la información de correlación y los parámetros de objeto.

8. Codificador de objetos de audio según la reivindicación 7, que comprende además:

un mezclador (92) descendente para la mezcla descendente de la pluralidad de objetos de audio en la pluralidad de canales de mezcla descendente, en el que el número de objetos de audio es mayor que el número de canales de mezcla descendente, y en el que el mezclador (92) descendente se acopla al generador de información de mezcla descendente de modo que la distribución de la pluralidad de objetos de audio en la pluralidad de canales de mezcla descendente se lleva a cabo según se indique en la información de mezcla descendente.

9. Codificador de objetos de audio según la reivindicación 7, en el que el generador (96) de información de mezcla descendente es operativo para calcular la información de mezcla descendente de modo que la información de mezcla descendente indica,

qué objeto de audio se incluye total o parcialmente en uno o más de la pluralidad de canales de mezcla descendente, y cuando se incluye un objeto de audio en más de un canal de mezcla descendente, una información sobre una parte de los objetos de audio incluidos en un canal de mezcla descendente de los más de un canales de mezcla descendente.

10. Método (101) de codificación de objetos de audio para generar una señal de objeto de audio codificada usando una pluralidad de objetos de audio, que comprende:

generar información (97) de mezcla descendente que indica una distribución de la pluralidad de objetos (90) de audio en al menos dos canales de mezcla descendente, generar (150) una información de potencia y una información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales de mezcla descendente;

generar parámetros (94) de objeto para los objetos de audio; y generar la señal (99) de objeto de audio codificada, comprendiendo la señal de objeto de audio codificada la información de potencia, la información de correlación, la información de mezcla descendente y los parámetros de objeto.

11. Señal de objeto de audio codificada que incluye una información de mezcla descendente que indica una distribución de una pluralidad de objetos de audio en al menos dos canales de mezcla descendente, una información de potencia y una información de correlación que indican una característica de potencia y una característica de correlación de los al menos dos canales de mezcla descendente, y parámetros de objeto, siendo los parámetros de objeto de manera que es posible la reconstrucción de los objetos de audio usando los parámetros de objeto y los al menos dos canales de mezcla descendente.

12. Señal de objeto de audio codificada según la reivindicación 11, almacenada en un medio de almacenamiento legible por ordenador.

13. Programa informático para realizar, cuando se ejecuta en un ordenador, un método según uno cualquiera de los métodos de las reivindicaciones 6 ó 10.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]