Descodificador de señal de audio, procedimiento para descodificar una señal de audio y programa de ordenador que utiliza etapas de procesamiento de objetos de audio en cascada.

Descodificador de señal de audio (100; 200; 500; 590) para proporcionar una representación de señal de mezclahacia arriba en función de una representación de señal de mezcla hacia abajo (112;

210; 510; 510) y unainformación paramétrica relativa a un objeto (110; 212; 512; 512a), comprendiendo el descodificador de señal deaudio:

un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezclahacia abajo, para proporcionar una primera información de audio (132; 262; 562; 562a) que describe un primerconjunto de uno o más objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio(134; 264; 564; 564a) que describe un segundo conjunto de uno o más objetos de audio de un segundo tipo deobjeto de audio en función de la representación de señal de mezcla hacia abajo y empleando al menos una parte dela información paramétrica relativa a un objeto, en el que la segunda información de audio es una información deaudio que describe los objetos de audio del segundo tipo de objeto de audio de una manera combinada;un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) ypara procesar la segunda información de audio en función de la información paramétrica relativa a un objeto, paraobtener una versión procesada (142; 272; 572; 572a) de la segunda información de audio; yun combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audiocon la versión procesada de la segunda información de audio, para obtener la representación de señal de mezclahacia arriba;

en el que el descodificador de señal de audio está configurado para proporcionar la representación de señal demezcla hacia arriba en función de una información residual asociada con un subconjunto de objetos de audiorepresentados por la representación de señal de mezcla hacia abajo, en el que el separador de objetos estáconfigurado para descomponer la representación de señal de mezcla hacia abajo para proporcionar la primerainformación de audio que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto deaudio al cual la información residual está asociada, y describiendo la segunda información de audio un segundoconjunto de uno o más objetos de audio de un segundo tipo de objeto de audio, que no tiene información residualasociada, en función de la representación de señal de mezcla hacia abajo y empleando la información residual; yen el que el procesador de señal de audio está configurado para procesar la segunda información de audio, pararealizar un procesamiento individual por objeto de los objetos de audio del segundo tipo de objeto de audio,empleando información paramétrica relativa a un objeto asociado con más de dos objetos de audio del segundo tipode objeto de audio; y

en el que la información residual describe una distorsión residual, que se prevé que permanezca si un objeto deaudio del primer tipo de objeto de audio se aísla simplemente empleando la información paramétrica relativa a unobjeto.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/058906.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HERRE, JURGEN, HELLMUTH, OLIVER, HILPERT, JOHANNES, FALCH,CORNELIA, RIDDERBUSCH,FALKO, TERENTIEV,LEONID.

Fecha de Publicación: 24 de Octubre de 2013.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/14
H04S7/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2426677_T3.pdf

Fragmento de la descripción:

Descodificador de señal de audio, procedimiento para descodificar una señal de audio y programa de ordenador que utiliza etapas de procesamiento de objetos de audio en cascada Sector técnico [0001] Las realizaciones según la invención se refieren a un descodificador de señal de audio para proporcionar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y una información paramétrica relativa a un objeto.

Otras realizaciones según la invención se refieren a un procedimiento para proporcionar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y una información paramétrica relativa a un objeto.

Otras realizaciones según la invención se refieren a un programa de ordenador.

Algunas realizaciones según la invención se refieren a un sistema SAOC Karaoke/Solo mejorado.

Antecedentes de la invención [0005] En los sistemas de audio modernos, se desea transferir y almacenar información de audio de una manera eficiente en velocidad de bits. Además, a menudo se desea reproducir un contenido de audio utilizando una pluralidad de dos o incluso más altavoces, que se distribuyen espacialmente en una habitación. En estos casos, se desea explotar las capacidades de una disposición como esta de múltiples altavoces para permitir a un usuario identificar espacialmente diferentes contenidos de audio o diferentes partes de un solo contenido de audio. Esto se puede conseguir mediante la distribución de forma individual de los diferentes contenidos de audio a altavoces diferentes.

En otras palabras, en la técnica de procesamiento de audio, transmisión de audio y almacenamiento de audio, existe una creciente demanda de gestionar contenidos de varios canales con el fin de mejorar la impresión de audición. El uso de contenido de audio multi-canal trae consigo mejoras significativas para el usuario. Por ejemplo, se puede obtener una impresión auditiva de 3 dimensiones, lo que trae consigo una mejora de la satisfacción del usuario en aplicaciones de entretenimiento. Sin embargo, los contenidos de audio multicanal también son útiles en entornos profesionales, por ejemplo, en aplicaciones de conferencia de teléfono, debido a que se puede mejorar la inteligibilidad de los conferenciantes mediante el uso de una reproducción de audio de múltiples canales.

Sin embargo, también es deseable tener un buen compromiso entre la calidad de audio y los requisitos de velocidad de bits con el fin de evitar una carga excesiva de los recursos causada por aplicaciones de múltiples canales.

Recientemente, se han propuesto las técnicas paramétricas relativas a la transmisión y / o almacenamiento con tasas de bits eficientes de escenas de audio que contienen múltiples objetos de audio, por ejemplo, Codificación de cola Binaural (Tipo I) (ver, por ejemplo la referencia [BCC]) , Codificación de fuente conjunta (ver, por ejemplo, la referencia [JSC]) , y Codificación de Objeto de Audio Espacial MPEG (SAOC) (ver, por ejemplo, las referencias [SAOC1], [SAOC2]) .

Estas técnicas tienen por objeto reconstruir perceptivamente la escena de audio de salida deseada en lugar de hacerlo por coincidencia de forma de onda.

La figura 8 muestra una vista general del sistema de dicho sistema (aquí: MPEG SAOC) . El Sistema MPEG SAOC 800 mostrado en la figura 8 comprende un codificador SAOC 810 y un descodificador SAOC 820. El codificador SAOC 810 recibe una pluralidad de señales de objeto x1 axN, que pueden ser representadas, por ejemplo, como señales en el dominio del tiempo o como señales en el dominio de tiempo-frecuencia (por ejemplo, en la forma de un conjunto de coeficientes de transformada de una transformada de tipo Fourier o en forma de señales de sub-banda QMF) . El codificador SAOC 810 típicamente también recibe coeficientes de mezcla hacia abajo d1 adN, que están asociados con las señales de objeto x1 axN. Unos conjuntos separados de coeficientes de mezcla hacia abajo pueden estar disponibles para cada canal de la señal de mezcla hacia abajo. El codificador SAOC 810 está típicamente configurado para obtener un canal de la señal de mezcla hacia abajo mediante la combinación de las señales de objeto =x1 axN de acuerdo con los coeficientes de mezcla hacia abajo asociados d1 a dN. Típicamente, hay menos canales de mezcla hacia abajo que señales de objeto x1 axN. Con la finalidad de permitir (al menos de manera aproximada) una separación (o tratamiento por separado) de las señales de objeto en el lado del descodificador SAOC 820, el codificador SAOC 810 proporciona tanto la o las varias señales de mezcla hacia abajo (designadas como canales de mezcla hacia abajo) 812 y una información lateral 814. La información lateral 814 describe características de las señales de objeto x1 axN, con la finalidad de permitir un procesamiento específico de objeto en el lado del descodificador.

El descodificador SAOC 820 está configurado para recibir tanto la una o varias señales de mezcla hacia abajo 812 como la información lateral 814. También, el descodificador SAOC 820 está típicamente configurado para recibir una información de interacción de usuario y/o una información de control de usuario 822, que describe una configuración de representación deseada. Por ejemplo, la información de interacción de usuario/ información de control de usuario 822 puede describir una configuración de altavoces y la colocación espacial deseada de los objetos suministrados por las señales de objeto x1 axN.

El descodificador SAOC 820 está configurado para proporcionar, por ejemplo, una pluralidad de señales de canal de mezcla hacia arriba descodificadas y1 ayM. Las señales de canal de mezcla hacia arriba pueden por ejemplo estar asociadaa con altavoces individuales de una disposición de representación de múltiples altavoces. El descodificador SAOC 820 puede, por ejemplo, comprender un separador de objetos 820a, que está configurado para reconstruir, al menos de manera aproximada, las señales de objeto x1 axN a partir de la o las varias señales de mezcla hacia abajo 812 y la información lateral 814, obteniéndose de este modo señales de objeto reconstruidas 820b. Sin embargo, las señales de objeto reconstruidas 820b pueden desviarse algo de las señales de objeto originales x1 axN, por ejemplo, porque la información lateral 814 no es suficiente no es suficiente para una reconstrucción perfecta debido a las limitaciones de tasa de bits. El descodificador SAOC 820 puede comprender también un mezclador 820c, que puede estar configurado para recibir las señales de objeto reconstruidas 820b y la información de interacción de usuario/ información de control de usuario 822, y para proporcionar, a partir de esta, las señales de canal de mezcla hacia arriba y1 a yM. El mezclador ^ ^ ^ ^ 820c puede estar configurado para utilizar la información de interacción de usuario /información de control de usuario 822 para determinar la contribución de las señales de objeto reconstruidas individuales 820b a las señales de canal de mezcla hacia arriba y1 ayM. La información de interacción de usuario/ información de control de usuario 822 puede, por ejemplo, comprender parámetros de representación (también designados como coeficientes de representación) , que determinan la contribución de las señales de objeto reconstruidas individuales 820b a las señales de canal de mezcla hacia arriba y1 ayM.

Sin embargo, cabe señalar que en muchas realizaciones, la separación de objetos, que está indicada por el separador de objetos 820a en la figura 8, y la mezcla, que se indica por el mezclador 820c en la figura 8, se realizan en una sola etapa. Para este propósito, pueden calcularse unos parámetros globales que describen un cartografiado directo de la o las varias señales de mezcla hacia abajo 812 en las señales de canal de mezcla hacia arriba y1 ayM. Estos parámetros se pueden calcular a partir de la información lateral 814 y la información de interacción de usuario/ información de control de usuario 822.

Con referencia ahora las figuras 9a, 9b y 9c, se describirán diferentes aparatos para obtener una representación de señal de mezcla hacia arriba a partir de una representación de señal de mezcla hacia abajo e información lateral relativa a objeto. La figura 9a muestra un diagrama de bloques esquemático de un sistema MPEG SAOC 900 que comprende un descodificador SAOC 920. El descodificador SAOC 920 comprende, como bloques funcionales separados, un decodificador de objeto 922 y un mezclador / representador 926. El descodificador de objeto 922 proporciona una pluralidad de señales de objeto reconstruidas 924 en función de la representación de señal de mezcla... [Seguir leyendo]

Reivindicaciones:

1. Descodificador de señal de audio (100; 200; 500; 590) para proporcionar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo (112; 210; 510; 510) y una información paramétrica relativa a un objeto (110; 212; 512; 512a) , comprendiendo el descodificador de señal de audio:

un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezcla hacia abajo, para proporcionar una primera información de audio (132; 262; 562; 562a) que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio (134; 264; 564; 564a) que describe un segundo conjunto de uno o más objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y empleando al menos una parte de la información paramétrica relativa a un objeto, en el que la segunda información de audio es una información de audio que describe los objetos de audio del segundo tipo de objeto de audio de una manera combinada;

un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) y para procesar la segunda información de audio en función de la información paramétrica relativa a un objeto, para obtener una versión procesada (142; 272; 572; 572a) de la segunda información de audio; y

un combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audio con la versión procesada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;

en el que el descodificador de señal de audio está configurado para proporcionar la representación de señal de mezcla hacia arriba en función de una información residual asociada con un subconjunto de objetos de audio representados por la representación de señal de mezcla hacia abajo, en el que el separador de objetos está configurado para descomponer la representación de señal de mezcla hacia abajo para proporcionar la primera información de audio que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto de audio al cual la información residual está asociada, y describiendo la segunda información de audio un segundo conjunto de uno o más objetos de audio de un segundo tipo de objeto de audio, que no tiene información residual asociada, en función de la representación de señal de mezcla hacia abajo y empleando la información residual; y

en el que el procesador de señal de audio está configurado para procesar la segunda información de audio, para realizar un procesamiento individual por objeto de los objetos de audio del segundo tipo de objeto de audio, empleando información paramétrica relativa a un objeto asociado con más de dos objetos de audio del segundo tipo de objeto de audio; y

en el que la información residual describe una distorsión residual, que se prevé que permanezca si un objeto de audio del primer tipo de objeto de audio se aísla simplemente empleando la información paramétrica relativa a un objeto.

2. El descodificador de señal de audio (100; 200; 500; 590) según la reivindicación 1, en el que el separador de objetos está configurado para proporcionar la primera información de audio empleando la información residual de modo que uno o más objetos de audio del primer tipo de objeto de audio se enfaticen por encima de objetos de audio del segundo tipo de objeto de audio en la primera información de audio, y en el que el separador de objetos está configurado para proporcionar la segunda información de audio empleando la información residual de modo que objetos de audio del segundo tipo de objeto de audio se enfaticen por encima de objetos de audio del primer tipo de objeto de audio en el segundo información de audio.

3. El descodificador de señal de audio (100; 200; 500; 570) según una de las reivindicaciones 1 a 2, en el que el procesador de señal de audio está configurado para procesar la segunda información de audio (134; 264; 564; 564a) en función de la información paramétrica relativa a un objeto (110; 212; 512; 512a) asociada con los objetos de audio del segundo tipo de objeto de audio e independiente de la información paramétrica relativa a un objeto (110; 212; 512; 512a) asociada con los objetos de audio del primer tipo de objeto de audio.

4. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 3, en el que el separador de objetos está configurado para obtener la primera información de audio (132; 262; 562; 562a, XEAO) y la segunda información de audio (134; 264; 564; 564a, XOBJ) empleando una combinación lineal de uno o más canales de señal de mezcla hacia abajo de la representación de señal de mezcla hacia abajo y uno o más canales residuales, en el que el separador de objetos está configurado para obtener parámetros de combinación para realizar la combinación lineal en función de parámetros de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio (m0... mNEAO-1; no... nNEAO-1) y en función de coeficientes de predicción de canal (cj, 0, cj, 1) de los objetos de audio del primer tipo de objeto de audio.

5. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 4, en el que el separador de objetos está configurado para obtener la primera información de audio y la segunda información de audio según

donde donde en el que XOBJ representan canales de la segunda información de audio;

en el que XEAO representan señales de objeto de la primera información de audio;

en el que D-1 representa una matriz que es una inversa de una matriz de mezcla hacia abajo extendida;

en el que C describe una matriz que representa una pluralidad de coeficientes de predicción de canal, cj, 0, cj, 1; 10 en el que l0 y r0 representan canales de la representación de señal de mezcla hacia abajo;

en el que res0 a resNEAO-1 representan canales residuales; y

en el que AEAO es una matriz de pre-representación EAO, cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de un señal de objeto de audio mejorado XEAO;

en el que el separador de objetos está configurado para obtener la matriz de mezcla hacia abajo inversa D-1 como 15 inversa de una matriz de mezcla hacia abajo extendida D que se define como en el que el separador de objetos está configurado para obtener la matriz C como en el que m0 a mNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio;

en el que no a nNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio;

en el que el separador de objetos está configurado para calcular los coeficientes de predicción cj, 0y cj, 1 como y en el que el separador de objetos está configurado para derivar coeficientes de predicción restringidos cj, 0 y cj, 1 de los coeficientes de predicción cj, 0 y cj, 1 empleando un algoritmo de restricción, o para utilizar los coeficientes de predicción cj, 0 y cj, 1 como los coeficientes de predicción cj, 0 y cj, 1;

en el que las cantidades de energía PLo, PRo, PLoRo, PLoCoj y PRoCoj se definen como en el que los parámetros OLDL, OLDR y IOCL, R corresponden a objetos de audio del segundo tipo de objeto de audio y se definen según en el que d0, i y d1, i son valores de mezcla hacia abajo asociados con los objetos de audio del segundo tipo de objeto de audio; en el que OLDi son valores de diferencia de nivel de objeto asociados con los objetos de audio del segundo tipo de 10 objeto de audio; en el que N es un número total de objetos de audio;

en el que NEAO es un número de objetos de audio del primer tipo de objeto de audio; en el que IOC0, 1 es un valor de correlación entre objetos asociado con un par de objetos de audio del segundo tipo de objeto de audio;

en el que eij y eL, R son valores de covarianza derivados de parámetros de diferencia de nivel de objeto y parámetros de correlación entre objetos; y

en el que eij están asociados con un par de objetos de audio del primer tipo de objeto de audio y eL, R está asociado con un par de objetos de audio del segundo tipo de objeto de audio.

6. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 4, en el que el separador de objetos está configurado para obtener la primera información de audio y la segunda información de audio según donde en el que XOBJ representa un canal de la segunda información de audio;

en el que XEAO representa señales de objeto de la primera información de audio;

en el que D-1 representa una matriz que es una inversa de una matriz de mezcla hacia abajo extendida;

en el que C describe una matriz que representa una pluralidad de coeficientes de predicción de canal, cj, 0, cj, 1; 15 en el que do representa un canal de la representación de señal de mezcla hacia abajo; y

en el que reso a resNEAO-1 representan canales residuales; y

en el que AEAO es una matriz de pre-representación EAO.

7. El descodificador de señal de audio según la reivindicación 6, en el que el separador de objetos está configurado para obtener la matriz de mezcla hacia abajo inversa D-1 es una inversa de una matriz de mezcla hacia abajo 20 extendida D que se define como en el que el separador de objetos está configurado para obtener la matriz C como en la que m0 a mNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio.

8. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 4, en el que el separador de objetos está configurado para obtener la primera información de audio y la segunda información de audio según en el que XOBJ representa canales de la segunda información de audio;

en el que XEAO representa señales de objeto de la primera información de audio; 10 donde en el que m0 a mNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio;

en el que n0 a nNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de 5 objeto de audio;

en el que OLDi son valores de diferencia de nivel de objeto asociados con los objetos de audio del primer tipo de objeto de audio;

en el que OLDL y OLDR son valores de diferencia de nivel de objeto comunes asociados con los objetos de audio del segundo tipo de objeto de audio; y

en el que AEAO es una matriz de pre-representación EAO.

9. El descodificador de señal de audio según una de las reivindicaciones 1 a 3, en el que el separador de objetos está configurado para obtener la primera información de audio y la segunda información de audio según en el que XOBJ representa un canal de la segunda información de audio; 15 en el que XEAO representan señales de objeto de la primera información de audio;

donde en el que m0 a mNEAO-1 son valores de mezcla hacia abajo asociados con los objetos de audio del primer tipo de objeto de audio; en el que OLDi son valores de diferencia de nivel de objeto asociados con los objetos de audio del primer tipo de objeto de audio;

en el que OLDL es un valor de diferencia de niveles de objeto común asociado con los objetos de audio del segundo tipo de objeto de audio; y en el que AEAO es una matriz de pre-representación EAO; en el que las matrices

se aplican a una representación d0 de una única señal de mezcla hacia abajo SAOC.

10. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 9, en el que el separador de objetos está configurado para aplicar una matriz de representación a la primera información de audio

(132; 262; 562; 562a) para cartografiar señales de objeto de la primera información de audio sobre canales de audio de la representación de señal de audio de mezcla hacia arriba (120; 220, 222; 562; 562a) .

11. El descodificador de señal de audio (100; 200; 500; 590) según una de las reivindicaciones 1 a 10, en el que el procesador de señal de audio (140; 270; 570; 570a) está configurado para realizar un reprocesamiento estéreo de la segunda información de audio (134; 264; 564; 564a) en función de una información de representación (Mren) , una información de covarianza relativa a objeto (E) , una información de mezcla hacia abajo (D) , para obtener canales de audio de la versión procesada de la segunda información de audio;

12. El descodificador de señal de audio (100; 200; 500; 590) según la reivindicación 11, en el que el procesador de señal de audio (140; 270; 570; 570a) está configurado para realizar el procesado estéreo para cartografiar una contribución de objeto de audio estimada (ED*JX) de la segunda información de audio (134; 264; 564; 564a) sobre una pluralidad de canales de la representación de señal de audio de mezcla hacia arriba en función de una información de representación y una información de covarianza.

13. El descodificador de señal de audio según la reivindicación 11 o la reivindicación 12, en el que el procesador de señal de audio está configurado para añadir una contribución de señal de audio descorrelacionada (P2Xd) , obtenida a partir de uno o más canales de audio de la segunda información de audio, a la segunda información de audio, o una información derivados de la segunda información de audio, en función de una información de error de mezcla hacia arriba (R) y uno o más valores de escalado de intensidad de señal descorrelacionados (wd1, wd2) .

14. El descodificador de señal de audio según una de las reivindicaciones 1 a 10, en el que el procesador de señal de audio (140; 270; 570; 570a) está configurado para realizar un postprocesado de la segunda información de audio (134; 264; 564; 564a) en función de una información de representación (A) , una información de covarianza relativa a objeto (E) y una información de mezcla hacia abajo (D) .

15. El descodificador de señal de audio según la reivindicación 14, en el que el procesador de señal de audio está configurado para realizar un procesado mono a binaural de la segunda información de audio, para cartografiar un único canal de la segunda información de audio sobre dos canales de la representación de señal de mezcla hacia arriba, teniendo en cuenta una función de transferencia relativa a la cabeza.

16. El descodificador de señal de audio según la reivindicación 14, en el que el procesador de señal de audio está configurado para realizar un procesado mono a estéreo de la segunda información de audio, para cartografiar un único canal de la segunda información de audio sobre dos canales de la representación de señal de mezcla hacia arriba.

17. El descodificador de señal de audio según la reivindicación 14, en el que el procesador de señal de audio está configurado para realizar un procesado estéreo a binaural de la segunda información de audio, para cartografiar dos canales de la segunda información de audio sobre dos canales de la representación de señal de mezcla hacia arriba, teniendo en cuenta una función de transferencia relativa a la cabeza.

18. El descodificador de señal de audio según la reivindicación 14, en el que el procesador de señal de audio está configurado para realizar un procesado estéreo a estéreo de la segunda información de audio, para cartografiar dos canales de la segunda información de audio sobre dos canales de la representación de señal de mezcla hacia arriba.

19. El descodificador de señal de audio según una de las reivindicaciones 1 a 18, en el que el separador de objetos está configurado para procesar objetos de audio del segundo tipo de objeto de audio, que no tiene información residual asociada, como un objeto de audio único, y en el que el procesador de señal de audio (140; 270; 570; 570a) está configurado para considerar parámetros de representación específicos del objeto asociados con los objetos de audio del segundo tipo de objeto de audio para ajustar contribuciones de los objetos de audio del segundo tipo de objeto de audio a la representación de señal de mezcla hacia arriba.

20. El descodificador de señal de audio según una de las reivindicaciones 1 a 19, en el que el separador de objetos está configurado para obtener uno o dos valores de diferencia de nivel de objeto comunes (OLDL, OLDR) para una pluralidad de objetos de audio del segundo tipo de objeto de audio; y

en el que el separador de objetos está configurado para utilizar el valor de diferencia de niveles de objetos común para un cálculo de coeficientes de predicción de canal (CPC) ; y

en el que el separador de objetos está configurado para utilizar los coeficientes de predicción de canal para obtener uno o dos canales de audio que representan la segunda información de audio.

21. El descodificador de señal de audio según una de las reivindicaciones 1 a 20, en el que el separador de objetos está configurado para obtener uno o dos valores de diferencia de nivel de objeto comunes (OLDL, OLDR) para una pluralidad de objetos de audio del segundo tipo de objeto de audio, y en el que el separador de objetos está configurado para utilizar el valor de diferencia de niveles de objetos común para un cálculo de entradas de una matriz (M) ; y

en el que el separador de objetos está configurado para utilizar la matriz (M) para obtener uno o más canales de audio que representan la segunda información de audio.

22. El descodificador de señal de audio según una de las reivindicaciones 1 a 21, en el que el separador de objetos está configurado para obtener selectivamente un valor de correlación entre objetos común (IOCL, R) asociado con el objeto de audio del segundo tipo de objeto de audio en función de la información paramétrica relativa a un objeto si se comprueba que hay dos objetos de audio del segundo tipo de objeto de audio, y para ajustar el valor de correlación entre objetos asociado con los objetos de audio del segundo tipo de objeto de audio a cero si se comprueba que hay más o menos que dos objetos de audio del segundo tipo de objeto de audio; y

en el que el separador de objetos está configurado para utilizar el valor de correlación entre objetos común para un cálculo de entradas de una matriz (M) ; y

en el que el separador de objetos está configurado para utilizar el valor de correlación entre objetos común asociada con los objetos de audio del segundo tipo de objeto de audio para obtener el o los más canales de audio que representan la segunda información de audio.

23. El descodificador de señal de audio según una de las reivindicaciones 1 a 22, en el que el procesador de señal de audio está configurado para representar la segunda información de audio en función de la información paramétrica relativa a un objeto, para obtener una representación parametrizada de los objetos de audio del segundo tipo de objeto de audio como la versión procesada de la segunda información de audio.

24. El descodificador de señal de audio según una de las reivindicaciones 1 a 23, en el que el separador de objetos está configurado para proporcionar la segunda información de audio de modo que la segunda información de audio describe más de dos objetos de audio del segundo tipo de objeto de audio.

25. El descodificador de señal de audio según la reivindicación 24, en el que el separador de objetos está configurado para obtener, como la segunda información de audio, una representación de señal de audio de un canal

o una representación de señal de audio de dos canales que representa más de dos objetos de audio del segundo tipo de objeto de audio.

26. El descodificador de señal de audio según una de las reivindicaciones 1 a 25, en el que el procesador de señal de audio está configurado para recibir la segunda información de audio y para procesar la segunda información de audio en función de la información paramétrica relativa a objeto, teniendo en cuenta información paramétrica relativa a un objeto asociado con más de dos objetos de audio del segundo tipo de objeto de audio.

27. El descodificador de señal de audio según una de las reivindicaciones 1 a 26, en el que el descodificador de señal de audio está configurado para extraer una información de número total de objetos (bsNumObjects) y una información de número de objetos de primer plano (bsNum-GroupsFGO) a partir de una información de configuración (SAOCSpecificConfig) de la información paramétrica relativa a un objeto, y para determinar el número de objetos de audio del segundo tipo de objeto de audio por formar una diferencia entre la información de número total de objetos y la información de número de objetos de primer plano.

28. El descodificador de señal de audio según una de las reivindicaciones 1 a 27, en el que el separador de objetos está configurado para utilizar información paramétrica relativa a un objeto asociado con NEAO objetos de audio del primer tipo de objeto de audio para obtener, como la primera información de audio, NEAO señales de audio (XEAO) que representan los NEAO objetos de audio del primer tipo de objeto de audio y para obtener, como la segunda información de audio, una o dos señales de audio (XOBJ) que representan los N-NEAO objetos de audio del segundo tipo de objeto de audio, procesar los N-NEAO objetos de audio del segundo tipo de objeto de audio como un objeto de audio de un único canal o de dos canales; y

en el que el procesador de señal de audio está configurado para representar individualmente los N-NEAO objetos de audio representados por la una o las dos señales de audio de la segunda información de audio empleando la información paramétrica relativa a un objeto asociado con los N-NEAO objetos de audio del segundo tipo de objeto de audio.

29. Procedimiento para proporcionar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y una información paramétrica relativa a un objeto, comprendiendo el procedimiento:

descomponer la representación de señal de mezcla hacia abajo, para proporcionar una primera información de audio que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio que describe un segundo conjunto de uno o más objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y empleando al menos una parte de la información paramétrica relativa a un objeto, en el que la segunda información de audio es una información de audio que describe los objetos de audio del segundo tipo de objeto de audio de una manera combinada; y

procesar la segunda información de audio en función de la información paramétrica relativa a un objeto, para obtener una versión procesada de la segunda información de audio; y

combinar la primera información de audio con la versión procesada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;

en el que la representación de señal de mezcla hacia arriba se proporciona en función de una información residual asociada con un subconjunto de objetos de audio representados por la representación de señal de mezcla hacia abajo, en el que se descompone la representación de señal de mezcla hacia abajo, para proporcionar la primera información de audio que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto de audio al cual la información residual está asociada, y describiendo la segunda información de audio un segundo conjunto de uno o más objetos de audio de un segundo tipo de objeto de audio, que no tiene información residual asociada, en función de la representación de señal de mezcla hacia abajo y empleando la información residual; en el que se realiza un procesamiento individual por objeto de los objetos de audio del segundo tipo de objeto de audio, empleando información paramétrica relativa a un objeto asociado con más de dos objetos de audio del segundo tipo de objeto de audio; y en el que la información residual describe una distorsión residual, que se prevé que permanezca si un objeto de audio del primer tipo de objeto de audio se aísla simplemente empleando la información paramétrica relativa a un objeto.

30. Programa de ordenador para realizar el procedimiento según la reivindicación 29 cuando el programa de ordenador se ejecuta en un ordenador.

Artículo Tipo Matriz de representación Matriz downmix

Karaoke

Clásico

KaraokeClásico

Descomponer una representación de señal de mezcla hacia abajo, para proporcionar una primera información de audio que describe un primer conjunto de uno o más objetos de audio de un primer tipo de objeto de audio y, una segunda información de audio que describe un segundo conjunto de uno o más objetos de audio de un segundo tipo de objeto de audio que depende de una representación de señal de mezcla hacia abajo y al menos una parte de la información paramétrica relativa a objeto Procesar la segunda información de audio que depende de la información paramétrica relativa a objeto, para obtener una versión procesada de la segunda información de audio Combinar la primera información de audio con la versión procesada de la segunda información de audio, para obtener una representación de señal de mezcla hacia abajo

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]