Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio.
Descodificador de señal de audio (100; 200; 500; 590) para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo (112;
210; 510; 510a) y de una información paramétrica relativa al objeto (110; 212; 512; 512a), comprendiendo el descodificador de señal de audio:
un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio (132; 262; 562; 562a) que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio (134; 264; 564; 564a) que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto;
un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) y para tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada (142; 272; 572; 572a) de la segunda información de audio; y
un combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba; en el cual el separador de objeto está configurado para obtener la primera información de audio y la segunda información de audio según**Fórmula**
donde**Fórmula**
donde**Fórmula**
donde XOBJ representa los canales de la segunda información de audio;
donde XEAO representa las señales de objeto de la primera información de audio;
donde D-1 representa una matriz que es la inversa de una matriz de mezcla hacia abajo extendida;
donde C describe una matriz que representa una pluralidad de coeficientes de predicción de canal, c j,0, c j,1.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12183562.
Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..
Nacionalidad solicitante: Alemania.
Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.
Inventor/es: HERRE, JURGEN, HELLMUTH, OLIVER, HILPERT, JOHANNES, FALCH,CORNELIA, RIDDERBUSCH,FALKO, TERENTIV,LEONID.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10H1/36 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10H INSTRUMENTOS DE MUSICA ELECTROFONICOS; INSTRUMENTOS EN LOS QUE LOS TONOS SON GENERADOS POR MEDIOS ELECTROMECANICOS O POR GENERADORES ELECTRONICOS, O EN LOS QUE LOS SONIDOS SON SINTETIZADOS A PARTIR DE UNA MEMORIA DE DATOS. › G10H 1/00 Elementos de instrumentos de música electrofónicos (teclados que se adaptan también a otros instrumentos de música G10B, G10C; disposiciones para producir una reverberación sonora o un eco G10K 15/08). › Dispositivos para el acompañamiento.
- G10L19/00 G10 […] › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L19/008 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
- G10L19/20 G10L 19/00 […] › utilizando codificación específica de clase de sonido, codificadores híbridos o codificación basada en objeto.
- H04S7/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.
PDF original: ES-2524428_T3.pdf
Ver la galería de la patente con 12 ilustraciones.
Fragmento de la descripción:
Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
Campo Técnico
[0001] Las realizaciones de acuerdo con la invención se relacionan con un decodificador de señales de audio para producir una representación de señal de mezcla ascendente que depende de una representación de señal de mezcla descendente e información paramétrica relacionada con un objeto.
[0002] Otras realizaciones de acuerdo con la invención se relacionan con un procedimiento para producir una representación de señal de mezcla ascendente dependiendo de una representación de señal de mezcla descendente e Información paramétrica relacionada con un objeto.
[0003] Otras realizaciones de acuerdo con la invención se relacionan con un programa de computación.
[0004] Algunas realizaciones de acuerdo con la invención se relacionan con un sistema SAOC de Karaoke/Solos mejorado.
Antecedentes de la Invención
[0005] En las disposiciones de audio modernas, es conveniente transferir y almacenar información de audio de manera eficiente con respecto a la velocidad de transmisión de bits. Además, con frecuencia es conveniente reproducir un contenido de audio empleando una pluralidad de dos o Incluso más parlantes, que están espaclalmente distribuidos en un recinto. En esos casos, es conveniente aprovechar las capacidades de dicha disposición de múltiples parlantes para permitir que un usuario identifique espacialmente diferentes contenidos de audio o diferentes elementos de un único contenido de audio. Esto se puede lograr distribuyendo individualmente los diferentes contenidos de audio en los diferentes parlantes.
[0006] Dicho de otro modo, en la técnica del procesamiento de audio, la transmisión de audio y el almacenamiento de audio, existe un creciente interés por manejar contenidos de canales múltiples para mejorar la Impresión auditiva. El uso de contenido de audio de múltiples canales trae aparejadas significativas mejoras para el usuario. Por ejemplo, se puede obtener una impresión auditiva tridimensional, lo que trae consigo una mayor satisfacción del usuario en aplicaciones de entretenimiento. Sin embargo, los contenidos de audio en múltiples canales también son de utilidad en entornos profesionales, por ejemplo en aplicaciones de conferencias telefónicas, puesto que se puede mejorar la inteligibilidad de los parlantes utilizando una reproducción de audio en canales múltiples.
[0007] Sin embargo, también es conveniente contar con un buen equilibrio entre buena calidad de audio y requerimientos de velocidad de transferencia de bits, a fin de evitar una excesiva carga de recursos causada por
aplicaciones de canales múltiples.
[0008] Últimamente se han propuesto técnicas paramétricas para la transmisión eficiente de bits y/o para el almacenamiento de escenas de audio que contienen múltiples objetos de audio, por ejemplo, Binaural Cue Coding (Type I) (Ver, por ejemplo la referencia [BCC]), Joint Source Coding (ver, por ejemplo, la referencia [JSC J), y MPEG Spatial Audio Object Coding (SAOC) (ver, por ejemplo, las referencias [SAOCI], [SAOC2]).
[0009] Estas técnicas apuntan a reconstruir perceptualmente la escena de salida de audio ventajosa en lugar de hacerlo
por coincidencia de formas de onda.
[0010] La Fig. 8 ilustra una reseña general de la disposición correspondiente a ese sistema (en este caso: MPEG SAOC). El sistema MPEG SAOC 800 ilustrado en la Fig. 8 comprende un codificador SAOC 810 y un decodificador SAOC 820. El codificador SAOC 810 recibe una pluralidad de señales de objeto Xi a XN, que pueden estar representadas, por ejemplo, en forma de señales en el dominio del tiempo o en forma señales en el dominio del tiempo y la frecuencia (por ejemplo, en forma de una serie de coeficientes de transformación del tipo de transformadas de Fourier, o en forma de señales de subbanda QMF). El codificador SAOC 810 también recibe, por lo general, coeficientes de mezcla descendente di a dN, que están asociados con las señales de objeto Xi a xN Se puede disponer de series independientes de de coeficientes de mezcla descendente por cada canal de de la señal de mezcla descendente. El codificador SAOC 810 está configurado típicamente para obtener un canal de la señal de mezcla descendente
combinando las señales de objeto Xi a Xn de acuerdo con los coeficientes de mezcla descendente asociados di a dN. Por lo general, hay menos canales de mezcla descendente que señales de objeto Xi a XN. Para dar lugar (por lo menos aproximadamente) a una separación (o tratamiento separado) de las señales de objeto del lado del decodificador SAOC 820, el codificador SAOC 8 10 suministra tanto la una o más señales de mezcla descendente (designados canales de mezcla descendente) 812 como una información complementaria 814. La información complementaria 814 describe características de las señales de objeto a XN, para dar lugar a un procesamiento específico de objetos del lado del decodificador.
[0011] El decodificador SAOC 820 está configurado para recibir tanto dicha una o más señales de mezcla descendente 812 como la información complementaria 814. Además, el decodificador SAOC 820 está configurado por lo general para recibir una información sobre interacción con el usuario y/o una información de interacción con el usuario y/o una información de control del usuario 822, que describe una configuración de renderización. Por ejemplo, la información de interacción con el usuario/información de control del usuario 822 puede describir una configuración de parlantes y la colocación espacial pretendida de los objetos provistos por las señales de objeto Xi a Xn, El decodificador SAOC 820 está configurado para producir, por ejemplo, una pluralidad de señales decodificadas de canales de mezcla ascendente
[0012] El decodificador SAOC 820 está configurado para producir, por ejemplo, una pluralidad de señales de canales decodificadas de mezcla descendente yi a yM. Las señales de canales de mezcla ascendente pueden estar asociadas, por ejemplo a parlantes individuales de una disposición de renderización de múltiples parlantes. El decodificador SAOC 820 puede comprender, por ejemplo, un separador de objetos 820a, que está configurado para reconstruir, por lo menos aproximadamente, las señales de objeto Xi a Xn sobre la base de dichas una o más señales de mezcla descendente 812 e información complementaria 814, a fin de obtener así las señales de objetos reconstruidas 820b. Sin embargo, las señales de objetos reconstruidas 820b se pueden desviar hasta cierto punto de las señales de objetos originales xi a xn, por ejemplo, porque la información complementaria 814 no basta totalmente para una reconstrucción perfecta debido a restricciones de velocidad de transmisión de bits. El decodificador SAOC 820 puede comprender además un mezclador 820c, que puede estar configurado para recibir las señales de objetos reconstruidas 820b y la información de interacción con el usuario/información de control de usuarios 822, y para suministrar, sobre la base de éstas, las señales de canales de mezcla ascendente yi a yM. El mezclador 820 puede estar configurado para usar la información de interacción con el usuario /información de control de usuarios 822 para determinar la contribución de las señales de objetos reconstruidas 820b individuales a las señales de canales de mezcla ascendente yi a yn». La información de interacción con el usuario/información de control de usuarios 822 puede comprender, por ejemplo, parámetros de renderización (que también se denominan coeficientes de renderización), que determinan la contribución de las señales de objetos reconstruidas 822 individuales a las señales de canales de mezcla ascendente yi a yM.
[0013] Sin embargo, cabe señalar que, en muchas realizaciones, la separación de los objetos, que está indicada por el separador de objetos 820a de la Fig. 8, y la mezcla, que está indicada por el mezclador 820c de la Fig. 8, se llevan a cabo en un solo paso. Para este fin, se pueden computar los parámetros generales que describen un mapeo directo de dichas una o más señales de mezcla descendente 812 sobre las señales de canales de mezcla ascendente a yM. Estos parámetros se pueden computar sobre la base de la información complementaria y la información de interacción con el usuario/ información de control de usuarios 822.
[0014] Tomando, ahora, como referencia las Figs. 9a, 9b y 9c, se describen diferentes aparatos para obtener una representación de la señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendente e información complementaria relacionada... [Seguir leyendo]
Reivindicaciones:
1. Descodificador de señal de audio (100; 200; 500; 590) para suministrar una representación de señal de mezcla hacia arriba en fundón de una representación de señal de mezcla hacia abajo (112; 210; 510; 510a) y de una información paramétrica relativa al objeto (110; 212; 512; 512a), comprendiendo el descodificador de señal de audio:
un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezcla hada abajo, para suministrar una primera información de audio (132; 262; 562; 562a) que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio (134; 264; 564; 564a) que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en fundón de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto;
un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) y para tratar la segunda información de audio en fundón de la información paramétrica relativa al objeto, para obtener una versión tratada (142; 272; 572; 572a) de la segunda información de audio; y
un combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual el separador de objeto está configurado para obtener la primera información de audio y la segunda información de audio según
donde
donde
__ Predicción
AOBJ ~ "*-OBJ
resn
fes*! i
Y _ A £40»*-:Predicción AEAO ~ A WÍEAO
f l '
l0
resn
\res^J
m = frc
^Predicción
M
Prediction
M
Prediction
OBJ
M Prediction EAO
donde X0Bj representa los canales de la segunda información de audio;
donde XEA0 representa las señales de objeto de la primera información de audio;
donde D'1 representa una matriz que es la inversa de una matriz de mezcla hacia abajo extendida;
donde C describe una matriz que representa una pluralidad de coeficientes de predicción de canal, c j o, c j,i;
donde lo y ro representan los canales de la representación de señal de mezcla hacia abajo; donde res0 a resNEAo -1 representan los canales residuales; y
donde Aeao es una matriz de pre-representación de EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio mejorado Xeao;
en el cual el separador de objetos está configurado para obtener la matriz de mezcla hacia abajo inversa D-1 como la inversa de una matriz de mezcla hacia abajo extendida D que se define como
**(Ver fórmula)**en el cual el separador de objetos está configurado para obtener la matriz C como
r
0 | ¡ o | 0^ | |
0 | ! o | 0 | |
0,0 | C0,l | ! i... | 0 |
\CKeao- i.0
'N,
EAO
-u
0
donde m0 a mNEAO son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde no a nNEAO -1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
en el cual el separador de objeto está configurado para calcular los coeficientes de predicción c j,0 y c j,i como
Cj, 0
PLoCojPro
ProCo jPloRo
PloPro
PRoCojPlo '
P2
LoRo
PloCojPloRo
aM p p p 2 '
1Lo^Ro LoRo
y en el cual el separador de objeto está configurado para derivar los coeficientes de predicción restringidos c ¡¡0 y c a
partir de los coeficientes de predicción c j 0 y c j 1 con ayuda de un algoritmo de restricción, o para utilizar los coeficientes de predicción c o y c j i como coeficientes de predicción c jo y c ji;
en el cual las cantidades de energía PLo, PRo, PLoRo, PLoCoj y PRoCoj se definen como
**(Ver fórmula)**donde los parámetros OLDL, OLDR, y IOCL,R corresponden a unos objetos de audio del segundo tipo de objeto de audio y se definen según
oldr =
N-N
EAO
**(Ver fórmula)**dliOLDi,
N-N
EAO
OLDl-~=
ctftiOLDi,
!OCL,R =
(IOC0'lt
l 0,
* - Neao = 2,
autrement.
donde d o,/y d y , son unos valores de mezcla hacia abajo asociados a los objetos de audlo del segundo tipo de objeto de audlo;
donde OLD¡ son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del segundo tipo de objeto de audio;
donde N es el número total de objetos de audlo;
donde Neao es el número de objetos de audio del prime.........................^
donde IOC0,i es un valor de correlación entre objetos a En ¡OS demás C3S0S. > audio del segundo tipo de objeto
de audio;
donde e¡j y ei_,R son unos valores de covariancia derivados de los parámetros de diferencia de nivel de objeto y de los parámetros de correlación entre objetos; y
donde e¡j está asociada a un par de objetos de audio del primer tipo de objeto de audio y eL,R está asociada a un par de objetos de audio del segundo tipo de objeto de audio.
2. Descodificador de señal de audio (100; 200; 500; 590) para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo (112; 210; 510; 510a) y de una información paramétrica relativa al objeto (110; 212; 512; 512a), comprendiendo el descodificador de señal de audio:
un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio (132; 262; 562; 562a) que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio (134; 264; 564; 564a) que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto;
un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) y
para tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada (142; 272; 572; 572a) de la segunda información de audio; y
un combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audlo con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual el separador de objeto está configurado para obtener la primera información de audio y la segunda Información de audio según
y ivr 9'a-
aobj
rl '
lO
Y A £i4^lWfEner9ía A&40 A 1V1£40
donde Xobj representa los canales de la segunda información de audio;
donde Xeao representa las señales de objeto de la primera información de audio;
donde
f
M
OBJ
OID,
Nj¡An-\
0
I OLDl + £ mfOLD,
/=0
o
OLDa
N pao 1
M
.Energía
EAO
mlOLD0
Neto-1
\OLDl +
í=0
OLDr + £ nfOIZ),
(=0
n\OLD^
NEAO
rnfOLDj y OLDR + £ «?£>££>
Jm2N _xOLDn OLDl+ m'OLDi \
i=0
/=0
1 ^'^¡V -1
"EAO '______"EAO 1
Ngjp-l
OLDr+ £ n]OLDi
i=0
donde mo a mNEAo 1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde no a nNEAo 1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLD¡ son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLDl y OLDr son unos valores de diferencia de nivel de objeto comunes asociados a los objetos de audio del segundo tipo de objeto de audio; y
donde Aeao es una matriz de pre-representación EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio mejorado Xeao-
3. Descodificador de señal de audio (100; 200; 500; 590) para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo (112; 210; 510; 510a) y de una información paramétrica relativa al objeto (110; 212; 512; 512a), comprendiendo el descodificador de señal de audio:
un separador de objetos (130; 260; 520; 520a) configurado para descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio (132; 262; 562; 562a) que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio (134; 264; 564; 564a) que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en
función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto;
un procesador de señal de audio configurado para recibir la segunda información de audio (134; 264; 564; 564a) y para tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada (142; 272; 572; 572a) de la segunda información de audio; y
un combinador de señal de audio (150; 280; 580; 580a) configurado para combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual el separador de objeto está configurado para obtener la primera información de audio y la segunda información de audio según
Xm,=A«°M|S-(4,)
donde Xobj representa un canal de la segunda información de audio;
donde Xeao representa las señales de objeto de la primera información de audio; donde
f
\
M'
Energía
OBJ
oldt
I OLDl + £ mfOLD;
(=0
hiqOLD0
I
I OLDl+ £ mfOLD,
r-o
M1
¡Energía
EAO
mNrJ-\OLDj
Ni
Neaq
OLDl+ £ mfOLD,
/-O
y
donde mo a ítineao 1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLD¡ son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLDl es un valor de diferencia de nivel de objeto común asociado a los objetos de audio del segundo tipo de objeto de audio; y
donde Aeao es una matriz de pre-representación EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio mejorado XEAO;
donde las matrices M Energia0Bj y M Energ`aEAo se aplican a una representación do de una señal de mezcla hacia abajo SAOC única.
4. Procedimiento para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y de una información paramétrica relativa al objeto, comprendiendo el procedimiento:
descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto; y
tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada de la segunda información de audio; y
combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual la primera información de audio y la segunda información de audio se obtienen según
' I N
X-OBJ - M
OBJ
resn
resN.
V neao /
Y _ A £40m)r:Predicción
^EAO A
f l '
l0
resn
resM.
donde
donde
IVf
A-*`Predicción
= D,C
Predicción
m
_.ion
Predicción
Predicción
l"LEAO
ion
ion
donde Xobj representa los canales de la segunda información de audio;
donde Xeao representa las señales de objeto de la primera información de audio;
donde D'1 representa una matriz que es la inversa de una matriz de mezcla hacia abajo extendida;
donde C describe una matriz que representa una pluralidad de coeficientes de predicción de canal, c¡_o, c
donde lo y ro representan los canales de la representación de la señal de mezcla hacia abajo;
donde reso a res neao -1 representan los canales residuales; y
donde Aeao es una matriz de pre-representación EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio Xeao mejorado;
donde la matriz de mezcla hacia abajo inversa D'1 se obtiene como la inversa de una matriz de mezcla hacia abajo extendida D que se define como
D =
m,
0 | ! Wü 1 | ||
0 | 1------------------ 1 _ | nNFM-1 | |
mQ | ! -1. | 0 | |
; | Í 0 ' | _ \ | |
i0 | -1 |
J
donde la matriz C se obtiene como
c =
o ! o
0 | ! 0 | |
c\o t I- | C0,l t b | ! 1 1 : \ |
1 1 * i l A |
0^
0
0
J
donde mo a mNEAo " son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde no a nNEAo -1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde los coeficientes de predicción c J0 y c n se calculan como
LoCújpRo ProCo,] rLoRo
cj,0 ~
,'Pr
PloPro ~ Pt
LOftQ
=
_ rRoCo,jPLo PloCojPl
PlqPro ~ P1
y ; et
LoRo
donde los coeficientes de predicción restringidos c ,0 y c ,1 se derivan de los coeficientes de predicción c ,0 y c ,1 con ayuda de un algoritmo de restricción, o bien donde los coeficientes de predicción c,0 y c, 1 se utilizan como coeficientes de predicción c, 0 y c, 1;
donde las cantidades de energía PLo,PRo,PLoRo,PLoCoj y PRoCoj se definen como
**(Ver fórmula)**donde los parámetros OLDl,OLDr, y IOCl,r corresponden a los objetos de audio del segundo tipo de objeto de audio y se definen según
tf-Wjao-l
OLDl= £ dlfiLD,
/=0
X-Heao-'
OLDr £ d]pLDt,
/=0
/OC£ñ ={/C>Co * ^°'2
l 0, de otro modo.
donde d0., y df,, son unos valores de mezcla hacia abajo asociados a los objetos de audio del segundo tipo de objeto de
audio;
donde OLD¡ son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del segundo tipo de objeto de audio;
donde N es el número total de objetos de audio;
donde Neao es el número de objetos de audio del primer tipo de objeto de audio;
donde IOCo,i es un valor de correlación entre objetos asociado a un par de objetos de audio del segundo tipo de objeto de audio;
donde e¡j y eL,R son unos valores de covariancia derivados de parámetros de diferencia de nivel de objeto y de los parámetros de correlación entre objetos; y
donde e¡j está asociado a un par de objetos de audio del primer tipo de objeto de audio y eL,R está asociado a un par de objetos de audio del segundo tipo de objeto de audio.
5. Procedimiento para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y de una información paramétrica relativa al objeto, comprendiendo el procedimiento:
descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto; y
tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada de la segunda información de audio; y
combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual la primera información de audio y la segunda información de audio se obtienen según
v _ MEn"ol-a-
aOBJ ~
rl' l0
donde
donde
donde
V _ A Ene,9'a f ^0
ABAO ~ A ÍVlEAO
l ro
Xobj representa los canales de la segunda información de audio; Xeao representa las señales de objeto de la primera información de
\
/
audio;
M
OBJ
M
BAO
OLD, | 0 oldr |
OLDl+ £ mfOLD, i=0 0 | |
NEAO~l OLDr+ £ nfOLD¡ (=0 | |
míOLD, | 1 n¡OLD0 |
Wejo-1 | Neao- 1 |
OLDb+ Y nfOLD, | |
/=0 \ | i=Q |
mi ,OLDn , NEAO 1 NEAO 1 | ni iOLDn , neao~1 neao 1 |
J
Nbao- l
OLDL+ £ m,!0Z4 ^OÍZ)+ £ »,2OZZ>
donde m0 a m/vEAo 1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde al no a Oneao "1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLD¡ son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLDl y OLDr son unos valores de diferencia de nivel de objeto comunes asociados a los objetos de audio del segundo tipo de objeto de audio; y
donde Aeao es una matriz de pre-representación EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio mejorado Xeao-
6. Procedimiento para suministrar una representación de señal de mezcla hacia arriba en función de una representación de señal de mezcla hacia abajo y de una información paramétrica relativa al objeto, comprendiendo el procedimiento:
descomponer la representación de señal de mezcla hacia abajo, para suministrar una primera información de audio que describe un primer conjunto de uno o varios objetos de audio de un primer tipo de objeto de audio, y una segunda información de audio que describe un segundo conjunto de uno o varios objetos de audio de un segundo tipo de objeto de audio en función de la representación de señal de mezcla hacia abajo y con ayuda de al menos una parte de la información paramétrica relativa al objeto; y
tratar la segunda información de audio en función de la información paramétrica relativa al objeto, para obtener una versión tratada de la segunda información de audio; y
combinar la primera información de audio con la versión tratada de la segunda información de audio, para obtener la representación de señal de mezcla hacia arriba;
en el cual la primera información de audio y la segunda información de audio se obtienen según
=»cr w
Y _ * É<Oly|iEnergía fl\
aeao ~ A LW1EAO \ao )
donde Xobj representa un canal de la segunda información de audio;
donde Xeao representan señales de objeto de la primera información de audio;
donde
U.Energía
M, =
'OBJ
OLDl
I OLDl + £ mfOLDi
(=0
EAO
m0OLD0
\OLDl+ £ mfOLDi
i=0
wIm OLD?! i
Mpjin i «pía *
OLDl+ £ mfOLD,
i=0
y
donde mo a mNEAo 1 son unos valores de mezcla hacia abajo asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLD¡son unos valores de diferencia de nivel de objeto asociados a los objetos de audio del primer tipo de objeto de audio;
donde OLDl es un valor de diferencia de nivel de objeto común asociado a los objetos de audio del segundo tipo de objeto de audio; y
donde Aeao es una matriz de pre-representación EAO cuyas entradas describen un cartografiado de objetos de audio mejorados en los canales de una señal de objeto de audio mejorado XEA0\
donde las matrices M Ener9iaOBj y M Energ'aEAo se aplican a una representación do de una señal de mezcla hacia abajo SAOC única.
7. Programa de ordenador para realizar el procedimiento según cualquiera de las reivindicaciones 4 a 6 cuando el programa de ordenador se ejecuta en un ordenador.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]