Codificador paramétrico para codificar una señal de audio multicanal.

Un codificador paramétrico para codificar una señal de audio multicanal que está compuesta por una primera señal de audio y una segunda señal de audio, teniendo el codificador paramétrico:

un transformador

(101) para transformar la primera señal de audio en el dominio de la frecuencia con el fin de obtener una primera señal de audio transformada, y para transformar la segunda señal de audio en el dominio de la frecuencia con el fin de obtener una segunda señal de audio transformada;

un generador (107) de parámetros para generar un primer parámetro de codificación, X(i), a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una primera banda i de frecuencia, y para generar un segundo parámetro de codificación, X(j), a partir de la primera señal de audio transformada y de la segunda señal de audio transformada en una segunda banda j de frecuencia; y

un combinador (109) de parámetros para combinar el primer parámetro de codificación y el segundo parámetro de codificación con el fin de obtener un parámetro de codificación combinado, X, de acuerdo con la fórmula**Fórmula**

en donde el parámetro I denota un conjunto de índices de bandas de frecuencia, el parámetro gi es un coeficiente de ponderación asignado a una banda i de frecuencia, el parámetro P1(i) denota una potencia de señal de la primera señal de audio en la banda i-ésima de frecuencia, el parámetro P2(i) denota una potencia de señal de la segunda señal de audio en la banda i-ésima de frecuencia,

y en donde el primer parámetro de codificación, X(i), y el segundo parámetro de codificación, X(j), son una diferencia de fase entre canales o una coherencia entre canales o una diferencia de intensidad entre canales o una diferencia de nivel entre canales.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CN2010/078358.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: Huawei Administration Building, Bantian, Longgang District Shenzhen, Guangdong 518129 CHINA.

Inventor/es: FALLER,CHRISTOF, XU,JIANFENG, MIAO,LEI, LANG,YUE.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L13/00 (Síntesis de la voz; Sistemas de síntesis de la voz a partir de texto)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)
google+ twitter facebookPin it
Ilustración 1 de Codificador paramétrico para codificar una señal de audio multicanal.
Ilustración 2 de Codificador paramétrico para codificar una señal de audio multicanal.
Ilustración 3 de Codificador paramétrico para codificar una señal de audio multicanal.
Ilustración 4 de Codificador paramétrico para codificar una señal de audio multicanal.
Codificador paramétrico para codificar una señal de audio multicanal.

Texto extraído del PDF original:

DESCRIPCIÓN

Codificador paramétrico para codificar una señal de audio multicanal

Campo de la invención

La presente invención está relacionada con la codificación de audio.

Antecedentes de la invención

La codificación de audio multicanal o estéreo paramétrico, tal como se describe por ejemplo en C. Faller y F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization (Representación eficiente de audio espacial mediante parametrización perceptual)", en Proc. IEEE Workshop on Appl. of Sig. Proc. to Audio and Acoust. (Actas de las Jornadas de Trabajo del IEEE sobre Aplicaciones del Procesamiento de Señales de Audio y Acústica), Octubre de 2001, páginas 199-202, utiliza cues (referencias) espaciales para sintetizar señales de audio downmix (mezcladas para reducir los canales) - normalmente mono o estéreo - en señales con más canales. Generalmente, las señales de audio downmix son el resultado de una superposición de una pluralidad de señales de canales de audio de una señal de audio multicanal, por ejemplo, de una señal de audio estéreo. Este menor número de canales están codificados en forma de onda y a los canales de audio codificados se les añade, como parámetros de codificación, información complementaria, esto es, las cue espaciales relativas a las relaciones de los canales de las señales originales. El descodificador utiliza esta información complementaria para regenerar el número original de canales de audio a partir de los canales de audio codificados en forma de onda descodificados.

Un codificador estéreo paramétrico básico puede utilizar las diferencias de nivel entre canales (ILD) como una cue necesaria para generar la señal estéreo a partir de la señal downmix de audio mono. Los codificadores más sofisticados también pueden utilizar la coherencia entre canales (ICC), que puede representar un grado de similitud entre las señales de los canales de audio, esto es, los canales de audio. Adicionalmente, cuando se codifican señales estéreo biaural, por ejemplo, para reproducción de audio 3D o sonido envolvente a través de auriculares, para reproducir las diferencias de fase/retardo entre los canales también puede desempeñar la función de una diferencia de fase entre canales (IPD).

La síntesis de las cue de ICC puede ser relevante para la mayoría de los contenidos de audio y musicales para regenerar el ambiente, la reverberación estéreo, la amplitud de la fuente y otras percepciones relacionadas con la impresión espacial, tal como se describe en J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization (Audición Espacial: La Psicofísica de la Localización de Sonidos por Humanos), The MIT Press, Cambridge, Massachusetts, EE.UU., 1997. La síntesis de coherencia se puede implementar mediante la utilización de descorreladores en el dominio de la frecuencia, tal como se describe en E. Schuijers, W. Oomen, B. den Brinker, y J. Breebaart, "Advances in parametric coding for high-quality audio (Avances en codificación paramétrica para audio de alta calidad)", en Preprint 114th Conv. Aud. Eng. Soc. (Publicación preliminar de la 114ª Convención de la Sociedad de Ingeniería de Audio), marzo de 2003. Sin embargo, los enfoques de síntesis conocidos para sintetizar las señales de audio multicanal pueden tener una mayor complejidad. Además, la utilización de los parámetros de ICC, por ejemplo además de otros parámetros, tales como los de diferencia de nivel entre canales (ICLD) y los de diferencia de fase entre canales (ICPD), puede incrementar excesivamente la tasa de bits.

El documento US 2005/180579 A1 divulga un esquema para la síntesis estéreo y multicanal de cues de correlación entre canales (ICC) (correlación cruzada normalizada) para la codificación de estéreo paramétrico y multicanal. El esquema sintetiza las cue de ICC de tal modo que se aproxima a la del original. A tal efecto se generan canales de audio difuso y se mezclan con la(s) señal(es) combinada(s) (por ejemplo, mediante suma) transmitida(s). Los canales de audio difuso se generan preferiblemente utilizando filtros relativamente largos con respuestas de pulsos Gaussianos que decrecen exponencialmente. Estas respuestas de pulsos generan un sonido difuso parecido a la reverberación posterior. Para reducir la complejidad del cálculo se propone una implementación alternativa en la que la diferencia de nivel entre canales (ICLD), la diferencia de tiempo entre canales (ICTD) y la síntesis de la ICC se realizan todas en el dominio de una única transformada de Fourier de tiempo corto (STFT), incluyendo el filtrado para la generación del sonido difuso.

El documento WO 2003/219130 A1 divulga un dispositivo de combinación que incluye: una unidad de detección que detecta flujos de bits codificados activos que son flujos de bits codificados efectivos a partir de una pluralidad de flujos de bits codificados a lo largo de un período de tiempo predeterminado; una primera unidad de combinación que combina, a partir de una pluralidad de flujos de bits downmix incluidos en los flujos de bits codificados, únicamente los flujos de bits downmix incluidos en los flujos de bits codificados activos, con el fin de generar un flujo de bits downmix combinado; y una segunda unidad de combinación que combina, a partir de una pluralidad de flujos de bits de parámetros incluidos en los flujos de bits codificados, únicamente los flujos de bits de parámetros incluidos en los flujos de bits codificados activos, con el fin de generar un flujo de bits de parámetros combinado.

El documento US 2003/219130 A1 divulga una escena auditiva sintetizada a partir de una señal de audio mono modificando, para cada una de las bandas críticas, un parámetro de la escena auditiva (por ejemplo, una diferencia de nivel interaural (ILD) y/o una diferencia de tiempo interaural (ITD)) para cada una de las subbandas dentro de la banda crítica, en donde la modificación se basa en el promedio de la coherencia calculada para la banda crítica. La modificación basada en la coherencia da lugar a escenas auditivas que tienen objetos cuya amplitud coincide de forma más precisa con la amplitud de los objetos en la escena auditiva original de entrada.

Resumen de la invención

Uno de los objetivos que se debe conseguir mediante la presente invención es reducir la complejidad de un esquema de codificación paramétrica. Este objetivo se logra mediante las características de las reivindicaciones independientes. A partir de la descripción, los dibujos y las reivindicaciones dependientes resultan evidentes otros modos de realización adicionales.

La invención se basa en el descubrimiento de que la combinación de parámetros de codificación paramétrica, como por ejemplo los parámetros de ICC, puede reducir la tasa de bits necesaria para representar los parámetros y de este modo se puede reducir la complejidad del esquema de codificación paramétrica resultante. Los parámetros de codificación combinados se pueden aplicar, por ejemplo, solo a una región de frecuencia determinada con el fin de mejorar la calidad de audio para, por ejemplo, la señal de voz, mediante lo cual se pueden reducir aún más la complejidad y los requisitos de memoria.

La invención se describe en las reivindicaciones independientes 1 y 6. Los modos de realización adicionales se definen en las reivindicaciones dependientes 2-5.

De acuerdo con una primera forma de implementación, el primer y el segundo parámetros de codificación pueden ser una diferencia de fase entre canales.

De acuerdo con una segunda forma de implementación, el primer y el segundo parámetros de codificación pueden ser una coherencia entre canales.

De acuerdo con una tercera forma de implementación, el primer y el segundo parámetros de codificación pueden ser una diferencia de intensidad entre canales.

De acuerdo con una cuarta forma de implementación, el primer y el segundo parámetros de codificación pueden ser una diferencia de nivel entre canales.

De acuerdo con una quinta forma de implementación, el generador de parámetros está configurado para generar el primer parámetro de codificación y el segundo parámetro de codificación a partir de la multiplicación de los valores de la primera señal de audio transformada y de la segunda señal de audio transformada.

De acuerdo con una sexta forma de implementación, el combinador de parámetros está configurado para determinar una media ponderada del primer parámetro de codificación y el segundo parámetro de codificación mediante la utilización de potencias de una primera señal de audio transformada y la segunda señal de audio transformada en la frecuencia determinada como coeficientes de ponderación con el fin de obtener los parámetros de codificación combinados.

De acuerdo con una séptima forma de implementación, el combinador de parámetros está configurado para determinar una media ponderada del primer parámetro de codificación y el segundo parámetro de codificación mediante la utilización de un coeficiente de ponderación dependiente de la frecuencia con el fin de obtener los parámetros de codificación combinados.

De acuerdo con una octava forma de implementación, el generador de parámetros está configurado para generar una pluralidad de parámetros de codificación a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una pluralidad de frecuencias, y en donde el combinador de parámetros está configurado para combinar la pluralidad de parámetros de codificación con el fin de obtener el parámetro de codificación combinado.

De acuerdo con una novena forma de implementación, el codificador paramétrico comprende, además, un combinador de señales para combinar la primera señal de audio transformada y la segunda señal de audio transformada para obtener una señal downmix.

De acuerdo con una décima forma de implementación, el codificador paramétrico comprende, además, un transformador inverso para la transformación inversa de una combinación de la primera señal de audio transformada y la segunda señal de audio transformada para obtener una señal downmix de audio.

De acuerdo con un segundo aspecto, la invención está relacionada con un método para codificar de forma paramétrica una señal de audio multicanal que está compuesta por una primera señal de audio y una segunda señal de audio, consistiendo el método en transformar la primera señal de audio en el dominio de la frecuencia para obtener una primera señal de audio transformada, y transformar la segunda señal de audio en el dominio de la frecuencia para obtener una segunda señal de audio transformada, generar un primer parámetro de codificación a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una primera frecuencia, y generar un segundo parámetro de codificación a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una segunda frecuencia, y combinar el primer parámetro de codificación y el segundo parámetro de codificación para obtener un parámetro de codificación combinado.

A partir de la funcionalidad del codificador paramétrico de acuerdo con el primer aspecto se pueden deducir directamente pasos adicionales del método de las formas de implementación de acuerdo con el segundo aspecto

Breve descripción de los dibujos

A continuación se describirán modos de realización de la invención haciendo referencia a los siguientes dibujos, en los que: la Fig. 1 muestra un diagrama de bloques de un codificador paramétrico de acuerdo con una forma de implementación; la Fig. 2 muestra un diagrama de bloques de un descodificador paramétrico de acuerdo con una forma de implementación; la Fig. 3 muestra un diagrama de un método para codificación paramétrica de acuerdo con una forma de implementación; y la Fig. 4 muestra un diagrama de un método para descodificación paramétrica de acuerdo con una forma de implementación.

Descripción detallada de los modos de realización

La Fig. 1 muestra un diagrama de un codificador paramétrico para codificar una señal de audio multicanal que está compuesta por una primera señal de audio, x1, y una segunda señal de audio, x2, de acuerdo con una forma de implementación. El codificador paramétrico comprende un transformador 101 para transformar la primera señal de audio en el dominio de la frecuencia con el fin de obtener una primera señal de audio transformada, y para transformar la segunda señal de audio en el dominio de la frecuencia con el fin de obtener una segunda señal de audio transformada. El transformador 101 puede comprender un primer transformador 103 para transformar la primera señal de audio, y un segundo transformador 105 para transformar la segunda señal de audio. A modo de ejemplo, el transformador 101 y/o los transformadores 103, 105 pueden ser transformadores de Fourier. La primera y la segunda señales de audio transformadas se le suministran a un generador 107 de parámetros para generar un primer parámetro de codificación a partir de la primera señal transformada y a partir de la segunda señal de audio transformada en una primera frecuencia, por ejemplo, en la frecuencia i-ésima o en la banda i-ésima. La banda i- ésima o "banda i" (véase también en la Fig. 1) se refiere a una banda de frecuencia i donde o en la que el generador 107 de parámetros genera el parámetro de codificación respectivo a partir de la primera y la segunda señales transformadas, y también se conoce como banda i de parámetros. El generador 107 de parámetros está configurado, además, para generar un segundo parámetro de codificación a partir de la primera y la segunda señales de audio transformadas en una segunda frecuencia o en una segunda banda. El primer y el segundo parámetros de codificación se le suministran al combinador 109 de parámetros, el cual combina el primer parámetro de codificación y el segundo parámetro de codificación con el fin de obtener un parámetro de codificación combinado de acuerdo con un principio descrito en la presente solicitud. No obstante, el combinador 109 de parámetros puede obtener por separado los parámetros de codificación para diferentes bandas de parámetros.

Haciendo referencia a la Fig. 1 y a los parámetros de ICC que forman un modo de realización de los parámetros de codificación, los canales de audio estéreo de entrada x1 y x2, por ejemplo, se convierten en una pluralidad de subbandas o bandas de parámetros. Los parámetros de ICC correspondientes se pueden calcular en todas o en un subconjunto de las bandas de parámetros. Para calcular los parámetros de ICC combinados, a los parámetros de ICC de todas o algunos subconjuntos de bandas de parámetros se les pueden aplicar uno o más de los procesos que combinan parámetros de ICC, por ejemplo, uno de los procesos de acuerdo con las ecuaciones (1)-(4). Al menos un parámetro de ICC combinado se puede insertar en un flujo de bits 111 o se puede transmitir a un descodificador de audio que no se ilustra en la Fig. 1.

En relación con los ICC que conforman un modo de realización de un parámetro de codificación, a continuación se describen a modo de ejemplo los siguientes modos de realización.

Se debe entender, sin embargo, que el parámetro de codificación puede ser cualquier parámetro de codificación o pertenecer a cualquier tipo de parámetro de codificación utilizado para la codificación paramétrica, por ejemplo, la diferencia de fase entre canales o la diferencia de intensidad entre canales o una diferencia de nivel entre canales o similares, y que el codificador puede estar adaptado para producir parámetros de codificación combinados en función de uno, algunos o todos los tipos de parámetros de codificación antes mencionados y para incluir como información complementaria en el flujo de bits 111 parámetros de codificación combinados de diferentes tipos.

El codificador paramétrico de la Fig. 1 puede formar un codificador estéreo paramétrico que calcula parámetros cue espaciales de percepción, como el ICLD, el ICPD, y/o el ICC, en bandas de parámetros. Si el índice de la banda de parámetros es i, entonces los parámetros calculados en esa banda se designan mediante ICLD(i), ICPD(i) e ICC(i). Las potencias de la señal izquierda y derecha en una banda de parámetros se denotan mediante P1(i) y P2(i), respectivamente.

A este respecto se pueden calcular uno o más parámetros de ICC combinados, por ejemplo, como un promedio  1 ICC ICC(i) (1)

NI iI en donde I es el conjunto de índices de las bandas de parámetros de las cuales se utilizan los ICC para calcular el parámetro de ICC combinado, y NI es el número de índices en el conjunto I.

Otra forma de calcular un parámetro de ICC combinado consiste en utilizar un promedio ponderado, esto es, (P(i)  P (i)) ( ICC i) 1 2

i ICC  I (2) (P(i)  P (i)) 1 2

iI en donde P1(i) denota una potencia de señal de la primera señal de canal de audio en la banda i-ésima, y en donde P2(i) denota una potencia de señal de la segunda señal del canal de audio en la banda i-ésima.

Además, al calcular el ICC combinado las diferentes bandas de parámetros (frecuencias) se pueden ponderar de forma diferente:  g (P(i)  P (i)) ( ICC i)

i

1 2  ICC  i I (3)  g (P(i)  P (i))

i

1 2 

i I en donde gi es un coeficiente de ponderación para la frecuencia (banda de parámetros) i.

Otro ejemplo emplea un promedio en función no de la potencia sino de la ponderación de la frecuencia. Además, al calcular el ICC combinado las diferentes bandas de parámetros (frecuencias) se pueden ponderar de forma diferente:  g

( ICC i)

i

 ICC  i I (4)  gi

i I Un único ICC para toda la banda se comporta sorprendentemente bien. En este caso, el ICC combinado se calcula utilizando todas las bandas de parámetros, esto es, I contiene los índices de todas las bandas de parámetros.

De acuerdo con algunas formas de implementación se puede mejorar la calidad de la voz utilizando únicamente los ICC en un rango de frecuencia limitado. Cuando para generar los parámetros de ICC se utilizan únicamente bandas de parámetros entre 500 Hz y 1,5 kHz, se producen menos artefactos. En este caso, el ICC combinado se calcula utilizando únicamente las bandas de parámetros entre 500 Hz y 1,5 kHz, esto es, I solo contiene esos índices.

De acuerdo con algunas formas de implementación, el codificador paramétrico que se muestra en la Fig. 1 puede calcular uno o más parámetros de ICC combinados: (a) combinando los parámetros de ICC de una pluralidad de bandas de parámetros en un parámetro de ICC combinado, (b) insertando los parámetros de ICC combinados en un flujo de bits, y (c) emitiendo como salida la corriente de bits.

La Fig. 2 muestra un diagrama de bloques de un codificador paramétrico para descodificar una señal de audio downmix de acuerdo con una forma de aplicación. La señal downmix puede ser proporcionada por el codificador paramétrico, tal como se muestra, por ejemplo, en la Fig. 1. El descodificador paramétrico comprende un transformador 201 para transformar la señal downmix de audio con el fin de obtener una señal downmix de audio transformada que tiene una frecuencia determinada, por ejemplo, una frecuencia i-ésima de una pluralidad de frecuencias, o, en correspondencia, una banda determinada, por ejemplo, una banda i-ésima de una pluralidad de bandas. El descodificador paramétrico comprende, además, un proveedor 203 para proporcionar un parámetro de codificación de frecuencia específica asociado a la frecuencia determinada. El parámetro de codificación de frecuencia específica se puede obtener a partir del parámetro de codificación combinado. No obstante, el parámetro de codificación de frecuencia específica puede corresponder al parámetro de codificación combinado. El descodificador paramétrico comprende, además, un sintetizador 205 de audio, por ejemplo, un sintetizador estéreo, para sintetizar una primera señal de audio y una segunda señal de audio en la frecuencia determinada o en la banda determinada a partir de la señal downmix de audio transformada proporcionada por el transformador 201 utilizando el parámetro de codificación de frecuencia específica tal como lo proporciona el proveedor 203.

De acuerdo con algunas formas de implementación, el transformador 201 puede ser un transformador de Fourier, en donde el sintetizador de audio puede sintetizar la primera y la segunda señales de audio en el dominio de la frecuencia. Así pues, la señal de salida proporcionada por el sintetizador 205 puede corresponder a la primera y a la segunda señales del canal de audio. Sin embargo, de acuerdo con algunas formas de implementación, el codificador paramétrico puede comprender, además, un transformador inverso 207 para la transformación inversa de la primera y la segunda señales del canal de audio en el dominio del tiempo con el fin de obtener una primera y una segunda señales del canal de audio, x1 y x2, en el dominio del tiempo.

El descodificador paramétrico que se muestra en la Fig. 1 utiliza el parámetro de ICC combinado o una versión modificada del mismo para todas las bandas de parámetros, o un subconjunto J de las mismas. Se puede utilizar en el descodificador el mismo subconjunto de bandas de parámetros que en el codificador, esto es, J=I, o un subconjunto diferente.

Con respecto a la Fig. 2, el descodificador paramétrico puede recibir la señal downmix s y los parámetros de estéreo, esto es, los parámetros de codificación, entre los cuales se puede recibir al menos un parámetro de ICC combinado. Para al menos una banda parámetros se utiliza un parámetro de ICC obtenido a partir de parámetros de ICC combinados. A algunas bandas no se les puede aplicar la síntesis de ICC.

De acuerdo con una forma de implementación, cuando se utiliza un ICC combinado para la "Combined ICC to Band ICC Conversion (Conversión de ICC Combinado a ICC de Banda)", el ICC combinado se aplica a todas las bandas de parámetros. O, si el ICC combinado se ha calculado únicamente para un subconjunto de bandas, J, entonces el descodificador puede aplicar el ICC combinado a todas las bandas, al mismo subconjunto, o a otro subconjunto, por ejemplo, un subconjunto del mismo subconjunto.

Si se utilizan dos ICC combinados, representan dos regiones de frecuencia distintas de la señal de audio. El descodificador puede aplicar los ICC combinados a las bandas de parámetros correspondientes a las regiones de frecuencia a partir de las cuales se calcularon los ICC combinados.

La Fig. 3 muestra un diagrama de un método para codificar de forma paramétrica una señal de audio multicanal compuesta por la primera y la segunda señales de audio tal como se ha mencionado más arriba. El método comprende transformar 301 la primera y la segunda señales de audio en el dominio de la frecuencia para obtener una primera y una segunda señales de audio transformadas, generar 303 un primer parámetro de codificación a partir de la primera y la segunda señales de audio transformadas en una primera frecuencia, y un segundo parámetro de codificación a partir de la primera y la segunda señales de audio transformadas en una segunda frecuencia, y combinar 305 el primer y el segundo parámetros de codificación para obtener un parámetro de codificación combinado. A modo de ejemplo, el método que se ilustra en la Fig. 3 puede ser utilizado por el codificador paramétrico que se muestra en la Fig. 1.

La Fig. 4 muestra un diagrama de bloques de un método para descodificar de forma paramétrica una señal downmix de audio a partir de un parámetro de codificación combinado. La señal downmix de audio puede representar una combinación, por ejemplo una superposición, de una primera y una segunda señales de audio. El parámetro de codificación combinado puede tener unas características tal como se han descrito más arriba.

El método comprende transformar 401 la señal downmix de audio para obtener una señal downmix de audio transformada que tiene una cierta frecuencia, proporcionar 403 un parámetro de codificación de frecuencia específica asociado a la frecuencia determinada a partir del parámetro de codificación combinado, de acuerdo con el principio descrito en la presente solicitud, y sintetizar 405 la primera y la segunda señales de audio en la frecuencia determinada a partir de la señal downmix de audio transformada y a partir del parámetro de codificación de frecuencia específica.

De acuerdo con algunas formas de implementación, el método que se ilustra en la Fig. 4 puede ser utilizado por el descodificador paramétrico como se muestra en la Fig. 2.

De acuerdo con algunas formas de implementación, el descodificador paramétrico que se muestra en la Fig. 2 puede ser un descodificador paramétrico estéreo adaptado para (a) recibir uno o más parámetros de ICC combinados, y (b) utilizar, para al menos una banda de parámetros, un parámetro de ICC relacionado con los parámetros de ICC combinado recibidos.

REIVINDICACIONES

1.

Un codificador paramétrico para codificar una señal de audio multicanal que está compuesta por una primera señal de audio y una segunda señal de audio, teniendo el codificador paramétrico: un transformador (101) para transformar la primera señal de audio en el dominio de la frecuencia con el fin de obtener una primera señal de audio transformada, y para transformar la segunda señal de audio en el dominio de la frecuencia con el fin de obtener una segunda señal de audio transformada; un generador (107) de parámetros para generar un primer parámetro de codificación, X(i), a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una primera banda i de frecuencia, y para generar un segundo parámetro de codificación, X(j), a partir de la primera señal de audio transformada y de la segunda señal de audio transformada en una segunda banda j de frecuencia; y un combinador (109) de parámetros para combinar el primer parámetro de codificación y el segundo parámetro de codificación con el fin de obtener un parámetro de codificación combinado, X, de acuerdo con la fórmula  g (P i()  P i())X i()

i

X

I

i

1 2  g (P i()  P i())

iI

i

1 2 en donde el parámetro I denota un conjunto de índices de bandas de frecuencia, el parámetro gi es un coeficiente de ponderación asignado a una banda i de frecuencia, el parámetro P1(i) denota una potencia de señal de la primera señal de audio en la banda i-ésima de frecuencia, el parámetro P2(i) denota una potencia de señal de la segunda señal de audio en la banda i-ésima de frecuencia, y en donde el primer parámetro de codificación, X(i), y el segundo parámetro de codificación, X(j), son una diferencia de fase entre canales o una coherencia entre canales o una diferencia de intensidad entre canales o una diferencia de nivel entre canales.

2.

El codificador paramétrico de la reivindicación 1, en el que el generador (107) de parámetros está configurado para generar el primer parámetro de codificación y el segundo parámetro de codificación mediante la multiplicación de los valores de la primera señal de audio transformada y de la segunda señal de audio transformada.

3.

El codificador paramétrico de una cualquiera de las reivindicaciones 1 a 2, en el que el generador (107) de parámetros está configurado para generar una pluralidad de parámetros de codificación a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una pluralidad de bandas de frecuencia y en el que el combinador de parámetros está configurado para combinar la pluralidad de los parámetros de codificación con el fin de obtener el parámetro de codificación combinado.

4.

El codificador paramétrico de una cualquiera de las reivindicaciones 1 a 3, que está configurado, además, para combinar la primera señal de audio transformada y la segunda señal de audio transformada con el fin de obtener una señal downmix (mezcladas para reducir los canales).

5.

El codificador paramétrico de una cualquiera de las reivindicaciones 1 a 4, que comprende, además, un transformador inverso para la transformación inversa de una combinación de la primera señal de audio transformada y la segunda señal de audio transformada con el fin de obtener una señal downmix de audio.

6.

Un método para codificar de forma paramétrica una señal de audio multicanal que está compuesta por una primera señal de audio y una segunda señal de audio, en donde el método está configurado para utilizar un codificador paramétrico de acuerdo con las reivindicaciones precedentes.