Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal.

Descodificador para derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal,

en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende:

un calculador (302) de filtro para derivar una función (310) de transferencia relacionada con la cabeza modificada H (X ) Y mediante la ponderación de la función de transferencia relacionada con la cabeza H (Xf ) Y del canal frontal y la función de transferencia relacionada con la cabeza H (Xs) 10 Y del canal trasero utilizando el parámetro (306) de nivel, de tal manera que la función (310) de transferencia relacionada con la cabeza modificada H (X ) Y se influye más por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:

donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y

un sintetizador (304) para derivar la señal (314) de mezcla descendente de auriculares utilizando la función (310) de transferencia relacionada con la cabeza modificada y la representación de la señal (312) de mezcla descendente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2006/008566.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: KJORLING, KRISTOFER, VILLEMOES, LARS, BREEBAART,JEROEN.

Fecha de Publicación: 20 de Marzo de 2012.

Clasificación Internacional de Patentes:

H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

PDF original: ES-2376889_T3.pdf

Fragmento de la descripción:

Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal.

Campo de la Invención La presente invención se refiere a la descodificación de señales de audio multicanal codificadas basadas en una representación multicanal paramétrica y en particular a la generación de mezclas descendentes de 2 canales que proporcionan una experiencia de escucha espacial, tal como por ejemplo una mezcla descendente compatible con auriculares o una mezcla descendente espacial para instalaciones de dos altavoces.

Antecedentes de la Invención El desarrollo reciente en la codificación de audio ha hecho disponible la capacidad de recrear una representación multicanal de una señal de audio basada en una señal estéreo (o mono) y datos de control correspondientes. Estos métodos difieren sustancialmente de las soluciones basadas en matriz más antiguas tales como Dolby Prologic, puesto que se transmiten los datos de control adicionales para controlar la recreación, también denominada como mezcla ascendente, de los canales envolventes basados en los canales mono o estéreo transmitidos.

De ahí, un descodificador de audio multicanal paramétrico de este tipo, por ejemplo MPEG Surround, reconstruye N canales basándose en M canales transmitidos, donde N > M, y los datos de control adicionales. Los datos de control adicionales representan una velocidad de datos más baja significativa que la transmisión de todos los N canales, haciendo que la codificación sea muy eficiente a la vez que se asegura la compatibilidad tanto con los dispositivos de M canales como dispositivos de N canales.

Estos métodos de codificación envolventes paramétricos comprenden normalmente una parametrización de la señal envolvente basada en IID (Inter channel Intensity Difference- Diferencia de Intensidad Intercanal) o CLD (Channel Level Difference- Diferencia de Nivel de Canal) e ICC (Inter Channel Coherence- Coherencia Intercanal) . Estos parámetros describen relaciones y correlaciones de potencia entre pares de canales en el proceso de mezcla ascendente. Parámetros adicionales también utilizados en la técnica anterior comprenden parámetros de predicción utilizados para predecir canales intermedios o de salida durante el procedimiento de mezcla ascendente.

Otros desarrollos en la reproducción de contenido de audio multicanal han proporcionado medios para obtener una impresión de escucha espacial utilizando auriculares estereofónicos. Para obtener una experiencia de escucha espacial utilizando solamente los dos altavoces de los auriculares, se mezclan de manera descendente las señales multicanal a señales estéreo utilizando HRTF (Head-related transfer functions- funciones de transferencia relacionados con la cabeza) , destinadas a tener en cuenta las características de transmisión extremadamente complejas de la cabeza humana para proporcionar la experiencia de escucha espacial.

Otro enfoque relacionado es usar un ambiente de reproducción de 2 canales convencional y filtrar los canales de una señal de audio multicanal con filtros apropiados para obtener la experiencia de escucha cercana a aquella de la reproducción con el número original de altavoces. El procesamiento de las señales es similar al caso de la reproducción de auriculares para crear una “mezcla descendente estéreo espacial” apropiada que tiene las propiedades deseadas. En contraste con el caso de auriculares, la señal de ambos altavoces llega directamente a ambos oídos de un oyente, provocando “efectos de diafonía” indeseables. Ya que esto se tiene que tener en cuenta para la calidad de reproducción óptima, los filtros utilizados para el tratamiento de señales comúnmente se denominan filtros de cancelación de diafonía. En general, el objetivo de esta técnica es extender el intervalo posible de fuentes de sonido al exterior de la base de altavoz estéreo mediante la cancelación de diafonía inherente utilizando filtros de cancelación de diafonía complejos.

Debido a la filtración compleja, los filtros HRTF son muy largos, es decir, pueden comprender varios cientos de derivaciones de filtro cada uno. Por la misma razón, es difícilmente posible encontrar una parametrización de los filtros que trabaje lo suficientemente bien para no degradar la calidad de percepción cuando se utilizan en lugar del filtro real.

Así, por una parte, representaciones paramétricas de ahorro de bits de señales multicanal existen que permiten un transporte eficiente de una señal multicanal codificada. Por otra parte, se conocen maneras elegantes de crear una experiencia de escucha espacial para una señal multicanal cuando se usan auriculares estereofónicos o altavoces estereofónicos solamente. Sin embargo, estos requieren el número completo de canales de la señal multicanal como entrada para la aplicación de las funciones de transferencia relacionadas con la cabeza que crean la señal de mezcla descendente de auriculares. Así, o bien se tiene que transmitir el conjunto completo de señales multicanal o bien se tiene que reconstruir por completo una representación paramétrica antes de aplicar las funciones de transferencia relacionadas con la cabeza o los filtros de cancelación de diafonía, y así o bien el ancho de banda de transmisión o bien la complejidad de cálculo es inaceptablemente alta.

La solicitud estadounidense US 2006/004274 se refiere a la generación de una señal de sonido mediante la aplicación de dos funciones de transferencia relacionadas con la cabeza a una señal de sonido monofónica transmitida. Se deriva cada una de las funciones de transferencia relacionadas con la cabeza añadiendo dos funciones de transferencia relacionadas con la cabeza adicionales.

La solicitud internacional WO2006/008683 describe un método y un dispositivo para procesar una señal estéreo obtenida de un codificador que codifica señales de audio de n canales en parámetros espaciales y una mezcla descendente estéreo.

En Faller C et al.: “Binaural Cue Coding – Part II: Schemes and Applications”, se introduce un esquema de codificación destinado a transmitir múltiples canales de una manera eficiente con respecto a la velocidad de bits.

La solicitud estadounidense US 2003/0035553 se refiere a la codificación perceptiva compatible inversa de indicaciones espaciales para convertir dos señales de audio o más en una señal de audio combinada que se incrusta con dos conjuntos o más de un parámetro o más de escenas auditivas, en la que cada conjunto de parámetros de escena auditiva (por ejemplo, una o más indicaciones espaciales tal como ILD, ITD o funciones de transferencia relacionadas con la cabeza) corresponde a una banda de frecuencia diferente en la señal de audio combinada.

Sumario de la Invención Es un objeto de la presente invención proporcionar un concepto que permita una reconstrucción más eficiente de una señal de dos canales que proporcione una experiencia de escucha espacial utilizando representaciones paramétricas de señales multicanal.

De acuerdo con un primer aspecto de la presente invención, se logra este objeto por un descodificador según la reivindicación 1 ó 19.

De acuerdo con un segundo aspecto de la presente invención, se logra este objeto por un descodificador binaural según la reivindicación 18.

De acuerdo con un tercer aspecto de la presente invención, se logra este objeto mediante un método de derivar una señal de mezcla descendente de auriculares según la reivindicación 20.

De acuerdo con un cuarto aspecto de la presente invención, se logra este objeto por un receptor o reproductor de audio según la reivindicación 21.

De acuerdo con un quinto aspecto de la presente invención, se logra este objeto por un método de recibir o reproducir audio según la reivindicación 22..

De acuerdo con un sexto aspecto de la presente invención, se logra este objeto por un programa informático según la reivindicación 23.

La presente invención se basa en el descubrimiento de que una señal de mezcla descendente de auriculares puede derivarse de una mezcla descendente paramétrica de una señal multicanal cuando se usa un calculador de filtro para derivar HRTF (funciones de transferencia relacionadas con la cabeza) modificadas a partir de HRTF originales de la señal multicanal y cuando el convertidor de filtro utiliza un parámetro de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal,... [Seguir leyendo]

Reivindicaciones:

1. Descodificador para derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende:

un calculador (302) de filtro para derivar una función (310) de transferencia relacionada con la cabeza modificada HY (X ) mediante la ponderación de la función de transferencia relacionada con la cabeza HY (Xf ) del canal frontal y la función de transferencia relacionada con la cabeza HY (Xs) del canal trasero utilizando el parámetro (306) de nivel, de tal manera que la función (310) de transferencia relacionada con la cabeza modificada HY (X ) se influye más por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:

() =º gw exp ( jw2) H (Xf ) + gw exp ( jw2) H (

HX Â¢Â¢ Xs )

Y f XY sY s XY fY

, donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y un sintetizador (304) para derivar la señal (314) de mezcla descendente de auriculares utilizando la función (310) de transferencia relacionada con la cabeza modificada y la representación de la señal (312) de mezcla descendente.

2. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo de tal manera que el número de funciones (310) de transferencia relacionadas con la cabeza modificadas derivadas es menor que el número de funciones (308) de transferencia relacionadas con la cabeza asociadas de los dos canales

3. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar una función (310) de transferencia relacionada con la cabeza modificada adaptada para aplicarse a una representación de banco de filtros de la señal de mezcla descendente.

4. Descodificador según la reivindicación 1, adaptado para utilizar una representación de la señal de mezcla descendente derivada en un dominio de banco de filtros.

5. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar la función (310) de transferencia relacionada con la cabeza modificada utilizando funciones (308) de transferencia relacionadas con la cabeza caracterizadas por más de tres parámetros.

6. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar los factores de ponderación para las funciones (308) de transferencia relacionadas con la cabeza de los dos canales utilizando el mismo parámetro (306) de nivel.

7. Descodificador según la reivindicación 6, en el que el calculador (302) de filtro es operativo para derivar un primer factor de ponderación wf para un primer canal f y un segundo factor de ponderación ws para un segundo canal s utilizando el parámetro de nivel CLDl de acuerdo con las siguientes formulas:

CLD1 /10

2 10

wf = , CLD1 /10

1+10

w = .

sCLD1 /10

1+10

8. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar la función (310) de transferencia relacionada con la cabeza modificada aplicando un factor de ganancia común g a la función (308) de transferencia relacionada con la cabeza de los dos canales de tal manera que se ahorra energía al derivar las funciones (310) de transferencia relacionadas con la cabeza modificadas.

9. Descodificador según la reivindicación 8, en el que el factor de ganancia común está dentro del intervalo de

[1/ 2, 1].

10. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar el parámetro de fase utilizando un tiempo de retardo entre respuestas de impulso de funciones (308) de transferencia relacionadas con la cabeza de los dos canales.

11. Descodificador según la reivindicación 10, en el que el calculador (302) de filtro es operativo en un dominio de banco de filtros que tiene n bandas de frecuencia y para derivar parámetros de fase individuales para cada banda de frecuencia utilizando el tiempo de retardo.

12. Descodificador según la reivindicación 10, en el que el calculador (302) de filtro es operativo en un dominio de banco de filtros que tiene más de dos bandas de frecuencia y para derivar parámetros de fase individuales para cada banda de frecuencia utilizando el tiempo de retardo de acuerdo con la siguiente fórmula:

(n + 1)

Â¢= 2 T

XY XY

64 .

13. Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar el parámetro de fase utilizando el ángulo de fase de la correlación cruzada compleja normalizada entre las respuestas de impulso de las funciones (308) de transferencia relacionadas con la cabeza del primer y del segundo canal.

14. Descodificador según la reivindicación 1, adaptado para utilizar una representación de una señal (312) de mezcla descendente que tiene un canal izquierdo y un canal derecho derivados de una señal multicanal que tiene un canal frontal izquierdo, un canal envolvente izquierdo, un canal frontal derecho, un canal envolvente derecho y un canal central.

15. Descodificador según la reivindicación 1, en el que el sintetizador es operativo para derivar canales de la señal

(314) de mezcla descendente de auriculares aplicando una combinación lineal de las funciones (310) de transferencia relacionadas con la cabeza modificadas a la representación de la mezcla (312) descendente de la señal multicanal.

16. Descodificador según la reivindicación 15, en el que el sintetizador es operativo para utilizar coeficientes para la combinación lineal de las funciones (310) de transferencia relacionadas con la cabeza modificadas dependiendo del parámetro (306) de nivel.

17. Descodificador según la reivindicación 15, en el que el sintetizador (304) es operativo para utilizar coeficientes para la combinación lineal dependiendo de parámetros multicanal adicionales relacionados con propiedades espaciales adicionales de la señal multicanal.

18. Descodificador binaural, que comprende:

un descodificador de acuerdo con la reivindicación 1;

un banco (300) de filtros de análisis para derivar la representación de la mezcla descendente de la señal (312) multicanal mediante el filtrado en subbanda de la mezcla descendente de la señal multicanal; y un banco (302) de filtros de síntesis para derivar una señal de auriculares de dominio de tiempo mediante la síntesis de la señal (314) de mezcla descendente de auriculares.

19. Descodificador para derivar una señal de mezcla descendente estéreo espacial utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando filtros de cancelación de diafonía relacionados con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende:

un calculador (302) de filtro para derivar un filtro de cancelación de diafonía modificado HY (X ) mediante la ponderación de la función de transferencia relacionada con la cabeza HY (Xf ) del canal frontal y la función de transferencia relacionada con la cabeza HY (Xs) del canal trasero de los dos canales utilizando el parámetro (306) de nivel, de tal manera que el filtro de cancelación de diafonía modificado HY (X ) se influye más por el filtro de cancelación de diafonía de un canal que tiene un nivel más alto que por el filtro de cancelación de diafonía de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:

() =º gw exp ( jw2) H (Xf ) + gw exp ( jw2) H (

HX Â¢Â¢ Xs )

Y f XY sY s XY fY

, wwf

donde ºXY es un parámetro de fase, s y son factores de ponderación derivados utilizando el parámetro (306)

de nivel y g es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y un sintetizador (304) para derivar la señal de mezcla descendente estéreo espacial utilizando los filtros de cancelación de diafonía modificados y la representación de la señal (312) de mezcla descendente.

20. Método de derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, comprendiendo el método:

derivar, utilizando el parámetro (306) de nivel, una función (310) de transferencia relacionada con la cabeza modificada HY (X ) mediante la ponderación de la función de transferencia relacionada con la cabeza HY (Xf ) del canal frontal y la función de transferencia relacionada con la cabeza HY (Xs) del canal trasero utilizando el parámetro (306) de nivel, de tal manera que la función de transferencia relacionada con la cabeza modificada HY (X ) se influye más por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:

() =º gw exp ( jw2) H (Xf ) + gw exp ( jw2) H (

HX Â¢Â¢ Xs )

Y f XY sY s XY fY

, donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y derivar la señal (314) de mezcla descendente de auriculares utilizando las funciones (310) de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente.

21. Receptor o reproductor de audio que tiene un descodificador para derivar una señal (314) de mezcla descendente de auriculares según las reivindicaciones 1 a 17.

22. Método de recibir o reproducir audio, teniendo el método un método para derivar una señal (314) de mezcla descendente de auriculares según la reivindicación 20.

23. Programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, uno de los métodos de las reivindicaciones 20 ó 22.

Patentes similares o relacionadas:

Método y sistema para el procesamiento de sonido envolvente en un auricular, del 27 de Mayo de 2020, de Voyetra Turtle Beach, Inc: Un método, que comprende: en un auricular de audio que recibe una pluralidad de señales de audio correspondientes a una pluralidad de canales de sonido envolvente: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Sistema y método de salida binaural paramétrico, del 19 de Febrero de 2020, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para codificar audio de entrada basado en un canal u objeto para la reproducción, incluyendo el método las etapas de: (a) renderizar inicialmente […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]

Control de rango dinámico basado en metadatos extendidos de audio codificado, del 11 de Diciembre de 2019, de APPLE INC.: Un sistema para producir una grabación de audio digital codificada que tiene una pluralidad de canales de audio u objetos de audio, que comprende: un codificador de audio […]