Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión.

Aparato (100; 200; 300; 400) para proporcionar una representación de señal de mezcla ascendente

(120; 428a- 428M) sobre la base de la representación de una señal de mezcla descendente (110; 414) y una información paramétrica relacionada con el objeto (112; 416), que están incluidas en una representación de flujo de bits de un contenido de audio, y dependiendo de una información de representación (114; 424), en donde el aparato comprende:

un limitador de distorsión (140; 240; 340; 422) configurado para ajustar parámetros de mezcla ascendente utilizando un esquema de control de distorsión (142) para evitar o limitar las distorsiones audibles que se originan por una inapropiada selección de los parámetros de representación (114; 424),

en donde el limitador de distorsión está configurado para obtener un parámetro de control de limitación de distorsión (116; 418; q) que está incluido en la representación de flujo de bits del contenido de audio, y para ajustar el esquema de control de distorsión dependiendo de un parámetro de control de limitación de distorsión;

en donde el limitador de distorsión está configurado para evaluar una bandera dinámica de actualización dentro de una sección de configuración de la representación de flujo de bits del contenido de audio; y

en donde el limitador de distorsión está configurado para evaluar la sección de configuración de la representación de flujo de bits del contenido de audio, para obtener el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y para evaluar una sección de cuadro de la representación de flujo de bits del contenido de audio, para obtener repetidamente actualizaciones del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/065671.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: ENGDEGARD, JONAS, HERRE, JURGEN, HELLMUTH, OLIVER, PURNHAGEN,HEIKO, FALCH,CORNELIA, TERENTIV,LEON.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2529219_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión

Campo técnico

[1] Las realizaciones de acuerdo con la invención se refieren a un aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente y una información paramétrlca relacionada con el objeto, que están incluidas en una representación de flujo de bits de un contenido de audio, y una Información de representación.

[2] Otra realización de acuerdo con la Invención se refiere a un aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples.

[3] Otra realización de acuerdo con la Invención se refiere a un método para proporcionar una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendente y una información paramétrlca relacionada con el objeto, que están incluidas en una representación de flujo de bits de un contenido de audio, y una Información de representación.

[4] Otra realización de acuerdo con la invención se refiere a un método para proporcionar un flujo de bits que representa una señal de audio de canales múltiples.

[5] Otra realización de acuerdo con la invención se refiere a un programa de computación que implementa uno de los métodos.

[6] Otra relación de acuerdo con la invención se refiere a un flujo de bits que representa una señal de audio de canales múltiples.

Antecedentes de la invención

[7] En la técnica del procesado de audio, la transmisión de audio y el almacenamiento de audio, existe un deseo creciente de manipular contenidos de canales múltiples a fin de mejorar la impresión de audición. La utilización de contenidos de audio de canales múltiples conlleva importantes mejoras para el usuario. Por ejemplo, se puede obtener una impresión de audición de 3 dimensiones, lo cual trae aparejada la satisfacción aumentada del usuario en las aplicaciones de entretenimiento. Sin embargo, los contenidos de audio de canales múltiples también resultan útiles en ambientes profesionales, por ejemplo en aplicaciones de teleconferencia, debido a que la inteligibilidad del altavoz se puede mejorar al utilizar una reproducción de audio de canales múltiples.

[8] Sin embargo, también se desea tener un buen compromiso entre la calidad del audio y los requisitos de velocidad de bits a fin de evitar una carga excesiva de los recursos causada por aplicaciones de canales múltiples.

[9] Recientemente, se han propuesto técnicas paramétricas para la transmisión eficaz desde el punto de vista de velocidad de bits y/o el almacenamiento de escenas de audio que contienen objetos de audio múltiples, por ejemplo, Codificación Binaural BCC (Tipo I) (ver, por ejemplo la referencia [BCC]), Codificación Conjunta de Fuente (ver, por ejemplo, la referencia [JSC]), Codificación de Audio Espacial [SAC] y Codificación MPEG de Objeto de Audio Espacial (SAOC) (ver, por ejemplo, la referencias [SAOC1], [SAOC2], [SAOC3] y la referencia sin publicación previa [SAOC]).

[1] Estas técnicas apuntan a reconstruir perceptiblemente la salida de escena de audio deseada antes que a una coincidencia de forma de onda.

[11] La Fig. 8 muestra una visión general de dicho sistema (aquí: SAOC MPEG). El sistema SAOC MPEG 8 que se muestra en la Fig. 8 comprende un codificador SAOC 81 y un decodificador SAOC 82. El codificador SAOC 81 recibe una pluralidad de señales de los objetos x1 a xN, que se puede representar, por ejemplo, como señales del dominio del tiempo o como señales del dominio del tiempo-frecuencia (por ejemplo, en la forma de un conjunto de coeficientes de transformada de una transformada del tipo de Fourier, o en la forma de señales de subbanda QMF). El codificador SAOC 81 generalmente también recibe los coeficientes de mezcla descendente d1 a dN, que están asociados con las señales de los objetos x1 a xN. Diferentes conjuntos de coeficientes de mezcla descendente pueden estar disponibles para cada canal de la señal de mezcla descendente. El codificador SAOC 81 está configurado generalmente para obtener un canal de la señal de mezcla descendente al combinar las señales de los objetos x1 a xN de acuerdo con los coeficientes de mezcla descendente asociados d1 a dN. Generalmente, existen menos canales de mezcla descendente que señales de los objetos x1 a xN. A fin de permitir (al menos aproximadamente) una separación (o el tratamiento separado) de las señales de los objetos del lado del

decodificador SAOC 82, el codificador SAOC 81 proporciona tanto la única o las varias señales de mezcla descendente (denominadas canales de mezcla descendente) 812 y una información lateral 814. La información lateral 814 describe las características de las señales de los objetos x1 a xN, a fin de permitir el procesado específico del objeto del lado del decodificador.

[12] El decodificador SAOC 82 está configurado para recibir tanto la única o las varias señales de mezcla descendente 812 y la información lateral 814. Además, el decodificador SAOC 82 está generalmente configurado para recibir la información de interacción del usuario y/o la información de control del usuario 822, que describe una configuración de representación deseada. Por ejemplo, la información de interacción del usuario/la información de control del usuario 822 puede describir una configuración de altavoz y la ubicación espacial deseada de los objetos que proporcionan las señales de los objetos x1 a xN.

[13] El decodificador SAOC 82 está configurado para proporcionar, por ejemplo, una pluralidad de señales decodificadas del canal de mezcla ascendente y1 a yM. Las señales del canal de mezcla ascendente pueden, por ejemplo, estar asociadas con altavoces individuales de una disposición de representación de altavoces múltiples. El decodificador SAOC 82 puede, por ejemplo, comprender un separador de objetos 82a, que está configurado para reconstruir, al menos aproximadamente, las señales de los objetos x1 a xN sobre la base de una o varias de las señales de mezcla descendente 812 y la información lateral 814, obteniendo por lo tanto señales reconstruidas de objetos 82b. Sin embargo, las señales reconstruidas de objetos 82b pueden desviarse de alguna manera de las señales originales de objetos x1 a xN, por ejemplo, debido a que la información lateral 814 no es totalmente suficiente para una perfecta reconstrucción debido a las restricciones de velocidad de bits. El decodificador SAOC 82 puede comprender además un mezclador 82c que puede estar configurado para recibir las señales reconstruidas de objetos 82b y la información de interacción del usuario/la información de control del usuario 822, y para proporcionar, sobre esta base, las señales del canal de mezcla ascendente y1 a yM. El mezclador 82c puede estar configurado para utilizar la información de interacción del usuario/la información de control del usuario 822 para determinar la contribución de las señales reconstruidas de objetos individuales 82b con las señales del canal de mezcla ascendente y1 a yM. La información de interacción del usuario/la información de control del usuario 822 puede, por ejemplo, comprender parámetros de representación (también denominados coeficientes de representación), que determinan la contribución de las señales reconstruidas de objetos individuales 82b con las señales del canal de mezcla ascendente y1 a yM.

[14] Sin embargo, deberá notarse... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato (1; 2; 3; 4) para proporcionar una representación de señal de mezcla ascendente (12; 428a- 428M) sobre la base de la representación de una señal de mezcla descendente (11; 414) y una información paramétrica relacionada con el objeto (112; 416), que están incluidas en una representación de flujo de bits de un contenido de audio, y dependiendo de una información de representación (114; 424), en donde el aparato comprende:

un limitador de distorsión (14; 24; 34; 422) configurado para ajustar parámetros de mezcla ascendente utilizando un esquema de control de distorsión (142) para evitar o limitar las distorsiones audibles que se originan por una inapropiada selección de los parámetros de representación (114; 424),

en donde el limitador de distorsión está configurado para obtener un parámetro de control de limitación de distorsión (116; 418; q) que está incluido en la representación de flujo de bits del contenido de audio, y para ajustar el esquema de control de distorsión dependiendo de un parámetro de control de limitación de distorsión;

en donde el limitador de distorsión está configurado para evaluar una bandera dinámica de actualización dentro de una sección de configuración de la representación de flujo de bits del contenido de audio; y

en donde el limitador de distorsión está configurado para evaluar la sección de configuración de la representación de flujo de bits del contenido de audio, para obtener el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y para evaluar una sección de cuadro de la representación de flujo de bits del contenido de audio, para obtener repetidamente actualizaciones del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.

2. El aparato (1; 2; 3; 4) de acuerdo con la reivindicación 1, en donde el aparato para proporcionar una representación de señal de mezcla ascendente está configurado para recibir una información de la matriz de representación deseada (114; 424) desde una interfaz de entrada;

en donde el limitador de distorsión (14; 24; 34; 422) está configurado para obtener una información de la matriz de representación modificada (132; p; p") dependiendo de la información de la matriz de representación deseada y del único o de los varios parámetros de control de limitación de distorsión (116; 418; q) y

en donde el aparato para proporcionar la representación de señal de mezcla ascendente está configurado para proporcionar una representación de señal de mezcla ascendente (12; 428a-428M) dependiendo de la información de la matriz de representación modificada.

3. El aparato (1; 2; 3; 4) de acuerdo con la reivindicación 2, en donde el limitador de distorsión está configurado para obtener uno o varios valores límites de la matriz de representación (r, q), que se incluyen en la representación de flujo de bits del contenido de audio y que describen valores mínimos y máximos de elementos de la matriz de representación, y para limitar una o varias entradas de la información de la matriz de representación modificada (132; p; p") de acuerdo con el único o los varios valores límite de la matriz de representación (r, q) cuando se obtiene la información de la matriz de representación modificada dependiendo de la información de la matriz de representación deseada.

4. El aparato (1; 2; 3; 4) de acuerdo con la reivindicación 2 o la reivindicación 3, en donde el limitador de distorsión está configurado para obtener la información de la matriz de representación modificada (132; p; p") dependiendo de la información de la matriz de representación deseada (114; 424), una información de la matriz de representación de referencia (r) y el único o los varios parámetros de control de limitación de distorsión (q).

5. El aparato (1; 2; 3; 4) de acuerdo con la reivindicación 4, en donde el limitador de distorsión está configurado para limitar una o varias entradas (p, p") de la matriz de representación modificada (132) en relación con la información de la matriz de representación de referencia (r) de acuerdo con el único o los varios valores límite de la matriz de representación (q).

6. El aparato (1; 2; 3; 4) de acuerdo con las reivindicaciones 2 a 5, en donde el limitador de distorsión está configurado para aplicar parámetros de control de limitación de distorsión individuales respecto al objeto (q), a fin de obtener la información de la matriz de representación modificada dependiendo de la información de la matriz de representación deseada.

7. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 6, en donde el aparato para proporcionar una representación de señal de mezcla ascendente está configurado para aplicar uno o varios factores de ganancia modificados (p, p") a muestras de audio de la representación de la señal de mezcla descendente (11, 414), o a una información lateral relacionada con el objeto asociada con los objetos de audio descritos por la señal de mezcla descendente, para proporcionar la representación de señal de mezcla ascendente (12; 428a-428M) dependiendo de los factores de ganancia, y

en donde el limitador de distorsión está configurado para obtener el único o los varios factores de ganancia modificados (p, p") dependiendo de uno o varios factores de ganancia deseados (p) y del único o de los varios parámetros de control de limitación de distorsión (116; 418; q).

8. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 7, donde el limitador de distorsión está configurado para derivar un nivel de referencia (r) para un factor de ganancia a limitar utilizando un filtro de suavizado que tiene una constante de tiempo,

en donde el limitador de distorsión está configurado para utilizar el nivel de referencia (r) para limitar el factor dado, y en donde el limitador de distorsión está configurado para obtener un parámetro de constante de tiempo, que se incluye en una representación de flujo de bits de un contenido de audio, y para ajustar la constante de tiempo del filtro de suavizado dependiendo del parámetro de constante de tiempo.

9. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 8 en donde el limitador de distorsión está configurado para obtener un parámetro de activación de control de distorsión, que está incluido en la representación de flujo de bits del contenido de audio, y para habilitar o inhabilitar el esquema de control de distorsión dependiendo del parámetro de activación de control de distorsión.

1. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 9, en donde el limitador de distorsión está configurado para obtener un parámetro de activación de la matriz de representación preconfigurado, que está incluido en la representación de flujo de bits del contenido de audio, y

en donde el limitador de distorsión está configurado para ejecutar, en respuesta a un estado activo del parámetro de activación de la matriz de representación preconfigurado, que una información de matriz de representación preconfigurada incluida en la representación de flujo de bits del contenido de audio, en vez de una información de la matriz de representación especificada por el usuario, se utilice para proporcionar la representación de la señal de mezcla ascendente sobre la base de la representación de la señal de mezcla descendente.

11. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 1, en donde el limitador de distorsión está configurado para obtener un parámetro de limitación de distorsión psicoacústica, que está incluido en la representación del flujo de bits del contenido de audio,

en donde el limitador de distorsión está configurado para ajustar uno o varios parámetros de mezcla ascendente dependiendo de un modelo de distorsión psicoacústica, de modo tal que se limita una medida de las distorsiones causadas por la derivación de la representación de la señal de mezcla ascendente desde la representación de la señal de mezcla descendente, y

en donde el limitador de distorsión está configurado para establecer uno o varios parámetros utilizados para ajustar el único o los varios parámetros de mezcla ascendente dependiendo del modelo de distorsión psicoacústica, o uno o varios parámetros del modelo de distorsión psicoacústica, dependiendo del parámetro de limitación de distorsión psicoacústica.

12. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 11, en donde el limitador de distorsión está configurado para obtener un parámetro de control de limitación de distorsión actualizado una vez por cada cuadro de audio, para obtener un esquema de control de distorsión variante en el tiempo.

13. El aparato (1; 2; 3; 4) de acuerdo con una de las reivindicaciones 1 a 12, en donde el limitador de distorsión está configurado para actualizar selectivamente el parámetro de control de limitación de distorsión, dependiendo de una bandera que indica la presencia de un parámetro de control de limitación de distorsión en una sección de cuadro de una representación de flujo de bits del contenido de audio, de tal forma que los intervalos de actualización para el parámetro de control de limitación de distorsión están determinados dinámicamente mediante la representación de flujo de bits del contenido de audio.

14. Aparato (5) para proporcionar un flujo de bits (52) que representa una señal de audio de canales múltiples, en donde el aparato comprende:

un mezclador de mezcla descendente (53) configurado para proporcionar una señal de mezcla descendente (532) sobre la base de una pluralidad de señales de objetos de audio (51a-51N);

un proveedor de información lateral (54) configurado para proporcionar una información lateral paramétrica relacionada con el objeto (542) que describe las características de las señales de objetos de audio (51a-51N) y parámetros de mezcla descendente, y uno o varios parámetros de control de limitación de distorsión (544) para controlar la aplicación de un esquema de control de distorsión del lado del aparato (1; 2; 3; 4) para proporcionar una representación de señal de mezcla ascendente;

un realizador de formatos de flujo de bits (55) configurado para proporcionar un flujo de bits (52) que comprende una representación de la señal de mezcla descendente (532), la información lateral paramétrica relacionada con el objeto (542) y el único o los varios parámetros de control de limitación de distorsión (544);

en donde el aparato está configurado para proporcionar un flujo de bits de modo que una sección de configuración del flujo de bits comprende una bandera dinámica de actualización; y

de modo que la sección de configuración de la representación de flujo de bits comprende el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y de modo que una sección de cuadro de la representación de flujo de bits comprende actualizaciones repetidas del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.

15. Un método para proporcionar una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendente y una información paramétrica relacionada con el objeto, que se

incluyen en una representación de flujo de bits de un contenido de audio, y dependiendo de una información de representación, el método comprende:

ajustar parámetros de mezcla ascendente utilizando un esquema de control de distorsión, para evitar o limitar las distorsiones audibles que son causadas por una selección inapropiada de los parámetros de representación, en donde se obtiene un parámetro de control de limitación de distorsión, que está incluido en la representación de flujo de bits del contenido de audio, y en donde el esquema de control de distorsión se ajusta dependiendo del parámetro de control de limitación de distorsión;

en donde se evalúa una bandera dinámica de actualización dentro de una sección de configuración de la representación de flujo de bits del contenido de audio, y

en donde se evalúa la sección de configuración de la representación de flujo de bits del contenido de audio, para obtener el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y en donde se evalúa una sección de cuadro de la representación de flujo de bits del contenido de audio, para obtener repetidamente actualizaciones del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.

16. Un método para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, en donde el método comprende:

derivar una señal de mezcla descendente sobre la base de una pluralidad de señales de objetos de audio; proporcionar una información lateral paramétrica relacionada con el objeto que describe las características de las señales de objetos de audio y los parámetros de mezcla descendente;

proporcionar uno o varios parámetros de control de limitación de distorsión para controlar la aplicación de un esquema de control de distorsión del lado de un aparato para proporcionar una representación de señal de mezcla ascendente; y

proporcionar un flujo de bits que comprende una representación de la señal de mezcla descendente, la información lateral paramétrica relacionada con el objeto y el único o los varios parámetros de control de limitación de distorsión, en donde el flujo de bits se proporciona de modo que una sección de configuración del flujo de bits comprende una bandera dinámica de actualización, y

de modo que la sección de configuración del flujo de bits comprende el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y

de modo que una sección de cuadro del flujo de bits comprende actualizaciones repetidas del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.

17. Un programa de computación para llevar a cabo el método de acuerdo con la reivindicación 15 o 16 cuando se ejecuta el programa de computación en una computadora.

18. Un flujo de bits que representa una señal de audio de canales múltiples, en donde el flujo de bits comprende: una representación de una señal de mezcla descendente que combina señales de audio de una pluralidad de objetos de audio;

una información lateral paramétrica relacionada con el objeto que describe características de los objetos de audio; y uno o varios parámetros de control de limitación de distorsión para controlar la aplicación de un esquema de control de distorsión del lado de un aparato para proporcionar una representación de señal de mezcla ascendente en donde una sección de configuración del flujo de bits comprende una bandera dinámica de actualización, y en donde la sección de configuración del flujo de bits comprende el parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está inactiva, y

en donde la sección de cuadro del flujo de bits comprende actualizaciones repetidas del parámetro de control de limitación de distorsión, si la bandera dinámica de actualización está activa.