Ruta de control jerárquico con restricciones para el procesamiento de la dinámica del audio.

Método para el procesamiento de la dinámica de una señal de audio multicanal usando una arquitectura de ruta de control jerárquico,

que comprende:

el establecimiento de tres niveles jerárquicos de procesamiento de señal en el siguiente orden jerárquico descendente:

- un nivel jerárquico total que procesa una señal total, en el que la señal total es todas las bandas de frecuencia de todos los canales de la señal de audio multicanal,

- un nivel jerárquico de canales que procesa canales dentro de la señal de audio multicanal, y

- un nivel jerárquico de bandas que procesa bandas de frecuencia dentro de cada canal de la señal de audio multicanal;

el cálculo de niveles de señal de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal, para proporcionar respectivamente una medida de nivel de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal;

el cálculo, usando un primer dispositivo o proceso de control de dinámica (16), como respuesta a la medida de nivel de la señal de audio total, de uno o más parámetros de control de dinámica;

el cálculo, usando un segundo dispositivo o proceso de control de dinámica (20-1 a 20-C) respectivo, como respuesta a al menos la medida de nivel de cada canal de la señal de audio multicanal, de uno o más parámetros de control de dinámica, en el que dichos parámetros de control de dinámica se pueden usar para influir en el funcionamiento de dispositivos o procesos de control de dinámica; y

el cálculo, usando un tercer dispositivo o proceso de control de dinámica (26-1-1 a 26-C-N) respectivo, como respuesta a al menos la medida de nivel de cada banda de frecuencia de cada canal de la señal de audio multicanal, de parámetros de modificación adecuados para controlar la modificación de la señal de audio multicanal; el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos total o de canales hasta al menos uno de los niveles jerárquicos de canales o de bandas, en el que dicho cálculo de parámetros de control de dinámica y parámetros de modificación también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido descendente desde otro nivel jerárquico; y

la modificación de la señal de audio multicanal como respuesta a uno o más de dichos parámetros de modificación.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/022132.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SEEFELDT,ALAN,JEFFREY, GUNDRY,KENNETH JAMES.

Fecha de Publicación: 21 de Mayo de 2014.

Clasificación Internacional de Patentes:

H03G7/00 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03G CONTROL DE LA AMPLIFICACION (redes de impedancia, p. ej. atenuadores H03H; control de la transmisión en líneas H04B 3/04). › Compresión o expansión de volumen en los amplificadores.
H04S7/00 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2482147_T3.pdf

Fragmento de la descripción:

Ruta de control jerárquico con restricciones para el procesamiento de la dinámica del audio Campo técnico

La invención se refiere a procesadores de señales de audio, al procesamiento de señales de audio y a software para controlar procesadores de señales de audio y el procesamiento de señales de audio. De acuerdo con algunos aspectos de la invención, se proporciona una ruta de control jerárquico para el procesamiento de la dinámica y se imponen restricciones, de manera jerárquica, sobre el procesamiento de la dinámica de señales de audio para mejorar el rendimiento.

Técnica antecedente

El objeto del procesamiento de la dinámica de señales de audio consiste en alterar el nivel relativo o dinámica de una señal de audio para que se mantenga dentro de los límites deseados. Por lo general, se logra creando algún tipo de medida, variable con el tiempo, del nivel de una señal de audio (por ejemplo, nivel r.m.s. o nivel pico) y, a continuación, computando y aplicando una modificación de la señal (por ejemplo, un cambio de ganancia) que sea una función de la medida del nivel. En la solicitud internacional de patente PCT/US25/38579, a nombre de Alan Jeffrey Seefeldt y publicada con el número WO 26/476 el 4 de mayo de 26, se dan a conocer procesadores dinámicos que comparten dicho modo de funcionamiento y que incluyen controles automáticos de ganancia (AGC), controles de gama dinámica (DRC), expansores, limitadores, puertas de ruido, etc. La solicitud de Seefeldt designa Estados Unidos entre otras entidades.

La figura 1 ilustra un diagrama de bloques de alto nivel de un procesador genérico de dinámica de audio que procesa una señal de audio (un único canal de una señal de audio multicanal o una señal de audio de un solo canal). Se puede considerar que el procesador incluye dos rutas: una ruta superior de «señal» 2 y una ruta inferior de «control» 4. En la ruta inferior de control, el nivel de la señal de audio se mide mediante un dispositivo o método de medición («medida de nivel») 6 y esta medición una medida del nivel de la señal es usada más tarde por un dispositivo o método de control de dinámica («control de dinámica») 8 para computar uno o más parámetros de modificación de señales. Dichos parámetros funcionan como señales de control de modificación de señales y se usan para modificar la señal de audio de acuerdo con una función de procesamiento de dinámica, y dicha función puede ser un perfil deseado de procesamiento de dinámica como el que se muestra en la figura 3b, que se describe más adelante. Tal como se muestra, los parámetros de modificación se obtienen a partir de la señal de audio de entrada. Otra posibilidad consiste en obtener los parámetros de modificación a partir del audio procesado (de salida) o de una combinación de las señales de audio de entrada y de salida. En la ruta de la señal de audio 2, los parámetros de modificación generados por el control de dinámica 8 se aplican al audio para controlar la modificación del audio, con lo cual se genera el audio procesado. La aplicación de los parámetros de modificación a una señal de audio se puede lograr de diversas maneras conocidas y se indica de modo genérico mediante el símbolo de multiplicación 12. En la ruta de la señal de audio 2, se puede retardar el audio mediante un dispositivo o método de retardo («retardo») 1 para compensar cualquier retardo relacionado con los procesos de estimación de niveles y control de dinámica.

Cuando se trabaja con material de audio multicanal complejo, es preciso actuar con precaución a la hora de computar y aplicar las modificaciones de las señales con el fin de evitar que se introduzcan artefactos perceptibles. Un procesador de dinámica básico que reciba la entrada de una señal de audio multicanal podría computar un nivel de señal que fuese representativo de todos los canales combinados en total y, a continuación, aplicar la misma modificación a todos los canales en función de dicha medida de nivel total. Al modificar todos los canales de la misma manera, dicho enfoque presenta la ventaja de mantener los niveles relativos entre todos los canales, con lo cual se conserva la imagen espacial (incluida, por ejemplo, la ubicación de imágenes virtuales distribuidas panorámicamente entre los canales, así como la dispersión percibida). Dicho enfoque puede funcionar bien si las modificaciones deseadas no son demasiado agresivas.

No obstante, pueden surgir problemas cuando las modificaciones deseadas son más severas. Consideremos una señal de audio multicanal (por ejemplo, 5.1 canales) a la que se le aplica un controlador de gama dinámica con una relación de compresión muy alta. Con este tipo de procesador, las señales que superan el umbral de compresión se atenúan de manera considerable para que el nivel de la señal se aproxime al umbral. Supongamos que la señal de audio contiene música de fondo con un nivel relativamente constante en todos los canales, para los cuales el nivel total tras combinar todos los canales se encuentre por debajo del umbral de compresión. Supongamos también que en el canal central se introduce un segmento de diálogo breve pero con un volumen alto. A causa del diálogo, el nivel total de todos los canales combinados supera ahora el umbral de compresión y, por lo tanto, se atenúa la totalidad de la señal. Cuando el diálogo termina, el nivel de la señal vuelve a caer por debajo del umbral de compresión y no se aplica la atenuación. A consecuencia de ello, en la música de fondo de los canales izquierdo, derecho, envolvente izquierdo y envolvente derecho, se oyen fluctuaciones en el nivel o el denominado «bombeo» oscilante en función del diálogo del canal central. El efecto puede sonar muy poco natural y puede resultar desconcertante para el oyente. Esta clase de artefactos (un tipo de modulación cruzada o intermodulación) ha sido

reconocida ampliamente dentro del campo del procesamiento de la dinámica del audio y una solución típica de la técnica anterior conlleva la aplicación del control de gama dinámica a cada canal de manera independiente. Aunque dicha solución puede llegar a corregir el problema mencionado, es posible que presente la desventaja de alterar la imagen espacial del audio. En particular, las fuentes virtuales distribuidas panorámicamente entre dos canales pueden dar la impresión de «fluctuar» debido a las diferentes cantidades de atenuación aplicadas a los dos canales. De este modo, existe la necesidad de hallar una solución que haga frente a los problemas de bombeo y de imagen inestable.

Existen problemas análogos cuando se considera el espectro de un único canal de audio. Consideremos un único canal que contiene una nota de cuerda sostenida, a frecuencias entre medias y altas, para la cual el nivel de señal se encuentra por debajo del umbral de compresión. Consideremos ahora un golpe de bombo con un volumen muy alto introducido en las frecuencias bajas y que hace que el nivel de la señal aumente momentáneamente y supere el umbral de compresión. Momentáneamente, se atenúa la totalidad de la señal, por lo cual se percibe en las cuerdas un efecto de bombeo en el nivel vinculado al bombo, que resulta muy poco natural. Una solución típica de la técnica anterior consiste en dividir la señal de audio en múltiples bandas de frecuencia y aplicar después el control de gama dinámica a cada banda de manera independiente. Esto reduce el problema del bombeo, pero puede alterar el balance espectral o el timbre percibidos. Por tanto, existe la necesidad de hallar una solución que reduzca el bombeo al tiempo que reduce los cambios en el balance espectral percibido.

El documento EP-A-1251715 trata sobre un dispositivo de corrección auditiva en el que una señal monofónica se divide en múltiples bandas y cada banda dispone de su propio control de ganancia. En este ejemplo de la técnica anterior, se aplica una señal de audio a un banco de filtros en el que la señal de audio se divide en cuatro bandas de frecuencia (subbandas). Un detector de nivel de banda ancha mide el nivel de la señal de audio de entrada. Cada subbanda cuenta con su propio detector de nivel que proporciona una de las entradas a un mezclador. Cada mezclador consiste en un combinador lineal que aporta una combinación ponderada de sus entradas a un cálculo de ganancia que proporciona una salida de ganancia para controlar un multiplicador. Más concretamente, lo que pasa a cada cálculo de ganancia es un nivel de señal compuesto por el nivel de banda ancha, el nivel de señal de la subbanda en particular y, en tres de las cuatro subbandas, el nivel de la subbanda inmediatamente superior, en proporciones establecidas por unos coeficientes predeterminados. A partir de cada nivel combinado, se calcula un multiplicador... [Seguir leyendo]

Reivindicaciones:

1. Método para el procesamiento de la dinámica de una señal de audio multicanal usando una arquitectura de ruta de control jerárquico, que comprende:

el establecimiento de tres niveles jerárquicos de procesamiento de señal en el siguiente orden jerárquico descendente:

- un nivel jerárquico total que procesa una señal total, en el que la señal total es todas las bandas de frecuencia de todos los canales de la señal de audio multicanal,

- un nivel jerárquico de canales que procesa canales dentro de la señal de audio multicanal, y

- un nivel jerárquico de bandas que procesa bandas de frecuencia dentro de cada canal de la señal de audio multicanal;

el cálculo de niveles de señal de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal, para proporcionar respectivamente una medida de nivel de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal;

el cálculo, usando un primer dispositivo o proceso de control de dinámica (16), como respuesta a la medida de nivel de la señal de audio total, de uno o más parámetros de control de dinámica;

el cálculo, usando un segundo dispositivo o proceso de control de dinámica (2-1 a 2-C) respectivo, como respuesta a al menos la medida de nivel de cada canal de la señal de audio multicanal, de uno o más parámetros de control de dinámica, en el que dichos parámetros de control de dinámica se pueden usar para influir en el funcionamiento de dispositivos o procesos de control de dinámica; y

el cálculo, usando un tercer dispositivo o proceso de control de dinámica (26-1-1 a 26-C-N) respectivo, como respuesta a al menos la medida de nivel de cada banda de frecuencia de cada canal de la señal de audio multicanal, de parámetros de modificación adecuados para controlar la modificación de la señal de audio multicanal;

el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos total o de canales hasta al menos uno de los niveles jerárquicos de canales o de bandas, en el que dicho cálculo de parámetros de control de dinámica y parámetros de modificación también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido descendente desde otro nivel jerárquico; y

la modificación de la señal de audio multicanal como respuesta a uno o más de dichos parámetros de modificación.

2. Método de acuerdo con la reivindicación 1, que además comprende el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos de canales o de bandas hasta al menos uno de los niveles jerárquicos total o de canales, en el que dicho cálculo también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido ascendente desde otro nivel jerárquico.

3. Método de acuerdo con la reivindicación 1, en el que dichos parámetros de control de dinámica incluyen también parámetros de modificación adecuados para controlar directa o indirectamente la señal de audio multicanal.

4. Método de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en el que la influencia sobre el funcionamiento de los dispositivos o procesos de control de dinámica que actúan en un nivel jerárquico más bajo hace que el nivel jerárquico más bajo genere una modificación de la información que de otro modo generaría.

5. Aparato que comprende unos medios adaptados para llevar a cabo todas las etapas del método de una cualquiera de las reivindicaciones 1 a 4.

6. Programa informático, almacenado en un medio legible por ordenador y adaptado, cuando se ejecuta en un ordenador, para llevar a cabo todas las etapas del método de una cualquiera de las reivindicaciones 1 a 4.

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]