Ruta de control jerárquico con restricciones para el procesamiento de la dinámica del audio.

Método para el procesamiento de la dinámica de una señal de audio multicanal usando una arquitectura de ruta de control jerárquico, que comprende:

el establecimiento de tres niveles jerárquicos de procesamiento de señal en el siguiente orden jerárquico descendente:

- un nivel jerárquico total que procesa una señal total, en el que la señal total es todas las bandas de frecuencia de todos los canales de la señal de audio multicanal,

- un nivel jerárquico de canales que procesa canales dentro de la señal de audio multicanal, y

- un nivel jerárquico de bandas que procesa bandas de frecuencia dentro de cada canal de la señal de audio multicanal;

el cálculo de niveles de señal de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal, para proporcionar respectivamente una medida de nivel de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal;

el cálculo, usando un primer dispositivo o proceso de control de dinámica

(16), como respuesta a la medida de nivel de la señal de audio total, de uno o más parámetros de control de dinámica;

el cálculo, usando un segundo dispositivo o proceso de control de dinámica (20-1 a 20-C) respectivo, como respuesta a al menos la medida de nivel de cada canal de la señal de audio multicanal, de uno o más parámetros de control de dinámica, en el que dichos parámetros de control de dinámica se pueden usar para influir en el funcionamiento de dispositivos o procesos de control de dinámica; y

el cálculo, usando un tercer dispositivo o proceso de control de dinámica (26-1-1 a 26-C-N) respectivo, como respuesta a al menos la medida de nivel de cada banda de frecuencia de cada canal de la señal de audio multicanal, de parámetros de modificación adecuados para controlar la modificación de la señal de audio multicanal; el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos total o de canales hasta al menos uno de los niveles jerárquicos de canales o de bandas, en el que dicho cálculo de parámetros de control de dinámica y parámetros de modificación también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido descendente desde otro nivel jerárquico; y

la modificación de la señal de audio multicanal como respuesta a uno o más de dichos parámetros de modificación.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/022132.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SEEFELDT,ALAN,JEFFREY, GUNDRY,KENNETH JAMES.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > H04S7/00 (Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación)
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CONTROL DE LA AMPLIFICACION (redes de impedancia,... > H03G7/00 (Compresión o expansión de volumen en los amplificadores)

PDF original: ES-2482147_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Ruta de control jerárquico con restricciones para el procesamiento de la dinámica del audio Campo técnico

La invención se refiere a procesadores de señales de audio, al procesamiento de señales de audio y a software para controlar procesadores de señales de audio y el procesamiento de señales de audio. De acuerdo con algunos aspectos de la invención, se proporciona una ruta de control jerárquico para el procesamiento de la dinámica y se imponen restricciones, de manera jerárquica, sobre el procesamiento de la dinámica de señales de audio para mejorar el rendimiento.

Técnica antecedente

El objeto del procesamiento de la dinámica de señales de audio consiste en alterar el nivel relativo o dinámica de una señal de audio para que se mantenga dentro de los límites deseados. Por lo general, se logra creando algún tipo de medida, variable con el tiempo, del nivel de una señal de audio (por ejemplo, nivel r.m.s. o nivel pico) y, a continuación, computando y aplicando una modificación de la señal (por ejemplo, un cambio de ganancia) que sea una función de la medida del nivel. En la solicitud internacional de patente PCT/US25/38579, a nombre de Alan Jeffrey Seefeldt y publicada con el número WO 26/476 el 4 de mayo de 26, se dan a conocer procesadores dinámicos que comparten dicho modo de funcionamiento y que incluyen controles automáticos de ganancia (AGC), controles de gama dinámica (DRC), expansores, limitadores, puertas de ruido, etc. La solicitud de Seefeldt designa Estados Unidos entre otras entidades.

La figura 1 ilustra un diagrama de bloques de alto nivel de un procesador genérico de dinámica de audio que procesa una señal de audio (un único canal de una señal de audio multicanal o una señal de audio de un solo canal). Se puede considerar que el procesador incluye dos rutas: una ruta superior de «señal» 2 y una ruta inferior de «control» 4. En la ruta inferior de control, el nivel de la señal de audio se mide mediante un dispositivo o método de medición («medida de nivel») 6 y esta medición una medida del nivel de la señal es usada más tarde por un dispositivo o método de control de dinámica («control de dinámica») 8 para computar uno o más parámetros de modificación de señales. Dichos parámetros funcionan como señales de control de modificación de señales y se usan para modificar la señal de audio de acuerdo con una función de procesamiento de dinámica, y dicha función puede ser un perfil deseado de procesamiento de dinámica como el que se muestra en la figura 3b, que se describe más adelante. Tal como se muestra, los parámetros de modificación se obtienen a partir de la señal de audio de entrada. Otra posibilidad consiste en obtener los parámetros de modificación a partir del audio procesado (de salida) o de una combinación de las señales de audio de entrada y de salida. En la ruta de la señal de audio 2, los parámetros de modificación generados por el control de dinámica 8 se aplican al audio para controlar la modificación del audio, con lo cual se genera el audio procesado. La aplicación de los parámetros de modificación a una señal de audio se puede lograr de diversas maneras conocidas y se indica de modo genérico mediante el símbolo de multiplicación 12. En la ruta de la señal de audio 2, se puede retardar el audio mediante un dispositivo o método de retardo («retardo») 1 para compensar cualquier retardo relacionado con los procesos de estimación de niveles y control de dinámica.

Cuando se trabaja con material de audio multicanal complejo, es preciso actuar con precaución a la hora de computar y aplicar las modificaciones de las señales con el fin de evitar que se introduzcan artefactos perceptibles. Un procesador de dinámica básico que reciba la entrada de una señal de audio multicanal podría computar un nivel de señal que fuese representativo de todos los canales combinados en total y, a continuación, aplicar la misma modificación a todos los canales en función de dicha medida de nivel total. Al modificar todos los canales de la misma manera, dicho enfoque presenta la ventaja de mantener los niveles relativos entre todos los canales, con lo cual se conserva la imagen espacial (incluida, por ejemplo, la ubicación de imágenes virtuales distribuidas panorámicamente entre los canales, así como la dispersión percibida). Dicho enfoque puede funcionar bien si las modificaciones deseadas no son demasiado agresivas.

No obstante, pueden surgir problemas cuando las modificaciones deseadas son más severas. Consideremos una señal de audio multicanal (por ejemplo, 5.1 canales) a la que se le aplica un controlador de gama dinámica con una relación de compresión muy alta. Con este tipo de procesador, las señales que superan el umbral de compresión se atenúan de manera considerable para que el nivel de la señal se aproxime al umbral. Supongamos que la señal de audio contiene música de fondo con un nivel relativamente constante en todos los canales, para los cuales el nivel total tras combinar todos los canales se encuentre por debajo del umbral de compresión. Supongamos también que en el canal central se introduce un segmento de diálogo breve pero con un volumen alto. A causa del diálogo, el nivel total de todos los canales combinados supera ahora el umbral de compresión y, por lo tanto, se atenúa la totalidad de la señal. Cuando el diálogo termina, el nivel de la señal vuelve a caer por debajo del umbral de compresión y no se aplica la atenuación. A consecuencia de ello, en la música de fondo de los canales izquierdo, derecho, envolvente izquierdo y envolvente derecho, se oyen fluctuaciones en el nivel o el denominado «bombeo» oscilante en función del diálogo del canal central. El efecto puede sonar muy poco natural y puede resultar desconcertante para el oyente. Esta clase de artefactos (un tipo de modulación cruzada o intermodulación) ha sido

reconocida ampliamente dentro del campo del procesamiento de la dinámica del audio y una solución típica de la técnica anterior conlleva la aplicación del control de gama dinámica a cada canal de manera independiente. Aunque dicha solución puede llegar a corregir el problema mencionado, es posible que presente la desventaja de alterar la imagen espacial del audio. En particular, las fuentes virtuales distribuidas panorámicamente entre dos canales pueden dar la impresión de «fluctuar» debido a las diferentes cantidades de atenuación aplicadas a los dos canales. De este modo, existe la necesidad de hallar una solución que haga frente a los problemas de bombeo y de imagen inestable.

Existen problemas análogos cuando se considera el espectro de un único canal de audio. Consideremos un único canal que contiene una nota de cuerda sostenida, a frecuencias entre medias y altas, para la cual el nivel de señal se encuentra por debajo del umbral de compresión. Consideremos ahora un golpe de bombo con un volumen muy alto introducido en las frecuencias bajas y que hace que el nivel de la señal aumente momentáneamente y supere el umbral de compresión. Momentáneamente, se atenúa la totalidad de la señal, por lo cual se percibe en las cuerdas un efecto de bombeo en el nivel vinculado al bombo, que resulta muy poco natural. Una solución típica de la técnica anterior consiste en dividir la señal de audio en múltiples bandas de frecuencia y aplicar después el control de gama dinámica a cada banda de manera independiente. Esto reduce el problema del bombeo, pero puede alterar el balance espectral o el timbre percibidos. Por tanto, existe la necesidad de hallar una solución que reduzca el bombeo al tiempo que reduce los cambios en el balance espectral percibido.

El documento EP-A-1251715 trata sobre un dispositivo de corrección auditiva en el que una señal monofónica se divide en múltiples bandas... [Seguir leyendo]

 


Reivindicaciones:

1. Método para el procesamiento de la dinámica de una señal de audio multicanal usando una arquitectura de ruta de control jerárquico, que comprende:

el establecimiento de tres niveles jerárquicos de procesamiento de señal en el siguiente orden jerárquico descendente:

- un nivel jerárquico total que procesa una señal total, en el que la señal total es todas las bandas de frecuencia de todos los canales de la señal de audio multicanal,

- un nivel jerárquico de canales que procesa canales dentro de la señal de audio multicanal, y

- un nivel jerárquico de bandas que procesa bandas de frecuencia dentro de cada canal de la señal de audio multicanal;

el cálculo de niveles de señal de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal, para proporcionar respectivamente una medida de nivel de la señal de audio total, de cada canal de la señal de audio total, y de cada banda de frecuencia de cada canal de la señal de audio multicanal;

el cálculo, usando un primer dispositivo o proceso de control de dinámica (16), como respuesta a la medida de nivel de la señal de audio total, de uno o más parámetros de control de dinámica;

el cálculo, usando un segundo dispositivo o proceso de control de dinámica (2-1 a 2-C) respectivo, como respuesta a al menos la medida de nivel de cada canal de la señal de audio multicanal, de uno o más parámetros de control de dinámica, en el que dichos parámetros de control de dinámica se pueden usar para influir en el funcionamiento de dispositivos o procesos de control de dinámica; y

el cálculo, usando un tercer dispositivo o proceso de control de dinámica (26-1-1 a 26-C-N) respectivo, como respuesta a al menos la medida de nivel de cada banda de frecuencia de cada canal de la señal de audio multicanal, de parámetros de modificación adecuados para controlar la modificación de la señal de audio multicanal;

el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos total o de canales hasta al menos uno de los niveles jerárquicos de canales o de bandas, en el que dicho cálculo de parámetros de control de dinámica y parámetros de modificación también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido descendente desde otro nivel jerárquico; y

la modificación de la señal de audio multicanal como respuesta a uno o más de dichos parámetros de modificación.

2. Método de acuerdo con la reivindicación 1, que además comprende el paso de parámetros de control de dinámica desde al menos uno de los niveles jerárquicos de canales o de bandas hasta al menos uno de los niveles jerárquicos total o de canales, en el que dicho cálculo también es como respuesta a parámetros de control de dinámica cuando se pasan en sentido ascendente desde otro nivel jerárquico.

3. Método de acuerdo con la reivindicación 1, en el que dichos parámetros de control de dinámica incluyen también parámetros de modificación adecuados para controlar directa o indirectamente la señal de audio multicanal.

4. Método de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en el que la influencia sobre el funcionamiento de los dispositivos o procesos de control de dinámica que actúan en un nivel jerárquico más bajo hace que el nivel jerárquico más bajo genere una modificación de la información que de otro modo generaría.

5. Aparato que comprende unos medios adaptados para llevar a cabo todas las etapas del método de una cualquiera de las reivindicaciones 1 a 4.

6. Programa informático, almacenado en un medio legible por ordenador y adaptado, cuando se ejecuta en un ordenador, para llevar a cabo todas las etapas del método de una cualquiera de las reivindicaciones 1 a 4.