Generación jerárquica de parámetros de control para el procesamiento de la dinámica del audio.

Un método para el procesamiento de la dinámica del audio, que comprende la modificación de la dinámica de una señal de audio en respuesta a la información obtenida de uno o más dispositivos o procesos que operan en un nodo de cada uno de dos niveles de jerarquía, presentando cada nivel uno o más nodos, en el que el uno o más dispositivos o procesos que actúan en cada nivel jerárquico toma una medida de una o más características de la señal de audio de manera que el uno o más dispositivos o procesos que actúan en un nivel jerárquico más bajo toma una medida de una o más características de una subdivisión más pequeña de la señal de audio, en el que dichos uno o más dispositivos o uno o más procesos en cada nodo de cada nivel toman una medida del audio en su nivel jerárquico y obtienen información a partir de dicha medida de la señal de audio y a partir de la información que reciben procedente de uno o más dispositivos o procesos en el otro nivel jerárquico, y en el que dicha subdivisión más pequeña del audio incluye una de

(1) subdivisiones de canal y (2) subdivisiones de banda de frecuencia

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E13169247.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 Potrero Avenue San Francisco California 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SEEFELDT,ALAN, GUNDRY,KENNETH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > H04S7/00 (Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación)
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CONTROL DE LA AMPLIFICACION (redes de impedancia,... > H03G7/00 (Compresión o expansión de volumen en los amplificadores)

PDF original: ES-2530360_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Generación jerárquica de parámetros de control para el procesamiento de la dinámica del audio Campo técnico

La invención se refiere a procesadores de señales de audio, al procesamiento de señales de audio y a software para controlar procesadores de señales de audio y el procesamiento de señales de audio. De acuerdo con algunos aspectos de la invención, se proporciona una ruta de control jerárquico para el procesamiento de la dinámica y se imponen restricciones, de manera jerárquica, sobre el procesamiento de la dinámica de señales de audio para mejorar el rendimiento.

Técnica antecedente

El objeto del procesamiento de la dinámica de señales de audio consiste en alterar el nivel relativo o dinámica de una señal de audio para que se mantenga dentro de los límites deseados. Por lo general, se logra creando algún tipo de medida, variable con el tiempo, del nivel de una señal de audio (por ejemplo, nivel r.m.s. o nivel pico) y, a continuación, computando y aplicando una modificación de la señal (por ejemplo, un cambio de ganancia) que sea una función de la medida del nivel. En la solicitud internacional de patente PCT/US2005/038579, a nombre de Alan Jeffrey Seefeldt y publicada con el número WO 2006/47600 el 4 de mayo de 2006, se dan a conocer procesadores de dinámica que comparten dicho modo de funcionamiento y que incluyen controles automáticos de ganancia (AGC), controles de gama dinámica (DRC), expansores, limitadores, puertas de ruido, etc. La solicitud de Seefeldt designa Estados Unidos entre otras entidades. Puede encontrarse técnica anterior relevante adicional en los documentos EP1251715A2, US 2006/0215852A1

La figura 1 ilustra un diagrama de bloques de alto nivel de un procesador genérico de dinámica de audio que procesa una señal de audio (un único canal de una señal de audio multicanal o una señal de audio de un solo canal). Se puede considerar que el procesador incluye dos rutas: una ruta superior de «señal» 2 y una ruta inferior de «control» 4. En la ruta inferior de control, el nivel de la señal de audio se mide mediante un dispositivo o proceso de medición («medida de nivel») 6 y esta medición, una medida del nivel de la señal, es usada más tarde por un dispositivo o proceso de control de dinámica («control de dinámica») 8 para computar uno o más parámetros de modificación de señales. Dichos parámetros funcionan como señales de control de modificación de señales y se usan para modificar la señal de audio de acuerdo con una función de procesamiento de dinámica, y dicha función puede ser un perfil deseado de procesamiento de dinámica como el que se muestra en la figura 3b, que se describe más adelante. Tal como se muestra, los parámetros de modificación se obtienen a partir de la señal de audio de entrada.

Alternativamente, los parámetros de modificación pueden obtenerse a partir del audio procesado (de salida) o de una combinación de las señales de audio de entrada y de salida. En la ruta de la señal de audio 2, los parámetros de modificación generados por el control de dinámica 8 se aplican al audio para controlar la modificación del audio, con lo cual se genera el audio procesado. La aplicación de los parámetros de modificación a una señal de audio se puede lograr de diversas maneras conocidas y se indica de modo genérico mediante el símbolo de multiplicación 12. En la ruta de la señal de audio 2, se puede retardar el audio mediante un dispositivo o proceso de retardo («retardo») 10 para compensar cualquier retardo relacionado con los procesos de estimación de niveles y control de dinámica.

Cuando se trabaja con material de audio multicanal complejo, es preciso actuar con precaución a la hora de computar y aplicar las modificaciones de las señales con el fin de evitar que se introduzcan artefactos perceptibles. Un procesador de dinámica básico que reciba la entrada de una señal de audio multicanal podría computar un nivel de señal que fuese representativo de todos los canales combinados en total y, a continuación, aplicar la misma modificación a todos los canales en función de dicha medida de nivel total. Al modificar todos los canales de la misma manera, dicho enfoque presenta la ventaja de mantener los niveles relativos entre todos los canales, con lo cual se conserva la imagen espacial (incluida, por ejemplo, la ubicación de imágenes virtuales distribuidas panorámicamente entre los canales, así como la dispersión percibida). Dicho enfoque puede funcionar bien si las modificaciones deseadas no son demasiado agresivas.

No obstante, pueden surgir problemas cuando las modificaciones deseadas son más severas. Consideremos una señal de audio multicanal (por ejemplo, 5.1 canales) a la que se le aplica un controlador de gama dinámica con una relación de compresión muy alta. Con este tipo de procesador, las señales que superan el umbral de compresión se atenúan de manera considerable para que el nivel de la señal se aproxime al umbral. Supongamos que la señal de audio contiene música de fondo con un nivel relativamente constante en todos los canales, para los cuales el nivel total tras combinar todos los canales se encuentre por debajo del umbral de compresión. Supongamos también que en el canal central se introduce un segmento de diálogo breve pero con un volumen alto. A causa del diálogo, el nivel total de todos los canales combinados supera ahora el umbral de compresión y, por lo tanto, se atenúa la totalidad de la señal. Cuando el diálogo termina, el nivel de la señal vuelve a caer por debajo del umbral de compresión y no se aplica la atenuación. A consecuencia de ello, en la música de fondo de los canales izquierdo,

derecho, envolvente izquierdo y envolvente derecho, se oyen fluctuaciones en el nivel o el denominado «bombeo» oscilante en función del diálogo del canal central. El efecto puede sonar muy poco natural y puede resultar desconcertante para el oyente. Esta clase de artefactos, un tipo de modulación cruzada o intermodulación, ha sido reconocida ampliamente dentro del campo del procesamiento de la dinámica del audio y una solución típica de la técnica anterior conlleva la aplicación del control de gama dinámica a cada canal de manera independiente. Aunque dicha solución puede llegar a corregir el problema mencionado, es posible que presente la desventaja de alterar la imagen espacial del audio. En particular, las fuentes virtuales distribuidas panorámicamente entre dos canales pueden dar la impresión de «fluctuar» debido a las diferentes cantidades de atenuación aplicadas a los dos canales. De este modo, existe la necesidad de hallar una solución que haga frente a los problemas de bombeo y de imagen inestable.

Existen problemas análogos cuando se considera el espectro de un único canal de audio. Consideremos un único canal que contiene una nota de cuerda sostenida, a frecuencias entre medias y altas, para la cual el nivel de señal se encuentra por debajo del umbral de compresión. Consideremos ahora un golpe de bombo con un volumen muy alto introducido en las frecuencias bajas y que hace que el nivel de la señal aumente momentáneamente y supere el umbral de compresión. Momentáneamente, se atenúa la totalidad de la señal, por lo cual se percibe en las cuerdas un efecto de bombeo en el nivel vinculado al bombo, que resulta muy poco natural. Una solución típica de la técnica anterior a este problema consiste en dividir la señal de audio en múltiples bandas de frecuencia y aplicar después el control de gama dinámica a cada banda de manera independiente. Esto reduce el problema del bombeo, pero puede alterar el balance espectral o el timbre percibidos. Por tanto, existe la necesidad de hallar una solución que reduzca el bombeo al tiempo que reduce los cambios en el balance espectral percibido.

... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para el procesamiento de la dinámica del audio, que comprende la modificación de la dinámica de una señal de audio en respuesta a la información obtenida de uno o más dispositivos o procesos que operan en un nodo de cada uno de dos niveles de jerarquía, presentando cada nivel uno o más nodos, en el que el uno o más dispositivos o procesos que actúan en cada nivel jerárquico toma una medida de una o más características de la señal de audio de manera que el uno o más dispositivos o procesos que actúan en un nivel jerárquico más bajo toma una medida de una o más características de una subdivisión más pequeña de la señal de audio, en el que dichos uno o más dispositivos o uno o más procesos en cada nodo de cada nivel toman una medida del audio en su nivel jerárquico y obtienen información a partir de dicha medida de la señal de audio y a partir de la información que reciben procedente de uno o más dispositivos o procesos en el otro nivel jerárquico, y en el que dicha subdivisión más pequeña del audio incluye una de (1) subdivisiones de canal y (2) subdivisiones de banda de frecuencia.

2. Un método según la reivindicación 1, en el que el otro nivel jerárquico comprende un nodo raíz que toma una medida de una totalidad de la señal de audio.

3. Un método según una cualquiera de las reivindicaciones 1-2, en el que dicha señal de audio es una señal de audio multicanal y el otro nivel jerárquico comprende una pluralidad de nodos que toman cada uno una medida de una subdivisión de canal de la señal de audio, y el nivel jerárquico más bajo comprende una pluralidad de nodos que toman cada uno una medida de una subdivisión de frecuencia de los canales de la señal de audio.

4. Un método según una cualquiera de las reivindicaciones 1-2, en el que dicha señal de audio es una señal de audio de un único canal y el nivel jerárquico más bajo comprende una pluralidad de nodos que toman cada uno una medida de una subdivisión de frecuencia de la señal de audio.

5. Un método según una cualquiera de las reivindicaciones 1-4, en el que la información obtenida a partir de una medida de la señal de audio en el otro nivel jerárquico se hace pasar en sentido descendente en la jerarquía hasta el nivel jerárquico más bajo con el fin de influir en el funcionamiento de los dispositivos o procesos que actúan en un nivel jerárquico más bajo.

6. Un método según la reivindicación 5, en el que la información obtenida a partir de una medida de la información de audio en el otro nivel jerárquico comprende no sólo información útil para influir en el funcionamiento de los dispositivos y procesos que actúan en el nivel jerárquico más bajo, sino también información útil para modificar la dinámica de la señal de audio.

7. Un método según la reivindicación 5 o la reivindicación 6, en el que la información obtenida a partir de una medida de la señal de audio en el nivel jerárquico más bajo y a partir de la información que pasa al nivel jerárquico más bajo se usa para influir en el funcionamiento de los dispositivos o procesos que actúan en el nivel jerárquico más bajo.

8. Un método según la reivindicación 7, en el que la influencia en el funcionamiento de los dispositivos o procesos que actúan en el nivel jerárquico más bajo da lugar a que el nivel jerárquico más bajo genere una modificación de la información que generaría en caso de no ejercerse dicha influencia.

9. Un método según la reivindicación 5 o la reivindicación 6, en el que la información obtenida a partir de una medida de la señal de audio en el nivel jerárquico más bajo y a partir de la información que pasa al nivel jerárquico más bajo se hace pasar en sentido ascendente en la jerarquía hasta el otro nivel jerárquico con el fin de influir en el funcionamiento de los dispositivos o procesos que actúan en el otro nivel jerárquico.

10. Un método según la reivindicación 9, en el que la influencia en el funcionamiento de los dispositivos o procesos que actúan en el otro nivel jerárquico da lugar a que el otro nivel jerárquico genere una modificación de la información que, en caso contrario, haría pasar al nivel jerárquico más bajo o que se usaría para modificar la señal de audio.

11. Un método según la reivindicación anterior, en el que la información para modificar la dinámica de una señal de audio es suavizada en el tiempo.

12. Aparato adaptado para llevar a cabo los métodos de una cualquiera de las reivindicaciones 1 a 11.

13. Un programa informático, almacenado en un medio legible por ordenador para dar lugar a que un ordenador lleve a cabo los métodos de una cualquiera de las reivindicaciones 1 a 11.