Mezcla de transmisión de audio con normalización de nivel de diálogo.

Un método para la mezcla de dos señales de audio de entrada en una única señal de audio mezclada mientras se mantiene un nivel de sonido percibido de la señal de audio mezclada

, comprendiendo el método:

la recepción de una señal de audio de entrada principal;

la recepción de una señal de audio de entrada asociada; donde la señal de audio de entrada asociada se acopla con la señal de audio de entrada principal;

la recepción de los metadatos de mezcla, los cuales contienen información de modificación de escala para la modificación de la escala de la señal de audio de entrada principal y que especifican cómo se deberían mezclar la señal de audio de entrada principal y la señal de audio de entrada asociada, con el fin de generar una señal de audio mezclada en el nivel de sonido percibido; donde la información de modificación de escala a partir de los metadatos de mezcla comprende un factor de escala de metadatos para la señal de audio de entrada principal, para la modificación de la escala de la señal de audio de entrada principal relativa a la señal de audio de entrada asociada; la recepción de una entrada de balance de mezcla, la cual denota un balance ajustable entre la señal de audio de entrada principal y la señal de audio de entrada asociada, donde la entrada de balance de mezcla comprende información de modificación de escala la cual permite una desviación de una ponderación de la señal de audio de entrada principal y la señal de audio de entrada asociada en la señal de audio mezclada como se especifica en los metadatos de mezcla;

la identificación de una señal dominante como la señal de audio de entrada principal o la señal de audio de entrada asociada a partir de la información de modificación de escala proporcionada por los metadatos de mezcla y a partir de la entrada de balance de mezcla, donde la otra señal de audio de entrada respectiva se identifica entonces como una señal no dominante; y donde la señal dominante se identifica mediante la comparación de la entrada de balance de mezcla con el factor de escala de metadatos para la señal de audio de entrada principal;

la modificación de escala de la señal no dominante en relación con la señal dominante; y

la combinación de la señal no dominante con su escala modificada con la señal dominante para producir la señal de audio mezclada.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2011/050482.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SCHILDBACH,WOLFGANG,A, GROESCHEL,ALEXANDER, WILLIAMS,PHILLIP A, COOPER,JARRET A.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CONTROL DE LA AMPLIFICACION (redes de impedancia,... > H03G3/00 (Control de la ganancia en los amplificadores o cambiadores de frecuencia (amplificadores controlados H03F 3/72; específicamente para los receptores de televisión H04N))

PDF original: ES-2502468_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Mezcla de transmisión de audio con normalización de nivel de diálogo.
Ilustración 2 de Mezcla de transmisión de audio con normalización de nivel de diálogo.
Ilustración 3 de Mezcla de transmisión de audio con normalización de nivel de diálogo.
Ilustración 4 de Mezcla de transmisión de audio con normalización de nivel de diálogo.
Ver la galería de la patente con 9 ilustraciones.
Mezcla de transmisión de audio con normalización de nivel de diálogo.

Fragmento de la descripción:

Mezcla de transmisión de audio con normalización de nivel de diálogo.

Campo técnico

Esta solicitud se refiere al campo de las señales de audio. En particular, se refiere a la mezcla de señales de audio. Antecedentes de la invención

La inclusión de metadatos junto con señales de audio ha permitido significativas mejoras en la experiencia de audición del usuario. Para una experiencia del usuario agradable, generalmente es deseable para el nivel de sonido general o el volumen sonoro de los diferentes programas que sea consistente. No obstante, las señales de audio de los diferentes programas que usualmente provienen de diferentes fuentes, son controladas por diferentes 15 productores y pueden contener contenido diverso que va desde diálogo de discurso a música a pistas de audio de películas con efectos de baja frecuencia. Esta posibilidad de diferencia en el nivel de sonido hace que sea un reto mantener el mismo nivel de sonido general a lo largo de tal variedad de programas durante la reproducción. En términos prácticos, no es conveniente para el oyente sentir la necesidad de ajustar el volumen de reproducción cuando cambie de un programa a otro con el fin de ajustar un programa para que esté más alto o más bajo con 2 respecto a otro programa debido a las diferencias en el nivel de sonido percibido de los diferentes programas. Las técnicas para cambiar las señales de audio con el fin de mantener un nivel de sonido consistente entre los programas se conocen generalmente como nivelación de señal. En el contexto de las pistas de audio de diálogo, una medida relacionada con el nivel de sonido percibido se conoce como el nivel de diálogo, el cual se basa en un nivel ponderado de media de la señal de audio. El nivel de diálogo se especifica con frecuencia mediante el uso de 25 un parámetro dialnorm, el cual indica un nivel en decibelios (dB) con respecto a la escala digital completa.

En el pasado, las emisoras que funcionaban con señales de audio tenían particulares problemas con las señales de audio tales como las pistas de audio cuyos niveles de audio estaban por encima o por debajo de los de otros programas, particularmente el audio que puede variar sustancialmente con el tiempo, tal como el diálogo. Con el 3 desarrollo del audio digital, el audio de multicanal y, particularmente, la capacidad de incluir metadatos junto con la señal de audio, los productores e ingenieros de audio tienen ahora una amplia gama de opciones para especificar ajustes, los cuales se pueden incrustar en la señal como metadatos con el fin de especificar de forma precisa los niveles de reproducción para diversos sistemas de reproducción. Estos ajustes se pueden proporcionar incluso en la fase de postproducción, de forma que las emisoras puedan entregar una señal de audio muy consistente y 35 garantizar que los elementos de audio más importantes lleguen al usuario final.

De manera similar, cuando se mezclan señales de audio, es conveniente para una experiencia de usuario agradable mantener también el mismo nivel de sonido percibido cuando se mezclan señales de entrada de audio en una única señal. Una técnica para llevar a cabo este objetivo es para las señales de entrada incluir metadatos de mezcla que 4 especifican cómo se debería modificar la escala de la señal cuando se mezcla.

Muchos estándares de audio actuales permiten al productor de contenido incluir señales de audio asociadas acopladas con la señal de audio principal incluyendo metadatos variables en el tiempo junto con las señales de audio asociadas. Por ejemplo, un productor de contenido podría proporcionar una pista con los comentarios del 45 director con una señal de audio asociada tal. Los metadatos que acompañan a la señal asociada especifican exactamente cómo desea el productor de contenido que la señal de audio de la pista principal se ajuste durante la mezcla para la reproducción combinada. Por ejemplo, E-AC-3 (Dolby Digital Plus) y el Codificador avanzado de audio de alta eficiencia (HE-AAC) son dos ejemplos de estándares que proporcionan tales metadatos de mezcla. Para obtener más detalles, consulte "ETSI TS 12 366 v1.2.1 (28-8): Estándar de compresión de audio digital 5 (AC-3, AC-3 mejorado)", el cual describe E-AC-3 (Dolby Digital Plus); o consulte "ETSI TS 11 154 V1.9.1 (29-9): Difusión de video digital (Digital Video Broadcasting) (DVB); especificación para el uso de codificación de audio y vídeo en las aplicaciones de difusión basada en la trama de transporte MPEG-2", que describe el Codificador avanzado de audio de alta eficiencia (HE-AAC). Ambos incorporados por la presente en su totalidad como referencia.

No obstante, un usuario puede desear divergir de los ajustes proporcionados por el productor, los cuales son dictados por los metadatos transmitidos junto con la señal asociada. Por ejemplo, un usuario que activa los comentarios del director mientras ve una película puede en algún momento durante la reproducción decidir que preferiría oír el diálogo original que el productor puede haber indicado en los metadatos que se atenúe en la mezcla

con el fin de que no se anteponga a los comentarios del director.

De este modo, existe una necesidad de proporcionar un ajuste que permita al usuario ajustar la mezcla de las señales de audio de entrada a la vez que se proporciona también una experiencia de usuario agradable y se 5 mantiene también el nivel de sonido percibido de la señal mezclada. Además, existe también una necesidad de proporcionar un ajuste de la mezcla de las señales de audio de entrada a la vez que se mantiene un nivel de sonido percibido consistente para la señal mezclada, incluso si la información de modificación de escala de los metadatos y una entrada de usuario externa pueden cambiar con el tiempo, por lo que no existiría la necesidad de realizar una nivelación adicional en la señal mezclada.

Resumen

El uso de metadatos de mezcla permite al productor de contenido controlar y especificar de forma precisa cómo se deberían combinar las señales durante la reproducción. De este modo, el nivel de sonido o nivel de diálogo de las 15 señales de audio de entrada se puede normalizar antes de mezclar por la información de modificación de escala proporcionada por los metadatos, de tal forma que la escala de cada entrada de señal al mezclador se modifique adecuadamente para lograr un nivel de sonido percibido consistente. De esta forma, el nivel relativo de cada señal de entrada que contribuye a la señal mezclada se controla durante la mezcla por medio de la información de modificación de escala contenida en los metadatos, que se proporciona con la señal. En la práctica, esta técnica 2 usualmente conlleva la identificación de una señal principal y una o varias señales asociadas para que se mezclen. Como sugieren los nombres, la señal principal es la señal estándar y una señal asociada es una señal relacionada de alguna forma con su respectiva señal principal. Por consiguiente, los metadatos proporcionan entonces información de modificación de escala para la señal principal relativa a la señal asociada cuando se mezclan.

Por ejemplo, con frecuencia como una característica especial, un productor puede incluir una pista de voz de "comentarios del director" adicional como una señal asociada junto con una película, donde el usuario puede escuchar los comentarios del director superpuestos en tiempo real en la parte superior de la película. De este modo, el usuario puede ver la película con su audio original y los comentarios del director al mismo tiempo. Durante la reproducción, una señal asociada tal está destinada a mezclarse con la señal de audio principal de la película 3 original, por ejemplo en un dispositivo de usuario final tal como un convertidor y descodificador. No obstante,... [Seguir leyendo]

 


Reivindicaciones:

1.-Un método para la mezcla de dos señales de audio de entrada en una única señal de audio mezclada mientras se mantiene un nivel de sonido percibido de la señal de audio mezclada, comprendiendo el método:

la recepción de una señal de audio de entrada principal;

la recepción de una señal de audio de entrada asociada; donde la señal de audio de entrada asociada se acopla con la señal de audio de entrada principal;

la recepción de los metadatos de mezcla, los cuales contienen información de modificación de escala para la modificación de la escala de la señal de audio de entrada principal y que especifican cómo se deberían mezclar la señal de audio de entrada principal y la señal de audio de entrada asociada, con el fin de generar una señal de audio mezclada en el nivel de sonido percibido; donde la información de modificación de escala a partir de los metadatos 15 de mezcla comprende un factor de escala de metadatos para la señal de audio de entrada principal, para la modificación de la escala de la señal de audio de entrada principal relativa a la señal de audio de entrada asociada;

la recepción de una entrada de balance de mezcla, la cual denota un balance ajustable entre la señal de audio de entrada principal y la señal de audio de entrada asociada, donde la entrada de balance de mezcla comprende 2 información de modificación de escala la cual permite una desviación de una ponderación de la señal de audio de entrada principal y la señal de audio de entrada asociada en la señal de audio mezclada como se especifica en los metadatos de mezcla;

la identificación de una señal dominante como la señal de audio de entrada principal o la señal de audio de entrada 25 asociada a partir de la información de modificación de escala proporcionada por los metadatos de mezcla y a partir de la entrada de balance de mezcla, donde la otra señal de audio de entrada respectiva se identifica entonces como una señal no dominante; y donde la señal dominante se identifica mediante la comparación de la entrada de balance de mezcla con el factor de escala de metadatos para la señal de audio de entrada principal;

la modificación de escala de la señal no dominante en relación con la señal dominante; y

la combinación de la señal no dominante con su escala modificada con la señal dominante para producir la señal de audio mezclada.

2.-El método de la reivindicación 1 comprendiendo además:

la determinación de un factor de escala para la modificación de escala de la señal no dominante basada en la información de modificación de escala a partir de los metadatos de mezcla y basada en la entrada de balance de

mezcla;

donde el factor de escala determinado se utiliza para la modificación de escala de la señal no dominante.

3.-El método de las reivindicaciones 1-2, donde

si el valor de la entrada de balance de mezcla es superior al factor de escala de metadatos para la señal de audio de entrada principal a partir de los metadatos de mezcla, entonces la señal de audio de entrada asociada se determinará como la señal dominante; de lo contrario, la señal de audio de entrada principal se determinará como la señal dominante.

4.-El método de cualquiera de las reivindicaciones 1-3, donde si la señal de audio de entrada asociada se identifica como la señal dominante, el método comprenderá además:

el cálculo del factor de escala para la señal de audio de entrada principal como el factor de escala de metadatos para la señal de audio de entrada principal a partir de los metadatos de mezcla menos el valor de la entrada de 55 balance de mezcla.

5.-El método de cualquiera de las reivindicaciones 1-3, donde si la señal de audio de entrada principal se identifica como la señal dominante, el método comprenderá además:

el cálculo del factor de escala para la señal de audio de entrada asociada como el valor de la entrada de balance de mezcla menos el factor de escala de metadatos a partir de los metadatos de mezcla para la señal de audio de entrada principal.

6.-EI método de cualquiera de las reivindicaciones 1-5 donde los metadatos de mezcla se contienen en la señal de audio de entrada asociada.

7.- EI método de cualquiera de las reivindicaciones 1-6, donde el nivel de sonido percibido se basa en un nivel ponderado de media de la señal de audio de entrada principal y la señal de audio de entrada asociada.

8.- EI método de cualquiera de las reivindicaciones 1-7, donde la entrada de balance de mezcla comprende una entrada de usuario externa que proporciona un valor de valores negativos a valores positivos.

9.- Un dispositivo para la mezcla de señales que aplica cualquiera de los métodos de mezcla de señales de las 15 reivindicaciones 1-8.

1.- Un medio de almacenamiento legible por un procesador que almacena instrucciones legibles por ordenador para ejecutar el método de cualquiera de las reivindicaciones 1-8.

11.-Un dispositivo para la mezcla de señales de audio de entrada en una única señal de audio mezclada mientras se mantiene un nivel de sonido percibido de la señal de audio mezclada, comprendiendo:

un receptor para recibir una señal de audio de entrada principal, una señal de audio de entrada asociada y metadatos de mezcla; donde la señal de audio de entrada asociada se acopla con la señal de audio de entrada 25 principal; donde los metadatos de mezcla contienen información de modificación de escala para la modificación de la escala de la señal de audio de entrada principal; donde la información de modificación de escala especifica cómo se deberían mezclar la señal de audio de entrada principal y la señal de audio de entrada asociada, con el fin de generar una señal de audio mezclada en el nivel de sonido percibido; donde la información de modificación de escala a partir de los metadatos de mezcla comprende un factor de escala de metadatos para la señal de audio de 3 entrada principal, para la modificación de la escala de la señal de audio de entrada principal relativa a la señal de audio de entrada asociada;

una entrada de balance de mezcla, la cual denota el balance ajustable entre las señales de audio de entrada principal y asociada; donde la entrada de balance de mezcla comprende la información de modificación de escala la 35 cual permite una desviación de una ponderación de la señal de audio de entrada principal y la señal de audio de entrada asociada en la señal de audio mezclada como se especifica en los metadatos de mezcla; y

una unidad de mezcla configurada para identificar una señal dominante como la señal de audio de entrada principal o la señal de audio de entrada asociada a partir de la información de modificación de escala proporcionada por los 4 metadatos de mezcla y a partir de la entrada de balance de mezcla, donde la otra señal de audio de entrada respectiva se identifica entonces como una señal no dominante; y donde la señal dominante se identifica mediante la comparación de la entrada de balance de mezcla con el factor de escala de metadatos para la señal de audio de entrada principal;

donde la unidad de mezcla se configura además para modificar la escala de la señal no dominante en relación con la señal dominante; y para combinar la señal no dominante con su escala modificada con la señal dominante para producir la señal de audio mezclada.

12.- EI dispositivo de la reivindicación 11, donde el factor de escala para la señal no dominante se determina 5 directamente a partir de la información de modificación de escala a partir de los metadatos de mezcla y la entrada de

balance de mezcla; la escala de la señal no dominante se modifica utilizando el factor de escala determinado; y la señal no dominante con su escala modificada se combina con la señal dominante en la señal mezclada.

13.- EI dispositivo de la reivindicación 11 ó 12, donde los metadatos de mezcla se integran con la señal de audio de 55 entrada asociada.

14.- EI dispositivo de cualquiera de las reivindicaciones 11-13, donde la entrada de balance de mezcla comprende además una entrada de usuario externa que proporciona un valor desde valores negativos a valores positivos.

15.-EI dispositivo de cualquiera de las reivindicaciones 11-14, donde el receptor se configura además para recibir señales de audio de entrada principal de multicanal y señales de audio de entrada asociadas y la unidad de mezcla se configura para mezclar las señales de audio de entrada principal de multicanal y las señales de audio de entrada asociadas.