COMBINACION DE SEÑALES DE AUDIO UTILIZANDO ANALISIS DE ESCENA AUDIBLE.

Un proceso para mezclar reduciendo tres canales de entrada de audio a,

y d a dos canales de audio de salida a'' y d'', en el que los tres canales de audio de entrada representan, en orden, direcciones espaciales consecutivas a, ß, y d y los dos canales de salida a'' y d'' representan las direcciones espaciales no consecutivas a y d, comprendiendo

extraer los componentes comunes de la señal de los dos canales de audio de entrada que representan las direcciones a y d para producir tres canales intermedios:

canal a', una modificación del canal a que representa la dirección a, comprendiendo el canal a' los componentes de la señal del canal a de los que los componentes de la señal comunes a los canales de entrada a y d han sido prácticamente eliminados,

canal d', una modificación del canal d que representa la dirección d, comprendiendo el canal d' los componentes de la señal del canal d de los que los componentes de la señal comunes a los canales de entrada a y d han sido prácticamente eliminados, y

canal ß', un canal nuevo que representa la dirección ß, comprendiendo el canal ß' los componentes de la señal comunes a los canales de entrada a y d, combinando el canal intermedio a', el canal intermedio ß', y el canal de entrada ß para producir el canal de salida a'',

combinar el canal intermedio d', y canal intermedio ß', y el canal de entrada ß para producir el canal de salida d'', y

aplicar dinámicamente uno o más ajustes de tiempo, fase, y amplitud o potencia a uno o más de los canales intermedios a', ß' y d' y al canal de entrada ß y/o uno o ambos de los canales de salida combinados a'' y ß'',

en el que uno o más de dichos ajustes están controlados al menos en parte por una medida de los eventos audibles en uno o más canales de los canales de entrada, de los canales intermedios, y/o los canales de salida combinados, un segmento de audio en un canal entre las fronteras consecutivas que constituye un evento audible, y

en el que cada frontera de evento audible se identifica en respuesta a un cambio en el contenido espectral con respecto al tiempo en un canal que excede un valor de consigna de manera que un conjunto de fronteras de evento audible se obtiene para cada canal

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/024630.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE,SAN FRANCISCO CALIFORNIA 94103.

Inventor/es: SMITHERS,MICHAEL,JOHN.

Fecha de Publicación: .

Fecha Concesión Europea: 2 de Junio de 2010.

Clasificación Internacional de Patentes:

  • H04R3/02 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04R ALTAVOCES, MICROFONOS, CABEZAS DE LECTURA PARA GRAMOFONOS O TRANSDUCTORES ACUSTICOS ELECTROMECANICOS ANALOGOS; APARATOS PARA SORDOS; SISTEMAS PARA ANUNCIOS EN PUBLICO (producción de sonidos cuya frecuencia no está determinada por la frecuencia de alimentación G10K). › H04R 3/00 Circuitos para transductores (disposiciones para producir una reverberación sonora o un eco G10K 15/08; amplificadores H03F). › para evitar la reacción acústica.

Clasificación PCT:

  • H04S3/02 H04 […] › H04S SISTEMAS ESTEREOFONICOS.H04S 3/00 Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad). › del tipo matricial, es decir, en los que las señales de entrada son combinadas algebraicamente, p. ej. después de haber sido desfasadas las unas con relación a las otras.
COMBINACION DE SEÑALES DE AUDIO UTILIZANDO ANALISIS DE ESCENA AUDIBLE.

Fragmento de la descripción:

Combinación de señales de audio utilizando análisis de la escena audible.

Campo técnico

La invención presente está relacionada con el cambio del número de canales en una señal de audio multicanal en la que se combinan algunos de los canales de sonido. Las aplicaciones incluyen la presentación de sonido multicanal en cines y vehículos. La invención no solo incluye los métodos sino también las implementaciones en programas de ordenador y las implementaciones en aparatos correspondientes.

Antecedentes técnicos

En las últimas décadas, ha habido un incremento constante en la producción, distribución y reproducción de material de sonido multicanal. Este incremento ha sido impulsado significativamente por la industria del cine en la que los sistemas de reproducción de canales 5.1 son casi universales, y más recientemente, por la industria de la música que está comenzando a producir música multicanal 5.1.

Típicamente, este material de sonido se reproduce a través de un sistema de reproducción que tiene el mismo número de canales que el material. Por ejemplo, una banda sonora de una película de 5.1 canales puede ser proyectada en un cine con 5.1 canales o a través de un sistema de sonido de cine en casa de 5.1 canales. Sin embargo, existe un deseo creciente de reproducir material multicanal en sistemas o en ambientes que no tienen el mismo número de canales de reproducción que el número de canales del material de sonido; por ejemplo, la reproducción de material de 5.1 canales en un vehículo que tiene únicamente dos o cuatro canales de reproducción, o la reproducción de bandas sonoras de películas que tienen más de 5.1 canales en un cine que está equipado únicamente con un sistema de 5.1 canales. En tales situaciones, existe una necesidad de combinar o "remezclar" algunos o todos los canales de la señal multicanal para su reproducción.

La combinación de canales puede producir distorsiones del sonido. Por ejemplo, algunos componentes de la frecuencia se pueden cancelar, mientras otros componentes de frecuencia se refuerzan o aumentan de volumen. Más comúnmente, esto es un resultado de la existencia de componentes de la señal de sonido similares o correlacionados en dos o más de los canales de van a ser combinados.

Es un objeto de esta invención minimizar o suprimir las distorsiones que se producen como resultado de la combinación de canales. Se apreciarán otros objetos a medida que se lea y comprenda este documento.

Se debe hacer notar que la combinación de canales puede ser necesaria para otros propósitos, no solo para la reducción del número de canales. Por ejemplo, puede existir una necesidad de crear un canal de reproducción adicional que sea una combinación de dos o más de los canales originales en la señal multicanal. Esto se puede describir como un tipo de "mezclado" en el que el resultado es un número de canales mayor del original. Así, En el contexto del "remezclado" o "mezclado", la combinación de canales para crear un canal adicional puede conducir a distorsiones audibles.

Las técnicas comunes para minimizar las distorsiones de mezclado o de combinación de canales implican aplicar, por ejemplo, uno o más ajustes de tiempo, fase, y amplitud (o potencia) a los canales que se van a combinar, al canal combinado resultante, o a ambos. Las señales de sonido son intrínsecamente dinámicas; esto es, sus características cambian con el tiempo. Por lo tanto, tales ajustes de la señal de sonido son calculados típicamente y aplicados de una manera dinámica. Cuando se eliminan algunas distorsiones resultantes de la combinación, tal proceso dinámico puede introducir otras distorsiones. Para minimizar tales distorsiones del proceso dinámico, la invención presente emplea el Análisis de la Escena Audible de manera que, en general, los ajustes del proceso dinámico se mantienen prácticamente constantes durante las escenas o eventos audibles y los cambios en dichos ajustes se permiten únicamente en o cerca de las fronteras de la escena o evento audible.

Análisis de la Escena Audible

La división de los sonidos en unidades percibidas separadamente es denominada con frecuencia "análisis de eventos audibles" o "análisis de la escena audible" ("ASA"). Una descripción muy extensa del análisis de la escena audible es estudiada por Albert S. Bregman en su libro Análisis de la Escena Audible - La Organización Percibida del Sonido, Instituto de Tecnología de Massachussets, 1991, cuarta edición, 2001, segunda edición en rústica de la editorial del MIT.

Las técnicas para identificar los eventos audibles (incluyendo las fronteras de los eventos) de acuerdo con los aspectos del análisis de la escena audible se describen en la Solicitud de Patente de los Estados Unidos S.N.10/478,538 de Brett G. Crockett, presentada el 20 de noviembre de 2003, titulada "Segmentando las Señales Audibles en Eventos Audibles" referencia de los procuradores DOL098US, que es la Solicitud Nacional de los Estados Unidos derivada de la Solicitud Internacional PCT/US02/05999, presentada el 2 de febrero de 2002, designando los Estados Unidos, publicada como WO 02/097792 el 5 de diciembre de 2002. Algunas aplicaciones de las técnicas de identificación de los eventos audibles de dicha solicitud de Crockett se establecen en la Solicitud de Patente de los estados Unidos SN10/478,397 de Brett G. Crochett y Michael J. Smithers, presentada el 20 de noviembre de 2003, titulada "Comparando el Sonido Utilizando Caracterizaciones Basadas en Eventos Audibles", registro de los procuradores DOL092US, que es una Solicitud Nacional de los Estados Unidos resultante de la Solicitud Internacional PCT/US02/05329, presentada el 22 de febrero de 2002, designando los estados Unidos, publicada como WO 02/097790 el 5 de diciembre de 2002, y la Solicitud de Patente de los Estados Unidos SN 10/478,398 de Brett G. Crockett y Michael J. Smithers, presentada el 20 de noviembre de 2003, y titulada "Método para Sincronizar Señales Audibles Utilizando Caracterizaciones Basadas en Eventos Audibles", publicada el 29 de julio de 2004 como US2004/0148159 A1, registrada por los procuradores como DOL09201US, que es una Solicitud Nacional de los Estados Unidos resultante de la Solicitud Internacional PCT/US02/05806, presentada el 25 de febrero de 2002, designando los Estados Unidos, publicada como WO02/097791 el 5 de diciembre de 2002.

Aunque las técnicas descritas en dichas solicitudes de Croquet y Crockett/Smithers son particularmente útiles en conexión con aspectos de la presente invención, otras técnicas para identificar eventos audibles y las fronteras de los eventos pueden ser empleadas en los aspectos de la invención presente.

El documento Wo2004/019656 A2 describe un proceso mediante el cual, utilizando una matriz variable M:N, siendo M las señales de audio de entrada, cada una asociada con una dirección, son trasladadas a N señales de audio de salida, cada una asociada con un dirección, en la que N es mayor que M, M es 2 ó más y N es un entero positivo igual a 3 ó más. La matriz variable está controlada en respuesta a medidas de: (1) los niveles relativos de las señales de entrada, y (2) la correlación cruzada de las señales de entrada de manera que un campo de sonido generado por las señales de salida tenga un imagen de sonido compacta en la dirección primaria nominal continua de las señales de entrada cuando las señales de entrada muestran una correlación alta, la imagen se expande de compacta a ancha a medida que la correlación disminuye y progresivamente se divide en múltiples imágenes de sonido compactas, cada una en una dirección asociada con una señal de entrada, a medida que la correlación continua disminuyendo hasta una muy poco correlación. En este proceso conocido se utilizan módulos decodificadores, que reciben cada uno dos ó más de las señales de entrada y proporcionan una ó más señales de salida. El documento no describe tales módulos decodificadores que reciben tres señales de entrada que representan, en orden, direcciones espaciales consecutivas, y proporcionan dos señales de salida que representan las dos no consecutivas de estas tres direcciones espaciales.

El documento US 6,487,535 B1 describe un codificador de audio de sub-banda que emplea filtros de reconstrucción perfectos/no perfectos, codificación de sub-banda predictiva/no predictiva, análisis de transitorios, y localización de bit en el tiempo psico-acústico/error de la desviación cuadrática mínima (mmse), frecuencia y los canales de audio múltiples para codificar/decodificar una cadena de datos para generar audio reconstruido de alta fidelidad. Las ventanas de...

 


Reivindicaciones:

1. Un proceso para mezclar reduciendo tres canales de entrada de audio a, y d a dos canales de audio de salida a'' y d'', en el que los tres canales de audio de entrada representan, en orden, direcciones espaciales consecutivas a, ß, y d y los dos canales de salida a'' y d'' representan las direcciones espaciales no consecutivas a y d, comprendiendo

extraer los componentes comunes de la señal de los dos canales de audio de entrada que representan las direcciones a y d para producir tres canales intermedios:

canal a', una modificación del canal a que representa la dirección a, comprendiendo el canal a' los componentes de la señal del canal a de los que los componentes de la señal comunes a los canales de entrada a y d han sido prácticamente eliminados,

canal d', una modificación del canal d que representa la dirección d, comprendiendo el canal d' los componentes de la señal del canal d de los que los componentes de la señal comunes a los canales de entrada a y d han sido prácticamente eliminados, y

canal ß', un canal nuevo que representa la dirección ß, comprendiendo el canal ß' los componentes de la señal comunes a los canales de entrada a y d, combinando el canal intermedio a', el canal intermedio ß', y el canal de entrada ß para producir el canal de salida a'',

combinar el canal intermedio d', y canal intermedio ß', y el canal de entrada ß para producir el canal de salida d'', y

aplicar dinámicamente uno o más ajustes de tiempo, fase, y amplitud o potencia a uno o más de los canales intermedios a', ß' y d' y al canal de entrada ß y/o uno o ambos de los canales de salida combinados a'' y ß'',

en el que uno o más de dichos ajustes están controlados al menos en parte por una medida de los eventos audibles en uno o más canales de los canales de entrada, de los canales intermedios, y/o los canales de salida combinados, un segmento de audio en un canal entre las fronteras consecutivas que constituye un evento audible, y

en el que cada frontera de evento audible se identifica en respuesta a un cambio en el contenido espectral con respecto al tiempo en un canal que excede un valor de consigna de manera que un conjunto de fronteras de evento audible se obtiene para cada canal.

2. Un proceso de acuerdo con la reivindicación 1 y el que las direcciones espaciales consecutivas a, ß y d son uno de los conjuntos de direcciones:

izquierda, centro y derecha

izquierda, centro izquierda, y centro

centro, centro derecha y derecha

centro, centro derecha y derecha

derecha, derecha media y derecha surround

derecha surround, central posterior e izquierda surronund, y

izquierda surround, izquierda media e izquierda.

3. Un proceso de acuerdo con cualquiera de las reivindicaciones 1 o reivindicación 2 en el que dichos ajustes están controlados de manera que permanezcan esencialmente constantes durante los eventos audibles y para permitir cambios en las proximidades o en las fronteras de los eventos.

4. Un proceso de acuerdo con la reivindicación 3 en el que la identificación de las fronteras de los eventos audibles en un canal incluye dividir la señal de audio en bloques de tiempo, convertir los datos en cada bloque al dominio de la frecuencia, y comparar el espectro de frecuencia normalizado para un bloque actual al espectro de frecuencia normalizado para el bloque inmediatamente precedente.

5. Un proceso de acuerdo con la reivindicación 4 en el que una medida de la diferencia única es calculada sumando los valores absolutos de la diferencia de los valores espectrales correspondientes expresados de forma logarítmica de los espectros de los bloques actual e inmediatamente precedente y comparar la medida única de la diferencia con un valor de consigna.

6. Un proceso de acuerdo con la reivindicación 5 en el que la frontera de un evento audible se identifica cuando la magnitud de la suma excede dicho valor de consigna.

7. Un aparato adaptado para ejecutar el método de cualquiera de las reivindicaciones 1 a la 6.

8. Un programa de ordenador, almacenado en un medio legible por una computadora para hacer que una computadora ejecute el método de cualquiera de las reivindicaciones 1 a 6.


 

Patentes similares o relacionadas:

PROCESADO DE SEÑALES DE AUDIO., del 16 de Julio de 2005, de STARKEY LABORATORIES, INC.: Un procedimiento para procesar señales de audio que comprende: el procesado de una señal de audio de entrada con una o más componentes de realimentación […]

PROCEDIMIENTO Y APARATO PARA REDUCIR LA RETROALIMENTACION INDESEADA., del 16 de Febrero de 2003, de BRITISH BROADCASTING CORPORATION: LA REALIMENTACION PRODUCIDA ENTRE LA SALIDA Y LA ENTRADA DE UNA TRAYECTORIA DE AMPLIFICACION SE REDUCE PROPORCIONANDO UN RELE EN […]

PROCEDIMIENTO Y DISPOSITIVO PARA EL FUNCIONAMIENTO DE SISTEMAS ASISTIDOS POR VOZ EN AUTOMOVILES., del 1 de Noviembre de 2002, de VOLKSWAGEN AKTIENGESELLSCHAFT: Procedimiento para el funcionamiento de sistemas asistidos por voz, como dispositivos de comunicación y/o dispositivos de intercomunicación en automóviles, en el que se […]

PROCEDIMIENTO PARA EL EFECTO ANTILOCAL ACUSTICO DE INSTALACIONES ELECTROACUSTICAS, del 16 de Abril de 1999, de ALCATEL ALSTHOM COMPAGNIE GENERALE D'ELECTRICITE: EN UN TELEFONO CON UN DISPOSITIVO DE VIVA VOZ Y CONTROL DE COMPANDER SE AJUSTA EL EFECTO ANTILOCAL PRODUCIDO LATERALMENTE CORRESPONDIENTE […]

DISPOSITIVO MULTICAPTADORES DE TOMA DE SONIDO Y DE TRATAMIENTO DE LA SEÑAL ASOCIADA, del 16 de Junio de 1998, de FRANCE TELECOM: EL DISPOSITIVO DE TOMA DE SONIDO INCLUYE VARIOS CAPTADORES FIJOS (10 1, .. 10 N, ...10 N) EN UN AMBIENTE DONDE REINA UN RUIDO QUE PROVIENE DE UNO O VARIOS […]

CIRCUITO PARA INSTALACIONES ELECTROACUSTICAS, del 16 de Marzo de 1998, de ALCATEL ALSTHOM COMPAGNIE GENERALE D'ELECTRICITE: EN UN CIRCUITO CON MEDIOS PARA LA SUPRESION DE ECOS POR CONTROL DE LA ATENUACION DE RETORNO PARA INSTALACIONES ELECTROACUSTICAS, EN ESPECIAL PARA UN EQUIPO 1 […]

SISTEMA DE REPRODUCCION DE SONIDO PROGRAMABLE., del 16 de Diciembre de 1993, de AUDIMAX CORPORATION: EN UN SISTEMA DE APOYO PARA LA ESCUCHA, LOS VALORES DE LOS PARAMETROS OPTIMOS SELECCIONADOS SE PROGRAMAN EN UNA MEMORIA PROGRAMABLE DE SOLO LECTURA, ELECTRONICAMENTE […]

Imagen de 'PROCEDIMIENTO EN TIEMPO REAL DE TRATAMIENTO Y DE GESTION PARA…'PROCEDIMIENTO EN TIEMPO REAL DE TRATAMIENTO Y DE GESTION PARA LA ANULACION DEL ECO ENTRE UN ALTOPARLANTE Y UN MICROFONO DE UNA TERMINAL INFORMATICA, del 16 de Agosto de 2007, de FRANCE TELECOM: Procedimiento en tiempo real de tratamiento y de gestión para la anulación del eco entre un altoparlante (HP) y un micrófono (M) de una terminal […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .