DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.

Método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada,

en el que dichas señales de audio de entrada pueden incluir componentes generadas mediante codificación matricial, que comprende obtener (4) componentes de señal de sonido ambiente a partir de dichas señales de audio de entrada, obtener (2) componentes de señal con decodificación matricial a partir de dichas señales de audio de entrada, y combinar (14, 16) de manera controlable componentes de señal de sonido ambiente y componentes de señal con decodificación matricial para proporcionar dichos canales de audio de sonido envolvente, caracterizado porque dicha combinación de manera controlable incluye aplicar (6, 8, 10, 12) factores de escala de ganancia basándose en la correlación de dichas señales de audio de entrada

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2008/007128.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CALIFORNIA 94103 ESTADOS UNIDOS DE AMERICA.

Inventor/es: VINTON , MARK, STUART, ROBINSON, CHARLES, QUITO, DAVIS, MARK, FRANKLIN.

Fecha de Publicación: .

Fecha Solicitud PCT: 6 de Junio de 2008.

Clasificación Internacional de Patentes:

  • G10L19/00M
  • H04S1/00D

Clasificación PCT:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04S3/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2358786_T3.pdf

 

Ilustración 1 de DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.
Ilustración 2 de DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.
Ilustración 3 de DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.
Ilustración 4 de DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.
Ilustración 5 de DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.
DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL.

Fragmento de la descripción:

Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.

Campo técnico

La invención se refiere al procesamiento de señales de audio. Más particularmente, se refiere a la obtención de componentes de señal de sonido ambiente a partir de señales de audio fuente, la obtención de componentes de señal con decodificación matricial a partir de las señales de audio fuente, y la combinación de manera controlable de las componentes de señal de sonido ambiente con las componentes de señal con decodificación matricial.

[1] C. Avendano y Jean-Marc Jot, "Frequency Domain Techniques for Stereo to Multichannel Upmix", 22ª conf. Int. de la AES sobre Virtual, Synthetic Entertainment Audio.

[2] E. Zwicker, H. Fastl, "Psycho-acoustics", Segunda Edición, Springer, 1990, Alemania.

[3] B. Crockett, "Improved Transient Pre-Noise Performance of Low Bit Rate Audio Coders Using Time Scaling Synthesis", Artículo nº. 6184, 117ª Conferencia de la AES, San Francisco, Oct. 2004.

[4] Solicitud de patente estadounidense n.º de serie 10/478.538, PCT presentada el 26 de febrero de 2002, publicada como US 2004/0165730 A1 el 26 de agosto de 2004, "Segmenting Audio Signals into Auditory Events", Brett G. Crockett.

[5] A. Seefeldt, M. Vinton, C. Robinson, "New Techniques in Spatial Audio Coding", Artículo nº. 6587, 119ª Conferencia de la AES, New York, Oct 2005.

[6] Solicitud de patente estadounidense n.º de serie 10/474.387, PCT presentada el 12 de febrero de 2002, publicada como US 2004/0122662 A1 el 24 de junio de 2004, "High Quality Time-Scaling and Pitch-Scaling of Audio Signals", Brett Graham Crockett.

[7] Solicitud de patente estadounidense n.º de serie 10/476.347, PCT presentada el 25 de abril de 2002, publicada como US 2004/0133423 A1 el 8 de julio de 2004, "Transient Performance of Low Bit Rate Audio Coding Systems By Reducing Pre-Noise", Brett Graham Crockett.

[8] Solicitud de patente estadounidense n.º de serie 10/478.397, PCT presentada el 22 de febrero de 2002, publicada como US 2004/0172240 A1 el 8 de julio de 2004, "comparing Audio Using Characterizations Based on Auditory Events", Brett G. Crockett et al.

[9] Solicitud de patente estadounidense n.º de serie 10/478.398, PCT presentada el 25 de febrero de 2002, publicada como US 2004/0148159 A1 el 29 de julio de 2004, "Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events", Brett G. Crockett et al.

[10] Solicitud de patente estadounidense n.º de serie 10/478.398, PCT presentada el 25 de febrero de 2002, publicada como US 2004/0148159 A1 el 29 de julio de 2004, "Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events", Brett G. Crockett et al.

[11] Solicitud de patente estadounidense n.º de serie 10/911,404, PCT presentada el 3 de agosto de 2004, publicada como US 2006/0029239 A1 el 9 de febrero de 2006, "Method for Combining Audio Signals Using Auditory Scene Analysis", Michael John Smithers.

[12] Solicitud internacional publicada según el Tratado de Cooperación en Materia de Patentes, PCT/US2006/020882, fecha de presentación internacional 26 de mayo de 2006, designación de los Estados Unidos, publicada como WO 2006/132857 A2 y A3 el 14 de diciembre de 2006, "Channel Reconfiguration with Side Information", Alan Jeffrey Seefeldt, et al.

[13] Solicitud internacional publicada según el Tratado de Cooperación en Materia de Patentes, PCT/US2006/028874, fecha de presentación internacional 24 de julio de 2006, designación de los Estados Unidos, publicada como WO 2007/016107 A2 el 8 de febrero de 2007, "Controlling Spatial Audio Coding Parameters as a Function of Auditory Events", Alan Jeffrey Seefeldt, et al.

[14] Solicitud internacional publicada según el Tratado de Cooperación en Materia de Patentes, PCT/US2007/004904, fecha de presentación internacional 22 de febrero de 2007, designación de los Estados Unidos, publicada como WO 2007/106234 A1 el 20 de septiembre 2007, "Rendering Center Channel Audio", Mark Stuart Vinton.

[15] Solicitud internacional publicada según el Tratado de Cooperación en Materia de Patentes, PCT/US2007/008313, fecha de presentación internacional 30 de marzo de 2007, designación de los Estados Unidos, publicada como WO 2007/127023 el 8 de noviembre de 2007, "Audio Gain Control Using Specific Loudness-Based Auditory Event Detection", Brett G. Crockett, et al.

Técnica anterior

La creación de material de audio multicanal a partir de o bien material estereofónico de dos canales con codificación matricial convencional (en el que los canales a menudo se designan como "Lt" y "Rt") o bien material estereofónico de dos canales sin codificación matricial (en el que los canales a menudo se designan como "Lo" y "Ro") se mejora mediante la derivación de canales envolventes. Sin embargo, el papel de los canales envolventes para cada tipo de señal (material con codificación matricial y sin codificación matricial) es bastante diferente. Para el material sin codificación matricial, usar los canales envolventes para resaltar el ambiente del material original a menudo produce resultados agradables para el oído. Sin embargo, para el material con codificación matricial es deseable recrear o aproximar las imágenes de sonido panorámico de los canales envolventes originales. Además, es deseable proporcionar una disposición que procese automáticamente los canales envolventes de la forma más apropiada, independientemente del tipo de entrada (o bien con codificación matricial o bien sin codificación matricial), sin necesidad de que el oyente seleccione un modo de decodificación.

En la actualidad, existen muchas técnicas para el mezclado ascendente de dos canales a múltiples canales. Tales técnicas varían desde decodificadores matriciales pasivos o fijos sencillos hasta decodificadores matriciales activos así como técnicas de extracción de sonido ambiente para derivación de canal envolvente. Más recientemente, las técnicas de extracción de sonido ambiente en el dominio de frecuencia para derivar los canales envolventes (véase, por ejemplo, la referencia 1) han demostrado ser prometedoras para crear experiencias de multicanal placenteras. Sin embargo, tales técnicas no vuelven a obtener imágenes de canal envolvente a partir de material con codificación matricial (LtRt) porque están diseñadas principalmente para material sin codificación matricial (LoRo). Alternativamente, los decodificadores matriciales pasivos y activos realizan razonablemente un buen trabajo de aislamiento de imágenes panorámicas envolventes para el material con codificación matricial. Sin embargo, las técnicas de extracción de sonido ambiente proporcionan un rendimiento mejor para material sin codificación material de lo que lo hace la decodificación matricial.

Con la generación actual de mezcladores ascendentes a menudo se requiere que el oyente cambie el sistema de mezclado ascendente para seleccionar el que mejor se ajusta al material de audio de entrada. Por tanto, un objeto de la presente invención es crear señales de canal envolvente que sean agradables para el oído tanto para material con codificación matricial como sin codificación matricial sin que se requiera que un usuario cambie entre modos de decodificación de la operación.

Descripción de la invención

C. Faller, "Matrix Surround Revisited", 30ª conferencia internacional de la AES, marzo de 2007, da a conocer un método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada, en el que las señales de audio de entrada pueden incluir componentes generadas mediante codificación matricial, que comprende obtener componentes de señal de sonido ambiente a partir de las señales de audio de entrada, obtener componentes de señal con decodificación matricial a partir de las señales de audio de entrada, y combinar de manera controlable componentes de señal de sonido ambiente y componentes de señal con decodificación matricial para proporcionar los canales de audio de sonido envolvente. Según la presente invención, según la reivindicación 1, este método se caracteriza porque dicha combinación de manera controlable incluye aplicar factores de escala de ganancia basándose en la correlación de dichas señales de audio de entrada.

Según aspectos de la presente... [Seguir leyendo]

 


Reivindicaciones:

1. Método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada, en el que dichas señales de audio de entrada pueden incluir componentes generadas mediante codificación matricial, que comprende

obtener (4) componentes de señal de sonido ambiente a partir de dichas señales de audio de entrada,

obtener (2) componentes de señal con decodificación matricial a partir de dichas señales de audio de entrada, y combinar (14, 16) de manera controlable componentes de señal de sonido ambiente y componentes de señal con decodificación matricial para proporcionar dichos canales de audio de sonido envolvente, caracterizado porque dicha combinación de manera controlable incluye aplicar (6, 8, 10, 12) factores de escala de ganancia basándose en la correlación de dichas señales de audio de entrada.

2. Método según la reivindicación 1, en el que la obtención de componentes de señal de sonido ambiente incluye aplicar un factor de escala de ganancia de componente de señal de sonido ambiente que cambia dinámicamente a una señal de audio de entrada y en el que dichos factores de escala de ganancia incluyen el factor de escala de ganancia de componente de señal de sonido ambiente que cambia dinámicamente aplicado en la obtención de componentes de señal de sonido ambiente.

3. Método según la reivindicación 2, en el que la obtención de componentes de señal con decodificación matricial incluye aplicar una decodificación matricial a dichas señales de audio de entrada, decodificación matricial que está adaptada para proporcionar señales de audio primera y segunda asociadas cada una con una dirección de sonido envolvente trasera y en el que dichos factores de escala de ganancia incluyen además un factor de escala de ganancia de componente de señal con codificación matricial que cambia dinámicamente aplicado a cada una de las señales de audio primera y segunda asociadas con una dirección de sonido envolvente trasera.

4. Método según la reivindicación 3, en el que dicho factor de escala de ganancia de componente de señal con codificación matricial es una función de una medida de correlación cruzada de dichas señales de audio de entrada.

5. Método según la reivindicación 4, en el que el factor de escala de ganancia de componente de señal con codificación matricial que cambia dinámicamente aumenta a medida que aumenta el grado de correlación cruzada y disminuye a medida que disminuye el grado de correlación cruzada.

6. Método según una cualquiera de las reivindicaciones 3 a 5, en el que dichos factores de escala de ganancia incluyen además un factor de escala de ganancia de canales de audio de sonido envolvente que cambia dinámicamente para controlar adicionalmente la ganancia de los canales de audio de sonido envolvente.

7. Método según la reivindicación 6, en el que el factor de escala de ganancia de los canales de audio de sonido envolvente es una función de una medida de correlación cruzada de dichas señales de audio de entrada.

8. Método según la reivindicación 7, en el que el método se lleva a cabo en el dominio tiempo-frecuencia o en el que el método se lleva a cabo en una o más bandas de frecuencia en el dominio tiempo-frecuencia.

9. Método según la reivindicación 2, en el que dicho factor de escala de ganancia de componente de señal de sonido ambiente es una función de una medida de correlación cruzada de dichas señales de audio de entrada.

10. Método según la reivindicación 9, en el que dicha medida de correlación cruzada se alisa temporalmente, o en el que la medida de correlación cruzada se alisa temporalmente empleando un integrador con pérdidas dependiente de la señal, o en el que la medida de correlación cruzada se alisa temporalmente empleando una media móvil.

11. Método según la reivindicación 10, en el que el alisado temporal es adaptativo en cuanto a la señal.

12. Método según una cualquiera de las reivindicaciones 1 a 11, en el que la obtención de componentes de señal de sonido ambiente incluye aplicar al menos una secuencia de filtro de decorrelación.

13. Método según la reivindicación 12, en el que se aplica la misma secuencia de filtro de decorrelación a cada una de dichas señales de audio de entrada, o en el que se aplica una secuencia de filtro de decorrelación diferente a cada una de dichas señales de audio de entrada.

14. Aparato adaptado para llevar a cabo los métodos según una cualquiera de las reivindicaciones 1 a 13.

15. Programa informático, almacenado en un medio legible por ordenador, para hacer que un ordenador lleve a cabo los métodos según una cualquiera de las reivindicaciones 1 a 13.


 

Patentes similares o relacionadas:

MÉTODO, DISPOSITIVO, APARATO CODIFICADOR, APARATO DECODIFICADOR Y SISTEMA DE AUDIO, del 8 de Febrero de 2012, de Koninklijke Philips Electronics N.V. Dolby International AB: Método de procesamiento de una señal de mezcla descendente estéreo que comprende señales estéreo primera y segunda (L0, R0), codificando la señal de mezcla […]

SISTEMA Y PROCEDIMIENTO PARA LA TRANSMISIÓN INALÁMBRICA DE SEÑALES DE AUDIO DIGITALES, del 20 de Diciembre de 2011, de GRUNDIG MULTIMEDIA B.V.: Sistema para la transmisión inalámbrica de señales de audio digitales con una unidad central , con un dispositivo para la selección […]

Imagen de 'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA…'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA APLICACIONES DE BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 19 de Agosto de 2010, de CODING TECHNOLOGIES SWEDEN AB: Método para codificar una envolvente espectral de potencia de una señal de audio estereofónica o de una señal de audio multicanal que tiene dos canales, teniendo […]

PROCEDIMIENTO Y APARATO PARA EL REALZADO DEL ESTEREO EN GRABACIONES DE AUDIO, del 23 de Junio de 2010, de UNIVERSIDAD POLITECNICA DE VALENCIA: Procedimiento y aparato para el realzado del estéreo en grabaciones de audio. La presente invención se enmarca dentro del campo de sistemas de procesado digital de la señal […]

Imagen de 'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA, del 13 de Mayo de 2010, de CODING TECHNOLOGIES AB: Unidad de reverberación para generar un primer canal y un segundo canal de una señal estereofónica o una señal multicanal, que comprende: un detector para detectar terminaciones […]

Imagen de 'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AJUSTABLE A ESCALA…'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AJUSTABLE A ESCALA PARA APLICACIONES DE CODIFICACION DE AUDIO A BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 18 de Febrero de 2010, de DOLBY SWEDEN AB: Método para decodificar una envolvente espectral de potencia codificada de una señal estereofónica o una señal multicanal que tiene dos canales, teniendo los dos canales un […]

Imagen de 'PROCEDIMIENTO Y DISPOSITIVO DE ESPACIALIZACION SONORA BINAURAL…'PROCEDIMIENTO Y DISPOSITIVO DE ESPACIALIZACION SONORA BINAURAL EFICAZ EN EL DOMINIO TRANSFORMADO, del 7 de Diciembre de 2009, de FRANCE TELECOM: Procedimiento de espacialización sonora de una escena de audio que comprende un primer conjunto que comprende un número, superior o igual a la unidad, […]

PROCEDIMIENTO Y APARATO PARA CODIFICAR Y DECODIFICAR SEÑALES DIGITALES, del 13 de Enero de 2012, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento de codificación de señales digitales compuestas de al menos dos canales, comprendiendo el procedimiento: dividir las señales digitales […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .