RESOLUCIÓN ESPACIAL MEJORADA DEL CAMPO SONORO PARA SISTEMAS DE REPRODUCCIÓN DE AUDIO MULTICANAL MEDIANTE DERIVACIÓN DE SEÑALES CON TÉRMINOS ANGULARES DE ORDEN SUPERIOR.
Un método para aumentar la resolución espacial de señales de audio que representan un campo sonoro,
comprendiendo el método: recibir tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y de primer orden; analizar las tres o más señales de audio de entrada para derivar características estadísticas del campo sonoro expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro; derivar dos o más señales procesadas de combinaciones ponderadas de las tres o más señales de audio de entrada en el que las tres o más señales de audio son ponderadas según las características estadísticas, en el que las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más ordenes mayores que uno; proporcionar cinco o más señales de audio de salida que representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno, en el que las cinco o más señales de audio de salida comprenden las tres o más señales de audio de entrada y las dos o más señales procesadas
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/020284.
Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.
Inventor/es: MCGRATH,David Stanley.
Fecha de Publicación: .
Fecha Solicitud PCT: 19 de Septiembre de 2007.
Clasificación Internacional de Patentes:
- H04S3/02 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › H04S 3/00 Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad). › del tipo matricial, es decir, en los que las señales de entrada son combinadas algebraicamente, p. ej. después de haber sido desfasadas las unas con relación a las otras.
Clasificación PCT:
- H04S3/02 H04S 3/00 […] › del tipo matricial, es decir, en los que las señales de entrada son combinadas algebraicamente, p. ej. después de haber sido desfasadas las unas con relación a las otras.
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.
PDF original: ES-2359752_T3.pdf
Ver la galería de la patente con 10 ilustraciones.
Fragmento de la descripción:
CAMPO TÉCNICO
La presente invención incumbe generalmente a audio e incumbe más específicamente a dispositivos y técnicas que pueden ser usados para mejorar la resolución espacial percibida de una reproducción de una señal de audio de resolución espacial baja mediante un sistema de reproducción de audio multicanal.
TÉCNICA ANTECEDENTE
Los sistemas de reproducción de audio multicanal ofrecen el potencial para recrear exactamente la sensación auditiva de un suceso acústico tal como una interpretación musical o un acontecimiento deportivo aprovechando las capacidades de altavoces múltiples que rodean a un oyente. Idealmente, el sistema de reproducción genera un campo sonoro multidimensional que recrea la sensación de dirección aparente de sonidos así como reverberación difusa que se espera acompañe a tal suceso acústico.
En un acontecimiento deportivo, por ejemplo, un espectador espera normalmente que los sonidos direccionales procedentes de los jugadores en un campo de juego sean acompañados por sonidos envolventes procedentes de otros espectadores. Una recreación exacta de las sensaciones auditivas en el acontecimiento no pude ser conseguida sin este sonido envolvente. De modo similar, las sensaciones auditivas en un concierto dentro de una sala no pueden ser recreadas exactamente sin recrear los efectos de reverberación de la sala de conciertos.
El realismo de las sensaciones recreadas por un sistema de reproducción es afectado por la resolución espacial de la señal reproducida. La exactitud de la recreación aumenta generalmente cuando aumenta la resolución espacial. Los sistemas de reproducción de audio comerciales y para consumidores emplean frecuentemente números mayores de altavoces pero, desgraciadamente, las señales de audio que reproducen pueden tener una resolución espacial relativamente baja. Muchas señales de audio difundidas y grabadas tienen una resolución espacial menor que la que puede ser deseada. Como resultado, el realismo que puede ser conseguido por un sistema de reproducción puede ser limitado por la resolución espacial de la señal de audio que ha de ser reproducida. Lo que es necesario es un modo de aumentar la resolución espacial de señales de audio.
Los documentos Patente de EE.UU. 5.757.927 y publicación de solicitud de patente internacional nº WO 00/19415 exponen sistemas reproductores Ambisonic que reciben señales de audio de entrada desde micrófonos de orden cero y primer orden. Aunque es conocido que la resolución espacial de un campo sonoro reproducido por estos sistemas puede ser incrementada incluyendo señales que representan el campo sonoro en función de la dirección con términos de orden superior, estos documentos no enseñan cómo derivar términos de orden segundo y superiores de estas señales de audio de entrada.
DESCRIPCIÓN DE LA INVENCIÓN
Un objeto de la presente invención es proveer lo necesario para el aumento de resolución espacial de señales de audio que representan un campo sonoro multidimensional.
Este objeto es conseguido por la invención descrita en esta exposición. Según un aspecto de la presente invención, características estadísticas del campo sonoro, expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro, son derivadas analizando tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y primer orden. Dos o más señales procesadas son derivadas de combinaciones ponderadas de las tres o más señales de audio de entrada. Las tres o más señales de audio son ponderadas en la combinación según las características estadísticas. Las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más órdenes mayores que uno. Las tres o más señales de audio de entrada y las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno.
Las diversas características de la presente invención y sus realizaciones preferidas pueden ser mejor comprendidas refiriéndose a la discusión siguiente y los dibujos adjuntos en los que los números de referencia iguales se refieren a elementos iguales en la diversas figuras. Los contenidos de la discusión siguiente y los dibujos son expuestos como ejemplos solamente y no debería entenderse que representan limitaciones en el alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La Figura 1 es un diagrama esquemático de un suceso acústico captado por un sistema de micrófonos y reproducido subsiguientemente por un sistema de reproducción.
La Figura 2 ilustra un oyente y el acimut aparente de un sonido.
La Figura 3 ilustra una porción de un sistema de reproducción ejemplar que distribuye señales a altavoces para recrear una sensación de dirección.
La Figura 4 es una ilustración gráfica de funciones de ganancia para los canales de dos altavoces adyacente en un sistema de reproducción hipotético.
La Figura 5 es una ilustración gráfica de funciones de ganancia que muestra una degradación en resolución espacial producida por una mezcla de señales de primer orden.
La Figura 6 es una ilustración gráfica de funciones de ganancia que incluyen señales de tercer orden.
Las Figuras 7A a 7D son diagramas de bloques esquemáticos de sistemas de reproducción ejemplares hipotéticos.
Las Figuras 8 y 9 son diagramas de bloques esquemáticos de un procedimiento para derivar términos de orden superior a partir de señales en formato B de tres canales (W, X, Y).
Las Figuras 10 a 12 son diagramas de bloques esquemáticos de circuitos que pueden ser usados para derivar características estadísticas de señales en formato B de tres canales.
La Figura 13 ilustra diagramas de bloques esquemáticos de circuitos que pueden ser usados para generar señales de segundo y tercer orden a partir de características estadísticas de señales en formato B de tres canales.
La Figura 14 es un diagrama de bloques esquemático de un sistema de micrófonos que incorpora diversos aspectos de la presente invención.
Las Figuras 15A y 15B son diagramas esquemáticos de disposiciones alternativas de transductores en un sistema de micrófonos.
La Figura 16 es una ilustración gráfica de funciones de ganancia hipotéticas para canales de altavoces en un sistema de reproducción.
La Figura 17 es un diagrama de bloques esquemático de un dispositivo que puede ser usado para implementar diversos aspectos de la presente invención.
MODOS DE REALIZAR LA INVENCIÓN
A. Introducción
La Figura 1 proporciona una ilustración esquemática de un suceso acústico 10 y un descodificador 17 que incorpora aspectos de la presente invención, que recibe señales de audio 18 que representan sonidos del suceso acústico captados por el sistema 15 de micrófonos. El descodificador 17 procesa las señales recibidas para generar señales procesadas con resolución espacial aumentada. Las señales procesadas son reproducidas por un sistema que incluye un conjunto de altavoces 19 dispuestos próximos a uno o más oyentes 12 para proporcionar una recreación exacta de las sensaciones auditivas que podrían haber sido experimentadas en el suceso acústico. El sistema 15 de micrófonos capta tanto ondas directas 13 de sonido como ondas indirectas 14 de sonido que llegan después de la reflexión en una
o más superficies en algún entorno acústico 16 tal como una habitación o una sala de conciertos.
En una implementación, el sistema 15 de micrófonos proporciona señales de audio que se ajustan al formato Ambisonic de señales de cuatro canales (W, X, Y, Z) conocido como formato B. El sistema de micrófonos SPS422B y el sistema de micrófonos MKV obtenible de SoundField Ltd., Wakefield, Inglaterra, son dos ejemplos que pueden ser usados. Detalles de implementación que usa sistemas de micrófonos SoundField son tratados después. Otros sistemas de micrófonos y formatos de señales pueden ser usados si se desea sin apartarse del alcance de la presente invención.
Las señales en formato B de cuatro canales (W, X, Y, Z) pueden ser obtenidas desde un conjunto de cuatro transductores acústicos coincidentes. Conceptualmente,... [Seguir leyendo]
Reivindicaciones:
1. Un método para aumentar la resolución espacial de señales de audio que representan un campo sonoro, comprendiendo el método:
recibir tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y de primer orden;
analizar las tres o más señales de audio de entrada para derivar características estadísticas del campo sonoro expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro;
derivar dos o más señales procesadas de combinaciones ponderadas de las tres o más señales de audio de entrada en el que las tres o más señales de audio son ponderadas según las características estadísticas, en el que las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más ordenes mayores que uno;
proporcionar cinco o más señales de audio de salida que representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno, en el que las cinco o más señales de audio de salida comprenden las tres o más señales de audio de entrada y las dos o más señales procesadas.
2. El método según la reivindicación 1, en el que las tres o más señales de audio de entrada son recibidas desde una pluralidad de transductores acústicos, teniendo cada uno sensibilidades direccionales con términos angulares de un orden no mayor que el primer orden.
3. El método según la reivindicación 1 o 2, que deriva de las características estadísticas dos o más señales que representan el campo sonoro en función de la dirección angular con términos angulares de segundo orden.
4. El método según la reivindicación 1 o 2, que deriva de las características estadísticas cuatro o más señales procesadas que representan el campo sonoro en función de la dirección angular con términos angulares de segundo orden y tercer orden.
5. El método según la reivindicación 1 o 2, que deriva de las características estadísticas cuatro o más señales procesadas que representan el campo sonoro en función de la dirección angular con términos angulares de dos o más órdenes mayores que uno.
6. El método según una cualquiera de las reivindicaciones 1 a 5, en el que las características estadísticas son derivadas al menos en parte de medias de las tres o más señales de audio de entrada calculadas sobre intervalos de tiempo.
7. El método según una cualquiera de las reivindicaciones 1 a 5, en el que cada una de las señales de audio de entrada es representada por muestras y las características estadísticas son derivadas al menos en parte de una suma de una pluralidad de las muestras para una señal de audio de entrada respectiva.
8. El método según una cualquiera de las reivindicaciones 1 a 5, en el que las características estadísticas son derivadas al menos en parte aplicando un filtro de aplanamiento a valores derivados de las tres o más señales de audio de entrada.
9. El método según una cualquiera de las reivindicaciones 1 a 8, que deriva características estadísticas dependientes de la frecuencia para las tres o más señales de audio de entrada.
10. El método según la reivindicación 9, que comprende:
aplicar una transformada de bloque a las tres o más señales de audio de entrada para generar coeficientes en el dominio de frecuencia; derivar las características estadísticas dependientes de la frecuencia a partir de coeficientes individuales en el dominio de la frecuencia o grupos de coeficientes en el dominio de la frecuencia, y
derivar las dos o más señales procesadas aplicando filtros a las tres o más señales de audio de entrada que tienen respuestas de frecuencia basadas en las características estadísticas dependientes de la frecuencia.
11. El método según la reivindicación 9, que comprende derivar las dos o más señales procesadas aplicando filtros a las tres o más señales de audio de entrada que tienen respuestas de impulsos basadas en las características estadísticas dependientes de la frecuencia.
12. Un aparato (70) para aumentar la resolución espacial de señales de audio que representan un campo sonoro, comprendiendo el aparato medios para realizar el método según una cualquiera de las reivindicaciones 1 a 11.
13. Un soporte (78) de almacenamiento que graba un programa de instrucciones ejecutable por un dispositivo (70), en el que la ejecución del programa de instrucciones causa que el dispositivo realice el método según una cualquiera de las reivindicaciones 1 a 11.
Patentes similares o relacionadas:
Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]
Aparato y procedimiento para la generación de una pluralidad de canales de audio, del 27 de Noviembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para la generación de una pluralidad de canales de audio para una primera instalación de altavoz que […]
Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial, del 20 de Noviembre de 2018, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Decodificador de audio multicanal para procesar una señal de audio de mezcla descendente derivada de una manera compatible con envolvente matricial y para procesar […]
Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia, del 26 de Julio de 2017, de DOLBY INTERNATIONAL AB: Un decodificador de señal de audio MPEG-SAOC para proporcionar una representación de señal de mezcla ascendente (130; 484a a 484M) sobre la base de […]
Método y dispositivo para decodificar una representación de campo sonoro de audio ambisónico para reproducir audio utilizando configuraciones 2D, del 31 de Agosto de 2016, de DOLBY INTERNATIONAL AB: Un método para decodificar una señal de audio codificada en formato ambisónico para L altavoces en posiciones determinadas conocidas, que […]
Renderización de audio multicanal mediante la utilización de matrices interpoladas, del 3 de Agosto de 2016, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para la codificación de un programa de audio de N canales, en el que el programa se especifica durante un intervalo de tiempo, el intervalo […]
Codificación y descodificación de objetos de audio, del 13 de Abril de 2016, de DOLBY INTERNATIONAL AB: Un procedimiento para reconstruir una tesela de tiempo/frecuencia de N objetos de audio, que comprende las etapas de: recibir M señales de mezcla descendente ; […]
Aparato para determinar una señal de audio espacial convertida, del 30 de Julio de 2014, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato adaptado para determinar una señal de audio espacial convertida combinada, presentando la señal de audio espacial convertida combinada al menos una primera componente […]