Aparato para determinar una se;al de audio multicanal de salida espacial.

Aparato (100) para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada,

que comprende:

un descomponedor (110) semántico configurado para descomponer la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano;

un transformador (120) configurado para transformar la parte de señal de primer plano usando la panorámica de amplitud como primera característica de transformación para obtener una primera señal transformada que tiene la primera propiedad semántica, comprendiendo el transformador (120) una fase (221, 340) de panorámica de amplitud para procesar la parte de señal de primer plano, en la que se proporciona ruido (350) de paso bajo generado localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano; y

para transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta como segunda característica de transformación para obtener una segunda señal transformada que tiene la segunda propiedad semántica; y

un procesador (130, 330) configurado para procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio multicanal de salida espacial.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/005828.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: DISCH,SASCHA, PULKKI,Ville, LAITINEN,Mikko-Ville, ERKUT,CUMHUR.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H04S7/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2392609_T3.pdf

 


Fragmento de la descripción:

Aparato para determinar una señal de audio multicanal de salida espacial

La presente invención pertenece al campo del procesamiento de audio, especialmente el procesamiento de propiedades de audio espaciales.

El procesamiento y/o la codificación de audio han avanzado de muchas maneras. Cada vez se genera más demanda para aplicaciones de audio espaciales. En muchas aplicaciones el procesamiento de señales de audio se utiliza para decorrelacionar o transformar señales. Tales aplicaciones pueden llevar a cabo, por ejemplo, un mezclado en sentido ascendente de mono a estéreo, un mezclado de mono/estéreo a multicanal, reverberación artificial, ampliación de estéreo o mezclado/transformación interactivo de usuario.

Para determinadas clases de señales como por ejemplo señales similares a ruido, como por ejemplo señales similares a aplausos, los métodos y sistemas convencionales se ven afectados por o bien una calidad de percepción insatisfactoria

o bien, si se usa un enfoque orientado al objeto, una elevada complejidad computacional debido al número de eventos auditivos que deben modelizarse o procesarse. Otros ejemplos de material de audio, que es problemático, son generalmente material de ambiente tal como, por ejemplo, el ruido que se emite por una bandada de pájaros, una orilla del mar, caballos galopando, una división de soldados marchando, etc.

Los conceptos convencionales usan, por ejemplo, codificación de estéreo paramétrica o de sonido envolvente MPEG (MPEG = Moving Pictures Expert Group, Grupo de expertos de imágenes en movimiento) . La figura 6 muestra una aplicación típica de un decorrelacionador en una mezcladora en sentido ascendente de mono a estéreo. La figura 6 muestra una señal de entrada mono proporcionada a un decorrelacionador 610, que proporciona una señal de entrada decorrelacionada en su salida. La señal de entrada original se proporciona a una matriz 620 de mezclado en sentido ascendente junto con la señal decorrelacionada. Dependiendo de parámetros 630 de control de mezclado en sentido ascendente, se transforma en una señal de salida estéreo. El decorrelacionador 610 de señales genera una señal D decorrelacionada alimentada a la fase 620 de formación de matriz junto con la señal M mono sin modificar. Dentro de la matriz 620 de mezclado, los canales estéreo L (L = canal estéreo izquierdo) y R (R = canal estéreo derecho) están formados según una matriz H de mezclado. Los coeficientes en la matriz H pueden fijarse de manera dependiente de la señal o controlarse por un usuario.

Alternativamente, la matriz puede controlarse mediante información complementaria, transmitida junto con la mezcla en sentido descendente, que contiene una descripción paramétrica de cómo mezclar en sentido ascendente las señales de la mezcla en sentido descendente para formar la salida multicanal deseada. Esta información complementaria espacial se genera habitualmente mediante un codificador de señales antes del proceso de mezclado en sentido ascendente.

Esto se realiza normalmente en la codificación de audio espacial paramétrica como, por ejemplo, en estéreo paramétrico, véase J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates” en 116ª Convención de AES, Berlín, preimpresión 6072, mayo de 2004 y en sonido envolvente MPEG, véase J. Herre, K. Kjörling, J. Breebaart, et al., “MPEG Surround -the ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding” en Procedimientos de la 122ª Convención de AES, Viena, Austria, mayo de 2007. Una estructura típica de un decodificador estéreo paramétrico se muestra en la figura 7. En este ejemplo, el proceso de decorrelación se realiza en un dominio de transformada, que está indicado por el banco 710 de filtros de análisis, que transforma una señal mono de entrada en el dominio de transformada como, por ejemplo, el dominio de frecuencia en cuanto a un número de bandas de frecuencia.

En el dominio de frecuencia, el decorrelacionador 720 genera la señal decorrelacionada correspondiente, que debe mezclarse en sentido ascendente en la matriz 730 de mezclado en sentido ascendente. La matriz 730 de mezclado en sentido ascendente considera parámetros de mezclado en sentido ascendente, que se proporcionan mediante la caja 740 de modificación de parámetros, a la que se le proporcionan parámetros de entrada espaciales y que está acoplada a una fase 750 de control de parámetros. En el ejemplo mostrado en la figura 7, los parámetros espaciales pueden modificarse por un usuario o mediante herramientas adicionales tales como, por ejemplo, postprocesamiento para transformación/presentación binaural. En este caso, los parámetros de mezclado en sentido ascendente pueden fusionarse con los parámetros procedentes de los filtros binaurales para formar los parámetros de entrada para la matriz 730 de mezclado en sentido ascendente. La medición de los parámetros puede llevarse a cabo mediante el bloque 740 de modificación de parámetros. La salida de la matriz 730 de mezclado en sentido ascendente se proporciona entonces a un banco 760 de filtros de síntesis, que determina la señal de salida estéreo.

Como se describió anteriormente, la salida L/R de la matriz H de mezclado puede calcularse a partir de la señal M de salida mono y la señal D decorrelacionada, por ejemplo según

En la matriz de mezclado, la cantidad de sonido decorrelacionado alimentado a la salida puede controlarse basándose en los parámetros transmitidos tales como, por ejemplo, configuraciones de ICC (ICC = Interchannel Correlation, correlación intercanal) y/o mixtas o definidas por el usuario.

Otro enfoque convencional se establece mediante el método de permutación temporal. Una propuesta dedicada sobre la decorrelación de señales similares a aplausos puede encontrarse, por ejemplo, en Gerard Hotho, Steven van de Par, Jeroen Breebaart, “Multichannel Coding of Applause Signals, ” en EURASIP Journal on Advances in Signal Processing, vol. 1, art. 10, 2008. En este caso, una señal de audio monofónica se segmenta en segmentos de tiempo solapantes, que se permitan temporalmente de manera pseudoaleatoria dentro de un “superbloque” para formar los canales de salida decorrelacionados. Las permutaciones son independientes entre sí para un número n de canales de salida.

Otro enfoque es el intercambio de canal alternante de copia original y retardada con el fin de obtener una señal decorrelacionada, véase la solicitud de patente alemana 102007018032.4-55.

En algunos sistemas orientados al objeto conceptuales convencionales, por ejemplo en Wagner, Andreas; Walther, Andreas; Melchoir, Frank; Strauß, Michael; “Generation of Highly Immersive Atmospheres for Wave Field Synthesis Reproduction” en la 116ª Convención internacional de EAS, Berlín, 2004, se describe cómo crear una escena inmersiva a partir de muchos objetos tales como por ejemplo palmadas individuales, mediante la aplicación una síntesis de campo de ondas.

Aún otro enfoque es la denominada “codificación de audio direccional” (DirAC = Directional Audio Coding) , que es un método para la representación de sonido espacial, aplicable para diferentes sistemas de reproducción de sonido, véase Pulkki, Ville, “Spatial Sound Reproduction with Directional Audio Coding” en J. Audio Eng. Soc., vol. 55, n.º 6, 2007. En la parte de análisis, la difusividad y la dirección de llegada del sonido se estiman en una única ubicación dependiendo del tiempo y de la frecuencia. En la parte de síntesis, señales de micrófono se dividen en primer lugar en partes no difusas y difusas y entonces se reproducen usando diferentes estrategias.

Los enfoques convencionales tienen varias desventajas. Por ejemplo, el mezclado en sentido ascendente guiado o no guiado de señales de audio que tienen contenido, tal como un aplauso, puede requerir una decorrelación fuerte. Por consiguiente, por un lado, es necesaria una decorrelación fuerte para restaurar la sensación ambiente de estar, por ejemplo, en una sala de conciertos. Por otro lado, los filtros de decorrelación adecuados tales como, por ejemplo, los filtros todo paso, degradan una reproducción de calidad de eventos transitorios, como una única palmada con las manos introduciendo efectos de difuminado temporales tales como ecos previos y posteriores y llamada de filtro. Además, la panorámica espacial de eventos de palmadas individuales debe realizarse en una... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato (100) para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada, que comprende:

un descomponedor (110) semántico configurado para descomponer la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano;

un transformador (120) configurado

para transformar la parte de señal de primer plano usando la panorámica de amplitud como primera característica de transformación para obtener una primera señal transformada que tiene la primera propiedad semántica, comprendiendo el transformador (120) una fase (221, 340) de panorámica de amplitud para procesar la parte de señal de primer plano, en la que se proporciona ruido (350) de paso bajo generado localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano; y

para transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta como segunda característica de transformación para obtener una segunda señal transformada que tiene la segunda propiedad semántica; y

un procesador (130, 330) configurado para procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio multicanal de salida espacial.

2. Aparato (100) según la reivindicación 1, en el que la primera característica de transformación se basa en la primera propiedad semántica y la segunda característica de transformación se basa en la segunda propiedad semántica.

3. Aparato (100) según la reivindicación 1 ó 2, en el que el transformador (120) está adaptado para transformar las señales transformadas primera y segunda que tienen cada una tantos componentes como canales en la señal de audio multicanal de salida espacial y el procesador (130) está adaptado para combinar las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial.

4. Aparato (100) según la reivindicación 1 ó 2, en el que el transformador (120) está adaptado para transformar las señales transformadas primera y segunda que tienen cada una menos componentes que la señal de audio multicanal de salida espacial y en el que el procesador (130) está adaptado para mezclar en sentido ascendente las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial.

5. Aparato (100) según la reivindicación 1, en el que el descomponedor (110) está adaptado para determinar un parámetro de entrada como parámetro de control a partir de la señal de audio de entrada.

6. Aparato (100) según una de las reivindicaciones 1 a 5, en el que el transformador (120) está adaptado para transformar la primera señal descompuesta y la segunda señal descompuesta basándose en diferentes cuadrículas de tiempo.

7. Aparato (100) según una de las reivindicaciones 1 a 8, en el que el descomponedor (110) está adaptado para determinar la primera señal descompuesta y/o la segunda señal descompuesta basándose en un método de separación transitoria.

8. Aparato (100) según la reivindicación 7, en el que el descomponedor (110) está adaptado para determinar una de la primera señal descompuesta o la segunda señal descompuesta mediante un método de separación transitoria y la otra basándose en la diferencia entre ésta y la señal de audio de entrada.

9. Aparato (100) según una de las reivindicaciones 1 a 8, en el que el descomponedor (110) está adaptado para descomponer la señal de audio de entrada, el transformador (120) está adaptado para transformar las señales descompuestas primera y/o segunda, y/o el procesador (130) está adaptado para procesar las señales transformadas primera y/o segunda en cuanto a diferentes bandas de frecuencia.

10. Aparato según la reivindicación 1, en el que el procesador está configurado para procesar la primera señal transformada, la segunda señal transformada y la parte de señal de segundo plano para obtener la señal de audio multicanal de salida espacial.

11. Método para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada y un parámetro de entrada que comprende las etapas de:

descomponer semánticamente la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer 5 plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano;

transformar la parte de señal de primer plano usando la panorámica de amplitud para obtener una primera señal transformada que tiene la primera propiedad semántica, procesando la parte de señal de primer plano en una fase (221, 340) de panorámica de amplitud, en la que se proporciona ruido (350) de paso bajo generado

localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano;

transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta para obtener una segunda señal transformada que tiene la segunda propiedad semántica; y

procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio 15 multicanal de salida espacial.

12. Programa informático que tiene un código de programa para realizar el método según la reivindicación 11, cuando el código de programa se ejecuta en un ordenador o un procesador.


 

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .