Procesador de audio espacial y método para proveer parámetros espaciales en base a una señal de entrada acústica.

Procesador audio espacial para suministrar parámetros espaciales (102, φ(k, n), ψ

(k, n)) a partir de una señal de entrada acústica (104), comprendiendo el procesador audio espacial:

un determinador de características de señal (108, 308, 408, 508, 608, 808, 908) configurado para determinar una característica de señal (110, 710, 810) de la señal de entrada acústica (104), donde la señal de entrada acústica (104) comprende al menos una componente direccional; y

un estimador de parámetro controlable (106, 306, 406, 506, 606, 606a, 606b, 806, 906) destinado a calcular los parámetros espaciales (102, φ (k, n), ψ(k, n)) para la señal de entrada acústica (104) en función de una regla de cálculo de parámetro espacial variable;

en el cual el estimador de parámetro controlable (106, 306, 406, 506, 606, 606a, 606b, 806, 906) está configurado para modificar la regla de cálculo de parámetro espacial variable en función de la característica de señal determinada (110, 710, 810).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/053958.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Inventor/es: DEL GALDO,Giovanni, KALLINGER,Markus, PULKKI,Ville, LAITINEN,Mikko-Ville, SCHULTZ-AMLING,Richard, THIERGART,OLIVER, KÜCH,FABIAN, KUNTZ,ACHIM, MAHNE,DIRK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2452557_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Procesador de audio espacial y método para proveer parámetros espaciales en base a una señal de entrada acústica

CAMPO DE TÉCNICO

Las realizaciones de la presente invención crean procesador de audio espacial para proveer parámetros espaciales en base a una señal de entrada acústica. Realizaciones adicionales de la presente invención crean un procedimiento para proveer parámetros espaciales en base a una señal de entrada acústica. Las realizaciones de la presente invención pueden ser concernientes con el campo de análisis acústica, descripción paramétrica y reproducción de sonido espacial, por ejemplo basada en grabaciones de micrófonos.

ANTECEDENTES DE LA INVENCIÓN

La grabación de sonido espacial tiene como objetivo capturar un campo de sonido con múltiples micrófonos, de tal manera que en el sitio de reproducción, el usuario que escucha percibe la imagen de sonido como si estuviera presente en el sitio de grabación. Procedimientos estándar para grabación de sonido espacial usan micrófonos estereofónicos simples o combinaciones más sofisticadas de micrófonos direccionales, por ejemplo tales como micrófonos de formato B usados en Ambisonics. Comúnmente, estos procedimientos son denominados como técnicas de micrófono coincidentes.

Como alternativa, se pueden aplicar procedimientos basados en una representación paramétrica de campos de sonido, que son denominados como procesadores de audio espacial paramétricos. Recientemente, se han propuesto varias técnicas para el análisis, descripción paramétrica y reproducción de audio espacial. Cada sistema tiene ventajas y desventajas únicas con respecto al tipo de la descripción paramétrica, el tipo de las señales requeridas, la dependencia e independencia de un montaje de altavoz específico, etc.

Un ejemplo para una descripción paramétrica eficiente de sonido espacial es dado por Codificación de Audio Direccional (DirAC) (V, Pulkki: Spatial Sound Reproduction with Directional Audio Coding, Journal of the AES, Vol. 55, No. 6, 2007) . DirAC representa un procedimiento al análisis acústico y descripción paramétrica del sonido espacial (análisis de DirAC) , también como su reproducción (síntesis de DirAC) . El análisis de DirAC toma múltiples señales de micrófono como entrada. La descripción de sonido espacial es provista para un numero de sub-bandas de frecuencia en términos de una o varias señales de audio de mezcla descendente e información lateral paramétrica que contiene dirección del sonido y difusividad. El ultimo parámetro describe que tan difuso el campo de sonido grabado esta. Además, la difusividad puede ser usada como una medida de confiabilidad para el valor estimativo de la dirección. Otra aplicación consiste del procesamiento dependiente de la dirección de la señal de audio espacial (M. Kallinger et al.: A Spatial Filtering Approach for Directional Audio Coding, 126th AES Convention, Munich, May 2009) . En base a la representación paramétrica, el audio espacial puede ser reproducido con montajes de altavoces arbitrarios, además, el análisis de DirAC puede ser considerado como un extremo frontal acústico para el sistema de codificación paramétrico que son aptos de codificar, transmitir y reproducir audio espacial de multicanal, por ejemplo surround de MEPG.

Otro procedimiento análisis de campo de sonido espacial es representado por el llamado Micrófono de Audio Espacial (SAM) (C. Faller: Microphone Front-Ends for Spatial Audio Coders, in Proceedings of the AES 125th International Convention, San Francisco, Oct. 2008) . SAM toma las señales de micrófonos direccionales coincidentes como entrada. Similar a DirAC, SAM determina la DOA (DOA-dirección de llegada) del sonido para una descripción paramétrica del campo de sonido, junto con un valor estimativo de los componentes de sonido difusos.

Técnicas paramétricas para la grabación y análisis de audio espacial, tales como DirAC y SAM, dependen de valores estimativos de parámetros de campo de sonido específicos. El desempeño de estos procedimientos son así fuertemente dependientes del desempeño de estimación de los parámetros de pista espacial tales como la dirección de llegada del sonido o la difusividad del campo de sonido.

En general, cuando se estiman parámetros de pista espacial, se pueden hacer suposiciones especificas en cuanto a las señales de entrada acústicas (por ejemplo, en lo estacionario o en la tonalidad) con el fin de emplear el mejor algoritmo (esto es, el más eficiente o más exacto) para el procesamiento de audio. Tradicionalmente, un solo modelo de señal no variante en el tiempo puede ser definido para este propósito. Sin embargo, un problema que surge comúnmente es que diferentes señales de audio pueden exhibir una varianza temporal significativa de tal manera que un modelo invariante en el tiempo general que describe la entrada de audio es frecuentemente inapropiado. En particular, cuando se considera un modelo de señal invariante en el tiempo individual para el procesamiento de audio, se puede presentar desajustes de modelo que degradan el desempeño del algoritmo aplicado.

Es un objetivo de las realizaciones de la presente invención proveer parámetros espaciales para una señal de entrada acústica con desajustes de modelo más bajas provocadas por una varianza temporal o un no estacionario temporal de la señal de entrada acústica.

BREVE DESCRIPCIÓN DE LA INVENCIÓN

Este objetivo es resuelto por un procesador de audio espacial de acuerdo con la reivindicación 1, un procedimiento para proveer parámetros espaciales en base a una señal de entrada acústica de acuerdo con la reivindicación 14 y un programa de computadora de acuerdo con la reivindicación 15.

Realizaciones de la presente invención crean un procesador de audio espacial para proveer parámetros espaciales en base a una señal de entrada acústica. El procesador de audio espacial comprende un determinador de características de señal y un estimador de parámetros controlables. El determinador de características de señal está configurado para determinar una característica de la señal de la señal de entrada acústica. El estimador de parámetros controlable está configurado para calcular los parámetros espaciales para la señal de entrada acústica de acuerdo con una regla de cálculo de parámetros espaciales variable. El estimador de parámetros está configurado además para modificar la regla de cálculo del parámetro espacial variable de acuerdo con la característica de señal determinada.

Es una idea de las realizaciones de la presente invención que un procesador de audio espacial para proveer parámetros espaciales basados en una señal de entrada acústica, que reduce desajustes de modelo provocados por una varianza temporal de la señal de entrada acústica, pueden ser creados cuando una regla de cálculo para calcular el parámetro espacial es modificada en base a una característica de señal de la señal de entrada acústica. Se ha encontrado que los desajustes de modelo pueden ser reducidos cuando una característica de señal de la señal de entrada acústica es determinada y en base a esta característica de señal determinada, los parámetros espaciales para la señal de entrada acústica son calculados.

En otras palabras, las realizaciones de la presente invención pueden manejar el problema de desajustes de modelo provocados por una varianza temporal de la señal de entrada acústica al determinar características (características de señal) de la señales de entrada acústicas, por ejemplo en una etapa de pre procesamiento (en el determinador de característica de señal) y luego identificar el modelo de señal (por ejemplo, una regla de calculo de parámetros espaciales o... [Seguir leyendo]

 


Reivindicaciones:

1. Procesador audio espacial para suministrar parámetros espaciales (102, q (k, n) , ψ (k, n) ) a partir de una señal de entrada acústica (104) , comprendiendo el procesador audio espacial:

un determinador de características de señal (108, 308, 408, 508, 608, 808, 908) configurado para determinar una característica de señal (110, 710, 810) de la señal de entrada acústica (104) , donde la señal de entrada acústica (104) comprende al menos una componente direccional; y

un estimador de parámetro controlable (106, 306, 406, 506, 606, 606a, 606b, 806, 906) destinado a calcular los parámetros espaciales (102, q (k, n) , ψ (k, n) ) para la señal de entrada acústica (104) en función de una regla de cálculo de parámetro espacial variable; en el cual el estimador de parámetro controlable (106, 306, 406, 506, 606, 606a, 606b, 806, 906) está configurado para modificar la regla de cálculo de parámetro espacial variable en función de la característica de señal determinada (110, 710, 810) .

2. Procesador audio espacial según la reivindicación 1, en el cual los parámetros espaciales (102) comprenden una dirección del sonido, y/o un carácter difuso del sonido, y/o una medida estadística de la dirección del sonido.

3. Procesador audio espacial según la reivindicación 1 ó la 2, en el cual el estimador de parámetro controlable (106, 306, 406, 506, 606, 606a, 606b, 806, 906) está configurado para calcular los parámetros espaciales (102, q (k, n) ,

ψ (k, n) ) como parámetros de codificación audio direccional que comprenden un parámetro de carácter difuso (ψ (k,

n) ) para un intervalo de tiempo (n) y para una sub-banda de frecuencias (k) y/o un parámetro de dirección de llegada (q (k, n) ) para un intervalo de tiempo (n) y una sub-banda de frecuencias (k) o como parámetros de micrófono audio espacial.

4. Procesador audio espacial según cualquiera de las reivindicaciones 1 a 3, en el cual el determinador de las características de señal (308) está configurado para determinar un intervalo de condición de estacionaria de la señal de entrada acústica (104) ;

y en el cual el estimador de parámetro controlable (306) está configurado para modificar la regla de cálculo de parámetro espacial variable según el intervalo de condición de estacionaria determinado, de manera que un periodo de determinación de media para calcular los parámetros espaciales (102, ψ (k, n) , q (k, n) ) sea relativamente más largo para un intervalo de condición de estacionaria relativamente más largo y sea relativamente más corto para un intervalo de condición de estacionaria relativamente más corto.

5. Procesador audio espacial según la reivindicación 4, en el cual el estimador de parámetro controlable (306) está configurado para calcular los parámetros espaciales (102, ψ (k, n) ) a partir de la señal de entrada acústica (104) para un intervalo de tiempo (n) y una sub-banda de frecuencias (k) en función de al menos una determinación de la media en el tiempo de los parámetros de señal (Ia (k, n) ) de la señal de entrada acústica (104) , y en el cual el estimador de parámetro controlable (306) está configurado para hacer variar un periodo de determinación de media de la determinación de la media en el tiempo de los parámetros de señal (Ia (k, n) ) de la señal de entrada acústica (104) según el intervalo de condición de estacionaria determinado.

6. Procesador audio espacial según la reivindicación 5, en el cual el estimador de parámetro controlable (306) está configurado para aplicar la determinación de la media en el tiempo de los parámetros de señal (Ia (k, n) ) de la señal de entrada acústica (104) con ayuda de un filtro pasa-bajos; en el cual el estimador de parámetro controlable (306) está configurado para ajustar una ponderación entre un parámetro de señal actual de la señal de entrada acústica (104) y de los parámetros de señal anteriores de la señal

de entrada acústica (104) a partir de un parámetro de ponderación (α) , de manera que el periodo de determinación de media esté basado en el parámetro de ponderación (α) , de manera que el peso del parámetro de señal actual, comparado con el peso de los parámetros de señal anteriores, sea relativamente grande para un intervalo de condición de estacionaria relativamente corto y de manera que el peso del parámetro de señal actual, comparado con el peso de los parámetros de señal anteriores, sea relativamente reducido para un intervalo de condición de estacionaria relativamente largo.

7. Procesador audio espacial según cualquiera de las reivindicaciones 1 a 6, en el cual el estimador de parámetro controlable (406, 506, 906) está configurado para seleccionar una regla de cálculo de parámetro espacial (410, 412) entre una pluralidad de reglas de cálculo de parámetro espacial (410, 412) para calcular los parámetros espaciales (102, ψ (k, n) , q (k, n) ) en función de la característica de señal determinada (110) .

8. Procesador audio espacial según la reivindicación 7, en el cual el estimador de parámetro controlable (406, 506) está configurado de manera que una primera regla de cálculo de parámetro espacial (410) entre la pluralidad de reglas de cálculo de parámetro espacial (410, 412) sea diferente de una segunda regla de cálculo de parámetro espacial (412) entre la pluralidad de reglas de cálculo de parámetro espacial (410, 412) y donde la primera regla de

cálculo de parámetro espacial (410) y la segunda regla de cálculo de parámetro espacial (412) se seleccionan de entre un grupo compuesto por:

determinación de la media en el tiempo en una pluralidad de intervalos de tiempo en una sub-banda de frecuencias, determinación de la media de frecuencia en una pluralidad de sub-bandas de frecuencias en un intervalo de tiempo, determinación de la media en el tiempo y determinación de la media de frecuencia y sin determinación de media.

9. Procesador audio espacial según cualquiera de las reivindicaciones 1 a 8, en el cual el determinador de características de señal (408) está configurado para determinar si la señal de entrada acústica (104) comprende componentes de fuentes de sonido diferentes al mismo tiempo o en el cual el determinador de características de la señal (508) está configurado para determinar una tonalidad de la señal de entrada acústica (104) ; en el cual el estimador de parámetro controlable (406, 506) está configurado para seleccionar, según un resultado de la determinación de las características de señal, una regla de cálculo de parámetro espacial (410, 412) de entre una pluralidad de reglas de cálculo de parámetro espacial (410, 412) , para calcular los parámetros espaciales (102, ψ (k, n) , q (k, n) ) de manera que se seleccione una primera regla de cálculo de parámetro espacial (410) entre la pluralidad de reglas de cálculo de parámetro espacial (410, 412) cuando la señal de entrada acústica (104) comprende componentes de cómo mucho una fuente de sonido o cuando la tonalidad de la señal de entrada acústica (104) está por debajo de un nivel umbral de tonalidad determinado y de manera que se seleccione una segunda regla de cálculo de parámetro espacial (412) entre la pluralidad de reglas de cálculo de parámetro espacial (410, 412) cuando la señal de entrada acústica (104) comprende componentes además de una fuente de sonido al mismo tiempo o cuando la tonalidad de la señal de entrada acústica (104) está por encima de un nivel umbral de tonalidad determinado; en el cual la primera regla de cálculo de parámetro espacial (410) comprende una determinación de media de frecuencia en un primer número de sub-bandas de frecuencias (k) y la segunda regla de cálculo de parámetro espacial (412) comprende una determinación de media de frecuencia en un segundo número de sub-bandas de frecuencias (k) o no comprende determinación de media de frecuencia; y en el cual el primer número es más grande que el segundo número.

10. Procesador audio espacial según cualquiera de las reivindicaciones 1 a 9, en el cual el determinador de características de señal (608) está configurado para determinar una relación señal ruido (110, 710) de la señal de entrada acústica (104) ; en el cual el estimador de parámetro controlable (606, 606a, 606b) está configurado para aplicar una determinación de media en el tiempo en una pluralidad de intervalos de tiempo en una sub-banda de frecuencias (k) , una determinación de media en frecuencia en una pluralidad de sub-bandas de frecuencias (k) en un intervalo de tiempo (n) , una determinación de media espacial o una combinación de estas últimas, y en el cual el estimador de parámetro controlable (606, 606a, 606b) está configurado para hacer variar un periodo de determinación de la media en el tiempo, de determinación de la media en frecuencia, de determinación de la media espacial, o de la combinación de estas últimas según la relación señal-ruido determinada (110, 710) de manera que el periodo de determinación de la media sea relativamente más largo para una relación señal-ruido (110, 710) relativamente más reducida de la señal acústica de entrada y de manera que el periodo de determinación de media sea relativamente más corto para una relación señal-ruido (110, 710) relativamente más grande de la señal de entrada acústica (104) .

11. Procesador audio espacial según la reivindicación 10, en el cual el estimador de parámetro controlable (606a, 606b) está configurado para aplicar la determinación de la media en el tiempo a un subconjunto de parámetros de intensidad (Ia (k, n) ) en una pluralidad de intervalos de tiempo y una sub-banda de frecuencias (k) o a un subconjunto de parámetros de dirección de llegada (q (k, n) ) en una pluralidad de intervalos de tiempo y una sub-banda de frecuencias (k) ; y en el cual un número de parámetros de intensidad (Ia (k, n) ) en el subconjunto de parámetros de intensidad (Ia (k, n) )

o un número de parámetros de dirección de llegada (q (k, n) ) en el subconjunto de parámetros de dirección de llegada (q (k, n) ) corresponde al periodo de determinación de la media en el tiempo de la determinación de la media en el tiempo, de manera que el número de parámetros de intensidad (Ia (k, n) ) en el subconjunto de parámetros de intensidad (Ia (k, n) ) o el número de parámetros de dirección de llegada (q (k, n) ) en el subconjunto de parámetros de dirección de llegada (q (k, n) ) sea relativamente más reducido para una relación señal-ruido (110, 710) relativamente más grande de la señal de entrada acústica (104) y de manera que el número de parámetros de intensidad (Ia (k, n) ) en el subconjunto de parámetros de intensidad (Ia (k, n) ) o el número de parámetros de dirección de llegada (q (k, n) ) en el subconjunto de parámetros de dirección de llegada (q (k, n) ) sea relativamente más grande para una relación señal-ruido (110, 710) relativamente más reducida de la señal de entrada acústica (104) .

12. Procesador audio espacial según cualquiera de las reivindicaciones 10 a 11, en el cual el determinador de características de señal (608) está configurado para suministrar la relación señal-ruido (110, 710) de la señal de entrada acústica (104) como una pluralidad de parámetros de relación señal-ruido de la señal de entrada acústica (104) , estando cada parámetro de relación señal-ruido de la señal de entrada acústica (104) asociado a una subbanda de frecuencias y un intervalo de tiempo, en el cual el estimador de parámetro controlable (606a, 606b) está configurado para recibir una relación señal-ruido diana (712) como una pluralidad de parámetros de relación señalruido diana, estando cada parámetro de relación señal-ruido diana asociado a una sub-banda de frecuencias y un

intervalo de tiempo, y en el cual el estimador de parámetro controlable (606a, 606b) está configurado para hacer variar el periodo de determinación de la media de la determinación de la media en el tiempo según un parámetro de relación señal-ruido actual de la señal acústica de entrada, de manera que un parámetro de relación señal-ruido actual (102) trata de corresponder a un parámetro de relación señal-ruido diana actual.

13. Procesador audio espacial según cualquiera de las reivindicaciones 1 a 12, en el cual el determinador de características de señal (908) está configurado para determinar si la señal de entrada acústica (104) comprende componentes transitorios que corresponden a unas señales de tipo aplausos; en el cual el estimador de parámetro controlable (906) comprende un banco de filtros (912) que está configurado para convertir la señal de entrada acústica (104) de un ámbito temporal en una representación de frecuencia a partir de una regla de cálculo de conversión, y en el cual el estimador de parámetro controlable (906) está configurado para seleccionar la regla de cálculo de conversión para convertir la señal de entrada acústica (104) del ámbito temporal en una representación de frecuencia entre una pluralidad de reglas de cálculo de conversión según el resultado de la determinación de características de señal, de manera que se seleccione una primera regla de cálculo de conversión entre la pluralidad de reglas de cálculo de conversión para convertir la señal de entrada acústica (104) del ámbito temporal a una representación de frecuencia cuando la señal acústica de entrada comprende componentes correspondientes a unas señales de tipo aplausos, y de manera que se seleccione una segunda regla de cálculo de conversión entre la pluralidad de reglas de cálculo de conversión para convertir la señal de entrada acústica (104) del ámbito temporal a una representación de frecuencia cuando la señal de entrada acústica no comprende componentes correspondiente a unas señales de tipo aplausos.

14. Procedimiento para suministrar parámetros espaciales a partir de una señal de entrada acústica, comprendiendo el procedimiento:

determinar (1010) una característica de señal de la señal de entrada acústica, donde la señal acústica de entrada comprende al menos una componente direccional; modificar (1020) una regla de cálculo de parámetro espacial variable según la característica de señal determinada, y calcular (1030) los parámetros espaciales de la señal acústica de entrada según la regla de cálculo de parámetro espacial variable.

15. Programa de ordenador que tiene un código de programa adaptado para realizar, cuando se ejecuta en un ordenador, el procedimiento según la reivindicación 14.