Adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada.

Aparato para generar una señal de salida de audio para simular una grabación de la señal de salida de audio de un micrófono virtual en una posición virtual configurable en un entorno, que comprende:

un estimador de posición de acontecimientos sonoros

(110) destinado a estimar una posición de un acontecimiento sonoro que indica una posición de un acontecimiento sonoro en el entorno, en el que el acontecimiento sonoro está activo en un determinado momento o en un determinado contenedor de tiempo-frecuencia, en el que el acontecimiento sonoro es una fuente sonora real o una fuente en imagen-espejo, en el que el estimador de posición de acontecimientos sonoros (110) está configurado para estimar la posición del acontecimiento sonoro que indica una posición de una fuente en imagen-espejo en el entorno cuando el acontecimiento sonoro es una fuente en imagen-espejo, y en el que el estimador de posición de acontecimientos sonoros (110) está adaptado para estimar la posición del acontecimiento sonoro a partir de una primera información de dirección suministrada por un primer micrófono espacial real situado en una posición del primer micrófono real en el entorno, y a partir de una segunda información de dirección suministrada por un segundo micrófono espacial real situado en una posición del segundo micrófono real en el entorno, donde el primer micrófono espacial real y el segundo micrófono espacial real son unos micrófonos espaciales que existen físicamente; y donde el primer micrófono espacial real y el segundo micrófono espacial real son unos aparatos destinados a la adquisición de sonido espacial capaz de determinar la dirección de llegada del sonido, y

un módulo de cálculo de informaciones (120) destinado a generar la señal de salida de audio a partir de una primera señal de entrada de audio grabada, a partir de la posición del primer micrófono real, a partir de la posición virtual del micrófono virtual, y a partir de la posición del acontecimiento sonoro,

en el cual el primer micrófono espacial real está configurado para grabar la primera señal de entrada de audio grabada, o en el cual un tercer micrófono está configurado para grabar la primera señal de entrada de audio grabada,

en el cual el estimador de posición de acontecimientos sonoros (110) está adaptado para estimar la posición del acontecimiento sonoro a partir de una primera dirección de llegada de la onda sonora emitida por el acontecimiento sonoro en la posición del primer micrófono real como primera información de dirección y a partir de una segunda dirección de llegada de la onda sonora en la posición del segundo micrófono real como segunda información de dirección, y

en el cual el módulo de cálculo de informaciones (120) comprende un compensador de propagación (500), en el cual el compensador de propagación (500) está adaptado para generar una primera señal de audio modificada modificando la primera señal de entrada de audio grabada a partir de una primera disminución de amplitud entre el acontecimiento sonoro y el primer micrófono espacial real y a partir de una segunda disminución de amplitud entre el acontecimiento sonoro y el micrófono virtual, ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio; o en el cual el compensador de propagación (500) está adaptado para generar una primera señal de audio modificada compensando un primer retardo entre una llegada de una onda sonora emitida por el acontecimiento sonoro en el primer micrófono espacial real y una llegada de la onda sonora al micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/071629.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HERRE, JURGEN, DEL GALDO,Giovanni, KALLINGER,Markus, THIERGART,OLIVER, KÜCH,FABIAN, KUNTZ,ACHIM, MAHNE,DIRK, KRATSCHMER,MICHAEL, CRACIUN,ALEXANDRA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > ALTAVOCES, MICROFONOS, CABEZAS DE LECTURA PARA GRAMOFONOS... > H04R3/00 (Circuitos para transductores (disposiciones para producir una reverberación sonora o un eco G10K 15/08; amplificadores H03F))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/16 (Estructura de codificadores de voz)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/20 (utilizando codificación específica de clase de sonido, codificadores híbridos o codificación basada en objeto)

PDF original: ES-2525839_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada

[1] La presente invención se relaciona con el procesamiento de audio y, en particular, con un aparato y procedimiento para la adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada.

[2] La grabación de sonido espacial tradicional apunta a capturar un campo sonoro con múltiples micrófonos de tal manera que, del lado de la reproducción, un oyente perciba la imagen sonora como si estuviera en el lugar de la grabación. Las estrategias normales para la grabación de sonido espacial por lo general utilizan micrófonos omnidireccionales espaciados, por ejemplo en al estereofonía AB, o micrófonos direccionales coincidentes, como por ejemplo en la estereofonía de intensidad, o bien micrófonos más sofisticados como un micrófono con formato B, por ej., en Ambisonics; véase, por ejemplo,

[1] R. K. Furness, "Ambisonics - An overview," en la 8a Conferencia Internacional de AES, abril de 199, pág. 181 189.

[3] En cuanto a la reproducción del sonido, estas estrategias no paramétricas derivan las señales de reproducción de audio deseadas (por ej., las señales que han de ser enviadas a los parlantes) directamente de las señales de micrófono grabadas.

[4] Por otro lado, se pueden aplicar procedimientos basados en la representación paramétrica de campos sonoros, a los que se hace referencia como codificadores de audio espacial paramétricos. Estos procedimientos emplean con frecuencia matrices de micrófonos para determinar una o más señales de mezcla descendente junto con información secundaria espacial que describe el sonido espacial. Son ejemplos la Codificación de Audio direccional (DirAC) o el denominado enfoque de micrófonos de audio espacial (SAM). Se pueden encontrar más detalles sobre la DirAC en

[2] Pulkkl, V., "Directional audio coding in spatial sound reproduction and stereo upmixing," en el Acta de la 28a Conferencia Internacional de AES, pág. 251-258, Piteá, Suecia, Junio 3 - Julio 2 de 26,

[3] V. Pulkki, "Spatial sound reproduction with directional audio coding," J. Audio Eng. Soc., vol. 55, no. 6, pág. 53- 516, Junio de 27.

Para más detalles sobre la estrategia de micrófonos de audio espacial, se hace referencia a

[4] C. Fallen "Mlcrophone Front-Ends for Spatial Audio Coders", en el Acta de la 125a Convención Internacional de AES, San Francisco, Oct. 28.

[5] En la DirAC, por ejemplo, el caso de la información de la pista espacial comprende la dirección de llegada (DOA) del sonido y la difusividad del campo sonoro computada en un dominio de dominio del tiempo-frecuencia. Para la reproducción del sonido, se pueden derivar las señales de reproducción de audio sobre la base de la descripción paramétrica. En algunas aplicaciones, la adquisición de sonido espacial apunta a capturar una escena sonora completa. En otras aplicaciones, la adquisición de sonido espacial sólo tiene por fin capturar ciertos componentes deseados. Con frecuencia se usan micrófonos para hablar muy cerca para grabar fuentes de sonido individuales con alta relación señal a ruido (SNR) y baja reverberación, en tanto que las configuraciones más distantes como la estereofonía XY representan una manera de capturar la imagen espacial de una escena sonora total. Se puede obtener una mayor flexibilidad en términos de directividad con la formación de haces, donde se utiliza una matriz de micrófonos para obtener patrones de captación direccionables. Se obtiene una flexibilidad aun mayor con los procedimientos antes mencionados, como por ejemplo la codificación direccional de audio (DirAC) (ver [2], [3]), en la cual es posible incluir filtros espaciales con patrones arbitrarios de captación, como se describe en

[5] M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Küch, D. Mahne, R. Schultz-Amling. y O. Thiergart, "A spatial filtering approach for directional audio coding," en Audio Engineering Society Convention 126, Munich, Alemania, mayo de 29,

como así también otras manipulaciones del procesamiento de señales de le la escena sonora; ver, por ejemplo,

[6] R. Schultz-Amling, F. Küch, O. Thiergart y M. Kallinger, "Acoustical zooming based on a parametric sound field representaron," en Audio Engineering Society Convention 128, Londres, R.U., mayo de 21,

[7] J. Herre, C. Falch, D. Mahne, G. Del Galdo, M. Kallinger y O. Thiergart, "Interactive teleconferencing combining spatial audio object coding and DirAC technology," en Audio Engineering Society Convention 128, Londres R.U., mayo de 21.

[6] Lo que tienen en común todos los conceptos antes mencionados es que los micrófonos están dispuestos en una geometría fija conocida. El espaciamiento entre los micrófonos es el menor posible para la microfonía coincidente, en tanto que normalmente es de sólo unos pocos centímetros en los demás procedimientos. A continuación nos referimos a cualquier aparato para la grabación del sonido espacial con capacidad para rescatar la dirección de llegada del sonido (por ej. una combinación de micrófonos direccionales o una matriz de micrófonos, etc.) como un micrófono espacial.

[7] Más aun, lo que tienen en común todos los procedimientos precedentemente mencionados es que se limitan a una representación del campo sonoro con respecto a un solo punto, es decir la ubicación de medición. Por consiguiente, los micrófonos necesarios deben estar situados en puntos muy específicos, cuidadosamente

seleccionados, por ej. cerca de las fuentes o de tal manera que se pueda captar de manera óptima la Imagen espacial.

[8] Sin embargo, en numerosas aplicaciones, esto no es factible y, por lo tanto, sería ventajoso colcocar varios micrófonos a mayor distancia de las fuentes de sonido y de todas maneras poder captar el sonido pretendido.

[9] Existen varios procedimientos de reconstrucción de campo para estimar el campo sonoro en un punto del espacio aparte de aquél en el cual se lo midiera. Uno de estos procedimientos es la holografía acústica, descripta en

[8] E. G. Williams, Fourier Acoustics: Sound Radiation and Nearfield Acoustical Holography, Academic Press, 1999.

[1] La holografía acústica permite computar el campo sonoro en cualquier punto con un volumen arbitrario, siempre que se conozca la presión sonora y la velocidad de partícula en toda su superficie. Por lo tanto, cuando el volumen es grande, se requiere un número de sensores no práctico por lo grande. Por añadidura, el procedimiento presupone que no hay fuentes sonoras presentes dentro del volumen, lo que hace que el algoritmo sea inviable para nuestras necesidades. La extrapolación de campos de ondas relacionada (remitirse también a [8]) tiene por fin extrapolar el campo sonoro conocidos sobre la superficie de un volumen a regiones externas. No obstante, la precisión de la extrapolación se degrada rápidamente en el caso de distancias de extrapolación más grandes, como así también en el caso de extrapolaciones hacia direcciones ortogonales a la dirección de propagación del sonido; véase

[9] A. Kuntz y R. Rabenstein, "Limitations in the extrapolation of wave fields from circular measurements," en 15th European Signal Processing Conference (EUSIPCO 27), 27.

[1] A. Walther y C. Faller, "Linear simulation of spaced matrices de micrófonos using b-format recordings," en Audio Engineering Society Convention 128, Londres R.U., mayo de 21, describe un modelo de onda plana, en el cual la extrapolación de campo sólo es posible en puntos lejanos a las fuentes sonoras reales, por ej., cerca del punto de medición.

[11] Una desventaja importante de los enfoques tradicionales es que la imagen espacial registrada siempre... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato para generar una señal de salida de audlo para simular una grabación de la señal de salida de audio de un micrófono virtual en una posición virtual configurare en un entorno, que comprende:

un estimador de posición de acontecimientos sonoros (11) destinado a estimar una posición de un acontecimiento sonoro que indica una posición de un acontecimiento sonoro en el entorno, en el que el acontecimiento sonoro está activo en un determinado momento o en un determinado contenedor de tiempo-frecuencia, en el que el acontecimiento sonoro es una fuente sonora real o una fuente en imagen-espejo, en el que el estimador de posición de acontecimientos sonoros (11) está configurado para estimar la posición del acontecimiento sonoro que indica una posición de una fuente en imagen-espejo en el entorno cuando el acontecimiento sonoro es una fuente en imagen-espejo, y en el que el estimador de posición de acontecimientos sonoros (11) está adaptado para estimar la posición del acontecimiento sonoro a partir de una primera información de dirección suministrada por un primer micrófono espacial real situado en una posición del primer micrófono real en el entorno, y a partir de una segunda información de dirección suministrada por un segundo micrófono espacial real situado en una posición del segundo micrófono real en el entorno, donde el primer micrófono espacial real y el segundo micrófono espacial real son unos micrófonos espaciales que existen físicamente; y donde el primer micrófono espacial real y el segundo micrófono espacial real son unos aparatos destinados a la adquisición de sonido espacial capaz de determinar la dirección de llegada del sonido, y

un módulo de cálculo de informaciones (12) destinado a generar la señal de salida de audio a partir de una primera señal de entrada de audio grabada, a partir de la posición del primer micrófono real, a partir de la posición virtual del micrófono virtual, y a partir de la posición del acontecimiento sonoro,

en el cual el primer micrófono espacial real está configurado para grabar la primera señal de entrada de audio grabada, o en el cual un tercer micrófono está configurado para grabar la primera señal de entrada de audio grabada,

en el cual el estimador de posición de acontecimientos sonoros (11) está adaptado para estimar la posición del acontecimiento sonoro a partir de una primera dirección de llegada de la onda sonora emitida por el acontecimiento sonoro en la posición del primer micrófono real como primera información de dirección y a partir de una segunda dirección de llegada de la onda sonora en la posición del segundo micrófono real como segunda información de dirección, y

en el cual el módulo de cálculo de informaciones (12) comprende un compensador de propagación (5), en el cual el compensador de propagación (5) está adaptado para generar una primera señal de audio modificada modificando la primera señal de entrada de audio grabada a partir de una primera disminución de amplitud entre el acontecimiento sonoro y el primer micrófono espacial real y a partir de una segunda disminución de amplitud entre el acontecimiento sonoro y el micrófono virtual, ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio; o en el cual el compensador de propagación (5) está adaptado para generar una primera señal de audio modificada compensando un primer retardo entre una llegada de una onda sonora emitida por el acontecimiento sonoro en el primer micrófono espacial real y una llegada de la onda sonora al micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio.

2. Aparato según la reivindicación 1,

en el cual el módulo de cálculo de informaciones (12) comprende un módulo de cálculo de informaciones laterales espaciales (57) destinado a calcular las informaciones laterales espaciales,

en el cual el módulo de cálculo de informaciones (12) está adaptado para estimar la dirección de llegada o una intensidad de sonido activo al micrófono virtual como informaciones laterales espaciales a partir de un vector de posición del micrófono virtual y a partir de un vector de posición del acontecimiento sonoro.

3. Aparato según la reivindicación 1,

en el cual el compensador de propagación (5) está adaptado para generar la primera señal de audio modificada modificando la primera señal de entrada de audio grabada a partir de la primera disminución de amplitud entre el acontecimiento sonoro y el primer micrófono espacial real y a partir de la segunda disminución de amplitud entre el acontecimiento sonoro y el micrófono virtual ajustando el valor de amplitud, el valor de magnitud o el valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio,

en el cual el compensador de propagación (5) está adaptado para generar la primera señal de audio modificada en un ámbito de tiempo-frecuencia a partir de la primera disminución de amplitud entre el acontecimiento sonoro y el primer micrófono espacial real y a partir de la segunda disminución de amplitud entre el acontecimiento sonoro y el micrófono virtual ajustando dicho valor de amplitud de la primera señal de entrada de audio grabada representada en un ámbito de tiempo-frecuencia.

4. Aparato según la reivindicación 1,

en el cual el compensador de propagación (5) está adaptado para generar la primera señal de audio modificada compensando el primer retardo entre la llegada de una onda sonora emitida por el acontecimiento sonoro en el primer micrófono espacial real y la llegada de la onda sonora al micrófono virtual ajustando el valor de amplitud, el valor de magnitud o el valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio, en el cual el compensador de propagación (5) está adaptado para generar la primera señal de

audio modificada en el ámbito de tiempo-frecuencia compensando el primer retardo entre la llegada de la onda sonora emitida por el acontecimiento sonoro en el primer micrófono espacial real y la llegada de la onda sonora al micrófono virtual ajustando dicho valor de amplitud de la primera señal de entrada de audio grabada representada en un ámbito de tiempo-frecuencia.

5. Aparato según cualquiera de las reivindicaciones anteriores, en el cual el compensador de propagación (5) está adaptado para realizar la compensación de propagación generando un valor de magnitud modificada de la primera señal de audio modificada aplicando la fórmula:

P¥(k, «) =

dt{kt n)

s(k, n)

(*, n)

en la que di(k, n) es la distancia entre la posición del primer micrófono espacial real y la posición del acontecimiento sonoro, en la que s(k, n) es la distancia entre la posición virtual del micrófono virtual y la posición del acontecimiento sonoro, en la que Pref(k, n) es un valor de magnitud de la primera señal de entrada de audio grabada representada en un ámbito de tiempo-frecuencia, y en al que Pv(k, n) es el valor de magnitud modificada correspondiente a la señal del micrófono virtual, en la que k designa un índice de frecuencia y en el que n designa un índice de tiempo.

6. Dispositivo según cualquiera de las reivindicaciones anteriores,

en el cual el módulo de cálculo de información (12) comprende por otro lado un combinador (51), en el cual el compensador de propagación (5) está adaptado por otro lado para modificar una segunda señal de entrada de audio grabada que se graba mediante el segundo micrófono espacial real compensando un segundo retardo o una segunda disminución de amplitud entre una llegada de la onda sonora emitida por el acontecimiento sonoro al segundo micrófono espacial real y una llegada de la onda sonora al micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la segunda señal de entrada de audio grabada, para obtener una segunda señal de audio modificada, y

en el cual el combinador (51) está adaptado para generar una señal de combinación combinando la primera señal de audio modificada y la segunda señal de audio modificada, para obtener la señal de salida de audio.

7. Aparato según la reivindicación 6,

en el cual el compensador de propagación (5) está adaptado por otro lado para modificar una o varias otras señales de entrada de audio grabadas que se graban mediante uno o varios otros micrófonos espaciales reales compensando los retardos o las diminuciones de amplitud entre una llegada de la onda sonora al micrófono virtual y una llegada de la onda sonora emitida por el acontecimiento sonoro a cada uno de los otros micrófonos espaciales reales, en el cual el compensador de propagación (5) está adaptado para compensar cada uno de los retardos o diminuciones de amplitud ajustando un valor de amplitud, un valor de magnitud o un valor de fase de cada una de las otras señales de entrada de audio grabadas, para obtener una pluralidad de terceras señales de audio modificadas, y

en el cual el combinador (51) está adaptado para generar una señal de combinación combinando la primera señal de audio modificada y la segunda señal de audio modificada y la pluralidad de terceras señales de audio modificadas, para obtener la señal de salida de audio.

8. Dispositivo según cualquiera de las reivindicaciones 1 a 5,

en el cual el módulo de cálculo de informaciones (12) comprende una unidad de ponderación espectral (52) destinada a generar una señal de audio ponderada modificando la primera señal de audio modificada en función de una dirección de llegada de la onda sonora en la posición virtual del micrófono virtual y en función de un vector de unidad que describe la orientación del micrófono virtual, para obtener la señal de salida de audio, en el cual la primera señal de audio modificada se modifica en un ámbito de tiempo-frecuencia.

9. Aparato según la reivindicación 6 o la 7, en el cual el módulo de cálculo de informaciones (12) comprende una unidad de ponderación espectral (52) destinada a generar una señal de audio ponderada modificando la señal de combinación en función de una dirección de llegada o de la onda sonora en la posición virtual del micrófono virtual y en función de un vector de unidad que describe la orientación del micrófono virtual, para obtener la señal de salida de audio, en el cual la señal de combinación se modifica en un ámbito de tiempo-frecuencia.

1. Aparato según la reivindicación 8 o la 9, en el cual la unidad de ponderación espectral (52) está adaptada para aplicar el factor de ponderación

a + (1 - c)cos(<pv(k,n)), o el factor de ponderación

.5 + ,5 cos(q>v(k, n))

a la señal de audio ponderada,

en la que Tlv(k, n) indica un ángulo que especifica una dirección de llegada de la onda sonora emitida por el acontecimiento sonoro en la posición virtual del micrófono virtual, en la que k designa un índice de frecuencia y en la que n designa un índice de tiempo.

11. Aparato según cualquiera de las reivindicaciones 1 a 6, en el cual el compensador de propagación (5) está adaptado por otro lado para generar una tercera señal de audio modificada modificando una tercera señal de entrada de audio grabada que se graba mediante un cuarto micrófono compensando un tercer retardo o una tercera disminución de amplitud entre una llegada de la onda sonora emitida por el acontecimiento sonoro al cuarto micrófono y una llegada de la onda sonora al micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase del tercera señal de entrada de audio grabada, para obtener la señal de salida de audio.

12. Aparato según cualquiera de las reivindicaciones anteriores, en el cual el estimador de posición de acontecimientos sonoros (11) está adaptado para estimar una posición del acontecimiento sonoro en un entorno tridimensional.

13. Aparato según cualquiera de las reivindicaciones anteriores, en el cual el módulo de cálculo de informaciones (12) comprende por otro lado una unidad de cálculo de difusión (81) adaptada para estimar una energía de sonido difuso en el micrófono virtual o una energía de sonido directo en el micrófono virtual, en el cual la unidad de cálculo de difusión (81) está adaptado para estimar la energía de sonido difuso en el micrófono virtual a partir de las energías de sonido difuso al primer y al segundo micrófono espacial real.

14. Aparato según la reivindicación 13, en el cual la unidad de cálculo de difusión (81) está adaptada para estimar

e<VM)

la energía de sonido difuso en el micrófono virtual aplicando la fórmula:

f(VM)

`'diir

JL

.v

iV

£

«(SMQ

^ditt

en la que N es el número de una pluralidad de micrófonos espaciales reales que comprende el primer y el segundo

cíSMO

t. I

micrófono espacial real, y en la que es la energía del sonido difuso en el i-ésimo micrófono espacial real.

15. Aparato según la reivindicación 13 o la 14, en el cual la unidad de cálculo de difusión (81) está adaptado para estimar la energía de sonido directo aplicando la fórmula:

¡vm> __ /' distan ce SMi - IPLSV íSMrt lílr ' - V distancc VM - ÍPLS) ait

en la que la "distancia SMi - IPLS" es la distancia entre una posición de el i-ésimo micrófono espacial real y la posición del acontecimiento sonoro, en la que la "distancia VM - IPLS" es la distancia entre la posición virtual y la

gCSMO

posición del acontecimiento sonoro, y en la que dir es la energía directa en el i-ésimo micrófono espacial real.

16. Aparato según cualquiera de las reivindicaciones 13 a 15, en el cual la unidad de cálculo de difusión (81) está adaptada para estimar la difusión en el micrófono virtual estimando la energía de sonido difuso en el micrófono virtual y la energía de sonido directo en el micrófono virtual y aplicando la fórmula:

*

tVVJ) _

o<VM]

Kiitr

Hüff + Hfir

píVM)

en la que indica la difusión en el micrófono virtual estimada, en la que <liíT indica la energía de sonido difuso p(VM)

estimada y en la que c'dif indica la energía de sonido directo estimada.

17. Procedimiento de generación de una señal de salida de audio para simular una grabación de la señal de salida de audio por un micrófono virtual en una posición virtual configurable en un entorno, que comprende:

estimar una posición del acontecimiento sonoro que indica una posición de un acontecimiento sonoro en el entorno, en el que el acontecimiento sonoro está activo en un determinado momento o en un determinado contenedor de tiempo-frecuencia, en el que el acontecimiento sonoro es una fuente sonora real o una fuente en imagen-espejo, en el que la etapa de estimación de la posición del acontecimiento sonoro comprende estimar la posición del acontecimiento sonoro indicando una posición de una fuente en imagen-espejo en el entorno cuando el acontecimiento sonoro es una fuente en imagen-espejo, y en el que la etapa de estimación de la posición del acontecimiento sonoro se basa en una primera información de dirección suministrada por un primer micrófono espacial real situado en una posición del primer micrófono real en el entorno, y basada en una segunda información de dirección suministrada por un segundo micrófono espacial real situado en una posición del segundo micrófono real en el entorno, donde el primer micrófono espacial real y el segundo micrófono espacial real son unos micrófonos espaciales que existen físicamente; y

donde el primer micrófono espacial real y el segundo micrófono espacial real son unos aparatos destinados a la adquisición de sonido espacial capaz de determinar la dirección de llegada del sonido, y generar la señal de salida de audio a partir de una primera señal de entrada de audio grabada a partir de la posición del primer micrófono real, a partir de la posición virtual del micrófono virtual, y a partir de la posición del acontecimiento sonoro, en el cual el primer micrófono espacial real está configurado para grabar la primera señal de entrada de audio grabada, o en el cual un tercer micrófono está configurado para grabar la primera señal de entrada de audio grabada, en el cual la estimación de la posición del acontecimiento sonoro se realiza a partir de una primera dirección de llegada de la onda sonora emitida por el acontecimiento sonoro en la posición del primer micrófono real como primera información de dirección y a partir de una segunda dirección de llegada de la onda sonora en la posición del segundo micrófono real como segunda información de dirección, en el cual la etapa de generación de la señal de audio de salida comprende generar una primera señal de audio modificada modificando la primera señal de entrada de audio grabada a partir de una primera disminución de amplitud entre el acontecimiento sonoro y el primer micrófono espacial real y a partir de una segunda disminución de amplitud entre el acontecimiento sonoro y el micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio; o

en el cual la etapa de generación de la señal de salida de audio comprende generar una primera señal de audio modificada compensando un primer retardo entre una llegada de una onda sonora emitida por el acontecimiento sonoro del primer micrófono espacial real y una llegada de la onda sonora al micrófono virtual ajustando un valor de amplitud, un valor de magnitud o un valor de fase de la primera señal de entrada de audio grabada, para obtener la señal de salida de audio.

18. Programa de ordenador para la realización del procedimiento según la reivindicación 17 cuando se ejecuta en un ordenador o un procesador de señal.