SINTESIS Y ESPACIALIZACION SONORA CONJUNTA.

Procedimiento para sintetizar y espacializar conjuntamente una pluralidad de fuentes sonoras en posiciones asociadas del espacio,

incluyendo:

a) una etapa de asignación a cada fuente de por lo menos un parámetro (pi), representativo de una amplitud de por lo menos una componente frecuencial de la fuente,

b) una etapa de espacialización en la que se emplea una codificación en una pluralidad de canales, en la que se duplica cada parámetro de amplitud (p1) para multiplicarlo por una ganancia (gim) de espacialización, determinándose cada ganancia de espacialización, por una parte, para un canal (pgm) de codificación y, por otra, para una fuente (Si) a espacializar,

c) una etapa de agrupación (R) de los parámetros (pim) multiplicados por las ganancias, en canales respectivos (pg1, ..., pgM), aplicando una suma de dichos parámetros multiplicados (pim) en todas las fuentes (Si) para cada canal (pgm), y

d) una etapa de síntesis paramétrica (SYNTH(1), ..., SYNTH(M)) aplicada a cada uno de los canales (pgm)

Tipo: Resumen de patente/invención. Número de Solicitud: W07050868FR.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY,75015 PARIS.

Inventor/es: EMERIT, MARC, VIRETTE,DAVID, PALLONE,GREGORY.

Fecha de Publicación: .

Fecha Concesión Europea: 28 de Octubre de 2009.

Clasificación Internacional de Patentes:

  • G10H7/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10H INSTRUMENTOS DE MUSICA ELECTROFONICOS; INSTRUMENTOS EN LOS QUE LOS TONOS SON GENERADOS POR MEDIOS ELECTROMECANICOS O POR GENERADORES ELECTRONICOS, O EN LOS QUE LOS SONIDOS SON SINTETIZADOS A PARTIR DE UNA MEMORIA DE DATOS.Instrumentos en los que los sonidos son sintetizados a partir de una memoria de datos, p. ej. órganos con computador (síntesis de ondas acústicas no específica de instrumentos de música G10K 15/02, G10L).
  • H04S3/00A

Clasificación PCT:

  • G10H7/10 G10H […] › G10H 7/00 Instrumentos en los que los sonidos son sintetizados a partir de una memoria de datos, p. ej. órganos con computador (síntesis de ondas acústicas no específica de instrumentos de música G10K 15/02, G10L). › utilizando coeficientes o parámetros almacenados en memoria, p. ej. coeficientes de Fourier (G10H 7/12 tiene prioridad).
  • H04S1/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas con dos canales (H04S 5/00, H04S 7/00 tienen prioridad).
  • H04S3/00 H04S […] › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
SINTESIS Y ESPACIALIZACION SONORA CONJUNTA.

Fragmento de la descripción:

Síntesis y espacialización sonora conjunta.

La presente invención se refiere a un procesamiento de audio y, más concretamente, una espacialización tridimensional de fuentes sonoras sintéticas.

Actualmente, la espacialización de una fuente sonora sintética suele realizarse sin tener en cuenta el modo de producción del sonido, es decir la manera misma en que se sintetiza el sonido. De esta manera, se han propuesto para la síntesis numerosos modelos, especialmente paramétricos. Paralelamente, se han propuesto asimismo numerosas técnicas de espacialización, sin proponer sin embargo una comparación con la técnica elegida para una síntesis.

Se conocen, entre las técnicas de síntesis, los métodos denominados "no paramétricos". A priori, no se utiliza parámetro particular alguno para modificar muestras anteriormente almacenadas en memoria. El representante más conocido de dichos métodos es la síntesis mediante tabla de onda clásica.

A este tipo de técnica se oponen los métodos de síntesis "paramétrica" que se basan en la utilización de un modelo que permite manipular un número reducido de parámetros, comparado con el número de muestras de señales producidas en el sentido de los métodos no paramétricos. Las técnicas de síntesis paramétricas se basan típicamente en modelos aditivos, sustractivos, fuente-filtro o no lineales.

Entre estos métodos paramétricos, se califican de "mutuos" aquellos que permiten manipular en común parámetros correspondientes a distintas fuentes sonoras, para utilizar entonces un único proceso de síntesis, para la totalidad de las fuentes. En los métodos denominados "sinusoidales", se construye típicamente un espectro en frecuencia a partir de los parámetros tales como la amplitud y la frecuencia de cada componente parcial del espectro sonoro global de las fuentes. En efecto, una implementación mediante transformada de Fourier inversa, seguida de una adición/recubrimiento, asegura una síntesis extremadamente eficaz de varias fuentes sonoras simultáneamente.

En lo que se refiere a la espacialización de fuentes sonoras, se conocen actualmente distintas técnicas. Algunas técnicas (como la "transaural" o la "binaural") se basan en tener en cuenta funciones de transferencia HRTF ("Head Related Transfer Function") que representan la perturbación de ondas acústicas por la morfología de un individuo, siendo dichas funciones HRTF propias de dicho individuo. La restitución sonora se efectúa de forma adaptada a los HRTF del oyente, típicamente en dos altavoces distantes ("transaural") o a partir de dos auriculares de un casco ("binaural"). Otras técnicas (por ejemplo la "ambiofónica" o el "multicanal" (5.1 a 10.1 o más) prevén una restitución en más de dos altavoces.

Más concretamente, algunas técnicas a base de HRTF utilizan la separación de las variables "frecuencia" y "posición" de las HRTF, proporcionando así un conjunto de p filtros de base (correspondientes a los p primeros valores propios de la matriz de covariancia de las HRTF cuyas variables estadísticas son las frecuencias), siendo dichos filtros ponderados mediante funciones espaciales (obtenidas mediante proyección de las HRTF en filtros de base). A continuación, las funciones espaciales pueden interpolarse como se describe en el documento US-5,500,900.

La espacialización de numerosas fuentes sonoras puede efectuarse gracias a una implementación multicanal aplicada a la señal de cada una de las fuentes sonoras. Las ganancias de los canales de espacialización se aplican directamente a las muestras sonoras de la señal, a menudo descritas en el dominio temporal (pero posiblemente también en el dominio frecuencial). Dichas muestras sonoras se procesan mediante un algoritmo de espacialización (con aplicación de ganancias que son en función de la posición deseada), con independencia del origen de dichas muestras. De este modo, la especialización propuesta podría aplicarse tanto a sonidos naturales como a sonidos sintéticos.

Por una parte, cada fuente sonora debe sintetizarse independientemente (con obtención de una señal temporal o frecuencial), con objeto de poder aplicar a continuación ganancias de espacialización independientes. Por lo tanto, para N fuentes sonoras, es necesario realizar N cálculos de síntesis.

Por otra parte, la aplicación de las ganancias a muestras sonoras, procedentes del dominio temporal o frecuencial, requiere como mínimo tantas multiplicaciones como muestras existentes. Por lo tanto, para un bloque de Q muestras, es necesario aplicar por lo menos N.M.Q. ganancias, siendo M el número de canales intermedios (por ejemplo canales ambiofónicos) y N el número de fuentes.

Por lo tanto, esta técnica requiere un elevado coste de cálculo en el caso de la espacialización de numerosas fuentes sonoras.

Entre las técnicas ambiofónicas, el método denominado de "altavoces virtuales" permite codificar las señales a espacializar aplicándoles especialmente ganancias, realizándose la descodificación mediante convolución de las señales codificadas mediante filtros precalculados (Jérôme Daniel, "Representación de campos acústicos, aplicación a la transmisión y reproducción de escenas sonoras complejas en un contexto multimedia", Tesis doctoral, 2000).

El documento WO-05/069272 presenta una técnica muy prometedora, que combina síntesis y espacialización.

Consiste en determinar amplitudes a asignar a señales que representan fuentes sonoras para definir, al mismo tiempo, la intensidad sonora (por ejemplo un "volumen") de una fuente a sintetizar y una ganancia de espacialización de dicha fuente. Este documento divulga especialmente una espacialización binaural con consideración de los retrasos y las ganancias (o "funciones espaciales") y, en particular, una mezcla de las fuentes sintetizadas en la parte codificación de la espacialización.

Más concretamente aún, un ejemplo de realización que se incluye en dicho documento WO-05/069272, en el que las fuentes se sintetizan asociando amplitudes a frecuencias que constituyen un "timbre sonoro" (por ejemplo una frecuencia fundamental y sus armónicos), prevé reagrupar por frecuencias idénticas señales de síntesis, con objeto de una espacialización posterior que opere sobre las frecuencias.

Este ejemplo de realización se ilustra en la figura 1. En un bloque de síntesis SYNTH (representado en trazo discontinuo), se asignan a frecuencias f0, f1, f2, ..., fp de cada fuente a sintetizar S1, ..., SN amplitudes respectivas a01, a11, ..., ap1, ..., aij, ..., a0N, a1N, ..., apN donde, en la notación general aij, j es un índice de fuente incluido entre 1 y N e i es un índice de frecuencia incluido entre 0 y p. Por supuesto, algunas amplitudes de un juego a0j, a1j, ..., apj a asignar a una misma fuente j pueden ser nulas si las frecuencias correspondientes no están representadas en el timbre sonoro de dicha fuente j.

Las amplitudes ai1, ..., aiN relativas a cada frecuencia fi se agrupan ("mezclan") para ser aplicadas, frecuencia por frecuencia, al bloque de espacialización SPAT para una codificación que opera en las frecuencias (por ejemplo en binaural, previendo entonces un retraso interaural a aplicar a cada fuente). Las señales de los canales c1, ..., ck, procedentes del bloque de espacialización SPAT, están destinadas a continuación a ser transmitidas a través de una o varias redes, o almacenadas, o demás, con objeto de una restitución posterior (precedida en su caso de una descodificación de espacialización adaptada).

Esta técnica, aunque muy prometedora, merece aún algunas optimizaciones.

De manera general, los procedimientos actuales requieren potencias de cálculo notables para espacializar numerosas fuentes sonoras sintetizadas.

La presente invención viene a mejorar la situación.

Propone a tal efecto un procedimiento para sintetizar y espacializar conjuntamente una pluralidad de fuentes sonoras en posiciones asociadas del espacio, incluyendo el procedimiento:

    a) una etapa...

 


Reivindicaciones:

1. Procedimiento para sintetizar y espacializar conjuntamente una pluralidad de fuentes sonoras en posiciones asociadas del espacio, incluyendo:

    a) una etapa de asignación a cada fuente de por lo menos un parámetro (pi), representativo de una amplitud de por lo menos una componente frecuencial de la fuente,
    b) una etapa de espacialización en la que se emplea una codificación en una pluralidad de canales, en la que se duplica cada parámetro de amplitud (p1) para multiplicarlo por una ganancia (gim) de espacialización, determinándose cada ganancia de espacialización, por una parte, para un canal (pgm) de codificación y, por otra, para una fuente (Si) a espacializar,
    c) una etapa de agrupación (R) de los parámetros (pim) multiplicados por las ganancias, en canales respectivos (pg1, ..., pgM), aplicando una suma de dichos parámetros multiplicados (pim) en todas las fuentes (Si) para cada canal (pgm), y
    d) una etapa de síntesis paramétrica (SYNTH(1), ..., SYNTH(M)) aplicada a cada uno de los canales (pgm).

2. Procedimiento según la reivindicación 1, en el cual:

    a) se asigna a cada fuente (Si) una pluralidad de parámetros (pi,k) representativos, cada uno, de una amplitud de una componente frecuencial (fk),
    b) se duplica cada parámetro de amplitud (pi,k) representativo de una componente frecuencial (fk) para multiplicarlo por una ganancia (gim) de espacialización, determinándose cada ganancia de espacialización, por una parte, para un canal (pgm) de codificación y, por otra parte, para una fuente (Si) a espacializar.
    c) en cada canal, se agrupan, componente frecuencial por componente frecuencial, los productos de los parámetros (pi,k) por las ganancias (gim), en subcanales (pg,km) asociados, cada uno, a una componente frecuencial (fk).

3. Procedimiento según la reivindicación 2, en el que se realiza la síntesis, en cada canal:

    d1) multiplicando la salida de cada subcanal asociado a una componente frecuencial (fk) por una envolvente espectral (envk) centrada en una frecuencia correspondiente a dicha componente frecuencial (fk),
    d2) y agrupando, mediante una suma en las componentes frecuenciales (fk), los productos resultantes de la operación d1),
para obtener, tras la operación d2), una señal (ssm) procedente de cada canal, codificada en espacialización y sintetizada.

    4. Procedimiento según una de las reivindicaciones anteriores, en el que la espacialización se realiza mediante codificación ambiofónica y los parámetros representativos de una amplitud que se asignan a las fuentes corresponden a amplitudes de armónicos esféricos (Ym).

    5. Procedimiento según la reivindicación 4, en combinación con la reivindicación 3, en el que, para pasar de una codificación ambiofónica a una descodificación con objeto de una restitución en espacialización binaural, se aplica un procesamiento en el dominio frecuencial directamente a los resultados de los productos procedentes de los canales respectivos tras la operación d2).

    6. Producto programa de ordenador, almacenado en una memoria de una unidad central o un terminal, y/o en un soporte amovible capaz de cooperar con el lector de dicha unidad central, y/o descargable vía una red de telecomunicaciones, caracterizado porque incluye instrucciones para la aplicación del procedimiento según una de las reivindicaciones 1 a 5.

    7. Módulo de generación de sonidos sintéticos espacializados, que incluye especialmente un procesador, caracterizado porque incluye además una memoria de trabajo que almacena instrucciones del producto programa de ordenador según la reivindicación 6.


     

    Patentes similares o relacionadas:

    CONTROLADOR MIDI CON SENSIBILIDAD PERSONALIZABLE, del 27 de Febrero de 2020, de PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE: Un controlador MIDI comprendiendo un cuerpo principal con un superficie de digitación curvada, en donde dicha superficie de digitación curvada está formada […]

    Imagen de 'Procedimiento y dispositivo electrónico para reproducir un instrumento…'Procedimiento y dispositivo electrónico para reproducir un instrumento musical virtual, del 31 de Julio de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un dispositivo electrónico que comprende: una pantalla; al menos uno de entre un altavoz y una interfaz de sonido; un procesador configurado para conectarse […]

    Dispositivo de grabación digital de instrumentos musicales con interferencia, del 20 de Mayo de 2015, de Gibson Brands, Inc: Un dispositivo portátil de grabación y reproducción directa de un instrumento musical que comprende: una etapa de entrada que puede funcionar para recibir señales […]

    Instrumento musical con salida para auriculars estereofónicos, del 16 de Abril de 2014, de Gibson Brands, Inc: Un instrumento musical que comprende: un transductor de audio para generar datos analogicos de audio; un modulo (23m, 23s) de interfaz […]

    APARATO PARA SINTETIZAR SEÑALES ANALOGICAS EN PCM., del 16 de Mayo de 1994, de NAMCO LTD.: ESTE INVENTO PROVEE UN APARATO DE SINTETIZACION DE SEÑALES ANALOGICAS INCLUYENDO UNA MEMORIA DE ONDAS PARA ALMACENAR UNA PLURALIDAD DE SEÑALES […]

    MECANISMOS DE DIVERSION QUE PRODUCEN SONIDO., del 16 de Julio de 1991, de WEINER, AVISH JACOB: DISPOSITIVO PARA LA DIVERSION QUE PRODUCE SONIDO. CONSTA DE UNA MEMORIA ROM, EN LA QUE ESTAN GRABADOS DATOS NUMERICOS REPRESENTANDO LOS SONIDOS CARACTERISTICOS DEL DISPOSITIVO, […]

    UN DISPOSITIVO MUSICAL PARA MUÑECOS, del 16 de Enero de 1989, de BERENGUER JUAN, JOSE: CONSISTENTE EN UN DISPOSITIVO MUSICAL Y LUMINICO APLICABLE A MUÑECOS, EL CUAL COMPRENDE UN ALTAVOZ REPRODUCTOR DE SONIDO CON AMPLIFICADOR Y ALIMENTACION A […]

    Imagen de 'GESTIÓN DE AUDIO EN UN ENTORNO DE DOBLE PROCESADOR'GESTIÓN DE AUDIO EN UN ENTORNO DE DOBLE PROCESADOR, del 6 de Abril de 2011, de RESEARCH IN MOTION LIMITED: Un método de control de audio para un dispositivo móvil de doble procesador que tiene un procesador de radiocomunicaciones y un procesador […]

    Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .