Aparato, procedimiento y programa de ordenador para obtener una señal de audio multi-canal a partir de una señal de audio.

Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal

(562, 564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508), que comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508),

en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) comprende:

medios (110; 220; 320) para una compresión con pérdidas de una primera representación (108; 212; 316; X(ω,k)) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322; X ) (ω,k)) de la señal de audio; y medios (120; 230; 330) para calcular una diferencia entre la representación comprimida (112; 222; 322; X ) (ω,k)) de la señal de audio y la primera representación (108; 212; 316; X(ω,k)) de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336; Ι A (w,k)Ι ),

describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que la representación de discriminación forma la señal de ambiente;

un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566); y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12168768.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HERRE, JURGEN, UHLE, CHRISTIAN, HELLMUTH, OLIVER, WALTHER, ANDREAS, JANSSEN,CHRISTIAAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > H04S5/00 (Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2461191_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Aparato, procedimiento y programa de ordenador para obtener una señal de audio multi-canal a partir de una señal de audio [0001] La presente invención se refiere en general a un aparato y a un procedimiento para generar una señal de ambiente a partir de una señal de audio, a un aparato y un procedimiento para obtener una señal de audio multicanal a partir de una señal de audio, y a un programa de ordenador. Concretamente, la presente invención se refiere a un procedimiento y concepto para calcular una señal de ambiente a partir de una señal de audio para mezclar

señales mono de audio para reproducción en sistemas multi-canal.

A continuación, se analizará la motivación subyacente a la presente invención. En la actualidad, el material de audio multi-canal también está experimentando una creciente popularidad en entornos domésticos. La razón principal de esto es que las películas en medios de DVD ofrecen a menudo sonido multi-canal 5.1. Por esta razón,

incluso los usuarios domésticos instalan frecuentemente sistemas de reproducción de audio capaces de reproducir señales de audio multi-canal.

Una configuración correspondiente puede consistir, por ejemplo, en tres altavoces (a modo de ejemplo designados con L, C y R) dispuestos en la parte delantera, dos altavoces (designados con LS y RS) dispuestos detrás o hacia atrás de un oyente y un canal de efectos de baja frecuencia (también denominado como LFE) . Los tres altavoces dispuestos en la parte delantera (L, C, R) se denominarán también en lo sucesivo como altavoces frontales. Los altavoces dispuestos detrás y en la parte posterior del oyente (LS, RS) se denominan también en lo sucesivo altavoces posteriores.

Además, cabe señalar que, por razones de conveniencia, los siguientes detalles y explicaciones se refieren a los sistemas 5.1. Los siguientes detalles pueden, por su puesto, aplicarse también a otros sistemas de canales múltiples, con sólo realizar pequeñas modificaciones.

Los sistemas de canales múltiples (tal como un sistema de audio multi-canal 5.1) proporcionan varias ventajas ya conocidas sobre la reproducción estéreo de dos canales. Esto se ejemplifica mediante las siguientes ventajas:

- Ventaja 1: estabilidad mejorada frente a la imagen, incluso de o fuera de la posición de escucha óptima (central) . El

"punto dulce" se amplía mediante el canal central. El término "punto dulce" se refiere a un área de posiciones de 35 escucha donde se puede percibir una impresión de sonido óptima (por un oyente) .

- Ventaja 2: Establecer una mejor aproximación de una impresión o experiencia a una sala de conciertos. Se obtiene una mayor experiencia de la "envoltura" y amplitud se obtiene a través de los altavoces de canal posteriores o los altavoces de canal posteriores.

Sin embargo, todavía hay una gran cantidad de contenidos de audio legados que consta de sólo dos ("estéreo") canales de audio, tal como en los discos compactos. Incluso se venden grabaciones muy viejas y antiguas películas y series de televisión en CD y/o DVD que están disponibles en calidad mono y/o por medio de solamente una señal de audio "mono" de un único canal.

Por lo tanto, hay opciones para la reproducción de material legado de audio mono a través de una configuración multicanal 5.1:

- Opción 1: Reproducción o playback del canal mono a través del centro o a través del altavoz central para obtener

una fuente mono verdadera. 50

- Opción 2: Reproducción o playback de la señal mono por los altavoces L y R (es decir, por el altavoz delantero izquierdo y el altavoz delantero derecho) .

Este enfoque produce una fuente mono fantasma que tiene una anchura de fuente percibida más amplia que una 55 fuente de mono verdadera, pero con una tendencia hacia el altavoz más cercano al oyente cuando el oyente no se sienta dentro o en el punto dulce.

Este procedimiento también puede ser usado si sólo hay disponible un sistema de reproducción de dos canales, y que no hace uso de la configuración de altavoces ampliada (tales como un a configuración de altavoz con 5 ó 6 altavoces) . El altavoz C o altavoz central, el altavoz LS, o altavoz trasero izquierdo, el altavoz RS, o altavoz trasero derecho y el altavoz LFE, o altavoz de canal de efectos de baja frecuencia, permanecen sin utilizar.

- Opción 3: Puede emplearse un procedimiento para convertir el canal de la señal mono en una señal multicanal

utilizando todos los altavoces 5.1 (es decir, los seis altavoces usados en un sistema de canales múltiples 5.1) . De esta manera, la señal multi-canal se beneficia de las ventajas que se han analizado previamente de la configuración de varios canales. El procedimiento se puede emplear en tiempo real o "sobre la marcha" o por medio de preprocesamiento y se conoce como proceso de mezcla o "mezcla".

En lo que respecta a la calidad del audio o la calidad del sonido, la opción 3 ofrece ventajas sobre la opción 1 y la opción 2. Sin embargo, particularmente con respecto a la señal generada para la alimentación de los altavoces posteriores, el procesamiento de la señal requerida no es obvio.

En la bibliografía, se describen dos conceptos diferentes para un procedimiento de mezcla o proceso de mezcla. Estos conceptos son el "Concepto Directo/Ambiente" y el "Concepto en la banda". A continuación, se describirán los dos conceptos indicados.

Concepto Directo/Ambiente [0010] Las "fuentes de sonido directo" se reproducen a través de los tres canales frontales de forma que se perciben en la misma posición que en la versión original de dos canales. La expresión "fuente de sonido directo" se usa aquí para describir el sonido que viene, única y directamente de una fuente de sonido discreto (por ejemplo, un instrumento) , y que muestra poco o ningún sonido adicional, por ejemplo, debido a reflejos de las paredes.

En este escenario, el sonido o el ruido alimentado a los altavoces posteriores debe consistir únicamente en ruido o sonido similar al ambiente (que puede o no estar presente en la grabación original) . El sonido o ruido similar al ambiente no está asociado a una única fuente de sonido o fuente de ruido, pero contribuye a la reproducción o playback del entorno acústico (acústica de la sala) de una grabación o a la denominada "sensación de envolvente" del oyente. El sonido similar al ambiente o ruido similar al ambiente es ruido o sonido adicional por parte del público en las actuaciones en directo (tal como aplausos) o el sonido ambiental o ruido ambiental añadido con intención artística (tal como el ruido de la grabación, canto de los pájaros, los sonidos de grillos chirriando) .

A modo de ilustración, la figura 7 representa la versión original de dos canales (de una grabación de audio) . La figura 8 muestra una entrega mezclada usando el concepto Directo/Ambiente.

Concepto en la banda [0013] Siguiendo el concepto circundante, a menudo denominado como "concepto en la banda", cada sonido o ruido (sonido directo, así como el ruido ambiental) puede posicionarse completa y/o arbitrariamente alrededor del

oyente. La posición del ruido o sonido es independiente de sus propiedades (sonido directo o ruido directo o sonido ambiental o ruido ambiental) y depende solamente del diseño específico del algoritmo y sus ajustes de parámetros.

La figura 9 representa el concepto envolvente.

En resumen, las figuras 7, 8 y 9 muestran varios conceptos de playback. Aquí, las figuras 7, 8 y 9 describen donde el oyente percibe el origen del sonido (como un área de traza oscura) . La figura 7 describe la percepción acústica durante la reproducción de música. La figura 8 describe la percepción acústica y/o localización... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal

(562, 564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508) , que 5 comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) , en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342;

512) a partir de la señal de audio (108; 208; 308; 508) comprende:

medios (110; 220; 320) para una compresión con pérdidas de una primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio; y

medios (120; 230; 330) para calcular una diferencia entre la representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio y la primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336; ⏐A (ω, k) ⏐) , describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida; en el que la representación de discriminación forma la señal de ambiente; un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566) ; y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544) .

2. Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal (562, 564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508) , que comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a 40 partir de la señal de audio (108; 208; 308; 508) ,

en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) comprende:

medios (110; 220; 320) para una compresión con pérdidas de una primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio,

medios (120; 230; 330) para calcular una diferencia entre la representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio y la primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una 50 representación de discriminación (122; 232; 332, 336; ⏐A (ω, k) ⏐) ,

describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y medios (130, 240, 340) para proporcionar la señal de ambiente (132; 242, 252, 254; 336, 342; a (t) , a[n]) usando la representación de discriminación,

en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que el aparato (510) para generar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) se configura para recibir la señal de audio (108; 208; 308; 508) ;

un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566) ; y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544) .

3. Procedimiento para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal y una señal de altavoz posterior a partir de una señal de audio, que comprende:

generar una señal de ambiente a partir de la señal de audio, en el que la generación de la señal de ambiente de la 25 señal de audio comprende la compresión con pérdidas (610) de una primera representación (108; 212; 316) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322) de la señal de audio; y

calcular (620) una diferencia (122; 232; 332, 336) entre la representación comprimida de la señal de audio y la primera representación de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336) que forme la señal de ambiente,

en el que la representación de discriminación describe la diferencia entre la primera representación de la señal de 35 audio y la representación comprimida de la señal de audio, y

en el que la representación de discriminación describe las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y

en el que la compresión con pérdidas se realiza de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que la representación de discriminación forma la señal de ambiente;

proporcionar la señal de audio o una señal obtenida a partir del mismo como la señal de altavoz frontal; y

proporcionar la señal de ambiente o una señal obtenida a partir del mismo como la señal de altavoz posterior.

4. Procedimiento para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal y una señal de altavoz posterior a partir de una señal de audio, que comprende:

generar una señal de ambiente a partir de la señal de audio, en el que la generación de la señal de ambiente de la señal de audio comprende la compresión con pérdidas (610) de una primera representación (108; 212; 316) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322) de la señal de audio;

calcular (620) una diferencia (122; 232; 332, 336) entre la representación comprimida de la señal de audio y la primera representación de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336) , y

proporcionar (630) la señal de ambiente usando la representación de discriminación,

en el que la representación de discriminación describe la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

en el que la representación de discriminación describe las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y

en el que la compresión con pérdidas se realiza de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

proporcionar la señal de audio o una señal obtenida a partir del mismo como la señal de altavoz frontal; y

proporcionar la señal de ambiente o una señal obtenida a partir del mismo como la señal de altavoz posterior.

5. Programa de ordenador para realizar el procedimiento de acuerdo con las reivindicaciones 3 ó 4 25 cuando el programa de ordenador se ejecuta en un ordenador.