Aparato, procedimiento y programa de ordenador para obtener una señal de audio multi-canal a partir de una señal de audio.

Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal (562,

564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508), que comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508),

en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) comprende:

medios (110; 220; 320) para una compresión con pérdidas de una primera representación (108; 212; 316; X(ω,k)) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322; X ) (ω,k)) de la señal de audio; y medios (120; 230; 330) para calcular una diferencia entre la representación comprimida (112; 222; 322; X ) (ω,k)) de la señal de audio y la primera representación (108; 212; 316; X(ω,k)) de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336; Ι A (w,k)Ι ),

describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que la representación de discriminación forma la señal de ambiente;

un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566); y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12168768.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HERRE, JURGEN, UHLE, CHRISTIAN, HELLMUTH, OLIVER, WALTHER, ANDREAS, JANSSEN,CHRISTIAAN.

Fecha de Publicación: 2 de Abril de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/008 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
G10L19/02 G10L 19/00 […] › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
H04S5/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.

PDF original: ES-2461191_T3.pdf

Fragmento de la descripción:

Aparato, procedimiento y programa de ordenador para obtener una señal de audio multi-canal a partir de una señal de audio [0001] La presente invención se refiere en general a un aparato y a un procedimiento para generar una señal de ambiente a partir de una señal de audio, a un aparato y un procedimiento para obtener una señal de audio multicanal a partir de una señal de audio, y a un programa de ordenador. Concretamente, la presente invención se refiere a un procedimiento y concepto para calcular una señal de ambiente a partir de una señal de audio para mezclar

señales mono de audio para reproducción en sistemas multi-canal.

A continuación, se analizará la motivación subyacente a la presente invención. En la actualidad, el material de audio multi-canal también está experimentando una creciente popularidad en entornos domésticos. La razón principal de esto es que las películas en medios de DVD ofrecen a menudo sonido multi-canal 5.1. Por esta razón,

incluso los usuarios domésticos instalan frecuentemente sistemas de reproducción de audio capaces de reproducir señales de audio multi-canal.

Una configuración correspondiente puede consistir, por ejemplo, en tres altavoces (a modo de ejemplo designados con L, C y R) dispuestos en la parte delantera, dos altavoces (designados con LS y RS) dispuestos detrás o hacia atrás de un oyente y un canal de efectos de baja frecuencia (también denominado como LFE) . Los tres altavoces dispuestos en la parte delantera (L, C, R) se denominarán también en lo sucesivo como altavoces frontales. Los altavoces dispuestos detrás y en la parte posterior del oyente (LS, RS) se denominan también en lo sucesivo altavoces posteriores.

Además, cabe señalar que, por razones de conveniencia, los siguientes detalles y explicaciones se refieren a los sistemas 5.1. Los siguientes detalles pueden, por su puesto, aplicarse también a otros sistemas de canales múltiples, con sólo realizar pequeñas modificaciones.

Los sistemas de canales múltiples (tal como un sistema de audio multi-canal 5.1) proporcionan varias ventajas ya conocidas sobre la reproducción estéreo de dos canales. Esto se ejemplifica mediante las siguientes ventajas:

- Ventaja 1: estabilidad mejorada frente a la imagen, incluso de o fuera de la posición de escucha óptima (central) . El

"punto dulce" se amplía mediante el canal central. El término "punto dulce" se refiere a un área de posiciones de 35 escucha donde se puede percibir una impresión de sonido óptima (por un oyente) .

- Ventaja 2: Establecer una mejor aproximación de una impresión o experiencia a una sala de conciertos. Se obtiene una mayor experiencia de la "envoltura" y amplitud se obtiene a través de los altavoces de canal posteriores o los altavoces de canal posteriores.

Sin embargo, todavía hay una gran cantidad de contenidos de audio legados que consta de sólo dos ("estéreo") canales de audio, tal como en los discos compactos. Incluso se venden grabaciones muy viejas y antiguas películas y series de televisión en CD y/o DVD que están disponibles en calidad mono y/o por medio de solamente una señal de audio "mono" de un único canal.

Por lo tanto, hay opciones para la reproducción de material legado de audio mono a través de una configuración multicanal 5.1:

- Opción 1: Reproducción o playback del canal mono a través del centro o a través del altavoz central para obtener

una fuente mono verdadera. 50

- Opción 2: Reproducción o playback de la señal mono por los altavoces L y R (es decir, por el altavoz delantero izquierdo y el altavoz delantero derecho) .

Este enfoque produce una fuente mono fantasma que tiene una anchura de fuente percibida más amplia que una 55 fuente de mono verdadera, pero con una tendencia hacia el altavoz más cercano al oyente cuando el oyente no se sienta dentro o en el punto dulce.

Este procedimiento también puede ser usado si sólo hay disponible un sistema de reproducción de dos canales, y que no hace uso de la configuración de altavoces ampliada (tales como un a configuración de altavoz con 5 ó 6 altavoces) . El altavoz C o altavoz central, el altavoz LS, o altavoz trasero izquierdo, el altavoz RS, o altavoz trasero derecho y el altavoz LFE, o altavoz de canal de efectos de baja frecuencia, permanecen sin utilizar.

- Opción 3: Puede emplearse un procedimiento para convertir el canal de la señal mono en una señal multicanal

utilizando todos los altavoces 5.1 (es decir, los seis altavoces usados en un sistema de canales múltiples 5.1) . De esta manera, la señal multi-canal se beneficia de las ventajas que se han analizado previamente de la configuración de varios canales. El procedimiento se puede emplear en tiempo real o "sobre la marcha" o por medio de preprocesamiento y se conoce como proceso de mezcla o "mezcla".

En lo que respecta a la calidad del audio o la calidad del sonido, la opción 3 ofrece ventajas sobre la opción 1 y la opción 2. Sin embargo, particularmente con respecto a la señal generada para la alimentación de los altavoces posteriores, el procesamiento de la señal requerida no es obvio.

En la bibliografía, se describen dos conceptos diferentes para un procedimiento de mezcla o proceso de mezcla. Estos conceptos son el "Concepto Directo/Ambiente" y el "Concepto en la banda". A continuación, se describirán los dos conceptos indicados.

Concepto Directo/Ambiente [0010] Las "fuentes de sonido directo" se reproducen a través de los tres canales frontales de forma que se perciben en la misma posición que en la versión original de dos canales. La expresión "fuente de sonido directo" se usa aquí para describir el sonido que viene, única y directamente de una fuente de sonido discreto (por ejemplo, un instrumento) , y que muestra poco o ningún sonido adicional, por ejemplo, debido a reflejos de las paredes.

En este escenario, el sonido o el ruido alimentado a los altavoces posteriores debe consistir únicamente en ruido o sonido similar al ambiente (que puede o no estar presente en la grabación original) . El sonido o ruido similar al ambiente no está asociado a una única fuente de sonido o fuente de ruido, pero contribuye a la reproducción o playback del entorno acústico (acústica de la sala) de una grabación o a la denominada "sensación de envolvente" del oyente. El sonido similar al ambiente o ruido similar al ambiente es ruido o sonido adicional por parte del público en las actuaciones en directo (tal como aplausos) o el sonido ambiental o ruido ambiental añadido con intención artística (tal como el ruido de la grabación, canto de los pájaros, los sonidos de grillos chirriando) .

A modo de ilustración, la figura 7 representa la versión original de dos canales (de una grabación de audio) . La figura 8 muestra una entrega mezclada usando el concepto Directo/Ambiente.

Concepto en la banda [0013] Siguiendo el concepto circundante, a menudo denominado como "concepto en la banda", cada sonido o ruido (sonido directo, así como el ruido ambiental) puede posicionarse completa y/o arbitrariamente alrededor del

oyente. La posición del ruido o sonido es independiente de sus propiedades (sonido directo o ruido directo o sonido ambiental o ruido ambiental) y depende solamente del diseño específico del algoritmo y sus ajustes de parámetros.

La figura 9 representa el concepto envolvente.

En resumen, las figuras 7, 8 y 9 muestran varios conceptos de playback. Aquí, las figuras 7, 8 y 9 describen donde el oyente percibe el origen del sonido (como un área de traza oscura) . La figura 7 describe la percepción acústica durante la reproducción de música. La figura 8 describe la percepción acústica y/o localización del sonido usando el concepto Directo/Ambiente. La figura 9 describe la percepción de sonido y/o la localización del sonido usando el concepto envolvente.

La siguiente sección proporciona una visión general sobre la técnica anterior con respecto a la mezcla de una señal de un canal o de dos canales para formar una versión de múltiples canales. La bibliografía indica varios procedimientos para mezclar señales de un único canal y señales de múltiples canales.

Procedimientos no señal adaptivos [0017] La mayoría de procedimientos para la generación de una señal denominada "pseudo estereofónica" no son señal adaptivos. Esto significa que procesan cualquier señal mono de la misma manera, independientemente del contenido de la señal. Estos sistemas funcionan a menudo con estructuras de filtro simples y/o retrasos de tiempo a fin de descorrelacionar las señales generadas. Puede encontrarse un análisis general de dicho sistema, por ejemplo, en... [Seguir leyendo]

Reivindicaciones:

1. Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal

(562, 564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508) , que 5 comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) , en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342;

512) a partir de la señal de audio (108; 208; 308; 508) comprende:

medios (110; 220; 320) para una compresión con pérdidas de una primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio; y

medios (120; 230; 330) para calcular una diferencia entre la representación comprimida (112; 222; 322; X (ω, k) ) de la señal de audio y la primera representación (108; 212; 316; X (ω, k) ) de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336; ⏐A (ω, k) ⏐) , describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida; en el que la representación de discriminación forma la señal de ambiente; un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566) ; y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544) .

2. Aparato (500) para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal (562, 564, 566) y una señal de altavoz posterior (542, 544) a partir de una señal de audio (108; 208; 308; 508) , que comprende:

un aparato (100; 200; 300; 510) para generar una señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a 40 partir de la señal de audio (108; 208; 308; 508) ,

en el que el aparato (100; 200; 300; 510) para generar la señal de ambiente (132; 232, 242, 252, 254; 332, 336, 342; 512) a partir de la señal de audio (108; 208; 308; 508) comprende:

describiendo la representación de discriminación la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

describiendo la representación de discriminación las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y medios (130, 240, 340) para proporcionar la señal de ambiente (132; 242, 252, 254; 336, 342; a (t) , a[n]) usando la representación de discriminación,

en el que los medios para la compresión con pérdidas se configuran de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que el aparato (510) para generar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) se configura para recibir la señal de audio (108; 208; 308; 508) ;

un aparato (550, 560) para proporcionar la señal de audio (108; 208; 308; 508) o una señal obtenida a partir del mismo como la señal de altavoz frontal (562, 564, 566) ; y

un aparato que proporciona la señal del altavoz posterior (520, 530, 540) para proporcionar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) proporcionada por el aparato (510) para generar la señal de ambiente (132; 230, 242, 252, 254; 332, 336, 342; 512) o una señal obtenida a partir del mismo como la señal de altavoz posterior (542, 544) .

3. Procedimiento para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal y una señal de altavoz posterior a partir de una señal de audio, que comprende:

generar una señal de ambiente a partir de la señal de audio, en el que la generación de la señal de ambiente de la 25 señal de audio comprende la compresión con pérdidas (610) de una primera representación (108; 212; 316) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322) de la señal de audio; y

calcular (620) una diferencia (122; 232; 332, 336) entre la representación comprimida de la señal de audio y la primera representación de la señal de audio con el fin de obtener una representación de discriminación (122; 232; 332, 336) que forme la señal de ambiente,

en el que la representación de discriminación describe la diferencia entre la primera representación de la señal de 35 audio y la representación comprimida de la señal de audio, y

en el que la representación de discriminación describe las porciones de la señal de audio no incorporadas en la representación comprimida con pérdidas o eliminadas en la representación comprimida con pérdidas, y

en el que la compresión con pérdidas se realiza de tal forma que se prefiere que las porciones de señal que muestran una distribución regular de la energía o que llevan una gran energía de señal se incluyan en la representación comprimida, mientras que las porciones de señal que tienen una energía distribuida de forma irregular o una energía inferior se transfieren a la representación comprimida de forma atenuada o sólo en escasa medida;

en el que la representación de discriminación forma la señal de ambiente;

proporcionar la señal de audio o una señal obtenida a partir del mismo como la señal de altavoz frontal; y

proporcionar la señal de ambiente o una señal obtenida a partir del mismo como la señal de altavoz posterior.

4. Procedimiento para obtener una señal de audio multi-canal que comprende una señal de altavoz frontal y una señal de altavoz posterior a partir de una señal de audio, que comprende:

generar una señal de ambiente a partir de la señal de audio, en el que la generación de la señal de ambiente de la señal de audio comprende la compresión con pérdidas (610) de una primera representación (108; 212; 316) de la señal de audio con el fin de obtener una representación comprimida (112; 222; 322) de la señal de audio;

proporcionar (630) la señal de ambiente usando la representación de discriminación,

en el que la representación de discriminación describe la diferencia entre la primera representación de la señal de audio y la representación comprimida de la señal de audio, y

proporcionar la señal de audio o una señal obtenida a partir del mismo como la señal de altavoz frontal; y

proporcionar la señal de ambiente o una señal obtenida a partir del mismo como la señal de altavoz posterior.

5. Programa de ordenador para realizar el procedimiento de acuerdo con las reivindicaciones 3 ó 4 25 cuando el programa de ordenador se ejecuta en un ordenador.

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]