APARATO Y METODO PARA SINTETIZAR TRES CANALES DE SALIDA, UTILIZANDO DOS CANALES DE ENTRADA.

Aparato para sintetizar tres canales (12a, 12b, 12c) de salida utilizando dos canales (10a,

10b) de entrada, en el que un segundo canal de los tres canales de salida puede alimentarse a un altavoz en un esquema de representación de audio pretendido, que está ubicado entre dos altavoces que pueden alimentarse con el primer canal de salida y el tercer canal de salida, que comprende:

un analizador (15) para analizar los dos canales de entrada, para detectar componentes de señal que ocurren en ambos canales de entrada para obtener componentes de señal detectadas; y

un generador (16) de señal, para generar los tres canales (12a, 12b, 12c) de salida utilizando los dos canales (10a, 10b) de entrada, en el que el generador de señal comprende:

un mezclador (16a) ascendente dos-tres, para generar al menos un segundo canal (12b) intermedio incluyendo al menos una parte de las componentes de señal detectadas;

un detector (16b) de recorte, para detectar una parte del segundo canal que tiene una amplitud por encima del umbral máximo; y

un controlador (30, 31) de mezclador ascendente dos-tres para controlar el mezclador (16a) ascendente dos-tres de tal manera que sólo una parte de las componentes de señal detectadas se alimenta al segundo canal y un resto de las componentes de señal permanecen ubicadas en los canales de salida primero y tercero, cuando una alimentación completa de las componentes de señal detectadas daría como resultado la superación de un umbral (61a, 61b) máximo para el segundo canal

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/013738.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C,80686 MUNCHEN.

Inventor/es: HELLMUTH, OLIVER, POPP, HARALD, WALTER, ANDREAS, HERRE,JUERGEN.

Fecha de Publicación: 9 de Junio de 2010.

Fecha Concesión Europea: 17 de Febrero de 2010.

Clasificación Internacional de Patentes:

H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

Clasificación PCT:

H04S3/00 H04S […] › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
H04S5/00 H04S […] › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.

APARATO Y METODO PARA SINTETIZAR TRES CANALES DE SALIDA, UTILIZANDO DOS CANALES DE ENTRADA.

Fragmento de la descripción:

Aparato y método para sintetizar tres canales de salida, utilizando dos canales de entrada.

La presente invención se refiere a sintetizadores de múltiples canales y, en particular, a dispositivos que generan tres o más canales de salida, utilizando dos canales de entrada estéreo.

El material de audio de múltiples canales cada vez se está volviendo más popular también en el ámbito del consumo doméstico. Esto primordialmente se debe al hecho de que películas en DVD ofrecen sonido 5.1 de múltiples canales y por lo tanto incluso los usuarios domésticos frecuentemente instalan sistemas de reproducción de audio que pueden reproducir audio de múltiples canales. Una configuración de este tipo consiste por ejemplo en 3 altavoces, L, C, R en la parte frontal, 2 altavoces Ls, Rs en la parte posterior y un canal de mejora de baja frecuencia (LFE, low frequency enhancement) y proporciona varias ventajas bien conocidas frente a la reproducción estéreo de 2 canales, por ejemplo:

- estabilidad de imagen frontal mejorada, incluso fuera de la posición de audición central óptima debido al canal central ("zona de sonido óptimo" más grande = posición de audición óptima)
- mayor sensación de "envolvimiento" del oyente, creada por las altavoces posteriores.

Sin embargo, existe una enorme cantidad de contenido de audio legado, que sólo consiste de dos canales de audio ("estéreo"), por ejemplo en Discos Compactos (CDCompact Disc).

Para reproducir material de audio legado en dos canales a través de una configuración de múltiples canales 5.1, hay dos opciones básicas:

1. Reproducir las señales estéreo del canal izquierdo y derecho a través de los altavoces L y R, respectivamente, es decir reproducirlas en la forma legada. Esta solución no aprovecha la configuración de altavoces ampliada (altavoces centrales y posteriores).
2. Puede utilizarse un método para convertir los dos canales del material del contenido en una señal de múltiples canales (esto puede suceder "sobre la marcha" o mediante preprocesamiento) que utiliza todos los altavoces 5.1 y de esta forma se beneficia de las ventajas previamente comentadas de la configuración de múltiples canales.

La solución n.º 2 claramente tiene ventajas frente a la n.º 1, pero también contiene algunos problemas especialmente con respecto a la conversión de los dos canales frontales (izquierdo y derecho = LR) en tres canales frontales (múltiples canales izquierdo, central y derecho = L'C'R').

Una buena solución de conversión de LR a L'C'R' debe cumplir los siguientes requisitos:

1) Para recrear una imagen frontal similar pero más estable en el caso de reproducción L'C'R' que en el de LR, el canal central deberá reproducir todos los eventos de sonido que usualmente se percibe que provienen desde el centro entre el altavoz izquierdo y derecho, si el oyente está es la "zona de sonido óptimo". Además, las señales en las posiciones frontal izquierda deberán reproducirse por L'C' y las señales en las posiciones frontal derecha deberán reproducirse por R'C', respectivamente (véase J.M. Jot y C. Avendano, "Spatial Enhancement of Audio Recordings", AES 23rd Conference, Copenhague, 2003).
2) La suma de la energía acústica emitida por los canales L'C'R' debe ser igual a la suma de la energía acústica de los canales fuente LR con el fin de lograr una impresión de sonido igualmente fuerte tanto para L'C'R como para LR. Considerando que existen iguales características en todos los canales de reproducción, esto se traduce en "la suma de la energía eléctrica de los canales L'C'R' debe ser igual a la suma de la energía eléctrica de los canales fuente LR".

Debido al requisito n.º 1, las señales de los canales izquierdo y derecho pueden mezclarse en un (único) canal central. Esto es particularmente cierto si las señales de canal izquierdo y derecho son casi idénticas, es decir representan una fuente de sonido ficticio en el centro de la fase de sonido frontal. Esta imagen ficticia se reemplaza ahora por una imagen "real" generada por el altavoz central. Debido al requisito n.º 2, esta señal central deberá transportar la suma de la energía izquierda y derecha. Si el nivel de las señales de canal izquierdo y derecho está cerca de la amplitud máxima que puede transmitirse por el canal (= 0 dBFS; dBFS = Escala Completa de dB), la suma de los niveles de ambos canales superará el nivel máximo que puede representarse por el canal/sistema. Esto usualmente da como resultado el efecto indeseado de "recorte".

La situación de recorte se ilustra en la figura 6. La figura 6 ilustra una forma de onda en tiempo de una señal 60 procesada por un procesador que tiene un umbral 61a positivo máximo y un umbral 61b negativo máximo. Dependiendo de la capacidad del procesador digital que procesa la señal digital, el umbral positivo máximo y el umbral negativo máximo pueden ser +1 y -1. De forma alternativa, cuando se utiliza procesador digital que representa los números en enteros, el umbral positivo máximo será 32768 correspondiente a 2¹⁵-1, y el umbral negativo máximo será -32768 correspondiente a -2¹⁵.

Dado que una señal de forma de onda en tiempo se representa por una secuencia de muestras, siendo cada muestra un número digital entre -32768 y +32767, queda fácilmente claro que pueden obtenerse números superiores cuando, para una cierta instancia de tiempo, el primer canal tiene un valor bastante elevado y el segundo canal también tiene un valor bastante elevado, y cuando estos valores bastante elevados se suman conjuntamente. Teóricamente, el número máximo que se obtiene mediante esta suma conjunta de los dos canales puede ser 65536. Sin embargo, el procesador de señal digital no puede representar este elevado número. En lugar de ello, el procesador digital sólo representará números iguales al umbral positivo máximo o al umbral negativo máximo. Por lo tanto, el procesador de señal digital realiza un recorte en cuanto que un número superior o igual al umbral positivo máximo o al umbral negativo máximo se reemplaza por un número igual al umbral positivo máximo y al umbral negativo máximo, de tal manera que, con respecto a la figura 6, se da la situación ilustrada. Dentro de una parte 62 de tiempo de recorte, la forma 60 de onda no tiene su forma natural (sinusoidal), sino que se aplana o recorta. Cuando esta forma de onda recortada se evalúa desde un punto de vista espectral, queda claro que este recorte en el dominio de tiempo da como resultado fuertes componentes armónicas provocadas por la alta magnitud de gradiente al inicio y al final de la parte 62 de tiempo de recorte.

Este "recorte digital" no está relacionado con la configuración de reproducción, es decir el amplificador y los altavoces utilizados para la representación de la señal de audio. Sin embargo, cada combinación amplificador/altavoz también tiene sólo un rango lineal limitado, y cuando este rango lineal se supera por una señal procesada, también tiene lugar una especie de recorte, que puede evitarse utilizando el concepto de la invención.

En cualquier caso, la aparición de recorte introduce fuertes distorsiones en la señal de audio, que degradan mucho la calidad de sonido percibido. De esta manera, la aparición de recorte tiene que evitarse. Aún más debido al hecho de que la mejora de sonido al representar una señal estéreo mediante una configuración de múltiples canales, tal como un sistema de altavoces 5.1, es pequeña en comparación con las distorsiones de recorte muy molestas. Por lo tanto, si no se puede garantizar que no se producirá un recorte, se preferirá utilizar sólo los altavoces izquierdo y derecho de una configuración de múltiples canales para representar una señal estéreo.

Existen soluciones en la técnica anterior para superar este problema de recorte.

Una solución simple para superar este problema es reducir en escala todos los canales de la misma manera hasta un nivel en el que ninguna de las señales de canal (en especial la señal central) supere el límite de 0 dBFS. Esto puede realizarse estáticamente mediante un valor fijo predeterminado. En este caso, el valor fijo también debe ser válido para las situaciones del peor caso, en las que el canal izquierdo y derecho tienen niveles máximos. Para la conversión promedio de LR a L'C'R', esto lleva a una versión L'C'R' significativamente más silenciosa que la de LR estéreo original,...

Reivindicaciones:

1. Aparato para sintetizar tres canales (12a, 12b, 12c) de salida utilizando dos canales (10a, 10b) de entrada, en el que un segundo canal de los tres canales de salida puede alimentarse a un altavoz en un esquema de representación de audio pretendido, que está ubicado entre dos altavoces que pueden alimentarse con el primer canal de salida y el tercer canal de salida, que comprende:

un analizador (15) para analizar los dos canales de entrada, para detectar componentes de señal que ocurren en ambos canales de entrada para obtener componentes de señal detectadas; y
un generador (16) de señal, para generar los tres canales (12a, 12b, 12c) de salida utilizando los dos canales (10a, 10b) de entrada, en el que el generador de señal comprende:
un mezclador (16a) ascendente dos-tres, para generar al menos un segundo canal (12b) intermedio incluyendo al menos una parte de las componentes de señal detectadas;
un detector (16b) de recorte, para detectar una parte del segundo canal que tiene una amplitud por encima del umbral máximo; y
un controlador (30, 31) de mezclador ascendente dos-tres para controlar el mezclador (16a) ascendente dos-tres de tal manera que sólo una parte de las componentes de señal detectadas se alimenta al segundo canal y un resto de las componentes de señal permanecen ubicadas en los canales de salida primero y tercero, cuando una alimentación completa de las componentes de señal detectadas daría como resultado la superación de un umbral (61a, 61b) máximo para el segundo canal.

2. Aparato según la reivindicación 1, en el que el generador (16) de señal es operativo para generar los tres canales de salida de tal manera que, para un determinado periodo de tiempo, una energía total de los tres canales de salida y canales de salida adicionales potencialmente generados es igual a una energía eléctrica o acústica de los dos canales de entrada.

3. Aparato según la reivindicación 1 ó 2, en el que el generador (16) de señal es operativo para generar el segundo canal de salida de tal manera que la parte de las componentes de señal detectadas alimentadas al segundo canal es lo más grande posible, de tal manera que una energía del segundo canal de salida, que incluye sólo la parte de las componentes de señal detectadas siempre tiene una amplitud máxima por debajo de o igual al umbral (61a, 61b) máximo.

4. Aparato según una cualquiera de las reivindicaciones anteriores, en el que el generador (16) de señal está adaptado de tal manera que un resto (73) de las componentes de señal detectadas, que no están en el segundo canal, se incluyen en los canales primero y tercero.

5. Aparato según una cualquiera de las reivindicaciones anteriores, en el que el umbral (61a, 61b) máximo es una amplitud a escala completa determinada por el aparato para sintetizar o un dispositivo de procesamiento digital o analógico conectado al aparato para sintetizar.

6. Aparato según la reivindicación 5, en el que el umbral (61a, 61b) máximo es igual a un valor de muestreo positivo o negativo máximo admisible de una forma de onda de una señal en el dominio de tiempo.

7. Aparato según una cualquiera de las reivindicaciones anteriores, en el que el analizador (15) es operativo para determinar (84) una medida de una correlación cruzada entre al menos una parte del primer canal de entrada y el segundo canal de entrada y para detectar (86) una parte que tiene una medida de correlación cruzada por encima de un umbral de similitud.

8. Aparato según una cualquiera de las reivindicaciones anteriores, en el que el analizador (15) es operativo para detectar (85) una energía de una parte del primer canal y una parte del segundo canal y para detectar (86) partes de los canales que tienen energías que son iguales o diferentes en menos de un umbral de igualdad.

9. Aparato según una cualquiera de las reivindicaciones anteriores, en el que el analizador (15) y el generador (16) de señal son operativos para realizar un análisis y síntesis selectivos en tiempo o selectivos en frecuencia.

10. Aparato según una cualquiera de las reivindicaciones anteriores, en el que los canales primero y segundo son un canal izquierdo (L) y un canal derecho (R) de una representación estéreo de una señal de audio, y en el que los tres canales de salida son un canal izquierdo frontal (L'), un canal central (C') y un canal derecho frontal (R'), o un canal izquierdo posterior (L_s), un canal central posterior (C_s) y un canal derecho posterior (C_s).

11. Método para sintetizar tres canales (12a, 12b, 12c) de salida utilizando dos canales (10a, 10b) de entrada, en el que un segundo canal (12b) de los tres canales de salida puede alimentarse a un altavoz en un esquema de representación de audio pretendido, que está ubicado entre dos altavoces que pueden alimentarse con el primer canal de salida y el tercer canal de salida, que comprende:

analizar (15) los dos canales de entrada, para detectar componentes de señal que ocurren en ambos canales de entrada; y
generar (16) los tres canales de salida utilizando los dos canales de entrada, en el que la etapa de generar comprende:
generar (16a) al menos un segundo canal (12b) intermedio que incluye al menos una parte de las componentes de señal detectadas;
detectar (16b) una parte del segundo canal que tiene una amplitud por encima del umbral máximo; y
controlar (30, 31) la etapa de generar de tal manera que sólo una parte de las componentes de señal detectadas se alimenta al segundo canal y un resto de las componentes de señal permanecen ubicadas en los canales de salida primero y tercero, cuando una alimentación completa de las componentes de señal detectadas daría como resultado la superación de un umbral máximo para el segundo canal.

12. Aparato para sintetizar tres canales (12a, 12b, 12c) de salida utilizando dos canales (10a, 10b) de entrada, en el que un segundo canal de los tres canales de salida puede alimentarse a un altavoz en un esquema de representación de audio pretendido, que está ubicado entre dos altavoces que pueden alimentarse con el primer canal de salida y el tercer canal de salida, que comprende:

un analizador (15) para analizar los dos canales de entrada, para detectar componentes de señal que ocurren en ambos canales de entrada, para obtener componentes de señal detectadas; y
un generador (16) de señal, para generar los tres canales (12a, 12b, 12c) de salida utilizando los dos canales (10a, 10b) de entrada, en el que el generador de señal comprende:
un detector (42) de recorte, para determinar una parte de los canales de entrada, en la que hay una probabilidad de recorte;
un mezclador (16a) ascendente dos-tres para generar tres canales intermedios, en el que un segundo canal intermedio incluye al menos una parte de las componentes de señal detectadas; y
un controlador (41) para controlar el mezclador (16a) ascendente dos-tres, de tal manera que un parámetro de generación para mezclar de manera ascendente la parte determinada por el detector de recorte se controla de tal manera que el segundo canal siempre tiene una amplitud por debajo de o igual al umbral máximo.

13. Método para sintetizar tres canales (12a, 12b, 12c) de salida utilizando dos canales (10a, 10b) de entrada, en el que un segundo canal (12b) de los tres canales de salida puede alimentarse a un altavoz en un esquema de representación de audio pretendido, que está ubicado entre dos altavoces que pueden alimentarse con el primer canal de salida y el tercer canal de salida, que comprende:

analizar (15) los dos canales de entrada para detectar componentes de señal que ocurren en ambos canales de entrada; y
generar (16) los tres canales de salida utilizando los dos canales de entrada, en el que la etapa de generar comprende:
determinar (42) una parte de los canales de entrada, en la que hay una probabilidad de recorte;
generar (16a) tres canales intermedios, en el que un segundo canal intermedio incluye al menos una parte de las componentes de señal detectadas; y
controlar (41) la etapa de generar (16a), de tal manera que un parámetro de generación para mezclar de manera ascendente la parte determinada por el detector de recorte se controla de tal manera que el segundo canal siempre tiene una amplitud por debajo de o igual al umbral máximo.

14. Programa informático para realizar, cuando se ejecuta en un ordenador, un método de sintetización según la reivindicación 11 ó 13.

Patentes similares o relacionadas:

Método y sistema para el procesamiento de sonido envolvente en un auricular, del 27 de Mayo de 2020, de Voyetra Turtle Beach, Inc: Un método, que comprende: en un auricular de audio que recibe una pluralidad de señales de audio correspondientes a una pluralidad de canales de sonido envolvente: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Sistema y método de salida binaural paramétrico, del 19 de Febrero de 2020, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para codificar audio de entrada basado en un canal u objeto para la reproducción, incluyendo el método las etapas de: (a) renderizar inicialmente […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]

Control de rango dinámico basado en metadatos extendidos de audio codificado, del 11 de Diciembre de 2019, de APPLE INC.: Un sistema para producir una grabación de audio digital codificada que tiene una pluralidad de canales de audio u objetos de audio, que comprende: un codificador de audio […]