Aparato y procedimiento para generar una señal de salida multi-canal.

1. Aparato para generar una señal de salida multi-canal que tiene K canales de salida,

correspondiendo la señal desalida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales detransmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajoque tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales deentrada, donde E es≥C es >E, y K es >1 y ≤ C donde la operación de mezclado hacia abajo es eficaz paraintroducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, ypara introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: uncalculador de canal de anulación (20) para calcular un canal de anulación (21) empleando información relacionadacon el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o lainformación paramétrica; un combinador (23) para combinar el canal de anulación (21) y el primer canal detransmisión (23) o una versión procesada de estos para obtener un segundo canal de base (25), en el que unainfluencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en elprimer canal de transmisión; y un canal reconstructor (26) para reconstruir un segundo canal de salidacorrespondiente al segundo canal de entrada empleando el segundo canal de base e información paramétricarelacionada con el segundo canal de entrada, y para reconstruir un primer canal de salida correspondiente al primercanal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho deque la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétricarelacionada con el primer canal de entrada.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2005/005199.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HERRE, JURGEN, HILPERT, JOHANNES, FALLER,CHRISTOF, DISCH,SASCHA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2387248_T3.pdf

 


Fragmento de la descripción:

Aparato y procedimiento para generar una señal de salida multi-canal.

Sector de la invención

La presente invención se refiere a la descodificación multi-canal y, en particular, a la descodificación multicanal, en la que por ejemplo están presentes al menos dos canales de transmisión, que es estéreo compatible.

En los últimos tiempos, la técnica de reproducción de audio multi-canal se está convirtiendo cada vez más importante. Esto puede ser debido al hecho de que las técnicas de compresión/ codificación de audio tales como la bien conocida técnica mp3 han hecho posible distribuir los registros de audio a través de Internet u otros canales de transmisión con un ancho de banda limitado. La técnica de codificación mp3 se ha hecho tan famosa por el hecho de que permite la distribución de todos los registros en un formato estéreo, es decir, una representación digital de la grabación de audio que incluye un canal estéreo primero o izquierdo y un segundo canal estéreo o derecho.

Sin embargo, hay carencias básicas en los sistemas de sonido de dos canales convencionales. Por lo tanto, se ha desarrollado la técnica envolvente. Una representación envolvente multi-canal recomendada incluye, además de los dos canales estéreo L y R, un canal central adicional C y dos canales de sonido envolvente Ls, Rs. Este formato de sonido de referencia también se conoce como estéreo tres / dos, lo que significa tres canales frontales y dos canales de sonido envolvente. Generalmente, se requieren cinco canales de transmisión. En un entorno de reproducción, son necesarios por lo menos cinco altavoces en los respectivos cinco lugares diferentes para obtener un punto óptimo agradable a una cierta distancia de los cinco altavoces bien colocados.

Son conocidas varias técnicas en la técnica para reducir la cantidad de datos necesarios para la transmisión de una señal de audio de canales múltiples. Estas técnicas se denominan técnicas estéreo conjuntas. Para este fin, se hace referencia a la figura 10, que muestra un dispositivo estéreo conjunto 60. Este dispositivo puede ser un dispositivo que implementa por ejemplo intensidad estéreo (IS) o codificación binaural (BCC) . Este dispositivo recibe generalmente - como entrada- al menos dos canales (CH1, CH2, ...CHn) , y tiene como salida un canal portador único y datos paramétricos. Los datos paramétricos se definen se modo que, en un descodificador, se puede calcular una aproximación de un canal original (CH1, CH2, ...

Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras en el dominio del tiempo etc, que proporcionan una representación comparativamente fina de la señal subyacente, mientras que los datos paramétricos no incluyen estas muestras de coeficientes espectrales sino que incluyen los parámetros de control para controlar un algoritmo de reconstrucción determinado, tal como la ponderación por multiplicación, desfase de tiempo, cambio de frecuencia, ... Los datos paramétricos, por lo tanto, incluyen solamente una representación relativamente basta de la señal o del canal asociado. Expresado en números, la cantidad de datos requeridos por un canal portador estará en el intervalo de 60-70 kbit / s, mientras que la cantidad de datos requeridos por el lado de información paramétrico para un canal estará en el intervalo de 1, 5 - 2, 5 kbit / s. Un ejemplo de datos paramétricos son los bien conocidos factores de escala, la información de intensidad estéreo o los parámetros binaurales tal como se describen a continuación.

El documento de HERRE J., FALLER C.: "MP3 Surround: Efficient y Compatible Coding de Multi-Channel Audio" AES CONVENTION, 8 May 2004 (2004-05-08) , páginas 1-14, describe: un aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, los E canales de transmisión representando un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y : C.

La codificación de intensidad estéreo se describe en la pre-impresión AES 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, Febrero 1994, Amsterdam. En general, el concepto de intensidad estéreo se basa en una transformada de eje principal que debe ser aplicada a los datos de ambos canales de audio estereofónicos. Si la mayoría de los puntos de datos se concentran alrededor del primer eje principal, puede lograrse una ganancia de codificación mediante la rotación de ambas señales en un ángulo determinado antes de la codificación. Esto es, sin embargo, no siempre es cierto para las técnicas de producción estereofónicas reales. Por lo tanto, esta técnica se ha modificado mediante la exclusión de la segunda componente ortogonal de la transmisión en el flujo de bits. Así, las señales reconstruidas para los canales izquierdo y derecho consisten en versiones de la misma señal transmitida ponderadas o escaladas de manera diferente. Sin embargo, las señales reconstruidas difieren en su amplitud, pero son idénticas en cuanto a su información de fase. Las envolventes energía-tiempo de ambos canales de audio originales, sin embargo, se conservan por medio de la operación de escalado selectivo, que normalmente opera de una manera selectiva en frecuencia. Esto se ajusta a la percepción humana del sonido en las frecuencias altas, donde las señales espaciales dominantes están determinadas por las envolventes de energía.

Además, en implementaciones prácticas, la señal transmitida, es decir, el canal portador se genera a partir de la señal suma de los canales izquierdo y derecho en lugar de girar ambos componentes. Además, este procesamiento, es decir, la generación de parámetros de intensidad estéreo para realizar la operación de escalado, se realiza en frecuencia selectiva, es decir, de forma independiente para cada banda de factor de escala, es decir, partición de frecuencia de codificación. Preferentemente, los dos canales se combinan para formar un combinado o canal "portador", y, sumado al canal combinado, la información de intensidad estéreo se determina como dependiente de la energía del primer canal, la energía del segundo canal o la energía del combinado o canal.

La técnica de BCC se describe en el documento de la convención AES 5574 5574, "Binaural cue coding applied to stereo y multi-channel audio compression", C. Faller, F. Baumgarte, mayo de 2002, Munich. En la codificación de BCC, un número de canales de entrada de audio se convierten en una representación espectral, utilizando una transformada basada en DFT con ventanas solapadas. El espectro uniforme resultante se divide en particiones no superpuestas cada una con un índice. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB) . Las diferencias de nivel entre canales (ICLD) y las diferencias de tiempo entre canales () se calculan para cada partición para cada marco k. El ICLD y el ICTD se cuantifican y se codifican resultando en un flujo de bits BCC. Las diferencias de nivel entre canales y diferencias de tiempo entre canales se dan para cada canal con respecto a un canal de referencia. A continuación, los parámetros se calculan de acuerdo con las fórmulas prescritas, que dependen de las determinadas particiones de la señal a procesar.

En un lado decodificador, el descodificador recibe una señal mono y el flujo de bits BCC. La señal mono se transforma en el dominio de la frecuencia y entra en un bloque de síntesis espacial, que también recibe los valores decodificados ICLD y ICTD. En el bloque de síntesis espacial, se utilizan los valores de los parámetros BCC (ICLD y ) para realizar una operación de ponderación de la señal mono con el fin de sintetizar las señales del canal múltiple, que, después de una conversión de frecuencia / tiempo, representan una reconstrucción de la señal audio multicanal original.

En el caso de BCC, el módulo estéreo conjunto 60 es operativo para dar como salida información de lado de canal de tal manera que los datos de canal paramétricos se cuantifican y codifican en parámetros ICLD o TICD, donde uno de los canales originales se utiliza como canal de referencia para la codificación de la información de lado de canal.

Normalmente, el canal portador está formado por la suma de los... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y donde la operacion de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: un calculador de canal de anulación (20) para calcular un canal de anulación (21) empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; un combinador (23) para combinar el canal de anulación (21) y el primer canal de transmisión (23) o una versión procesada de estos para obtener un segundo canal de base (25) , en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y un canal reconstructor (26) para reconstruir un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y para reconstruir un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.

2. Aparato según la reivindicación 1, en el que el combinador (22) es operativo para sustraer el canal de anulación del primer canal de transmisión o la versión procesada de estos.

3. Aparato según la reivindicación 1 o la reivindicación 2, en el que el calculador de canal de anulación (20) es operativo para calcular una estimación para el primer canal de entrada empleando el primer canal de transmisión y el segundo canal de transmisión para obtener el canal de anulación (21) .

4. Aparato según cualquiera de las reivindicaciones 1 - 3, en el que la información paramétrica incluye un parámetro de diferencia entre el primer canal de entrada y un canal de referencia, y en el que el calculador de canal de anulación (20) es operativo para calcular una suma del primer canal de transmisión y el segundo canal de transmisión y para ponderar la suma empleando el parámetro de diferencia.

5. Aparato según cualquiera de las reivindicaciones 1 - 4, en el que la operación de mezclado hacia abajo es tal que el primer canal de entrada es introducido en el primer canal de transmisión tras ser escalado por un factor de mezclado hacia abajo, y en el que el calculador de canal de anulación (20) es operativo para escalar la suma de los canales de transmisión primero y segundo empleando un factor de escala, que depende del factor de mezclado hacia abajo.

6. Aparato según la reivindicación 5, en el que el factor de ponderación es igual al factor de mezclado hacia abajo.

7. Aparato según cualquiera de las reivindicaciones 1 - 6, en el que el calculador de canal de anulación (20) es operativo para determinar una suma de los canales de transmisión primero y segundo para obtener el primer canal de base.

8. Aparato según cualquiera de las reivindicaciones 1 -7, que comprende además un procesador (24) que es operativo para procesar el primer canal de transmisión por ponderación empleando un primer factor de ponderación, y en el que el calculador de canal de anulación (20) es operativo para ponderar el segundo canal de transmisión empleando un segundo factor de ponderación.

9. Aparato según la reivindicación 8, en el que la información paramétrica incluye el parámetro de diferencia entre el primer canal de entrada y un canal de referencia, y en el que el calculador de canal de anulación (20) es operativo para determinar el segundo factor de ponderación basado en un parámetro de diferencia.

10. Aparato según la reivindicación 8 o 9, en el que el primer factor de ponderación es igual a (1-h) , donde h es un valor real, y en el que el segundo factor de ponderación es igual a h.

11. Aparato según la reivindicación 10, en el que la información paramétrica incluye un valor de diferencia de nivel, y donde h se deriva de el valor de diferencia de nivel paramétrico.

12. Aparato según la reivindicación 11, en el que h es igual a un valor derivado de la diferencia de nivel dividida por un factor que depende de la operación de mezclado hacia abajo.

13. Aparato según la reivindicación 10, en el que la información paramétrica incluye la diferencia de nivel entre el primer canal y el canal de referencia, y en el que h es igual a 112 x 10Ll20, donde L es la diferencia de nivel.

14. Aparato según cualquiera de las reivindicaciones 1 - 13, en el que la información paramétrica también incluye una señal de control que depende de la relación entre el primer canal de entrada y el segundo canal de entrada, y en el que el calculador de canal de anulación (20) está controlado por la señal de control para aumentar o disminuir activamente una energía del canal de anulación o incluso deshabilitar el cálculo del canal de anulación del todo.

15. Aparato según cualquiera de las reivindicaciones 1 - 14, en el que la operación de mezclado hacia abajo también es operativa para introducir un tercer canal de entrada en el segundo canal de transmisión, comprendiendo el aparato además otro combinador para combinar el canal de anulación y el segundo canal de transmisión o una versión procesada de estos para obtener un tercer canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada on el segundo canal de transmisión; y un canal reconstructor para reconstruir el tercer canal de salida correspondiente al tercer canal de entrada empleando el tercer canal de base e información paramétrica relacionada con el tercer canal de entrada.

16. Aparato según cualquiera de las reivindicaciones 1 - 15, en el que la información paramétrica incluye diferencias de nivel entre canales, diferencias de tiempo entre canales, diferencias de fase entre canales o valores de correlación entre canales, y en el que el canal reconstructor (26) es operativo para aplicar cualquiera de los parámetros del grupo mencionado en un canal de base para obtener un canal de salida en bruto.

17. Aparato según la reivindicación 16, en el que el canal reconstructor (26) es operativo para escalar the canal de salida en bruto de modo que toda la energía en el canal de salida reconstruido final es igual a toda la energía de los E canales de transmisión.

18. Aparato según cualquiera de las reivindicaciones 1 - 17, en el que la información paramétrica se dan por bandas, y en el que el calculador de canal de anulación (20) , el combinador (22) y el canal reconstructor (26) son operativos para procesar la pluralidad de bandas empleando información paramétrica determinada por bandas, y en el que el aparato también comprende una unidad de conversión tiempo/ frecuencia (IFB) para convertir los canales de transmisión en una representación en frecuencia que tiene bandas de frecuencia, y una unidad de conversión frecuencia/ tiempo para convertir bandas de frecuencia reconstruidas en el dominio del tiempo.

19. El aparato según cualquiera de las reivindicaciones 1 - 18 que comprende además: un sistema que se selecciona de entre el grupo que consiste en un reproductor de video digital, un reproductor de audio digital, un ordenador, un receptor satélite, un receptor cable , un receptor de difusión terrestre, y un sistema de entretenimiento doméstico; y donde el sistema comprende el calculador de canal, el combinador, y el canal reconstructor.

20. Procedimiento para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y donde la operacion de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: calcular (20) un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; combinar (22) el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y reconstruir (26) un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.

21. Programa de ordenador que tiene un código de programa para implementar, cuando se ejecuta en un ordenador, un procedimiento para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multicanal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y dond e la operación de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, comprendiendo el procedimiento: calcular (20) un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; combinar (22) el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la

influencia del primer canal de entrada en el primer canal de transmisión; y reconstruir (26) un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.

Izquierda Derecha Central Posterior – izq Posterior - der

IZQUIERDO ENV. IZQ. CENTRAL DERECHO ENV. DER.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .