Número reducido de decodificación de canales.

Calculador de parámetros para derivar los parámetros de conversión a la alza (508,

510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524), comprendiendo el calculador de parámetros:

un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC (510) con la información sobre una correlación entre el canal izquierdo y derecho.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2006/008175.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: VILLEMOES, LARS, BREEBAART,JEROEN, KJOERLING,KRISTOFER.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04S3/00 SECCION H — ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

PDF original: ES-2398573_T3.pdf

 


Fragmento de la descripción:

Número reducido de decodificación de canales.

Campo de la Invención [0001] La presente invención se refiere a la decodificación de señales de audio y en particular a la decodificación de una conversión paramétrica a la baja de canales múltiples, o multicanal, de una señal multicanal original, a un número menor de canales que el número de canales de la señal multicanal original.

Antecedentes de la Invención [0002] El desarrollo reciente de la codificación de audio ha hecho posible la habilidad de recrear una representación de canales múltiples, o multicanal, de una señal de audio en base a una señal estéreo (o mono) y los datos de control correspondientes. Estos procedimientos difieren de manera sustancial de las soluciones más antiguas basadas en matrices, tales como Dolby Prologic, puesto que los datos de control adicionales se transmiten para controlar la recreación, referida también como la conversión a la alza, de los canales envolventes en base a los canales mono o estéreo transmitidos.

De este modo, tal decodificador paramétrico de audio multicanal, por ejemplo MPEG Envolvente, reconstruye N canales en base a M canales transmitidos, donde N > M, y en base a los datos de control adicionales. Los datos de control adicionales representan una tasa de datos significativamente menor que la transmisión de todos los N canales, haciendo la codificación muy eficiente, mientras que, al mismo tiempo, asegura la compatibilidad con ambos, los dispositivos de M canales y los dispositivos de N canales.

Estos procedimientos de codificación paramétrica envolvente usualmente incluyen una parametrización de la señal envolvente en base a la Diferencia de Intensidad Entre Canales (IID, por sus siglas en inglés) y a la Coherencia Entre Canales (ICC, por sus siglas en inglés) . Estos parámetros describen relaciones de energía y correlación entre pares de canales en el proceso de conversión a la alza. Parámetros de adicionales, usados también en el arte previo, incluyen a los parámetros de predicción usados para predecir los canales intermedios o de salida durante el procedimiento de conversión a la alza.

Dos ejemplos famosos de tal codificación multicanal son la codificación BCC y el MPEG envolvente. En la codificación BCC, un número de canales de audio de entrada se convierten a una representación espectral usando una transformación basada en la Transformada Discreta de Fourier (DFT, por sus siglas en inglés) con ventanas superpuestas. El espectro uniforme resultante es dividido entonces en particiones no superpuestas. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB, por sus siglas en inglés) . Entonces, los parámetros espaciales llamados Diferencia de Nivel Entre Canales (ICLD, por sus siglas en inglés) y Diferencia de Tiempo Entre Canales (ICTD, por sus siglas en inglés) son estimados para cada partición. El parámetro ICLD describe un nivel de diferencia entre dos canales y el parámetro ICTD describe la diferencia de tiempo (cambio de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se dan para cada canal con respecto a un canal común de referencia. Después de la derivación de estos parámetros, los parámetros son cuantificados y codificados para la transmisión.

Los parámetros individuales son estimados con respecto al canal único de referencia en la codificación BCC. En otros sistemas paramétricos de codificación de envolvente, por ejemplo en el MPEG envolvente, se emplea una parametrización con estructura de árbol. Esto significa que los parámetros ya no son estimados con respecto a un canal común único de referencia, sino con diferentes canales de referencia que pueden ser aún una combinación de canales de la señal multicanal original. Por ejemplo, teniendo una señal de 5.1 canales, los parámetros pueden ser estimados entre una combinación de los canales frontales y entre una combinación de los canales posteriores.

Por supuesto, la compatibilidad hacia atrás con los estándares de audio establecidos actualmente es altamente deseable también para los esquemas de codificación paramétrica. Por ejemplo, teniendo una señal convertida en mono a la baja, es deseable que también se proporcione una posibilidad de crear una señal de reproducción estéreo con alta fidelidad. Esto significa que una señal monofónica convertida a la baja tiene que ser convertida a la alza en una señal estéreo, haciendo uso de los parámetros adicionales transmitidos de la mejor manera posible.

Un problema común en la codificación multicanal es la preservación de la energía en la conversión a al alza, ya que la percepción humana de la posición espacial de una fuente sonora es dominada por la intensidad sonora de la señal, es decir, por la energía contenida dentro de la señal. Por lo tanto, debe tenerse un cuidad extremo en la reproducción de la señal para atribuirle la intensidad sonora correcta a cada canal reconstruido, de tal modo que se evite la introducción de artefactos que disminuyan grandemente la percepción de la calidad de la señal reconstruida. Ya que durante la conversión a la baja, las amplitudes de las señales son comúnmente sumadas, la posibilidad de interferencia aumenta, siendo descrita por el parámetro de correlación o coherencia.

Cuando se trata de la reconstrucción de un número reducido de canales (un número de canales menor que el número original de canales de la señal multicanal) , los esquemas como el BCC son de manejo simple, puesto que cada parámetro es transmitido con respecto al mismo canal único de referencia. Por lo tanto, teniendo conocimiento sobre el canal de referencia, puede derivarse fácilmente el nivel más relevante de información (medida absoluta de energía) para cada canal necesitado para la conversión a al alza. De este modo, puede reconstruirse un número reducido de canales sin la necesidad de reconstruir la señal multicanal completa en principio. Así, el cómputo de la energía para las energías de la señal multicanal es más sencillo en la BCC al usar variables únicas en lugar de los productos de las variables, pero esto es solamente un primer paso. Cuando se habla de la derivación de energías y correlaciones de un número reducido de canales, que deben estar tan cerca como sea posible a las conversiones parciales a la baja de las señales multicanal originales, el nivel de dificultad entre el MPEG Envolvente y la BCC es comparable.

En contraste con esto, una estructura basada en árbol, como el MPEG envolvente, utiliza una parametrización en la que la información relevante para cada canal individual no está contenida en un parámetro único. Por consiguiente, en el arte previo, la reconstrucción de un número reducido de canales requiere de la reconstrucción de la señal multicanal seguida de una conversión a la baja en la cantidad reducida de canales para no violar el requerimiento de preservación de la energía. Esto tiene la obvia desventaja de una complejidad computacional extremadamente alta.

La solicitud de patente internacional WO 2005/101370 A1 describe un enfoque particular de codificación multicanal de datos en un solo canal monofónico y en información lateral asociada, que tiene información sobre las propiedades espaciales de la señal multicanal original. Cuando se transmiten tanto el canal de downmix y la información lateral, un descodificador adecuado es capaz de reconstruir una aproximación de la señal multicanal original que había sido la base para la generación de la mezcla downmix y los parámetros.

La parametrización se elige de manera que las combinaciones específicas de canal de los canales originales pueden ser reproducidas sin la utilización de todos los parámetros de transmisión, de modo que la complejidad computacional en la reconstrucción puede ser reducida cuando, por ejemplo, sólo deben reconstruir los canales delanteros (canales izquierdo, central y derecho) de una señal de 5.1 canales.

Breve Descripción de la Invención [0013] Es el objetivo de la presente invención proporcionar un concepto para obtener un número reducido de canales a partir de una señal paramétrica multicanal de manera más eficiente.

En conformidad con un primer aspecto de la presente invención, este objetivo es logrado por medio de un calculador de parámetro para derivar los parámetros de la conversión a la alza según la reivindicación 1.

En conformidad con un segundo aspecto de la presente invención, este objetivo es logrado por medio de un reconstructor de canal según la reivindicación 16.

En conformidad con un tercer aspecto de la presente invención, este objetivo es logrado por medio de un procedimiento... [Seguir leyendo]

 


Reivindicaciones:

1. Calculador de parámetros para derivar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524) , comprendiendo el calculador de parámetros:

un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC

(510) con la información sobre una correlación entre el canal izquierdo y derecho.

2. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de parámetros multicanal (504, 506) que describen las propiedades de la señal de un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de la señal multicanal.

3. El calculador de parámetro según la reivindicación 2, en el que el re-calculador de parámetro (502) es operativo para derivar los parámetros de conversión a la alza (508, 510) que describen las mismas propiedades de la señal de los canales de la representación intermedia de canal como los parámetros multicanal (504, 506) .

4. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de los parámetros de correlación (ICC) (504) con la información sobre una correlación y los parámetros de nivel (CLD)

(506) con la información de la energía para un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de una señal multicanal.

5. El calculador de parámetro según la reivindicación 4, en el que se adapta al uso de parámetros multicanal para una señal multicanal que incluye un canal izquierdo frontal (LF, por sus siglas en inglés) (2) , izquierdo envolvente (LS, por sus siglas en inglés) (5) , derecho frontal (RF, por sus siglas en inglés) (4) , derecho envolvente (RS, por sus siglas en inglés) (6) y central (C) (3) .

6. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD (508) , usando:

un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal;

un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3) ;

un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6) ; y

un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4) .

7. El calculador de parámetro según la reivindicación 6, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD en conformidad con la siguiente fórmula:

en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R (524) derivados por

En los que las energías de las señales multicanal se derivan de los parámetros CLD de la siguiente manera:

8. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro ICC (510) usando: un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal:

un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3) : un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6) ; y un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4) ; un primer parámetro ICC (ICC2) con información de la correlación entre el canal LS (5) y RS (6) ; y un segundo parámetro ICC (ICC3) con información sobre la correlación entre el canal LF (2) y RF (4) .

9. El calculador de parámetro según la reivindicación 8, en el que el parámetro ICC (510) se deriva en conformidad con la siguiente fórmula:

10. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro es operativo para derivar el parámetro CLD (508) , usando:

un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;

un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) ;

un parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal.

11. El calculador de parámetro según la reivindicación 10, en el que el parámetro CLD (508) se deriva de la siguiente fórmula:

en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R derivados por

donde 12. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro ICC (510) usando:

un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;

un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) ;

un primer parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal; y

un segundo parámetro ICC (ICC1) con información de la correlación entre una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) .

13. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el valor ICC utilizando la siguiente fórmula:

donde la medida p de correlación es derivada como y

14. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para usar los parámetros multicanal (504, 506) que describen una representación de sub-banda de la señal multicanal.

15. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) es operativo para usar parámetros multicanal valuado complejos (504, 506) .

16. El reconstructor de canal con un reconstructor de parámetro, en el que incluye:

un calculador de parámetro según la reivindicación 7; y

un convertidor a la alza (520) para derivar la representación estéreo (524) usando los parámetros de conversión a la alza (508, 510) y la señal convertida a la baja (522) .

17. Procedimiento para generar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja y menos canales que la señal multicanal, caracterizando la representación estéreo una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo y en la que los parámetros multicanal (504, 506) incluyen la información sobre los canales no incluidos en la representación estéreo; caracterizado el procedimiento porque incluye:

derivar los parámetros de conversión a la alza (508, 510) incluyendo un parámetro CLD (508) y una parámetro ICC

(510) a partir de los parámetros multicanal usando los parámetros con información sobre los canales no incluidos en la representación estéreo (524) , el parámetro CLD (508) con información de la energía para el canal izquierdo y el derecho de la representación estéreo y el parámetro ICC (519) con información sobre una correlación entre el canal izquierdo y derecho.

18. El receptor o reproductor de audio (600) , teniendo el receptor o reproductor de audio un calculador de parámetro (601) Según la reivindicación 1.

19. Procedimiento para recibir o reproducir audio, teniendo el procedimiento un procedimiento para generar parámetros de conversión a la alza según la reivindicación 17.

20. Programa de computadora con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para generar los parámetros de conversión a la alza según la reivindicación 17.

21. Programa computacional con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para recibir o reproducir audio, según la reivindicación 19.


 

Patentes similares o relacionadas:

Codificador que utiliza cancelación del efecto de solapamiento hacia delante, del 25 de Abril de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Decodificador para decodificar un flujo de datos que comprende una secuencia de tramas en las cuales se codifican segmentos de tiempo de […]

Decodificador con filtros configurables, del 17 de Abril de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un decodificador acoplado a los datos codificados recibidos, dicho decodificador incluye: una etapa de desempaquetado configurada para, en respuesta […]

Descodificación estéreo de predicción compleja basada en TCMD, del 17 de Abril de 2019, de DOLBY INTERNATIONAL AB: Un sistema descodificador para proporcionar una señal estéreo por codificación estéreo de predicción compleja, que comprende: una etapa de mezcla ascendente (406, […]

Codificación mejorada de señales de audio digitales multicanales, del 10 de Abril de 2019, de Orange: Procedimiento de codificación de una señal de audio multicanal que representa una escena sonora que consta de una pluralidad de fuentes sonoras, […]

Codificación de audio de multicanal utilizando predicción compleja y señalización de estimación explícita, del 3 de Abril de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Decodificador de audio para decodificar una señal de audio multicanal codificada , comprendiendo la señal de audio multicanal codificada una primera señal […]

Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales, del 29 de Marzo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales, que comprende: un mezclador descendente para el mezclado de forma […]

Mecanismo para la señalización dinámica de las capacidades del codificador, del 27 de Marzo de 2019, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un nodo de control en un sistema de comunicación celular, que comprende: una o más interfaces de comunicación configuradas para acoplar comunicativamente […]

Un método y aparato para cuantificación de vector flexible, del 22 de Marzo de 2019, de Nokia Technologies OY: Un método para cuantificar un vector de coeficientes de frecuencia espectral de línea para una trama de audio posterior a una primera trama de audio, que comprende: […]

Otras patentes de KONINKLIJKE PHILIPS ELECTRONICS N.V.