Número reducido de decodificación de canales.

Calculador de parámetros para derivar los parámetros de conversión a la alza (508,

510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524), comprendiendo el calculador de parámetros:

un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC (510) con la información sobre una correlación entre el canal izquierdo y derecho.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2006/008175.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: VILLEMOES, LARS, BREEBAART,JEROEN, KJOERLING,KRISTOFER.

Fecha de Publicación: 20 de Marzo de 2013.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

PDF original: ES-2398573_T3.pdf

Fragmento de la descripción:

Número reducido de decodificación de canales.

Campo de la Invención [0001] La presente invención se refiere a la decodificación de señales de audio y en particular a la decodificación de una conversión paramétrica a la baja de canales múltiples, o multicanal, de una señal multicanal original, a un número menor de canales que el número de canales de la señal multicanal original.

Antecedentes de la Invención [0002] El desarrollo reciente de la codificación de audio ha hecho posible la habilidad de recrear una representación de canales múltiples, o multicanal, de una señal de audio en base a una señal estéreo (o mono) y los datos de control correspondientes. Estos procedimientos difieren de manera sustancial de las soluciones más antiguas basadas en matrices, tales como Dolby Prologic, puesto que los datos de control adicionales se transmiten para controlar la recreación, referida también como la conversión a la alza, de los canales envolventes en base a los canales mono o estéreo transmitidos.

De este modo, tal decodificador paramétrico de audio multicanal, por ejemplo MPEG Envolvente, reconstruye N canales en base a M canales transmitidos, donde N > M, y en base a los datos de control adicionales. Los datos de control adicionales representan una tasa de datos significativamente menor que la transmisión de todos los N canales, haciendo la codificación muy eficiente, mientras que, al mismo tiempo, asegura la compatibilidad con ambos, los dispositivos de M canales y los dispositivos de N canales.

Estos procedimientos de codificación paramétrica envolvente usualmente incluyen una parametrización de la señal envolvente en base a la Diferencia de Intensidad Entre Canales (IID, por sus siglas en inglés) y a la Coherencia Entre Canales (ICC, por sus siglas en inglés) . Estos parámetros describen relaciones de energía y correlación entre pares de canales en el proceso de conversión a la alza. Parámetros de adicionales, usados también en el arte previo, incluyen a los parámetros de predicción usados para predecir los canales intermedios o de salida durante el procedimiento de conversión a la alza.

Dos ejemplos famosos de tal codificación multicanal son la codificación BCC y el MPEG envolvente. En la codificación BCC, un número de canales de audio de entrada se convierten a una representación espectral usando una transformación basada en la Transformada Discreta de Fourier (DFT, por sus siglas en inglés) con ventanas superpuestas. El espectro uniforme resultante es dividido entonces en particiones no superpuestas. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB, por sus siglas en inglés) . Entonces, los parámetros espaciales llamados Diferencia de Nivel Entre Canales (ICLD, por sus siglas en inglés) y Diferencia de Tiempo Entre Canales (ICTD, por sus siglas en inglés) son estimados para cada partición. El parámetro ICLD describe un nivel de diferencia entre dos canales y el parámetro ICTD describe la diferencia de tiempo (cambio de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se dan para cada canal con respecto a un canal común de referencia. Después de la derivación de estos parámetros, los parámetros son cuantificados y codificados para la transmisión.

Los parámetros individuales son estimados con respecto al canal único de referencia en la codificación BCC. En otros sistemas paramétricos de codificación de envolvente, por ejemplo en el MPEG envolvente, se emplea una parametrización con estructura de árbol. Esto significa que los parámetros ya no son estimados con respecto a un canal común único de referencia, sino con diferentes canales de referencia que pueden ser aún una combinación de canales de la señal multicanal original. Por ejemplo, teniendo una señal de 5.1 canales, los parámetros pueden ser estimados entre una combinación de los canales frontales y entre una combinación de los canales posteriores.

Por supuesto, la compatibilidad hacia atrás con los estándares de audio establecidos actualmente es altamente deseable también para los esquemas de codificación paramétrica. Por ejemplo, teniendo una señal convertida en mono a la baja, es deseable que también se proporcione una posibilidad de crear una señal de reproducción estéreo con alta fidelidad. Esto significa que una señal monofónica convertida a la baja tiene que ser convertida a la alza en una señal estéreo, haciendo uso de los parámetros adicionales transmitidos de la mejor manera posible.

Un problema común en la codificación multicanal es la preservación de la energía en la conversión a al alza, ya que la percepción humana de la posición espacial de una fuente sonora es dominada por la intensidad sonora de la señal, es decir, por la energía contenida dentro de la señal. Por lo tanto, debe tenerse un cuidad extremo en la reproducción de la señal para atribuirle la intensidad sonora correcta a cada canal reconstruido, de tal modo que se evite la introducción de artefactos que disminuyan grandemente la percepción de la calidad de la señal reconstruida. Ya que durante la conversión a la baja, las amplitudes de las señales son comúnmente sumadas, la posibilidad de interferencia aumenta, siendo descrita por el parámetro de correlación o coherencia.

Cuando se trata de la reconstrucción de un número reducido de canales (un número de canales menor que el número original de canales de la señal multicanal) , los esquemas como el BCC son de manejo simple, puesto que cada parámetro es transmitido con respecto al mismo canal único de referencia. Por lo tanto, teniendo conocimiento sobre el canal de referencia, puede derivarse fácilmente el nivel más relevante de información (medida absoluta de energía) para cada canal necesitado para la conversión a al alza. De este modo, puede reconstruirse un número reducido de canales sin la necesidad de reconstruir la señal multicanal completa en principio. Así, el cómputo de la energía para las energías de la señal multicanal es más sencillo en la BCC al usar variables únicas en lugar de los productos de las variables, pero esto es solamente un primer paso. Cuando se habla de la derivación de energías y correlaciones de un número reducido de canales, que deben estar tan cerca como sea posible a las conversiones parciales a la baja de las señales multicanal originales, el nivel de dificultad entre el MPEG Envolvente y la BCC es comparable.

En contraste con esto, una estructura basada en árbol, como el MPEG envolvente, utiliza una parametrización en la que la información relevante para cada canal individual no está contenida en un parámetro único. Por consiguiente, en el arte previo, la reconstrucción de un número reducido de canales requiere de la reconstrucción de la señal multicanal seguida de una conversión a la baja en la cantidad reducida de canales para no violar el requerimiento de preservación de la energía. Esto tiene la obvia desventaja de una complejidad computacional extremadamente alta.

La solicitud de patente internacional WO 2005/101370 A1 describe un enfoque particular de codificación multicanal de datos en un solo canal monofónico y en información lateral asociada, que tiene información sobre las propiedades espaciales de la señal multicanal original. Cuando se transmiten tanto el canal de downmix y la información lateral, un descodificador adecuado es capaz de reconstruir una aproximación de la señal multicanal original que había sido la base para la generación de la mezcla downmix y los parámetros.

La parametrización se elige de manera que las combinaciones específicas de canal de los canales originales pueden ser reproducidas sin la utilización de todos los parámetros de transmisión, de modo que la complejidad computacional en la reconstrucción puede ser reducida cuando, por ejemplo, sólo deben reconstruir los canales delanteros (canales izquierdo, central y derecho) de una señal de 5.1 canales.

Breve Descripción de la Invención [0013] Es el objetivo de la presente invención proporcionar un concepto para obtener un número reducido de canales a partir de una señal paramétrica multicanal de manera más eficiente.

En conformidad con un primer aspecto de la presente invención, este objetivo es logrado por medio de un calculador de parámetro para derivar los parámetros de la conversión a la alza según la reivindicación 1.

En conformidad con un segundo aspecto de la presente invención, este objetivo es logrado por medio de un reconstructor de canal según la reivindicación 16.

En conformidad con un tercer aspecto de la presente invención, este objetivo es logrado por medio de un procedimiento... [Seguir leyendo]

Reivindicaciones:

1. Calculador de parámetros para derivar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524) , comprendiendo el calculador de parámetros:

un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC

(510) con la información sobre una correlación entre el canal izquierdo y derecho.

2. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de parámetros multicanal (504, 506) que describen las propiedades de la señal de un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de la señal multicanal.

3. El calculador de parámetro según la reivindicación 2, en el que el re-calculador de parámetro (502) es operativo para derivar los parámetros de conversión a la alza (508, 510) que describen las mismas propiedades de la señal de los canales de la representación intermedia de canal como los parámetros multicanal (504, 506) .

4. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de los parámetros de correlación (ICC) (504) con la información sobre una correlación y los parámetros de nivel (CLD)

(506) con la información de la energía para un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de una señal multicanal.

5. El calculador de parámetro según la reivindicación 4, en el que se adapta al uso de parámetros multicanal para una señal multicanal que incluye un canal izquierdo frontal (LF, por sus siglas en inglés) (2) , izquierdo envolvente (LS, por sus siglas en inglés) (5) , derecho frontal (RF, por sus siglas en inglés) (4) , derecho envolvente (RS, por sus siglas en inglés) (6) y central (C) (3) .

6. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD (508) , usando:

un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal;

un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3) ;

un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6) ; y

un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4) .

7. El calculador de parámetro según la reivindicación 6, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD en conformidad con la siguiente fórmula:

en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R (524) derivados por

En los que las energías de las señales multicanal se derivan de los parámetros CLD de la siguiente manera:

8. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro ICC (510) usando: un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal:

un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3) : un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6) ; y un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4) ; un primer parámetro ICC (ICC2) con información de la correlación entre el canal LS (5) y RS (6) ; y un segundo parámetro ICC (ICC3) con información sobre la correlación entre el canal LF (2) y RF (4) .

9. El calculador de parámetro según la reivindicación 8, en el que el parámetro ICC (510) se deriva en conformidad con la siguiente fórmula:

10. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro es operativo para derivar el parámetro CLD (508) , usando:

un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;

un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) ;

un parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal.

11. El calculador de parámetro según la reivindicación 10, en el que el parámetro CLD (508) se deriva de la siguiente fórmula:

en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R derivados por

donde 12. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro ICC (510) usando:

un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;

un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) ;

un primer parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal; y

un segundo parámetro ICC (ICC1) con información de la correlación entre una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6) .

13. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el valor ICC utilizando la siguiente fórmula:

donde la medida p de correlación es derivada como y

14. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para usar los parámetros multicanal (504, 506) que describen una representación de sub-banda de la señal multicanal.

15. El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) es operativo para usar parámetros multicanal valuado complejos (504, 506) .

16. El reconstructor de canal con un reconstructor de parámetro, en el que incluye:

un calculador de parámetro según la reivindicación 7; y

un convertidor a la alza (520) para derivar la representación estéreo (524) usando los parámetros de conversión a la alza (508, 510) y la señal convertida a la baja (522) .

17. Procedimiento para generar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja y menos canales que la señal multicanal, caracterizando la representación estéreo una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo y en la que los parámetros multicanal (504, 506) incluyen la información sobre los canales no incluidos en la representación estéreo; caracterizado el procedimiento porque incluye:

derivar los parámetros de conversión a la alza (508, 510) incluyendo un parámetro CLD (508) y una parámetro ICC

(510) a partir de los parámetros multicanal usando los parámetros con información sobre los canales no incluidos en la representación estéreo (524) , el parámetro CLD (508) con información de la energía para el canal izquierdo y el derecho de la representación estéreo y el parámetro ICC (519) con información sobre una correlación entre el canal izquierdo y derecho.

18. El receptor o reproductor de audio (600) , teniendo el receptor o reproductor de audio un calculador de parámetro (601) Según la reivindicación 1.

19. Procedimiento para recibir o reproducir audio, teniendo el procedimiento un procedimiento para generar parámetros de conversión a la alza según la reivindicación 17.

20. Programa de computadora con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para generar los parámetros de conversión a la alza según la reivindicación 17.

21. Programa computacional con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para recibir o reproducir audio, según la reivindicación 19.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]