Codificación de señales de múltiples canales.

Un método de codificar señales de audio de múltiples canales (c1 - cN) que comprende al menos un canal primeroy un segundo,

que comprende las etapas de:

generar parámetros de codificación (px) que representan a una señal principal (x) que es una primeracombinación lineal predeterminada de señales de las señales de múltiples canales (c1 - cN);

obtener los parámetros óptimos (p1 - pN) de un filtro adaptativo (31; 131, 132, 133:1-2); y

codificar los parámetros óptimos (p1 - pN)

caracterizado por la siguiente etapa de:

obtener los parámetros óptimos (p1 - pN) de al menos un segundo filtro adaptativo (31; 131, 132, 133:1-2);

siendo el citado primer filtro adaptativo (31; 131, 132, 133:1-2) obtenido para proporcionar una diferenciamínima entre la señal del primer canal (c1 - cN) y una señal de salida de filtro cuando el primer filtro adaptativo(31; 131, 132, 133:1-2) es aplicado sobre la primera combinación lineal predeterminada (x);

siendo la diferencia mínima definida de acuerdo con un primer criterio;

siendo el citado segundo filtro adaptativo obtenido para proporcionar una diferencia mínima entre la señal delsegundo canal (c1 - cN) y una señal de salida de filtro cuando el segundo filtro adaptativo es aplicado sobre laprimera combinación lineal predeterminada (x);

estando la diferencia mínima definida de acuerdo con un segundo criterio; y

por lo que las etapas de obtención de los citados filtros adaptativos primero y segundo (31; 131, 132, 133:1-2)son realizadas bajo al menos una restricción perceptual seleccionada del grupo de restricción de ganancia yde restricción de forma;

imponiendo la citada restricción de ganancia una de una restricción en ganancia hardware que requiere unacoincidencia de energía exacta entre un canal original y un canal estimado y una restricción de gananciasuelta que requiere que un canal de salida tenga una energía prescrita;

imponiendo la citada restricción de forma un conjunto de restricciones lineales sobre una forma del espectroen el filtro adaptativo primero y segundo, respectivamente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2004/001907.

Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: 164 83 STOCKHOLM SUECIA.

Inventor/es: BRUHN, STEFAN, JOHANSSON, INGEMAR, TALEB,Anisse, SANDGREN,PATRIK.

Fecha de Publicación: 23 de Octubre de 2013.

Clasificación Internacional de Patentes:

G10L19/008 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
H04S5/02 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › H04S 5/00 Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación. › del tipo seudocuadrafónico, p. ej. en los que las señales de los canales de llegada son derivados de señales estereofónicas de dos canales.

PDF original: ES-2439693_T3.pdf

Fragmento de la descripción:

Codificación de señales de múltiples canales CAMPO TÉCNICO La presente invención se refiere en general a la codificación de señales de audio, y en particular a la codificación de señales de audio de múltiples canales.

ANTECEDENTES Existe una gran necesidad en el mercado de transmitir y almacenar señales de audio a baja velocidad de datos aun manteniendo una alta calidad de audio. Particularmente, en casos en los que los recursos de transmisión y de almacenamiento están limitados la operación a alta velocidad de bits es un factor de coste esencial. Éste es típicamente el caso, por ejemplo, en las aplicaciones de transmisión en tiempo real y de intercambio de mensajes en los sistemas de comunicación para móviles, tales como GSM, UMTS o CDMA.

Hoy en día, no hay códecs estandarizados disponibles que proporcionen calidad de audio estereofónico a velocidades de bits que sean económicamente interesantes para su uso en los sistemas de comunicación para móviles. Lo que es posible con los códecs disponibles es la transmisión monofónica de las señales de audio. Hasta cierto punto está disponible también la transmisión estereofónica. No obstante, las limitaciones de la velocidad de bits normalmente requieren limitar la representación del estéreo bastante drásticamente.

La manera más sencilla de la codificación estereofónica o de múltiples canales de señales de audio es codificar las señales de los diferentes canales separadamente como señales individuales e independientes. Otra manera básica utilizada en la transmisión por radio en FM en estéreo y que asegura la compatibilidad con receptores de radio mono heredados es transmitir una señal de suma y una señal de diferencia de los dos canales implicados.

Los códecs de audio de la técnica actual, tales como MPEG – 1/2 de Capa III y MPEG – 2/4 AAC hacen uso de la llamada codificación de estéreo conjunta. De acuerdo con esta técnica, las señales de los diferentes canales son procesadas conjuntamente, en lugar de separada e individualmente. Las dos técnicas de codificación de estéreo conjunta más comúnmente utilizadas son conocidas como codificación de estéreo “Medio/Lateral” (M/S – Mid/Side, en inglés) y codificación de estéreo basada en intensidad, las cuales normalmente se aplican a sub-bandas de las señales de estéreo o de múltiples canales para ser codificadas.

La codificación de estéreo M/S es similar al procedimiento descrito en la radio de FM estéreo, en el sentido de que codifica y transmite las señales de suma y de diferencia de las sub-bandas del canal y aprovecha por ello la redundancia entre las sub-bandas del canal. La estructura y operación de un codificador basado en codificación de estéreo M/S se describe, por ejemplo, en la Patente de US 5.285.498, por J. D. Johnston.

El estéreo basado en intensidad, por otro lado, es capaz de hacer uso de la irrelevancia del estéreo. Transmite la intensidad conjunta de los canales (de las diferentes sub-bandas) junto con algo de información de ubicación que indica cómo está distribuida la intensidad entre los canales. El estéreo basado en intensidad sólo proporciona información acerca de la magnitud del espectro de los canales. La información de fase no es transportada. Por esta razón, y puesto que la información inter canales temporal (más específicamente la diferencia de tiempo inter canales) es de importante relevancia psico-acústica particularmente a bajas frecuencias, el estéreo basado en la intensidad sólo puede ser utilizado a altas frecuencias por encima, por ejemplo, de 2 kHz. Un método de codificación de estéreo basado en intensidad se describe, por ejemplo, en la Patente Europea 0497413, por R. Veldhuis et al, véase también “Intensity Stereo Coding”, por J. Harre et al, 96th AES Convention, 26.02.1994.

Un método de codificación de estéreo recientemente desarrollado se describe, por ejemplo, en un documento de la conferencia con el título “Binaural cue coding applied to stereo and multi-channel audio compression”, 112th AES convention, Mayo de 2002, Munich, Germany por C. Faller et al. Este método es un método de codificación de audio de múltiples canales paramétrico. El principio básico es que en el lado de la codificación, las señales de entrada de N canales c1, c2, … cN son combinadas en una señal mono m. La señal mono es codificada en audio utilizando cualquier códec de audio monofónico convencional. En paralelo, algunos parámetros son obtenidos a partir de las señales de canales, que describen la imagen de múltiples canales. Los parámetros son codificados y transmitidos al descodificador, junto con el flujo de bits de audio. El descodificador primero descodifica la señal mono m’ y a continuación regenera las señales de canal c1’, c2’, …, cN’ basándose en la descripción paramétrica de la imagen de múltiples canales.

El principio del método de Codificación de Referencia Bianural (BCC – Binaural Cue Coding, en inglés) es que transmite la señal mono codificada y los llamados parámetros de BCC. Los parámetros de BCC comprenden diferencias de nivel inter canales y diferencias de tiempo inter canales codificadas para sub-bandas de la señal de entrada de múltiples canales original. El descodificador regenera las diferentes señales de canal aplicando ajustes de nivel de sub-bandas y de fase de la señal mono basándose en los parámetros de BCC. La ventaja sobre, por

ejemplo, M/S o estéreo basado en intensidad es que la información de estéreo que comprende información inter canales temporal es transmitida a velocidades de bits mucho menores.

Un problema con las técnicas de codificación de múltiples canales del estado actual de la técnica descritas anteriormente es que requieren altas velocidades de bits para proporcionar buena calidad. El estéreo basado en intensidad, si se aplica a bajas velocidades de bits tan bajas como por ejemplo unos pocos Kbps sufre del hecho de que no proporciona ninguna información inter canales temporal. Dado que esta información es perceptualmente importante para bajas frecuencias por debajo, por ejemplo, de 2 kHz, no puede proporcionar una impresión de estéreo a tan bajas frecuencias.

La BCC es capaz de reproducir la imagen de múltiples canales incluso a bajas frecuencias a bajas velocidades de bits de, por ejemplo, 3 kbps puesto que también transmite información inter canales temporal. No obstante, esta técnica requiere transformadas de tiempo - frecuencia que requieren muchos cálculos en cada uno de los canales, tanto en el codificador como en el descodificador. Además, la BCC optimiza el mapeo de una manera matemática pura. Los artefactos característicos inmanentes en el método de codificación, no obstante, no desaparecerán.

Otra técnica, descrita en la patente de US 5.434.948 por C. E. Holt et al, utiliza un planteamiento similar de codificar la señal mono e información lateral. En este caso, la información lateral consiste en filtros de predicción y opcionalmente en una señal residual. Los filtros de predicción, estimados mediante un algoritmo de mínimos cuadrados promediados, cuando se aplica a la señal mono permite la predicción en las señales de audio de múltiples canales. Con esta técnica se puede conseguir una codificación de muy baja velocidad de bits de fuentes de audio de múltiples canales, no obstante, con el coste de una caída de la calidad.

Un planteamiento similar al planteamiento de filtrado anterior se describe en el documento WO 03/090206 por Breebaart y Groenendaal. No obstante, este planteamiento utiliza un filtro fijo aplicado a la señal mono y combinado junto con la señal mono no filtrada mediante una operación de matriciación. La operación de matriciación depende de un parámetro de correlación recibido y de un parámetro de nivel recibido. El objetivo de tal síntesis de señal es restaurar la correlación y la diferencia de nivel de los dos canales originales. Debido a la inherentemente fija operación de filtrado, la síntesis de la señal tiene un potencial muy limitado para la reproducción de la señal y no se adapta a las características de la señal. El planteamiento puede ser considerado como una extensión del método de codificación de estéreo basado en intensidad explicado anteriormente, en el cual ahora una componente temporal es transportada al descodificador. Aún así, sólo los parámetros de nivel y de correlación permiten un cierto grado de adaptabilidad mediante una operación de matriciación. Esta operación consiste en una mera rotación y escalado de las señales filtradas estadísticamente, limitando así la capacidad de reproducción polifónica. Otro inconveniente... [Seguir leyendo]

Reivindicaciones:

1. Un método de codificar señales de audio de múltiples canales (c1 – cN) que comprende al menos un canal primero y un segundo, que comprende las etapas de:

generar parámetros de codificación (px) que representan a una señal principal (x) que es una primera combinación lineal predeterminada de señales de las señales de múltiples canales (c1 – cN) ; obtener los parámetros óptimos (p1 – pN) de un filtro adaptativo (31; 131, 132, 133:1-2) ; y codificar los parámetros óptimos (p1 – pN)

caracterizado por la siguiente etapa de:

obtener los parámetros óptimos (p1 – pN) de al menos un segundo filtro adaptativo (31; 131, 132, 133:1-2) ; siendo el citado primer filtro adaptativo (31; 131, 132, 133:1-2) obtenido para proporcionar una diferencia mínima entre la señal del primer canal (c1 – cN) y una señal de salida de filtro cuando el primer filtro adaptativo (31; 131, 132, 133:1-2) es aplicado sobre la primera combinación lineal predeterminada (x) ; siendo la diferencia mínima definida de acuerdo con un primer criterio; siendo el citado segundo filtro adaptativo obtenido para proporcionar una diferencia mínima entre la señal del segundo canal (c1 – cN) y una señal de salida de filtro cuando el segundo filtro adaptativo es aplicado sobre la primera combinación lineal predeterminada (x) ; estando la diferencia mínima definida de acuerdo con un segundo criterio; y por lo que las etapas de obtención de los citados filtros adaptativos primero y segundo (31; 131, 132, 133:1-2) son realizadas bajo al menos una restricción perceptual seleccionada del grupo de restricción de ganancia y de restricción de forma;

imponiendo la citada restricción de ganancia una de una restricción en ganancia hardware que requiere una coincidencia de energía exacta entre un canal original y un canal estimado y una restricción de ganancia suelta que requiere que un canal de salida tenga una energía prescrita; imponiendo la citada restricción de forma un conjunto de restricciones lineales sobre una forma del espectro en el filtro adaptativo primero y segundo, respectivamente.

2. Un método de acuerdo con la reivindicación 1, caracterizado porque al menos uno del primer criterio y del segundo criterio es un criterio de mínimos cuadrados promediados.

3. Un método de acuerdo con la reivindicación 1 ó 2, caracterizado porque la restricción perceptual es al menos

una restricción de ganancia, que intenta proporcionar una energía total de la señal de salida de filtro igual a la energía total de la señal del primer canal.

4. El método de acuerdo con la reivindicación 3, caracterizado porque la restricción de ganancia es una restricción absoluta, que demanda que la energía total de la señal de salida del filtro adaptativo sea igual a la energía total de la 40 señal del correspondiente canal.

5. Un método de acuerdo con la reivindicación 3, caracterizado porque la restricción de ganancia es una restricción de software, que favorece el que los filtros adaptativos proporcionen la energía total de la señal de salida del filtro adaptativo cercana a la energía total de la señal del canal correspondiente.

6. Un método de acuerdo con la reivindicación 3, caracterizado porque la restricción de ganancia está impuesta como un factor de ganancia (gc1 – gcN) veces un filtro adaptativo obtenido sin restricciones de ganancia.

7. Un método de acuerdo con la reivindicación 6, caracterizado porque el filtro restringido en ganancia

viene dado por:

donde es el filtro adaptativo obtenido sin restricciones de ganancia, E c es una energía prescrita de la señal de salida del filtro adaptativo y

es una salida del filtro adaptativo de la señal principal x (n) sin restricciones de ganancia.

8. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 7, caracterizado porque la restricción perceptual es al menos una restricción de forma, que impone una forma de espectro predefinida sobre el filtro adaptativo (31; 131, 132, 133:1-2) .

9. Un método de acuerdo con la reivindicación 8, caracterizado porque la restricción de forma impone un contenido cero en un intervalo de frecuencia predefinido.

10. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 9, caracterizado porque la etapa de codificación de los parámetros óptimos (p1 – pN) comprende codificar conjuntamente los parámetros óptimos de los filtros primero y segundo.

11. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 10 y de acuerdo con la reivindicación 8, caracterizado porque la etapa de obtener parámetros a su vez comprende las etapas de:

crear una segunda combinación lineal predeterminada (s; c*1 – c*N) de las señales de las señales de múltiples canales (c1 – cN) ; obtener parámetros de un tercer filtro para proporcionar una diferencia mínima entre la segunda combinación lineal predeterminada y la señal de salida del filtro cuando se aplica el tercer filtro sobre la primera combinación lineal predeterminada, bajo la restricción de forma; calcular los parámetros óptimos de los filtros primero y segundo en función de los parámetros óptimos del tercer filtro.

12. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 11, caracterizado porque la etapa de obtener se lleva a cabo basándose en los parámetros de codificación (px) que representan a la señal principal (x) .

13. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 11, caracterizado porque la etapa de obtener se lleva a cabo basándose directamente en la primera combinación lineal predeterminada (x) .

14. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 13, caracterizado porque las señales de múltiples canales comprenden más de dos canales, por lo que la señal principal se basa en una primera combinación lineal predeterminada (x) de todos los más de dos canales, y la señal de cada canal se representa mediante un filtro adaptativo separado, optimizado bajo la restricción perceptual.

15. Aparato codificador (14) , que comprende:

una entrada (16:1 – 16:N) para señales de audio de múltiples canales (c1 – cN) que comprenden al menos un canal primero y un segundo; un medio (38) para generar los parámetros de codificación (px) que representan a una señal principal (x) que es una primera combinación lineal predeterminada de señales de las señales de múltiples canales (c1 – cN) , cuyo medio (38) para generar está conectado a la entrada (16:1 – 16:N) ; un medio (31; 131, 132, 133:1-2) para obtener los parámetros óptimos de un primer filtro adaptativo; un medio (66) para codificar los parámetros óptimos; y un medio de salida (52) ;

caracterizado por:

un medio (31; 131, 132, 133:1-2) para obtener los parámetros óptimos de un segundo filtro adaptativo; proporcionando el primer filtro adaptativo una diferencia mínima entre la señal del primer canal (c1 – cN) y la señal del filtro de salida cuando el primer filtro adaptativo es aplicado sobre la primera combinación lineal predeterminada (x) ; estando la diferencia mínima definida de acuerdo con un primer criterio; proporcionando el segundo filtro adaptativo una diferencia mínima entre la señal del segundo canal (c1 – cN) y la señal de salida del filtro cuando el segundo filtro adaptativo es aplicado sobre la primera combinación lineal predeterminada (x) ; estando la diferencia mínima definida de acuerdo con un segundo criterio; por lo que el medio (31; 131, 132, 133:1-2) para obtener los parámetros óptimos de los citados filtros adaptativos primero y segundo está dispuesto para obtener los parámetros óptimos bajo al menos una restricción perceptual seleccionada del grupo de restricción de ganancia y de restricción de forma; imponiendo la citada restricción de ganancia el que una de una restricción de ganancia de hardware requiera una exacta coincidencia de energía entre un canal original y un canal estimado y el que una restricción de pérdida de ganancia suelta requiera un canal de salida para tener una energía prescrita; Imponiendo la citada restricción de forma un conjunto de restricciones lineales sobre una forma del espectro en los filtros primero y segundo, respectivamente.

Patentes similares o relacionadas:

Aparato y procedimiento para el procesamiento de señales estéreo para la reproducción en automóviles, para lograr un sonido tridimensional individual por los altavoces frontales, del 6 de Febrero de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Procesador digital para un sistema de reproducción de altavoces , con exactamente tres o cuatro altavoces frontales, comprendiendo el procesador digital […]

Decodificación de señal de audio multicanal usando señales de-correlacionadas, del 17 de Junio de 2015, de DOLBY INTERNATIONAL AB: Decodificador de audio multi-canal para generar una reconstrucción de una señal multi-canal (412; 508; 610a; 610b; 630) usando una señal de submezcla (405; […]

Medio de grabación, dispositivo de reproducción, programa, método de reproducción y circuito integrado, del 20 de Agosto de 2014, de PANASONIC CORPORATION: Un medio de grabación en el que se graban una aplicación, un sonido de clic, y un flujo digital que incluye un flujo de vídeo y un flujo de audio multiplexados […]

Convertidor estéreo de múltiples canales para derivar una señal envolvente estéreo y/o central de audio, del 23 de Abril de 2014, de KONINKLIJKE PHILIPS N.V: Convertidor estéreo de múltiples canales, que comprende medios estéreo para generar una señal de información a partir de señales de audio […]

Sistema de altavoces para un ordenador personal, del 23 de Septiembre de 2013, de GIBSON GUITAR CORP: Un sistema multicanal de altavoces para su uso con un ordenador personal de sobremesa que comprende: un soporte dotado de una superficie inferior […]

Método y codificador para combinar conjuntos de datos digitales, método para descodificar y descodificador para tales conjuntos de datos digitales combinados y soporte de grabación para almacenar tales conjuntos de datos digitales combinados, del 2 de Abril de 2013, de AURO TECHNOLOGIES: Un método para reducir un conjunto de datos digitales de muestras (A0, A1, A2, A3, A4, A5, A6, A7, A8, A9)con un primer tamaño en un segundo conjunto […]

MÉTODO Y CODIFICADOR PARA COMBINAR CONJUNTOS DE DATOS DIGITALES, MÉTODO PARA DESCODIFICAR Y DESCODIFICADOR PARA TALES CONJUNTOS DE DATOS DIGITALES COMBINADOS Y SOPORTE DE GRABACIÓN PARA ALMACENAR TALES CONJUNTOS DE DATOS DIGITALES COMBINADOS, del 14 de Enero de 2011, de GALAXY STUDIOS NV: Un método para combinar un primer conjunto de datos digitales de muestras (A0, A1, A2, A3, A4, A5, A6, A7, A8, A9) con un primer tamaño y un segundo conjunto […]

DISPOSITIVO Y PROCEDIMIENTO PARA GENERAR UNA SEÑAL MULTICANAL CON UN PROCESAMIENTO DE SEÑAL DE VOZ, del 16 de Septiembre de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para generar una señal multicanal con un número de señales de canal de salida, que es mayor que un número de señales de canal de entrada de una señal […]