Alisamiento mejorado de filtros en codificación y/o descodificación de audio multi-canal.
Un método para codificar una señal de audio multi-canal que comprende las etapas de:
- codificar una primera representación de la señal de al menos uno de dichos múltiples canales en un primer proceso de codificación;
- codificar una segunda representación de la señal de al menos uno de dichos múltiples canales en un segundo proceso de codificación basado en un filtro, en el que dicho segundo proceso de codificación incluye la predicción inter-canales para la predicción de dicha segunda representación de la señal basándose en la primera representación de la señal y en la segunda representación de la señal,
caracterizado por realizar el alisamiento de filtro adaptable a la señal en dicho segundo proceso de codificación, 10 comprendiendo:
- estimar un rendimiento esperado de codificación de dicho segundo proceso de codificación, en el que dicho rendimiento es representativo de una ganancia de predicción de dicha predicción inter-canales, y
- adaptar el alisamiento de filtro dependiendo del rendimiento estimado esperado de la codificación.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2006/000234.
Solicitante: TELEFONAKTIEBOLAGET L M ERICSSON (PUBL).
Nacionalidad solicitante: Suecia.
Dirección: 164 83 STOCKHOLM SUECIA.
Inventor/es: TALEB,Anisse, ANDERSSON,STEFAN.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- H04B1/66 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04B TRANSMISION. › H04B 1/00 Detalles de los sistemas de transmision, no cubiertos por uno de los grupos H04B 3/00 - H04B 13/00; Detalles de los sistemas de transmisión no caracterizados por el medio utilizado para la transmisión. › para reducir el ancho de banda de las señales; para mejorar la eficacia de la transmisión (H04B 1/68 tiene prioridad).
PDF original: ES-2389499_T3.pdf
Fragmento de la descripción:
Alisamiento mejorado de filtros en codificación y/o descodificación de audio multi-canal.
CAMPO TÉCNICO DE LA INVENCIÓN
La presente invención se refiere en general a técnicas de codificación y descodificación de audio, y más en particular a la codificación/descodificación de audio multi-canal tal como la codificación/descodificación estéreo.
ANTECEDENTES DE LA INVENCIÓN
Existe una gran necesidad en el mercado de transmitir y almacenar señales de audio a baja tasa de bits mientras se mantiene alta calidad de audio. En particular, en los casos en los que los recursos de transmisión o almacenaje están limitados a operar a baja tasa de bits, el factor costo es esencial. Este es típicamente el caso, por ejemplo, en aplicaciones de flujo de datos y mensajería en sistemas de comunicaciones móviles tales como GSM, UMTS o CDMA.
Un ejemplo general de un sistema de transmisión de audio usando codificación y descodificación multi-canal se ilustra esquemáticamente en la figura 1. El sistema en conjunto comprende básicamente un codificador de audio multi-canal 100 y un módulo de transmisión 10 en la parte transmisora, y un módulo receptor 20 y un descodificador de audio multi-canal 200 en la parte receptora.
El modo más simple de codificar en estereofonía o multi-canal señales de audio es codificar las señales de los diferentes canales separadamente como señales individuales e independientes, como se ilustra en la figura 2. Sin embargo, esto significa que no se elimina la redundancia entre la pluralidad de los canales, y que el requisito de tasa de bits será proporcional al número de canales.
Otro modo básico usado en la radiotransmisión estéreo FM y que asegura compatibilidad con los receptores de radio mono primitivos es transmitir una señal suma y una señal diferencia de los dos canales implicados.
El estado de la técnica de los codecs (codificadores-descodificadores) de audio, tales como MPEG-1/2 Capa III y MPEG-2/4 AAC, hace uso de la llamada codificación estéreo conjunta. De acuerdo con esta técnica, las señales de los diferentes canales se procesan conjuntamente en lugar de individual y separadamente. Las dos técnicas de
codificación estéreo conjunta que se usan más comúnmente se conocen como Estéreo “Mid/Side” (M/S) y
codificación estéreo en intensidad que se aplican usualmente a sub-bandas de las señales estéreo o multi-canal que se tienen que codificar.
La codificación estéreo M/S es similar al procedimiento descrito en la radio FM estéreo, en el sentido de que codifica y transmite las señales suma y diferencia de las sub-bandas del canal y por ello aprovecha la redundancia entre las sub-bandas del canal. La estructura y la operación de un codificador basado en la codificación estéreo M/S se describe, por ejemplo, en la referencia [1].
Por otra parte, estéreo en intensidad puede hacer uso de la intrascendencia del estéreo. Transmite la intensidad conjunta de los canales (de las diferentes sub-bandas) junto con alguna información de situación que indica cómo se distribuye la intensidad entre los canales. Estéreo en intensidad sólo proporciona información espectral de la magnitud de los canales, mientras que la información de fase no se transporta. Por esta razón y ya que la información temporal inter-canales (más específicamente la diferencia de tiempo inter-canales) es de la mayor relevancia psico-acústica, particularmente a bajas frecuencias, estéreo en intensidad se puede sólo usar a altas frecuencias por encima de, por ejemplo, 2 kHz. Un método de codificación de estéreo en intensidad se describe, por ejemplo, en la referencia [2].
Un método de codificación estéreo recientemente desarrollado, llamado Codificación en Entrada Binaural (BCC: Binaural Cue Coding) se describe en la referencia [3]. Este método es un método paramétrico de codificación de audio multi-canal. El principio básico de este tipo de técnica paramétrica de codificación es que en la parte codificadora las señales de entrada de N canales se combinan para formar una mono-señal. La mono-señal se codifica en audio usando cualquier codec de audio monofónico convencional. En paralelo, se derivan parámetros de las señales de los canales, que describen la imagen multi-canal. Los parámetros se codifican y se transmiten al descodificador, junto con el flujo de bits de audio. El descodificador descodifica primero la mono-señal y a continuación regenera las señales de los canales basándose en la descripción paramétrica de la imagen multi-canal.
El principio del método de Codificación en Entrada Binaural (BCC) es que transmite la mono-señal codificada y los llamados parámetros de BCC. Los parámetros de BCC comprenden diferencias codificadas de nivel inter-canales y diferencias de tiempo inter-canales para las sub-bandas de la señal original de entrada multi-canal. El descodificador regenera las diferentes señales de los canales aplicando ajustes de nivel y fase y/o de retardo en modo de subbanda de la mono-señal basándose en los parámetros de BCC. La ventaja sobre, por ejemplo, la codificación M/S o estéreo en intensidad es que la información estéreo que comprende información temporal inter-canales se trasmite a tasas de bits mucho más bajas. Sin embargo, BCC requiere ayuda computacional y generalmente no perceptivamente optimizada.
Otra técnica, descrita en la referencia [4], usa el mismo principio de codificación de la mono-señal y la llamada información lateral. En este caso, la información lateral consta de filtros indicadores y opcionalmente una señal residual. Los filtros indicadores, estimados por un algoritmo LMS, cuando se aplican a la mono-señal, , permiten la predicción de las señales de audio multi-canal. Con esta técnica es posible alcanzar una tasa de bits muy baja en la codificación de fuentes de audio multi-canal, sin embargo, a costa de un descenso en la calidad.
Los principios básicos de tal codificación estéreo paramétrica se ilustran en la figura 3, que muestra una disposición de un codec estéreo, que comprende un módulo mezclador reductor 120, un mono-codec de núcleo 130, 230 y un codificador/descodificador paramétrico de información lateral estéreo 140, 240. El mezclador reductor transforma la señal multi-canal (en este caso estéreo) en una mono-señal. El objetivo del codec paramétrico estéreo es reproducir una señal estéreo en el descodificador dados la mono-señal reconstruida y los parámetros estéreo adicionales.
Para completar, se tiene que mencionar una técnica que se usa en audio 3D. Esta técnica sintetiza las señales de los canales derecho e izquierdo filtrando las señales de la fuente de sonido con los llamados filtros que tienen en cuenta la posición de la cabeza. Sin embargo, esta técnica requiere que las diferentes señales de la fuente de sonido estén separadas y por ello generalmente no se puede aplicar a la codificación estéreo o multi-canal.
Los rápidos cambios en las características del filtro entre imágenes consecutivas crean aberraciones de dentado perturbadoras e inestabilidad en la imagen estéreo reconstruida. Para superar este problema, se ha introducido el alisamiento de los filtros [11]. Sin embargo, el alisamiento convencional de los filtros lleva generalmente a una mayor reducción del rendimiento, puesto que los coeficientes del filtro ya no son los óptimos para la imagen presente. En particular, el alisamiento tradicional de los filtros lleva generalmente a una reducción global de la anchura de la imagen estéreo.
Por ello existe una necesidad general mejorar el alisamiento de los filtros en procesos de codificación y/o descodificación multi-canal.
SUMARIO DE LA INVENCIÓN
La presente invención supera estas y otras desventajas de las disposiciones de la técnica anterior.
Es un objetivo general de la presente invención proporcionar alta calidad de audio multi-canal a bajas tasas de bits.
Es un objetivo de la invención proporcionar alisamiento mejorado de los filtros en la codificación y/o descodificación de audio multi-canal.
En particular, es deseable proporcionar un proceso eficiente de codificación y/o descodificación que sea capaz de eliminar o al menos reducir los efectos de aberraciones de codificación de una manera eficiente.
Es también deseable que sea capaz de tratar el problema de la reducción de la anchura... [Seguir leyendo]
Reivindicaciones:
1. Un método para codificar una señal de audio multi-canal que comprende las etapas de:
- codificar una primera representación de la señal de al menos uno de dichos múltiples canales en un primer proceso de codificación;
- codificar una segunda representación de la señal de al menos uno de dichos múltiples canales en un segundo proceso de codificación basado en un filtro, en el que dicho segundo proceso de codificación incluye la predicción inter-canales para la predicción de dicha segunda representación de la señal basándose en la primera representación de la señal y en la segunda representación de la señal,
caracterizado por realizar el alisamiento de filtro adaptable a la señal en dicho segundo proceso de codificación, comprendiendo:
- estimar un rendimiento esperado de codificación de dicho segundo proceso de codificación, en el que dicho rendimiento es representativo de una ganancia de predicción de dicha predicción inter-canales, y
- adaptar el alisamiento de filtro dependiendo del rendimiento estimado esperado de la codificación.
2. Un método de acuerdo con la reivindicación 1, en el que el alisamiento del filtro se basa en el rendimiento de un filtro de predicción inter-canales.
3. El método de codificación de la reivindicación 2, en el que dicho alisamiento de filtro se realiza modificando el filtro de dicho segundo proceso de codificación dependiendo del rendimiento estimado del filtro.
4. El método de codificación de la reivindicación 3, en el que el filtro se modifica por medio de un factor de alisamiento, que se adapta dependiendo del rendimiento estimado del filtro
5. El método de codificación de la reivindicación 4, en el que dicho alisamiento del filtro se realiza reduciendo la energía del filtro de dicho segundo proceso de codificación dependiendo del rendimiento estimado del filtro.
6. Un aparato para codificar una señal de audio multi-canal que comprende:
- un primer codificador para codificar una primera representación de la señal de al menos uno de dichos canales múltiples;
- un segundo codificador basado en filtro para codificar una segunda representación de la señal de al menos uno de dichos canales múltiples, en el que dicho segundo codificador incluye un filtro adaptable de predicción inter-canales para la predicción de dicha segunda representación de la señal basándose en la primera representación de la señal y en la segunda representación de la señal,
caracterizado por tener medios para realizar el alisamiento de filtro adaptable a la señal en dicho segundo codificador basado en filtro, basándose en una ganancia de predicción de dicho filtro de predicción inter-canales, comprendiendo dichos medios:
- medios para estimar un rendimiento esperado de la codificación de dicho segundo codificador; y
- medios para adaptar el alisamiento de filtro dependiendo del rendimiento estimado esperado de la codificación.
7. Un aparato de acuerdo con la reivindicación 6, en el que el alisamiento de filtro se basa en el rendimiento del filtro de predicción inter-canales.
8. El aparato codificador de la reivindicación 7, en el que dichos medios para adaptar el alisamiento de filtro comprenden medios para modificar el filtro de dicho segundo codificador dependiendo del rendimiento estimado del filtro.
9. El aparato codificador de la reivindicación 8, en el que dichos medios para adaptar el alisamiento de filtro comprenden medios para adaptar un factor de alisamiento dependiendo del rendimiento estimado del filtro, y en el que dichos medios para modificar el filtro son operables para modificar el filtro basándose en el factor de alisamiento.
10. El aparato codificador de la reivindicación 9, en el que dichos medios para modificar el filtro comprenden medios para reducir la energía del filtro de dicho segundo proceso de codificación dependiendo del rendimiento estimado del
filtro.
11. Un método de descodificar una señal codificada de audio multi-canal, que comprende las etapas de:
- descodificar, en respuesta a datos de reconstrucción de la primera señal, una representación codificada de la primera señal de al menos uno de dichos canales múltiples en un primer proceso de descodificación;
- descodificar, en respuesta a los datos de reconstrucción de la segunda señal, una representación codificada de la segunda señal de al menos uno de dichos canales múltiples en un segundo proceso de descodificación, caracterizado por:
- recibir información representativa del alisamiento de filtro adaptable a la señal de una parte codificadora, en el que dicha información comprende un factor de alisamiento que depende del rendimiento estimado esperado de codificación de un proceso de codificación en la parte codificadora, en el que dicho rendimiento es representativo de una ganancia de predicción de una predicción inter-canales incluida en la codificación; y
- realizar, basándose en dicha información, el alisamiento de filtro adaptable a la señal en dicho segundo proceso de descodificación.
12. Un aparato para descodificar una señal codificada de audio multi-canal, que comprende:
- medios para descodificar, en respuesta a los datos de reconstrucción de la primera señal, una representación codificada de la primera señal de al menos uno de dichos canales múltiples en un primer proceso de descodificación;
- medios para descodificar, en respuesta a los datos de reconstrucción de la segunda señal, una representación codificada de la segunda señal de al menos uno de dichos canales múltiples en un segundo proceso de descodificación,
caracterizado por:
- medios para recibir información representativa del alisamiento de filtro adaptable a la señal desde un extremo codificador correspondiente, en los que dicha información comprende un factor de alisamiento que depende del rendimiento estimado esperado de la codificación de un proceso de codificación en la parte codificadora, en los que dicho rendimiento es representativo de una ganancia de predicción de una predicción inter-canales incluida en la codificación; y
- medios para realizar, basándose en dicha información, el alisamiento del filtro adaptable a la señal en dicho segundo proceso de descodificación.
13. Un sistema de transmisión de audio, caracterizado porque dicho sistema comprende al menos uno de un aparato codificador de la reivindicación 6 y de un aparato descodificador de la reivindicación 12.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]