Descodificación de trenes de bits codificados de audio multicanal usando transformación híbrida adaptativa.

Un método para descodificar una trama de una señal de audio digital codificada,

en el que:

* la trama comprende metadatos de trama, un primer bloque de audio y uno o más bloques de audio subsiguientes; y

* cada uno del primer bloque de audio y los subsiguientes comprende metadatos de bloque y datos de audio codificados para dos o más canales de audio, en el que:

- los datos de audio codificados comprenden factores de escala y valores a escala que representan el contenido espectral de los dos o más canales de audio, estando cada valor a escala asociado con uno de los factores de escala respectivo; y

- los metadatos de bloque comprenden información de control que describe las herramientas de control usadas por un proceso de codificación que produjo los datos de audio codificados, incluyendo las herramientas de control procesamiento de transformada híbrida adaptativa que comprende:

· aplicar un banco de filtros de análisis implementado por una transformada primaria a los dos o más canales de audio para generar coeficientes de la transformada primaria, y

· aplicar una transformada secundaria a los coeficientes de la transformada primaria para al menos alguno de los dos o más canales de audio para generar coeficientes de la transformada híbrida; y en el que el método comprende:

(A) recibir la trama de la señal de audio digital codificada; y

(B) examinar la señal de audio digital codificada de la trama en una única pasada para descodificar los datos de audio codificados para cada bloque de audio en orden por bloque, en el que la descodificación de cada bloque de audio respectivo comprende:

(1) determinar para cada canal respectivo de los dos o más canales si el proceso de codificación usó procesamiento de transformada híbrida adaptativa para codificar cualquiera de los datos de audio codificados;

(2) si el proceso de codificación usó el procesamiento de transformada híbrida adaptativa para el canal respectivo: (a) si el bloque de audio respectivo es el primer bloque de audio de la trama:

(i) obtener todos los coeficientes de la transformada híbrida del canal respectivo para la trama a partir de los datos de audio codificados del primer bloque de audio, y

(ii) aplicar una transformada secundaria inversa a los coeficientes de la transformada híbrida para obtener coeficientes de la transformada secundaria inversa, y

(b) obtener coeficientes de la transformada primaria a partir de los coeficientes de la transformada secundaria para el canal respectivo del bloque de audio respectivo;

(3) si el proceso de codificación no usó el procesamiento de transformada híbrida adaptativa para el canal respectivo, obtener coeficientes de la transformada primaria para el canal respectivo descodificando los datos codificados del bloque de audio respectivo; y

(C) aplicar una transformada primaria inversa a los coeficientes de la transformada primaria para generar una señal de salida que representa el canal respectivo del bloque de audio respectivo.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2010/054480.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: RAMAMOORTHY,KAMALANATHAN.

Fecha de Publicación: 19 de Marzo de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/02 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.

PDF original: ES-2463840_T3.pdf

Fragmento de la descripción:

Descodificación de trenes de bits codificados de audio multicanal usando transformación híbrida adaptativa

Referencia cruzada a solicitudes relacionadas Esta solicitud reivindica prioridad respecto a la solicitud provisional de patente de Estados Unidos nº 61/267.422 presentada el 7 de diciembre de 2009.

Campo técnico

La presente invención se refiere en general a sistemas de codificación de audio y se refiere más específicamente a métodos y dispositivos que decodifican señales digitales de audio codificadas.

Técnica antecedente El United States Advanced Television Systems Committee (ATSC) , Inc., que fue formado por organizaciones miembros del Joint Committee on InterSociety Coordination (JCIC) , desarrolló un conjunto coordinado de estándares nacionales para el desarrollo de los servicios de la televisión nacional de EE.UU. Estos estándares, incluyendo estándares relevantes de codificación/descodificación de audio, se exponen en varios documentos incluyendo el Documento A/52B titulado “Digital Audio Compression Standard (AC-3, E-AC-3) ”, Revisión B, publicado el 14 de junio de 2005. El algoritmo de codificación de audio especificado en el documento A/52B se denomina “AC-3”. Una versión mejorada de este algoritmo, que se describe en el Anexo E del documento, se denomina “E-AC-3”. Estos dos algoritmos se denominan en este documento como “AC-3” y los estándares pertinentes se denominan en este documento como los “estándares ATSC”.

El documento A/52B no especifica muchos aspectos de diseño del algoritmo sino que, más bien, describe una “sintaxis del tren de bits” que define características estructurales y sintácticas de la información codificada que un descodificador compatible debe ser capaz de descodificar. Muchas aplicaciones que cumplen los estándares ATSC transmitirán información de audio digital codificada como datos binarios en serie. Como resultado, los datos codificados a menudo se denominan como tren de bits pero son permisibles otras disposiciones de los datos. Por facilidad de discusión, el término “tren de bits” se usa en este documento para denominar una señal de audio digital codificada independientemente del formato o la técnica de grabación o transmisión que se use.

Un tren de bits que cumpla los estándares ATSC está dispuesto en una serie de “tramas de sincronización”. Cada trama es una unidad del tren de bits que es capaz de ser totalmente descodificada en uno o más canales de datos de audio digital modulados por impulsos codificados (PCM) . Cada trama incluye “bloques de audio” y metadatos de trama que están asociados con los bloques de audio. Cada uno de los bloques de audio contiene datos de audio codificado que representan muestras de audio digital para uno o más canales de audio y metadatos de bloque asociados a los datos de audio codificados.

Aunque los detalles del diseño algorítmico no se especifican en los estándares ATSC, ciertas características algorítmicas han sido ampliamente adoptadas por los fabricantes de equipo profesional y para el consumidor. Una característica universal de implementación para los descodificadores que pueden descodificar trenes de bits AC-3

mejorado generados por codificadores E-AC-3 es un algoritmo que descodifica todos los datos codificados en una trama para un canal respectivo antes de descodificar los datos para otro canal. Este planteamiento se ha usado para mejorar el rendimiento de las implementaciones en procesadores de un solo chip que tienen poca memoria integrada en el chip porque algunos procesos de descodificación requieren datos para un canal dado procedentes de cada uno de los bloques de audio de una trama. Procesando los datos codificados en el orden del canal, las operaciones de descodificación pueden realizarse usando la memoria integrada en el chip para un canal particular. Los datos del canal descodificados pueden ser transferidos posteriormente a memoria externa al chip para liberar recursos integrados en el chip para el siguiente canal.

Un tren de bits que cumpla los estándares ATSC puede ser muy complejo porque es posible un gran número de 55 variaciones. Unos pocos ejemplos aquí mencionados sólo incluyen brevemente acoplamiento de canales, rematrización de canales, normalización de diálogo, compresión de gama dinámica, submezcla de canales y conmutación de longitud de bloque para trenes de bits AC-3 estándar, y múltiples trenes independientes, subtrenes dependientes, extensión espectral y transformación híbrida adaptativa para trenes de bits AC-3 mejorado. Los detalles para estas características pueden obtenerse del documento A/52B.

Procesando cada canal independientemente, pueden simplificarse los algoritmos requeridos para estas variaciones. Los procesos complejos subsiguientes como el filtrado de síntesis pueden realizarse sin preocupación para estas variaciones. Los algoritmos más sencillos parecerían proporcionar un beneficio al reducir los recursos computacionales necesarios para procesar una trama de datos de audio.

Por desgracia, este planteamiento requiere que el algoritmo de descodificación lea y examine datos en todos los bloques de audio dos veces. Cada iteración de lectura y examen de datos de bloques de audio en una trama se denomina en este documento como una “pasada” sobre los bloques de audio. La primera pasada realiza cálculos extensivos para determinar la ubicación de los datos de audio descodificados en cada bloque. La segunda pasada realiza muchos de estos mismos cálculos a medida que realiza los procesos de descodificación. Ambas pasadas requieren considerables recursos computacionales para calcular las ubicaciones de los datos. Si puede eliminarse la pasada inicial, puede ser posible reducir los recursos totales de procesamiento necesarios para descodificar una trama de datos de audio.

Exposición de la invención Un objeto de la presente invención es reducir los recursos computacionales requeridos para descodificar una trama de datos de audio en trenes de bits codificados dispuestos en unidades jerárquicas como las tramas y los bloques de audio mencionados anteriormente. El texto precedente y la siguiente descripción se refieren a trenes de bits codificados que cumplen los estándares ATSC pero la presente invención no está limitada al uso sólo con estos trenes de bits. Los principios de la presente invención pueden aplicarse esencialmente a cualquier tren de bits codificado que tenga características estructurales similares a las tramas, bloques y canales usados en algoritmos de codificación AC-3.

Según un aspecto de la presente invención, que se define por las reivindicaciones adjuntas, un método descodifica una trama de una señal de audio digital codificada recibiendo la trama y examinando la señal de audio digital codificada en una única pasada para descodificar los datos de audio codificados para cada bloque de audio en orden por bloque. Cada trama comprende metadatos de trama y una pluralidad de bloques de audio. Cada bloque de audio comprende metadatos de bloque y datos de audio codificados para uno o más canales de audio. Los metadatos de bloque comprenden información de control que describe las herramientas de codificación usadas por 25 un proceso de codificación que produjo los datos de audio codificados. Una de las herramientas de codificación es el procesamiento de transformada híbrida que aplica un banco de filtros de análisis implementado por una transformada primaria a uno o más canales de audio para generar coeficientes espectrales que representan el contenido espectral del uno o más canales de audio, y aplica una transformada secundaria a los coeficientes espectrales para al menos algunos del uno o más canales de audio para generar coeficientes de la transformada híbrida. La descodificación de cada bloque de audio determina si el proceso de codificación usó procesamiento de transformada híbrida adaptativa para codificar cualquiera de los datos de audio codificados. Si el proceso de codificación usó procesamiento de transformada híbrida adaptativa, el método obtiene todos los coeficientes de la transformada híbrida para la trama a partir de los datos de audio codificados en el primer bloque de audio en la trama y aplica una transformada secundaria inversa a los coeficientes de la transformada híbrida para obtener

coeficientes de la transformada secundaria inversa y obtiene coeficientes espectrales a partir de los coeficientes de la transformada secundaria inversa. Si el proceso de codificación no usó procesamiento de transformada híbrida adaptativa, los coeficientes espectrales se obtienen a partir de los datos de audio codificados en el bloque de... [Seguir leyendo]

Reivindicaciones:

1. Un método para descodificar una trama de una señal de audio digital codificada, en el que:

• la trama comprende metadatos de trama, un primer bloque de audio y uno o más bloques de audio subsiguientes; y

• cada uno del primer bloque de audio y los subsiguientes comprende metadatos de bloque y datos de audio codificados para dos o más canales de audio, en el que:

- los datos de audio codificados comprenden factores de escala y valores a escala que representan el contenido espectral de los dos o más canales de audio, estando cada valor a escala asociado con uno de los factores de escala respectivo; y

- los metadatos de bloque comprenden información de control que describe las herramientas de control usadas por un proceso de codificación que produjo los datos de audio codificados, incluyendo las herramientas de control procesamiento de transformada híbrida adaptativa que comprende:

· aplicar un banco de filtros de análisis implementado por una transformada primaria a los dos o más canales de audio para generar coeficientes de la transformada primaria, y

· aplicar una transformada secundaria a los coeficientes de la transformada primaria para al menos alguno de los dos o más canales de audio para generar coeficientes de la transformada híbrida;

y en el que el método comprende:

(A) recibir la trama de la señal de audio digital codificada; y

(B) examinar la señal de audio digital codificada de la trama en una única pasada para descodificar los datos de audio codificados para cada bloque de audio en orden por bloque, en el que la descodificación de cada bloque de audio respectivo comprende:

(1) determinar para cada canal respectivo de los dos o más canales si el proceso de codificación usó procesamiento

de transformada híbrida adaptativa para codificar cualquiera de los datos de audio codificados; 35

(2) si el proceso de codificación usó el procesamiento de transformada híbrida adaptativa para el canal respectivo:

(a) si el bloque de audio respectivo es el primer bloque de audio de la trama:

(i) obtener todos los coeficientes de la transformada híbrida del canal respectivo para la trama a partir de los datos de audio codificados del primer bloque de audio, y

(ii) aplicar una transformada secundaria inversa a los coeficientes de la transformada híbrida para obtener

coeficientes de la transformada secundaria inversa, y 45

(b) obtener coeficientes de la transformada primaria a partir de los coeficientes de la transformada secundaria para el canal respectivo del bloque de audio respectivo;

(3) si el proceso de codificación no usó el procesamiento de transformada híbrida adaptativa para el canal respectivo, obtener coeficientes de la transformada primaria para el canal respectivo descodificando los datos codificados del bloque de audio respectivo; y

de salida que representa el canal respectivo del bloque de audio respectivo. 55

2. El método de la reivindicación 1, en el que la trama de la señal de audio digital codificada cumple la sintaxis del tren de bits AC-3 mejorado.

3. El método de la reivindicación 2, en el que las herramientas de codificación incluyen procesamiento de extensión espectral y la descodificación de cada bloque de audio respectivo comprende además:

determinar si el proceso de descodificación debería usar procesamiento de extensión espectral para descodificar cualquiera de los datos de audio codificados; y

si debería usarse procesamiento de extensión espectral, sintetizar una o más componentes espectrales a partir de los coeficientes de la transformada secundaria inversa para obtener coeficientes de la transformada primaria con un ancho de banda extendido.

4. El método de la reivindicación 2 o 3, en el que las herramientas de codificación incluyen acoplamiento de canales y la descodificación de cada bloque de audio respectivo comprende además:

determinar si el proceso de codificación usó acoplamiento de canales para codificar cualquiera de los datos de audio codificados; y

si el proceso de codificación usó acoplamiento de canales, deducir las componentes espectrales a partir de los 10 coeficientes de la transformada secundaria inversa para obtener coeficientes de la transformada primaria para canales acoplados.

5. Un aparato para descodificar una trama de una señal de audio digital codificada, en el que el aparato comprende medios para realizar todas las etapas de una cualquiera de las reivindicaciones 1 a 4. 15

6. Un medio de almacenamiento que graba un programa de instrucciones que es ejecutable por un dispositivo para realizar un método para descodificar una trama de una señal de audio digital codificada, en el que el método comprende todas las etapas de una cualquiera de las reivindicaciones 1 a 4.

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]