Descodificación de audio usando un mezclado descendente eficaz.
Un método que hace funcionar un descodificador de audio (200) para descodificar datos de audio que incluyen bloques codificados de N.
n canales de datos de audio para formar datos de audio descodificados que incluyen M.m canales de audio descodificado, M³1, siendo n el número de canales de efectos de baja frecuencia en los datos de audio codificados, y siendo m el número de canales de efectos de baja frecuencia en los datos de audio descodificados, comprendiendo el método:
• aceptar los datos de audio que incluyen bloques de N.n canales de datos de audio codificados que han sido codificados mediante un método de codificación, incluyendo el método de codificación transformar N.n canales de datos de audio digital y formar y empaquetar datos de exponente y de mantisa de dominio de frecuencia; y
• descodificar los datos de audio aceptados, incluyendo la descodificación:
- desempaquetar y descodificar (403) los datos de exponente y de mantisa de dominio de frecuencia,
- determinar coeficientes de transformada (605) a partir de los datos de exponente y de mantisa de dominio de frecuencia desempaquetados y descodificados,
- someter a una transformación inversa (607) los datos de dominio de frecuencia y aplicar un procesamiento adicional para determinar datos de audio muestreados, y
- mezclar de manera descendente en el dominio de tiempo (613) al menos algunos bloques de los datos de audio muestreados determinados según datos de mezclado descendente para el caso en que M
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E11154910.
Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.
Inventor/es: THESING,ROBIN, SILVA,JAMES M, ANDERSEN,ROBERT L.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/008 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
- H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
PDF original: ES-2467290_T3.pdf
Fragmento de la descripción:
Descodificación de audio usando un mezclado descendente eficaz
Campo de la invención La presente divulgación se refiere en general al procesamiento de señales de audio.
Antecedentes La compresión de datos de audio digital se ha convertido en una técnica importante en la industria del audio. Se han introducido nuevos formatos que permiten una reproducción de audio de alta calidad sin necesidad de un gran ancho de banda de datos, el cual es necesario en las técnicas tradicionales. El Comité de Sistemas de Televisión Avanzada (ATSC) ha adoptado la tecnología de codificación AC-3 y, más recientemente, la AC-3 mejorada (E-AC-3)
como la norma de servicio de audio para la televisión de alta definición (HDTV) en los Estados Unidos. La norma EAC-3 también se utiliza en los sistemas multimedia de los consumidores (disco de vídeo digital) y en la radiodifusión directa por satélite. La norma E-AC-3 es un ejemplo de codificación perceptual y permite la codificación de múltiples canales de audio digital en un flujo de bits de audio codificado y metadatos.
Existe la necesidad de descodificar de manera eficaz un flujo de bits de audio codificado. Por ejemplo, la vida útil de las baterías de los dispositivos portátiles está limitada en gran medida por el consumo de energía de su unidad de procesamiento principal. El consumo de energía de una unidad de procesamiento está estrechamente relacionado con la complejidad computacional de sus tareas. Por tanto, reducir la complejidad computacional media de un sistema de procesamiento de audio portátil aumentará la vida útil de la batería de tal sistema.
El término x86 es comúnmente utilizado por los expertos en la técnica para designar una familia de arquitecturas de conjunto de instrucciones de procesador cuyos orígenes se remontan al procesador 8086 de Intel. Como resultado de la ubicuidad de la arquitectura de conjunto de instrucciones x86, existe también la necesidad de descodificar de manera eficaz un flujo de bits de audio codificado en un procesador o sistema de procesamiento que tenga una arquitectura de conjunto de instrucciones x86. Muchas implementaciones de descodificadores tienen un carácter genérico, mientras que otras están diseñadas específicamente para procesadores integrados. Nuevos procesadores tales como el procesador Geode de AMD y el nuevo Intel Atom son ejemplos de diseños de 32 bits y de 64 bits que usan el conjunto de instrucciones x86 y que están usándose en pequeños dispositivos portátiles.
Sumario Un aspecto de la invención se refiere a un método que hace funcionar un descodificador de audio para descodificar datos de audio según la reivindicación 1. Aspectos adicionales se definen de la manera expuesta en las reivindicaciones dependientes 2 a 12.
Un aspecto adicional de la invención se refiere a un medio de almacenamiento legible por ordenador que almacena instrucciones de descodificación que cuando son ejecutadas por uno o más procesadores de un sistema de procesamiento hacen que el sistema de procesamiento lleve a cabo el método descrito anteriormente.
Un aspecto adicional de la invención se refiere a un aparato que procesa datos de audio para descodificar datos de audio que incluyen bloques codificados de N.n canales de datos de audio para formar datos de audio descodificados que incluyen M.m canales de de audio descodificado, M≥1, siendo n el número de canales de efectos de baja frecuencia en los datos de audio codificados, y siendo m el número de canales de efectos de baja frecuencia en los datos de audio descodificados, comprendiendo el aparato medios para llevar a cabo el método anterior.
Breve descripción de los dibujos La figura 1 muestra un pseudocódigo 100 de instrucciones que, cuando se ejecutan, llevan a cabo un proceso de descodificación AC-3 típico.
Las figuras 2A a 2D muestran, en forma de diagrama de bloques simplificado, algunas configuraciones de descodificador diferentes que pueden usar de manera ventajosa uno o más módulos comunes.
La figura 3 muestra un pseudocódigo y un diagrama de bloques simplificado de una realización de un módulo de descodificación de sección de entrada.
La figura 4 muestra un diagrama de flujo de datos simplificado del funcionamiento de una realización de un módulo de descodificación de sección de entrada.
La figura 5A muestra un pseudocódigo y un diagrama de bloques simplificado de una realización de un módulo de descodificación de sección de procesamiento.
La figura 5B muestra un pseudocódigo y un diagrama de bloques simplificado de otra realización de un módulo de descodificación de sección de procesamiento.
La figura 6 muestra un diagrama de flujo de datos simplificado del funcionamiento de una realización de un módulo de descodificación de sección de procesamiento.
La figura 7 muestra un diagrama de flujo de datos simplificado del funcionamiento de otra realización de un módulo de descodificación de sección de procesamiento.
La figura 8 muestra un diagrama de flujo de una realización de un procesamiento de un módulo de descodificación de sección de procesamiento tal como el mostrado en la figura 7.
La figura 9 muestra un ejemplo de procesamiento de cinco bloques que incluye un mezclado descendente de 5.1 a 2.0 usando una realización de la presente invención para el caso de una transformada de no solapamiento que incluye un mezclado descendente de 5.1 a 2.0.
La figura 10 muestra otro ejemplo de procesamiento de cinco bloques que incluye un mezclado descendente de 5.1 a 2.0 usando una realización de la presente invención para el caso de una transformada de solapamiento.
La figura 11 muestra un pseudocódigo simplificado de una realización de mezclado descendente en el dominio de tiempo.
La figura 12 muestra un diagrama de bloques simplificado de una realización de un sistema de procesamiento que incluye al menos un procesador y que puede llevar a cabo descodificaciones, que incluye una o más características de la presente invención.
Descripción de realizaciones de ejemplo Aspectos generales Realizaciones de la presente invención incluyen un método, un aparato y lógica codificada en uno o más medios tangibles legibles por ordenador para llevar a cabo acciones.
Realizaciones particulares incluyen un método que hace funcionar un descodificador de audio para descodificar datos de audio que incluyen bloques codificados de N.n canales de datos de audio para formar datos de audio descodificados que incluyen M.m canales de audio descodificado, M≥1, siendo n el número de canales de efectos de baja frecuencia en los datos de audio codificados, y siendo m el número de canales de efectos de baja frecuencia en los datos de audio descodificados. El método comprende aceptar los datos de audio que incluyen bloques de N.n canales de datos de audio codificados que han sido codificados mediante un método de codificación que incluye transformar N.n canales de datos de audio digital y formar y empaquetar datos de exponente y de mantisa de dominio de frecuencia; y descodificar los datos de audio aceptados. La descodificación incluye: desempaquetar y descodificar los datos de exponente y de mantisa de dominio de frecuencia; determinar coeficientes de transformada a partir de los datos de exponente y de mantisa de dominio de frecuencia desempaquetados y descodificados;
someter a una transformación inversa los datos de dominio de frecuencia y aplicar un procesamiento adicional para determinar datos de audio muestreados; y mezclar de manera descendente en el dominio de tiempo al menos algunos bloques de los datos de audio muestreados determinados según datos de mezclado descendente para el caso en que M<N. Al menos se cumple uno de A1, B1 y C1:
siendo A1 que la descodificación incluye determinar bloque a bloque si hay que aplicar un mezclado descendente en el dominio de frecuencia o un mezclado descendente en el domino de tiempo, y si para un bloque particular se determina que hay que aplicar un mezclado descendente en el dominio de frecuencia, aplicar un mezclado descendente en el dominio de frecuencia para el bloque particular,
siendo B1 que el mezclado descendente en el dominio de tiempo incluye comprobar si los datos de mezclado descendente han cambiado con respecto a datos de mezclado descendente usados anteriormente, y, si han cambiado, aplicar una atenuación cruzada para determinar datos de mezclado descendente atenuados de manera cruzada y un mezclado descendente en el dominio de tiempo según los datos de mezclado descendente atenuados de manera cruzada, y, si no han cambiado, realizar directamente un mezclado descendente en el dominio de tiempo 60 según los datos de mezclado... [Seguir leyendo]
Reivindicaciones:
1. Un método que hace funcionar un descodificador de audio (200) para descodificar datos de audio que incluyen bloques codificados de N.n canales de datos de audio para formar datos de audio descodificados que incluyen M.m
canales de audio descodificado, M≥1, siendo n el número de canales de efectos de baja frecuencia en los datos de audio codificados, y siendo m el número de canales de efectos de baja frecuencia en los datos de audio descodificados, comprendiendo el método:
• aceptar los datos de audio que incluyen bloques de N.n canales de datos de audio codificados que han sido codificados mediante un método de codificación, incluyendo el método de codificación transformar N.n canales de datos de audio digital y formar y empaquetar datos de exponente y de mantisa de dominio de frecuencia; y
• descodificar los datos de audio aceptados, incluyendo la descodificación:
- desempaquetar y descodificar (403) los datos de exponente y de mantisa de dominio de frecuencia,
- determinar coeficientes de transformada (605) a partir de los datos de exponente y de mantisa de dominio de frecuencia desempaquetados y descodificados,
- someter a una transformación inversa (607) los datos de dominio de frecuencia y aplicar un procesamiento adicional para determinar datos de audio muestreados, y
- mezclar de manera descendente en el dominio de tiempo (613) al menos algunos bloques de los datos de audio muestreados determinados según datos de mezclado descendente para el caso en que M<N;
en el que el mezclado descendente en el dominio de tiempo incluye (1100) comprobar si los datos de mezclado descendente han cambiado en el tiempo con respecto a datos de mezclado descendente usados anteriormente, y , si han cambiado, aplicar una atenuación cruzada para determinar datos de mezclado descendente atenuados de manera cruzada y un mezclado descendente en el domino de tiempo según los datos de mezclado descendente atenuados de manera cruzada, y, si no han cambiado, realizar directamente un mezclado descendente en el dominio de tiempo según los datos de mezclado descendente.
2. El método según la reivindicación 1, donde el método incluye identificar (835) uno o más canales no contribuyentes de los N.n canales de entrada, siendo un canal no contribuyente un canal que no contribuye en los M.m canales, y donde el método no lleva a cabo una transformación inversa de los datos de dominio de frecuencia ni aplica un procesamiento adicional en el uno o más canales no contribuyentes identificados.
3. El método según cualquiera de las reivindicaciones anteriores, en el que la transformación en el método de codificación usa una transformada solapada, y donde el procesamiento adicional incluye aplicar operaciones de división en ventanas y de solapamiento y suma (609) para determinar datos de audio muestreados.
4. El método según cualquiera de las reivindicaciones anteriores, en el que el método de codificación incluye formar y empaquetar metadatos relacionados con los datos de exponente y de mantisa de dominio de frecuencia, donde los metadatos incluyen opcionalmente metadatos relacionados con un procesamiento de pre-ruido transitorio y el
mezclado descendente.
5. El método según cualquiera de las reivindicaciones anteriores, en el que el descodificador (200) usa al menos un procesador x86 cuyo conjunto de instrucciones incluye difundir en flujo continuo extensiones (SSE) de una sola instrucción y múltiples datos que comprenden instrucciones vectoriales, y en el que el mezclado descendente en el dominio de tiempo incluye ejecutar instrucciones vectoriales en al menos un procesador del uno o más procesadores x86.
6. El método según la reivindicación 2, en el que n=1 y m=0, de manera que la transformación inversa y la aplicación de un procesamiento adicional no se llevan cabo en el canal de efecto de baja frecuencia.
5.
7. El método según la reivindicación 2, en el que los datos de audio que incluyen bloques codificados incluyen información que define el mezclado descendente, y en el que la identificación de uno o más canales no contribuyentes usa la información que define el mezclado descendente.
8. El método según la reivindicación 7, en el que la información que define el mezclado descendente incluye parámetros de nivel de mezclado que tienen valores predefinidos que indican que uno o más canales son canales no contribuyentes.
9. El método según la reivindicación 2, en el que la identificación de uno o más canales no contribuyentes incluye 65 además identificar si uno o más canales tienen una cantidad insignificante de contenido con respecto a uno o más otros canales, en el que la identificación de si uno o más canales tienen una cantidad insignificante de contenido con respecto a uno o más otros canales incluye comparar la diferencia de una medida de cantidad de contenido entre pares de canales con un umbral ajustable y/o en el que un canal tiene una cantidad insignificante de contenido con respecto a otro canal si su energía o nivel absoluto es al menos 15 dB inferior a los del otro canal o si su energía o nivel absoluto es al menos 18 dB inferior a los del otro canal o si su energía o nivel absoluto es al menos 25 dB
inferior a los del otro canal.
10. El método según cualquier reivindicación anterior, en el que los datos de audio aceptados están en forma de un flujo de bits de tramas de datos codificados, y en el que la descodificación se divide en un conjunto de operaciones de descodificación de sección de entrada (201) y en un conjunto de operaciones de descodificación de sección de 10 procesamiento (203) , incluyendo las operaciones de descodificación de sección de entrada el desempaquetado y la descodificación de los datos de exponente y de mantisa de dominio de frecuencia de una trama del flujo de bits en datos de exponente y de mantisa de dominio de frecuencia desempaquetados y descodificados para la trama, y los metadatos incluidos en la trama, incluyendo las operaciones de descodificación de sección de procesamiento la determinación de los coeficientes de transformada, la transformación inversa y la aplicación de un procesamiento adicional, la aplicación de cualquier procesamiento de pre-ruido transitorio requerido de descodificación y el mezclado descendente en el caso en que M<N.
11. El método según la reivindicación 10, en el que las operaciones de descodificación de sección de entrada se llevan a cabo en una primera pasada seguida de una segunda pasada, comprendiendo la primera pasada desempaquetar metadatos bloque a bloque y guardar punteros que apuntan a la ubicación en la que están almacenados los datos de exponente y de mantisa empaquetados, y comprendiendo la segunda pasada usar los punteros guardados que apuntan a los exponentes y mantisas empaquetados, y desempaquetar y descodificar datos de exponente y de mantisa canal a canal.
12. El método según cualquier reivindicación anterior, en el que los datos de audio codificados se codifican según una norma del conjunto de normas que consiste en la norma AC-3, la norma E-AC-3 y la norma HE-AAC.
13. Un medio de almacenamiento legible por ordenador que almacena instrucciones de descodificación que cuando son ejecutadas por uno o más procesadores de un sistema de procesamiento hacen que el sistema de 30 procesamiento lleve a cabo el método de cualquiera de las reivindicaciones anteriores.
14. Un aparato (1200) que procesa datos de audio para descodificar los datos de audio que incluyen bloques codificados de N.n canales de datos de audio para formar datos de audio descodificados que incluyen M.m canales de audio descodificado, M≥1, siendo n el número de canales de efectos de baja frecuencia en los datos de audio codificados, y siendo m el número de canales de efectos de baja frecuencia en los datos de audio descodificados, comprendiendo el aparato medios para llevar a cabo el método de cualquiera de las reivindicaciones 1 a 12.
Patentes similares o relacionadas:
Método y sistema para el procesamiento de sonido envolvente en un auricular, del 27 de Mayo de 2020, de Voyetra Turtle Beach, Inc: Un método, que comprende: en un auricular de audio que recibe una pluralidad de señales de audio correspondientes a una pluralidad de canales de sonido envolvente: […]
Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Sistema y método de salida binaural paramétrico, del 19 de Febrero de 2020, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para codificar audio de entrada basado en un canal u objeto para la reproducción, incluyendo el método las etapas de: (a) renderizar inicialmente […]
Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]
Control de rango dinámico basado en metadatos extendidos de audio codificado, del 11 de Diciembre de 2019, de APPLE INC.: Un sistema para producir una grabación de audio digital codificada que tiene una pluralidad de canales de audio u objetos de audio, que comprende: un codificador de audio […]