CODEC AUDIO SIN PÉRDIDA ESCALABLE Y HERRAMIENTA DE AUTORÍA.

Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable;

separar los datos audio en porciones de bits más significativos (MSB) y menos significativos (LSB) para cada ventana de análisis y codificados con diferentes algoritmos sin pérdida: asignando una anchura de bit MSB mínima (Min MSB); asignando una anchura de bit LSB; comparando una carga puesta en memoria intermedia para los datos audio codificados con una carga permitida para cada ventana; escalando los datos audio codificados sin pérdida en las ventanas no conformes de modo que la carga puesta en memoria intermedia para la corriente de bits no exceda de la carga permitida, introduciendo dicha operación de escala pérdida en los datos codificados en las ventanas; donde asignar la anchura de bit LSB incluye además: calcular una anchura de bit LSB max (Max LSB) como la anchura de bit de los datos audio menos Min MSB; calcular una norma L∞ como la amplitud absoluta máxima de los datos audio en la ventana de análisis; calcular Max Amp como el número de bits necesarios para representar una muestra con valor igual a -L∞ calcular una norma L2 al cuadrado como la suma de las amplitudes al cuadrado de los datos audio en la ventana de análisis; si Max Amp no excede de Min MSB y la norma L2 no excede de un umbral, poner la anchura de bit LSB a cero bits; y si Max Amp no excede de Min MSB pero la norma L2 excede del umbral, poner la anchura de bit LSB a la anchura de bit LSB max dividida por un factor de escala; si Max Amp excede de Min MSB, poner la anchura de bit LSB a Max Amp menos Min MSB

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/009240.

Solicitante: DTS, INC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5220 Las Virgenes Road Calabasas, CA 91302 ESTADOS UNIDOS DE AMERICA.

Inventor/es: FEJZO,Zoran.

Fecha de Publicación: .

Fecha Solicitud PCT: 21 de Marzo de 2005.

Clasificación Internacional de Patentes:

  • G10L19/00L
  • G10L19/14A1R

Clasificación PCT:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

Clasificación antigua:

  • G10L19/00 G10L […] › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2363932_T3.pdf

 


Fragmento de la descripción:

Referencia cruzada a solicitudes relacionadas

Esta solicitud reivindica el beneficio de prioridad según 35 U.S.C. 119(e) por la Solicitud Provisional de Estados Unidos número 60/566.183 titulada “Codec audio sin pérdida compatible posterior” presentada el 25 de Marzo de 2004.

Antecedentes de la invención

Campo de la invención

Esta invención se refiere a codecs audio sin pérdida y más específicamente a una herramienta de autoría y codec audio sin pérdida escalable.

Descripción de la técnica relacionada

Actualmente se usan varios sistemas de codificación audio con pérdida de tasa de bits baja en un amplio rango de productos y servicios de reproducción audio de consumo y profesionales. Por ejemplo, el sistema de codificación audio Dolby AC3 (Dolby digital) es un estándar mundial para codificar pistas de sonido audio estéreo y de canal 5.1 para disco láser, vídeo DVD codificado NTSC, y ATV, usando tasas de bits de hasta 640 kbit/s. Los estándares de codificación audio MPEG I y MPEG II se usan ampliamente para codificación de pistas de sonido estéreo y multicanal para vídeo DVD codificado PAL, radiodifusión digital terrestre en Europa y transmisión por satélite en Estados Unidos, a tasas de bits de hasta 768 kbit/s. El sistema de codificación audio de acústica coherente DTS (Digital Theater Systems) se usa frecuentemente para pistas de sonido audio de canal 5.1 de calidad de estudio para disco compacto, vídeo DVD, transmisión por satélite en Europa y disco láser y tasas de bits de hasta 1536 kbit/s.

Un codec mejorado que ofrece anchura de banda de 96 kHz y resolución de 24 bits se describe en la Patente de Estados Unidos número 6.226.616 (también asignada a Digital Theater Systems, Inc.). Dicha patente emplea una metodología de núcleo y extensión en la que el algoritmo de codificación audio tradicional constituye el codificador audio “de núcleo”, y permanece inalterado. Los datos audio necesarios para representar frecuencias audio más altas (en el caso de tasas de muestreo más altas) o resolución de muestreo más alta (en el caso de mayores longitudes de palabra), o ambos, son transmitidos como una corriente de ‘extensión'. Esto permite a los proveedores de contenidos audio incluir una sola corriente de bits audio que es compatible con diferentes tipos de decodificadores residentes en el equipo base del consumidor. La corriente de núcleo será decodificada por los decodificadores más antiguos que ignorarán los datos de extensión, mientras que los decodificadores más nuevos utilizarán corrientes de datos tanto de núcleo como de extensión dando reproducción de sonido de mayor calidad. Sin embargo, este acercamiento anterior no proporciona codificación o decodificación verdaderamente sin pérdida. Aunque el sistema de la Patente de Estados Unidos 6.226.216 proporciona reproducción audio de mejor calidad, no proporciona un rendimiento “sin pérdida”.

Recientemente, muchos consumidores han mostrado interés por estos codecs denominados “sin pérdida”. Los codecs “sin pérdida” se basan en algoritmos que comprimen datos sin desechar información. Como tales, no emplean efectos psicoacústicos tal como “enmascarado”. Un codec sin pérdida produce una señal decodificada que es idéntica a la señal fuente (digitalizada). Esta operación tiene un costo: tales codecs requieren típicamente más anchura de banda que los codecs con pérdida, y comprimen los datos en menor grado.

La falta de compresión puede producir un problema cuando el contenido está siendo creado en un disco, CD, DVD, etc, en particular en casos de material fuente altamente no correlacionado o requisitos de anchura de banda fuente muy grande. Las propiedades ópticas del medio establecen una tasa de bits máxima para todo el contenido que no se puede superar. Como se representa en la figura 1, se establece típicamente un umbral duro 10, por ejemplo, 9,6 Mbps para DVD audio, para audio de modo que la tasa total de bits no exceda del límite del medio.

Los datos audio y otros se ponen en el disco al objeto de satisfacer las varias limitaciones del medio y de asegurar que todos los datos que sean necesarios para decodificar una trama dada estén presentes en la memoria intermedia del decodificador audio. La memoria intermedia tiene el efecto de alisar la carga codificada trama a trama (tasa de bits) 12, que puede fluctuar ampliamente de una trama a otra, para crear una carga puesta en memoria intermedia 14, es decir, la media puesta en memoria intermedia de la carga codificada trama a trama. Si la carga puesta en memoria intermedia 14 de la corriente de bits sin pérdida para un canal dado excede del umbral en cualquier punto, los archivos de entrada audio son alterados para reducir su contenido de información. Los archivos audio pueden ser alterados reduciendo la profundidad de bit de uno o más canales tales como de 24 bits a 22 bits, filtrando una anchura de banda de frecuencia de canal a paso bajo solamente, o reduciendo la anchura de banda audio, por ejemplo, filtrando información superior a 40 kHz al muestrear a 96 kHz. Los archivos de entrada audio alterados son recodificados de modo que la carga 16 nunca exceda del umbral 10. Un ejemplo de este proceso se describe en SurCode MLP -Manual del Propietario, páginas 20-23.

Éste es un proceso de mucho cálculo y poca eficiencia temporal. Además, aunque el codificador audio todavía es sin pérdida, la cantidad de contenido audio distribuido al usuario se ha reducido en toda la corriente de bits. Además, el proceso de alteración es inexacto; si se quita demasiada poca información, todavía puede existir el problema, si se quita demasiada información, se desechan innecesariamente datos audio. Además, el proceso de autoría tendrá que ser adaptado a las propiedades ópticas específicas del medio y el tamaño de la memoria intermedia del decodificador.

La publicación EP0869620A2 se refiere a un método y aparato de codificación/decodificación de datos digitales. Este método incluye analizar el significado de los datos digitales codificados y decodificar los datos digitales analizados desde dígitos significativos superiores a los dígitos de menor significado. Otra publicación US2003/179938A1 describe un método de formar una señal comprimida en la que una unidad de dos o más bits es dividida en una parte MSB y otra parte LSB y donde MSB se comprime de una forma sin pérdida.

Resumen de la invención

La presente invención proporciona un codec audio que genera una corriente de bits sin pérdida y una herramienta de autoría que desecha selectivamente bits para satisfacer las limitaciones del medio, canal, memoria intermedia del decodificador o tasa de bits del dispositivo de reproducción sin tener que filtrar los archivos de entrada audio, recodificar o perturbar de otro modo la corriente de bits sin pérdida.

Esto se lleva a cabo, como se reivindica en las reivindicaciones independientes, codificando sin pérdida los datos audio en una secuencia de ventanas de análisis a una corriente de bits escalable, comparando la carga puesta en memoria intermedia con una carga permitida para cada ventana, y escalando selectivamente los datos audio codificados sin pérdida en las ventanas no conformes para reducir la carga codificada, por lo tanto la carga puesta en memoria intermedia, introduciendo por ello pérdida.

En una realización ejemplar, el codificador audio separa los datos audio en porciones de bits más significativos (MSB) y menos significativos (LSB) y codifica cada una con un algoritmo sin pérdida diferente. Una herramienta de autoría escribe las porciones MSB en una corriente de bits, escribe las porciones LSB en las ventanas conformes a la corriente de bits, y escala las porciones LSB sin pérdida de cualesquiera tramas no conformes para hacerlas conformes y escribe las porciones LSB ahora con pérdida en la corriente de bits. El decodificador audio decodifica las porciones MSS y LSB y reensambla los datos audio PCM.

El codificador audio divide cada muestra audio en las porciones MSB y LSB, codifica la porción MSB con un primer algoritmo sin pérdida, codifica la porción LSB con un segundo algoritmo sin pérdida, y empaqueta los datos audio codificados en corriente de bits sin pérdida escalable. El punto límite entre las porciones MSB y LSB es establecido adecuadamente por la energía y/o la amplitud máxima de muestras en una ventana de análisis. Las anchuras de bit LSB son empaquetadas en la corriente de bits. La porción LSB es codificada preferiblemente... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable; separar los datos audio en porciones de bits más significativos (MSB) y menos significativos (LSB) para cada

ventana de análisis y codificados con diferentes algoritmos sin pérdida: asignando una anchura de bit MSB mínima (Min MSB); asignando una anchura de bit LSB; comparando una carga puesta en memoria intermedia para los datos audio codificados con una carga permitida para

cada ventana; escalando los datos audio codificados sin pérdida en las ventanas no conformes de modo que la carga puesta en

memoria intermedia para la corriente de bits no exceda de la carga permitida, introduciendo dicha operación de escala pérdida en los datos codificados en las ventanas; donde asignar la anchura de bit LSB incluye además: calcular una anchura de bit LSB max (Max LSB) como la anchura de bit de los datos audio menos Min MSB; calcular una norma L∞ como la amplitud absoluta máxima de los datos audio en la ventana de análisis; calcular Max Amp como el número de bits necesarios para representar una muestra con valor igual a -L∞; calcular una norma L2 al cuadrado como la suma de las amplitudes al cuadrado de los datos audio en la ventana de

análisis;

si Max Amp no excede de Min MSB y la norma L2 no excede de un umbral, poner la anchura de bit LSB a cero bits; y si Max Amp no excede de Min MSB pero la norma L2 excede del umbral, poner la anchura de bit LSB a la anchura

de bit LSB max dividida por un factor de escala; si Max Amp excede de Min MSB, poner la anchura de bit LSB a Max Amp menos Min MSB.

2. El método de la reivindicación 1, donde la anchura de bit LSB se limita a una anchura de bit LSB máxima (Max LSB) determinada por una anchura de palabra de los datos audio y Min MSB.

3. El método de la reivindicación 1, donde una anchura de bit LSB y las porciones MSB y LSB codificadas son empaquetadas en una corriente de bits para cada ventana de análisis.

4. El método de la reivindicación 1, donde la porción MSB es codificada con un algoritmo sin pérdida que incluye descorrelación entre múltiples canales audio y predicción adaptiva dentro de cada canal audio.

5. El método de la reivindicación 1, donde la porción LSB es codificada con un algoritmo sin pérdida que replica los bits para las muestras PCM.

6. El método de la reivindicación 1, donde la porción LSB es codificada con un algoritmo sin pérdida que usa predicción de orden bajo y codificación de entropía.

7. El método de la reivindicación 1, donde las ventanas de análisis son tramas, incluyendo cada trama una cabecera para almacenar las anchuras de bit LSB y uno o más segmentos, incluyendo cada segmento uno o más conjuntos de canales, incluyendo cada conjunto de canales uno o más canales audio, incluyendo cada canal una o más extensiones de frecuencia, incluyendo dicha extensión de frecuencia más baja porciones MSB y LSB codificadas.

8. El método de la reivindicación 7, donde la corriente de bits tiene una división MSB y LSB distinta para cada canal en cada conjunto de canales en cada trama.

9. El método de la reivindicación 7, donde dichas extensiones de frecuencia más alta incluyen solamente porciones LSB codificadas.

10. El método de la reivindicación 1, donde la corriente de bits es creada

empaquetando las porciones MSB codificadas sin pérdida en la corriente de bits para todas las ventanas; empaquetando las porciones LSB codificadas sin pérdida en la corriente de bits para las ventanas conformes; escalando las porciones LSB codificadas sin pérdida para cualesquiera ventanas no conformes para hacerlas

conformes; y empaquetando las porciones LSB codificadas ahora con pérdida para las ventanas ahora conformes en la corriente de bits.

11. El método de la reivindicación 10, donde las porciones LSB son escaladas calculando una reducción de anchura de bit LSB para la ventana de análisis; decodificando las porciones LSB en las ventanas no conformes; reduciendo las porciones LSB por la reducción de anchura de bit LSB desechando dicho número de LSBs; codificando las porciones LSB modificadas con el algoritmo de codificación sin pérdida; empaquetando las porciones LSB codificadas; y empaquetando las anchuras de bit LSB modificadas y la reducción de anchura de bit LSB en la corriente de bits.

12. El método de la reivindicación 11, donde la codificación sin pérdida es replicación de bit simple, donde las porciones LSB son reducidas

añadiendo difuminado a cada porción LSB con el fin de difuminar el LSB siguiente pasada la reducción de anchura de bit LSB; y

desplazar la porción LSB a la derecha por la reducción de anchura de bit LSB.

13. El método de la reivindicación 11, donde la reducción de anchura de bit LSB es justo suficiente para que la carga puesta en memoria intermedia no exceda de la carga permitida.

14. El método de la reivindicación 11, donde los datos audio incluyen múltiples canales, calculándose dicha reducción de anchura de bit LSB para cada canal según una regla de priorización de canal.

15. Un artículo manufacturado incluyendo una corriente de bits separada en una secuencia de ventanas de análisis de datos audio codificados almacenados en un medio, siendo codificados sin pérdida los datos audio en cada ventana de análisis excepto cuando sea necesario para reducir la carga puesta en memoria intermedia de dicha ventana de análisis de modo que no sea más que una carga permitida; donde parte de las ventanas de análisis incluyen porciones de bit más significativo (MSB) y de bit menos significativo (LSB) codificadas sin pérdida y las ventanas de análisis restantes incluyen porciones MSB codificadas sin pérdida y porciones LSB codificadas con pérdida; donde los datos audio son separados en porciones MSB y LSB para cada ventana de análisis y codificados con diferentes algoritmos sin pérdida:

asignando una anchura de bit MSB mínima (Min MSB);

asignando una anchura de bit LSB;

donde asignar la anchura de bit LSB incluye además:

calcular una anchura de bit LSB max (Max LSB) como la anchura de bit de los datos audio menos Min MSB;

calcular una norma L∞ como la amplitud absoluta máxima de los datos audio en la ventana de análisis;

calcular Max Amp como el número de bits necesarios para representar una muestra con valor igual a -L∞;

calcular una norma L2 al cuadrado como la suma de las amplitudes al cuadrado de los datos audio en la ventana de análisis;

si Max Amp no excede de Min MSB y la norma L2 no excede de un umbral, poner la anchura de bit LSB a cero bits; y si Max Amp no excede de Min MSB pero la norma L2 excede del umbral, poner la anchura de bit LSB a la anchura de bit LSB max dividida por un factor de escala; y

si Max Amp excede de Min MSB, poner la anchura de bit LSB a Max Amp menos Min MSB. 5

16. El artículo manufacturado de la reivindicación 15, donde la corriente de bits incluye información de cabecera conteniendo las anchuras de bit modificadas de las porciones LSB y la reducción de anchura de bit de las porciones LSB.

17. El artículo manufacturado de la reivindicación 16, donde las porciones LSB son codificadas sin pérdida y con pérdida usando replicación de bit.

18. El artículo manufacturado de la reivindicación 17, donde la reducción de anchura de bit de las porciones LSB es

justo suficiente para que la carga puesta en memoria intermedia no exceda de la carga permitida. 15


 

Patentes similares o relacionadas:

CÓDEC DE AUDIO MULTI-CANAL SIN PÉRDIDAS, del 1 de Agosto de 2011, de DTS, INC: Un método para codificar sin pérdidas datos de audio de PCM, que comprende: poner en bloques la señal de audio multicanal en tramas de igual tiempo de duración; procesar […]

Imagen de 'PROCEDIMIENTO Y APARATO PARA LA CODIFICACION/DECODIFICACION DE…'PROCEDIMIENTO Y APARATO PARA LA CODIFICACION/DECODIFICACION DE AUDIO SIN PERDIDA, del 18 de Mayo de 2010, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento de codificación de audio sin pérdida que comprende: correlacionar una señal espectral de audio en el dominio frecuencial […]

Imagen de 'CODIFICACION DE AUDIO'CODIFICACION DE AUDIO, del 19 de Enero de 2010, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con un medio para […]

Imagen de 'MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN…'MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA, del 8 de Abril de 2011, de FRANCE TELECOM: Método de conmutación de tasas de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión, […]

Imagen de 'DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES…'DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES ESPECTRALES Y CODIFICADOR Y DECODIFICADOR PARA SEÑALES DE AUDIO, del 17 de Marzo de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio, que comprende: un dispositivo para el procesamiento posterior de valores espectrales basándose en un primer […]

Imagen de 'VOCODIFICADOR DE VELOCIDAD VARIABLE'VOCODIFICADOR DE VELOCIDAD VARIABLE, del 2 de Diciembre de 2010, de QUALCOMM INCORPORATED: - Un procedimiento de procesamiento de una señal de voz que comprende una pluralidad de tramas, comprendiendo el procedimiento: calcular un nivel de energía […]

Imagen de 'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA, del 27 de Octubre de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador: - un módulo de combinación de […]

Imagen de 'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO'METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .