CODIFICACION DE ENTROPIA POR ADAPTACION DE CODIFICACION ENTRE MODALIDADES DE NIVEL Y DE LONGITUD DE SUCESION Y NIVEL.

Un procedimiento de codificación de datos de audio en un esquema de codificación vectorial de Huffman,

en un sistema informático, comprendiendo el procedimiento:

determinar un código de Huffman a partir de una tabla de códigos de Huffman, para su empleo en la codificación de un vector de símbolos (810) de datos de audio, en el que la determinación se basa en una suma de valores de los símbolos (812) de datos de audio; y

codificar el vector de símbolos de datos de audio utilizando el código de Huffman

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E06021094.

Solicitante: MICROSOFT CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: ONE MICROSOFT WAY,REDMOND WA 98052.

Inventor/es: SRINIVASAN, SRIDHAR, HOLCOMB,THOMAS W, REGUNATHAN,SHANKAR L, LIN,CHIN-LUNG BRUCE.

Fecha de Publicación: 17 de Marzo de 2010.

Fecha Solicitud PCT: 3 de Septiembre de 2003.

Fecha Concesión Europea: 18 de Noviembre de 2009.

Clasificación Internacional de Patentes:

G10L19/02Q
G10L19/14
H03M7/40 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de códigos la longitud variable, p. ej. código Shanno-Fano, código Huffman, código Morse.
H03M7/40A
H03M7/46 H03M 7/00 […] › Conversión en o a partir de códigos de coordenada diferencial, es decir, por representación del número de dígitos consecutivos o grupos de dígitos del mismo tipo con ayuda de una palabra código y de un dígito representativo de este tipo.

Clasificación PCT:

G06F17/20
G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
H03M7/40 H03M 7/00 […] › Conversión en, o a partir de códigos la longitud variable, p. ej. código Shanno-Fano, código Huffman, código Morse.
H03M7/46 H03M 7/00 […] › Conversión en o a partir de códigos de coordenada diferencial, es decir, por representación del número de dígitos consecutivos o grupos de dígitos del mismo tipo con ayuda de una palabra código y de un dígito representativo de este tipo.
H03M7/48 H03M 7/00 […] › alternativamente con otros códigos durante el proceso de conversión, p. ej. siendo realizada la codificación de coordenada diferencial únicamente en tanto que series de dígitos, del mismo tipo, de longitud suficiente están presentes.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre.

CODIFICACION DE ENTROPIA POR ADAPTACION DE CODIFICACION ENTRE MODALIDADES DE NIVEL Y DE LONGITUD DE SUCESION Y NIVEL.

Fragmento de la descripción:

Codificación de entropía por adaptación de codificación entre modalidades de nivel y de longitud de sucesión y nivel.

Campo

La presente invención se refiere a la codificación adaptable de entropía de datos de audio. Por ejemplo, un codificador de audio conmuta entre la codificación de Huffman de niveles directos de datos cuantizados de audio y la codificación aritmética de longitudes de sucesión y niveles de datos cuantizados de audio.

Antecedentes

Con la introducción de los discos compactos, las redes telefónicas digitales inalámbricas y el suministro de audio por Internet, el audio digital ha devenido común y corriente. Los ingenieros utilizan una gran variedad de técnicas para procesar el audio digital eficientemente, manteniendo a la vez la calidad del audio digital. Para comprender estas técnicas, ayuda comprender cómo se representa y procesa la información de audio en un ordenador.

I. Representación de Información de Audio en un Ordenador

Un ordenador procesa información de audio como una serie de números que representan la información de audio. Por ejemplo, un único número puede representar una muestra de audio, que es un valor de amplitud (es decir, volumen) en un momento específico. Diversos factores afectan a la calidad de la información de audio, incluyendo la profundidad de la muestra, la tasa de muestreo y la modalidad del canal.

La profundidad (o precisión) de la muestra indica la gama de números utilizados para representar una muestra. Cuanto más valores sean posibles para la muestra, mayor la calidad, porque el número puede capturar variaciones de amplitud más sutiles. Por ejemplo, una muestra de 8 bits tiene 256 valores posibles, mientras que una muestra de 16 bits tiene 65.536 valores posibles.

La tasa de muestreo (medida habitualmente como el número de muestras por segundo) también afecta a la calidad. Cuanto mayor sea la tasa de muestreo, mayor la calidad, porque pueden representarse más frecuencias de sonido. Algunas tasas comunes de muestreo son 8.000, 11.025, 22.050, 32.000, 44.100, 48.000 y 96.000 muestras/segundo.

La Tabla 1 muestra varios formatos de audio con distintos niveles de calidad, junto con los correspondientes costes brutos en velocidades de bits.

TABLA 1 Velocidades de bits para información de audio de distinta calidad

Como muestra la Tabla 1, el coste de la información de audio de alta calidad, tal como el audio de discos compactos, es una alta velocidad de bits. La información de audio de alta calidad consume grandes cantidades de almacenamiento de ordenador y capacidad de transmisión. Las empresas y los consumidores dependen de manera creciente de los ordenadores, sin embargo, para crear, distribuir y reproducir contenidos de audio de alta calidad.

II. Compresión y Descompresión del Audio

Muchos ordenadores y redes de ordenadores carecen de los recursos para procesar audio digital en bruto. La compresión (también llamada codificación) reduce el coste de almacenar y transmitir información de audio, convirtiendo la información a un formato de menor velocidad de bits. La compresión puede ser sin pérdidas (en donde la calidad no se ve afectada) o con pérdidas (en donde la calidad se ve afectada pero la reducción de la velocidad de bits, mediante la compresión sin pérdidas, es más drástica). La descompresión (también llamada descodificación) extrae una versión reconstruida de la información original a partir del formato comprimido.

En general, el objetivo de la compresión de audio es representar digitalmente señales de audio a fin de proporcionar la máxima calidad de señal con la menor cantidad posible de bits. Un sistema codificador/descodificador convencional de audio ("códec") utiliza la codificación de subbanda/transformación, la cuantización, el control de velocidad y la codificación de longitud variable para lograr su compresión. La cuantización y otras técnicas de compresión con pérdidas introducen ruido, potencialmente audible, en una señal de audio. La audibilidad del ruido depende de cuánto ruido hay y de cuánto ruido percibe el oyente. El primer factor se refiere principalmente a la calidad objetiva, mientras que el segundo factor depende de la percepción humana del sonido. El codificador convencional de audio comprime entonces sin pérdidas los datos cuantizados utilizando codificación de longitud variable para reducir adicionalmente la velocidad de bits.

A. Compresión y Descompresión con Pérdidas de Datos de Audio

Convencionalmente, un codificador de audio utiliza una gran variedad de distintas técnicas de compresión con pérdidas. Estas técnicas de compresión con pérdidas, habitualmente, implican transformaciones de frecuencia, modelación/ponderación perceptual y cuantización. La correspondiente descompresión implica cuantización inversa, ponderación inversa y transformaciones inversas de frecuencia.

Las técnicas de transformación de frecuencia convierten datos a un formato que hace más fácil separar la información perceptualmente importante de la información perceptualmente no importante. La información menos importante puede someterse luego a una compresión con más pérdidas, mientras que la información más importante se preserva, a fin de proporcionar la mejor calidad percibida para una velocidad dada de bits. Un transformador de frecuencia, típicamente, recibe las muestras de audio y las convierte en datos en el dominio de frecuencia, a veces llamados coeficientes de frecuencia o coeficientes espectrales.

La mayor parte de la energía en los sonidos naturales, tales como el habla y la música, se concentra en la gama de baja frecuencia. Esto significa que, estadísticamente, las gamas de mayor frecuencia tendrán coeficientes de frecuencia que son cero o cercanos a cero, reflejando la falta de energía en las gamas de mayor frecuencia.

La modelización perceptual implica procesar datos de audio según un modelo del sistema auditivo humano, a fin de mejorar la calidad percibida de la señal de audio reconstruida para una velocidad dada de bits. Por ejemplo, un modelo auditivo, típicamente, considera la gama de la audición humana y las bandas críticas. Utilizando los resultados de la modelización perceptual, un codificador modela el ruido (p. ej., el ruido de cuantización) en los datos de audio, con el objetivo de minimizar la audibilidad del ruido para una velocidad dada de bits. Si bien el codificador, a veces, debe introducir ruido (p. ej., ruido de cuantización) para reducir la velocidad de bits, la ponderación permite al codificador poner más ruido en bandas donde sea menos audible, y viceversa.

La cuantización aparea gamas de valores de entrada con valores individuales, introduciendo una pérdida irreversible de información, o ruido de cuantización, pero permitiendo también que un codificador regule la calidad y la velocidad de bits de la salida. A veces, el codificador realiza la cuantización conjuntamente con un controlador de velocidad, que ajusta la cuantización para regular la velocidad de bits y/o la calidad. Hay diversas clases de cuantización, incluyendo la adaptable y la no adaptable, la escalar y la vectorial, la uniforme y la no uniforme. La ponderación perceptual puede considerarse como una forma de cuantización no uniforme.

La cuantización inversa y la ponderación inversa reconstruyen los datos de coeficientes de frecuencia ponderados y cuantizados, como una aproximación de los datos de coeficientes de frecuencia originales. El transformador de frecuencia inverso convierte luego los datos de coeficientes de frecuencia reconstruidos en muestras reconstruidas de audio del dominio temporal.

B. Compresión y Descompresión sin Pérdidas de Datos de Audio

Convencionalmente, un codificador de audio emplea una o más entre una gran variedad de técnicas de compresión sin pérdidas. En general, las técnicas de compresión sin pérdidas incluyen la codificación de longitud de sucesión, la codificación de Huffman y la codificación aritmética. Las correspondientes técnicas de descompresión incluyen la descodificación de longitud de sucesión, la descodificación de Huffman y la descodificación aritmética.

La codificación de longitud de sucesión es una técnica de compresión sencilla y bien conocida utilizada para vídeo de cámara, texto y otros tipos de contenidos. En general, la codificación...

Reivindicaciones:

1. Un procedimiento de codificación de datos de audio en un esquema de codificación vectorial de Huffman, en un sistema informático, comprendiendo el procedimiento:

determinar un código de Huffman a partir de una tabla de códigos de Huffman, para su empleo en la codificación de un vector de símbolos (810) de datos de audio, en el que la determinación se basa en una suma de valores de los símbolos (812) de datos de audio; y

codificar el vector de símbolos de datos de audio utilizando el código de Huffman.

2. El procedimiento de la reivindicación 1, en el cual el código de Huffman es un código de escape, en el cual el vector de símbolos de datos de audio es un vector n-dimensional, en el cual el código de escape indica que el vector n-dimensional ha de codificarse como x vectores n/x-dimensionales, utilizando al menos una tabla distinta de códigos de Huffman, y en el cual n, x y n/x son enteros.

3. El procedimiento de la reivindicación 1, en el cual la determinación comprende comparar la suma de valores con un umbral, y en el cual el umbral depende de un número de símbolos de datos de audio en el vector.

4. El procedimiento de la reivindicación 3, en el cual el número de símbolos de datos de audio es 4, y en el cual el umbral es 6.

5. El procedimiento de la reivindicación 3, en el cual el número de símbolos de datos de audio es 2, y en el cual el umbral es 16.

6. El procedimiento de la reivindicación 3, en el cual el número de símbolos de datos de audio es 1, y en el cual el umbral es 100.

7. Un medio legible por ordenador que almacena instrucciones ejecutables por ordenador, para causar que un codificador de audio lleve a cabo el procedimiento de la reivindicación 1.

8. Un procedimiento de descodificación de datos de audio en un esquema de descodificación vectorial de Huffman en un sistema informático, comprendiendo el procedimiento:

recibir un código (1010) de Huffman para su empleo a fin de descodificar un vector de símbolos de datos de audio, habiendo sido el código de Huffman determinado y seleccionado a partir de una tabla de códigos de Huffman durante la codificación, sobre la base de una suma de valores de los símbolos (812) de datos de audio; y

descodificar el vector de símbolos de datos de audio utilizando el código Huffman.

9. El procedimiento de la reivindicación 8, en el cual el código de Huffman es un código de escape, y en el cual el código de escape indica que el vector de símbolos de datos de audio ha de descodificarse utilizando uno o más códigos distintos de Huffman, a partir de una o más tablas distintas de códigos de Huffman.

10. El procedimiento de la reivindicación 8, en el cual el código de Huffman fue determinado comparando la suma de valores con un umbral, en donde el umbral depende de un cierto número de símbolos de datos de audio en el vector.

11. El procedimiento de la reivindicación 10, en el cual el número de símbolos de datos de audio es 4, y en el cual el umbral es 6.

12. El procedimiento de la reivindicación 10, en el cual el número de símbolos de datos de audio es 2, y en el cual el umbral es 16.

13. El procedimiento de la reivindicación 10, en el cual el número de símbolos de datos de audio es 1, y en el cual el umbral es 100.

14. Un medio legible por ordenador que almacena instrucciones ejecutables por ordenador para causar que un descodificador de audio lleve a cabo el procedimiento de la reivindicación 8.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]