Codificación entrópica adaptando la codifidación entre modos de nivel y de longitud de serie/nivel.

Un procedimiento de codificación de datos de audio que comprende varios símbolos en un sistema informático,

caracterizándose el procedimiento por

codificar un primer vector que comprender un primer número de símbolos que representan la dimensión delprimer vector, en el cual la codificación del primer vector comprende:

verificar si un código está incluido para el primer vector en una primera tabla de código procedente deun conjunto de varias tablas de códigos para el primer número de símbolos, en el cual la primera tablade códigos comprende códigos para representan vectores que tienen el primer número de símbolos yun código de escape;

si un código para el primer vector está incluido en la primera tabla de códigos, la representación delprimer vector con el código procedente de la primera tabla de códigos; y

en caso contrario, dividir el primer vector en segundos vectores , comprendiendo cada uno unsegundo número de símbolos que representa la dimensión del segundo vector, en el cual el segundonúmero de símbolos difiere del primer número de símbolos, y

para cada uno de los segundos vectores, codificar el segundo vector,

en el cual la codificación del segundo vector comprende:

seleccionar una segunda tabla basada en el segundo número de símbolo; y

representar el segundo vector con un código procedente de la segunda tabla de códigos, en el cual lasegunda tabla de códigos difiere de la primera tabla de códigos.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08017491.

Solicitante: MICROSOFT CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: ONE MICROSOFT WAY REDMOND, WA 98052-6399 ESTADOS UNIDOS DE AMERICA.

Inventor/es: CHEN,WEI-GE, Mehrohtra,Sanjeev.

Fecha de Publicación: 4 de Julio de 2012.

Clasificación Internacional de Patentes:

G06F17/20
G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
G10L19/14
H03M7/40 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de códigos la longitud variable, p. ej. código Shanno-Fano, código Huffman, código Morse.
H03M7/46 H03M 7/00 […] › Conversión en o a partir de códigos de coordenada diferencial, es decir, por representación del número de dígitos consecutivos o grupos de dígitos del mismo tipo con ayuda de una palabra código y de un dígito representativo de este tipo.
H03M7/48 H03M 7/00 […] › alternativamente con otros códigos durante el proceso de conversión, p. ej. siendo realizada la codificación de coordenada diferencial únicamente en tanto que series de dígitos, del mismo tipo, de longitud suficiente están presentes.

PDF original: ES-2388942_T3.pdf

Fragmento de la descripción:

Codificación entrópica adaptando la codificación entre modos de nivel y de longitud de serie/nivel

Campo

La presente invención se refiere a codificación entrópica adaptativa de datos de audio. Por ejemplo, un codificador de audio conmuta entre codificación de Huffman de niveles directos de datos de audio cuantificados y codificación aritmética de longitudes y niveles de serie de datos de audio cuantificados.

Antecedentes

Con la introducción de los discos compactos, las redes de telefonía inalámbrica digital y el suministro de audio por Internet, el audio digital se ha convertido en algo común. Los ingenieros hacen uso de una diversidad de técnicas para procesar eficazmente el audio digital mientras que a la vez mantienen la calidad del audio digital. El hecho de entender estas técnicas, ayuda a entender cómo se representa y se procesa la información de audio en un ordenador.

I. Representación de Información de Audio en un Ordenador

Un ordenador procesa la información de audio como una serie de números que representan la información de audio. Por ejemplo, un número simple puede representar una muestra de audio, que tenga un valor de amplitud (es decir, una intensidad de sonido) en un instante particular. Diversos factores afectan a la calidad de la información de audio, incluyendo profundidad de muestra, frecuencia de muestreo, y modo canal.

La profundidad de muestra (o precisión) indica la gama de números utilizados para representar una muestra. A mayor número de valores posibles para la muestra, más alta es la calidad debido a que el número puede capturar más variaciones leves de amplitud. Por ejemplo, una muestra de 8 bits tiene 256 valores posibles, mientras que una muestra de 16 bits tiene 65.536 valores posibles.

La frecuencia de muestreo (medida normalmente como el número de muestras por segundo) , también afecta a la calidad. Cuanto más elevada sea la frecuencia de muestreo, más alta es la calidad debido a que se pueden representar más frecuencias de sonido. Algunas frecuencias de muestreo habituales son 8.000, 11.025, 22.050, 32.000, 44.100,

48.000 y 96.000 muestras/ segundo.

La Tabla 1 muestra varios formatos de audio con diferentes niveles de calidad, junto con los costes correspondientes de velocidad de bit bruta.

Tabla 1: Velocidades de bit para información de audio de calidad diferente

Calidad Profundidad de Muestra (bits/muestra) Frecuencia de Muestreo (muestras/segundo) Modo Velocidad de Bit Bruta (bits/segundo) Telefonía de Internet 8 8.000 mono 64.000 Teléfono 8 11.025 mono 88.200 Audio de CD 16 44.100 estéreo 1.411.200 Audio de alta calidad 16 48.000 estéreo 1.536.000

Según muestra la Tabla 1, el coste de la información de audio de alta calidad tal como el audio de CD, es una alta velocidad de bit. La información de audio de alta calidad consume grandes cantidades de capacidad de almacenamiento en ordenador y de transmisión. Las compañías y los consumidores dependen sin embargo crecientemente de los ordenadores, para crear, distribuir y reproducir contenidos de audio de alta calidad.

II. Compresión y Descompresión de Audio

Muchos ordenadores y redes de ordenadores carecen de recursos para procesar el audio digital en bruto. La compresión (conocida también como codificación) , reduce el coste del almacenaje y la transmisión de información de audio al convertir la información a una forma de velocidad de bit más baja. La compresión puede ser sin pérdidas (en la que no se ve perjudicada la calidad) o con pérdidas (en la que se ve perjudicada la calidad, pero la reducción de velocidad de bit mediante la compresión sin pérdidas es más drástica) . La descompresión (también llamada descodificación) extrae una versión reconstruida de la información original a partir de la forma comprimida.

En general, el objetivo de la compresión de audio consiste en representar digitalmente las señales de audio para proporcionar una máxima calidad de señal con la menor cantidad de bits posible. Un sistema convencional de

codificador/ descodificador (“códec”) de audio utiliza codificación de sub-banda/ transformación, cuantificación, control de velocidad, y codificación de longitud variable, para conseguir su compresión. La cuantificación y otras técnicas de compresión con pérdidas introducen ruido potencialmente audible en la señal de audio. La audibilidad del ruido depende de cuánto ruido exista y de cuánto de ese ruido perciba el oyente. El primer factor se refiere principalmente a la calidad objetiva, mientras que el segundo factor depende de la percepción humana del sonido. La codificación de audio convencional comprime entonces sin pérdidas los datos cuantificados utilizando codificación de longitud variable para reducir aún más la velocidad de bit.

A. Compresión y Descompresión de Datos de Audio con Pérdidas

Convencionalmente, un codificador de audio utiliza una diversidad de técnicas diferentes de compresión con pérdidas. Estas técnicas de compresión con pérdidas incluyen típicamente transformaciones de frecuencia, modelación/ ponderación perceptual, y cuantificación. La descompresión correspondiente incluye cuantificación inversa, ponderación inversa, y transformaciones inversas de frecuencia.

Las técnicas de transformación de frecuencia convierten datos en una forma que hace que sea más fácil separar la información perceptualmente importante de la información perceptualmente no importante. La información menos importante puede ser sometida entonces a compresión con más pérdidas, mientras que la información más importante se reserva, con el fin de proporcionar la calidad mejor percibida para una velocidad de bit dada. Un transformador de frecuencia recibe típicamente las muestras de audio y las convierte en datos en el dominio de la frecuencia, denominados a veces coeficientes de frecuencia o coeficientes espectrales.

La mayor parte de la energía de los sonidos naturales tales como la palabra y la música, se concentra en la gama de baja frecuencia. Esto significa que, estadísticamente, las gamas de frecuencias más altas tendrán más coeficientes de frecuencia que sean cero o próximos a cero, reflejando la falta de energía en las gamas de frecuencias más altas.

La modelación perceptual implica procesar datos de audio de acuerdo con un modelo del sistema auditivo humano para mejorar la calidad percibida de la señal de audio reconstruida para una velocidad de bit dada. Por ejemplo, un modelo auditivo considera típicamente la gama de bandas críticas y de audición humanas. Utilizando los resultados de la modelación perceptual, un codificador configura el ruido (por ejemplo, el ruido de cuantificación) de los datos de audio con el objetivo de minimizar la audibilidad del ruido para una velocidad de bit dada. Mientras que el codificador debe introducir ruido a veces (por ejemplo, ruido de cuantificación) para reducir la velocidad de bit, la ponderación permite que el codificador ponga más ruido en las bandas en las que es menos audible, y viceversa.

La cuantificación cartografía las gamas de valores de entrada en los valores simples, introduciendo pérdidas irreversibles de información o de ruido de cuantificación, así como permitiendo también que un codificador regule la calidad y la velocidad de bit de la salida. A veces, el codificador realiza la cuantificación junto con un controlador de velocidad que ajusta la cuantificación para regular la velocidad de bit y/o la calidad. Existen varias clases de cuantificación, incluyendo la adaptativa y la no adaptativa, la escalar y la vectorial, la uniforme y la no uniforme. La ponderación perceptual puede ser considerada como una forma de cuantificación no uniforme.

La cuantificación inversa y la ponderación inversa reconstruyen los datos de coeficientes de frecuencia cuantificados, ponderados, en una aproximación de los datos de coeficientes de frecuencia originales. El transformador de frecuencia inversa convierte a continuación los datos de coeficientes de frecuencia en muestras de audio reconstruidas en el dominio del tiempo.

B. Compresión y Descompresión de Datos de Audio sin Pérdidas

Convencionalmente, el codificador de audio utiliza una o más de una... [Seguir leyendo]

Reivindicaciones:

1. Un procedimiento de codificación de datos de audio que comprende varios símbolos en un sistema informático, caracterizándose el procedimiento por

codificar un primer vector que comprender un primer número de símbolos que representan la dimensión del primer vector, en el cual la codificación del primer vector comprende:

verificar si un código está incluido para el primer vector en una primera tabla de código procedente de un conjunto de varias tablas de códigos para el primer número de símbolos, en el cual la primera tabla de códigos comprende códigos para representan vectores que tienen el primer número de símbolos y un código de escape; si un código para el primer vector está incluido en la primera tabla de códigos, la representación del primer vector con el código procedente de la primera tabla de códigos; y en caso contrario, dividir el primer vector en segundos vectores , comprendiendo cada uno un segundo número de símbolos que representa la dimensión del segundo vector, en el cual el segundo número de símbolos difiere del primer número de símbolos, y para cada uno de los segundos vectores, codificar el segundo vector,

en el cual la codificación del segundo vector comprende:

seleccionar una segunda tabla basada en el segundo número de símbolo; y representar el segundo vector con un código procedente de la segunda tabla de códigos, en el cual la segunda tabla de códigos difiere de la primera tabla de códigos.

2. El procedimiento de la reivindicación 1, en el cual el primer número de símbolos es superior al segunda número de símbolos, y en el cual el primer vector tiene una probabilidad de ocurrencia más alta que el segundo vector.

3. El procedimiento de la reivindicación 1 en el cual la primera tabla de códigos comprende:

códigos para representar vectores probables de un conjunto de vectores posibles que tienen el primer número de símbolos; y un código de escape para vectores menos probables.

4. El procedimiento según la reivindicación 1, en el cual el primer número de símbolos difiere del segundo número de símbolo por un factor de 2.

5. Un procedimiento de descodificación de datos de audio que comprende varios vectores codificados en un sistema informático, caracterizándose el procedimiento por:

descodificar un primer vector, que tiene un primer número de símbolos en el cual la descodificación del primer vector comprende:

recibir un primer código; buscar el primer código en una primera tabla de códigos en un grupo de barias tablas de códigos; determinar si el primer código es un código de escape; si el primer código es un código de escape:

recibir un segundo código que representa una parte del primer vector, en el cual el segundo código no está incluido en la primera tabla de códigos; y descodificar el segundo código;

si el primer código no es un código de escape:

buscar símbolos para el primer vector en la primera tabla de códigos; e incluir los símbolos en una corriente de datos descodificada.

en el cual el primer número de símbolos es una base para saber si el primer código es un código de escape o no es un código de escape.

6. El procedimiento de la reivindicación 5 en el cual la descodificación del segundo código comprende:

buscar el segundo código en una segunda tabla de códigos en el grupo de varias tablas de códigos; determinar si el segundo código es un código de escape; si el segundo código e s un código de escape:

recibir un tercer código que representa el primer vector, en el cual el tercer código no está incluido en la segunda tabla de códigos; y

descodificar el tercer código; y si el segundo código no es un código de escape:

buscar símbolos para el primer vector en la segunda tabla de códigos; e incluir los símbolos en la corriente de datos descodificada;

en el cual la segunda tabla de códigos difiere de la primera tabla de códigos.

7. El procedimiento de la reivindicación 5 que comprende, además:

descodificar un segundo vector, en el cual el segundo vector tiene un segundo número de símbolos, y en el cual el primer número difiere del segundo número por un factor de 2.

8. El procedimiento de la reivindicación 1 en el cual la codificación del segundo vector comprende:

determinar si un código está disponible para el segundo vector en la segunda tabla de códigos, en el cual la segunda tabla de códigos comprende un código de escape que indica un cambio respecto de la segunda tabla de códigos para una técnica de codificación sin tabla; si el código está disponible para el segundo vector en la segunda tabla de códigos, representar el segundo vector con el código procedente de la segunda tabla de códigos; y en caso contrario, dividir el segundo vector en varios símbolos simples, y para cada uno de los varios símbolos simples, representar el símbolo simple con un código obtenido por la técnica de codificación sin tabla.

9. El procedimiento de la reivindicación 1 en el cual la codificación del segundo vector comprende:

determinar si un código está disponible para el segundo vector en la segunda tabla de códigos, en el cual la segunda tabla de códigos comprende un código de escape que indica un cambio respecto de la segunda tabla de códigos para una tercera tabla de códigos de las varias tablas de códigos; si el código está disponible para el segundo vector en la segunda tabla de códigos, representar el segundo vector con el código procedente de la segunda tabla de códigos; y en caso contrario, dividir el segundo vector en varios terceros vectores, comprendiendo cada uno un tercer número de símbolos y para cada uno de los varios terceros vectores, codificar el tercer vector utilizando la tercera tabla de códigos, en el cual el tercer número de símbolos difiere del primer número de símbolos y difiere del segundo número de símbolos.

10. El procedimiento de la reivindicación 5 en el cual la descodificación del segundo código comprende:

buscar el segundo código en una segunda tabla de códigos en el grupo de varias tablas de códigos; determinar si el segundo código es un código de escape procedente de la segunda tabla de códigos; si el segundo código es el código de escape procedente de la segunda tabla de códigos, para cada uno de los varios símbolos simples en el primer vector, descodificar un código que representa el símbolo simple utilizando una técnica de descodificación sin tabla e incluir el símbolo simple en la corriente de datos descodificada; si el segundo código no es el código de escape procedente de la segunda tabla de códigos:

buscar un segundo vector, que tiene un segundo número de símbolos, en la segunda tabla de códigos, en el cual el segundo vector está asociado al segundo código en la segunda tabla de códigos; e incluir el segundo número de símbolos del segundo vector en la corriente de datos descodificada.

11. Soporte legible por ordenador que almacena instrucciones que pueden ser ejecutadas por ordenador para hacer que un ordenador efectúe el procedimiento de una cualquiera de las reivindicaciones 1 a 10.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]