PROCEDIMIENTO Y APARATO PARA LA CODIFICACION/DECODIFICACION DE AUDIO SIN PERDIDA.
Un procedimiento de codificación de audio sin pérdida que comprende:
correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia;
obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits;
seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada;
seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y
codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad;
caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;
en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0"
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E05251452.
Solicitante: SAMSUNG ELECTRONICS CO., LTD..
Nacionalidad solicitante: República de Corea.
Dirección: 416 MAETAN-DONG, YEONGTONG-GU SUWON-SI,,GYEONGGI-DO.
Inventor/es: OH,ENNMI, KIM,JUNGHOE, LEI,MIAO, LEE,SHIHWA, KIM,SANGWOOK.
Fecha de Publicación: .
Fecha Solicitud PCT: 10 de Marzo de 2005.
Fecha Concesión Europea: 3 de Marzo de 2010.
Clasificación Internacional de Patentes:
- G10L19/00L
Clasificación PCT:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
Clasificación antigua:
- G10L19/00 G10L […] › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.
Fragmento de la descripción:
Procedimiento y aparato para la codificación/decodificación de audio sin pérdida.
La presente invención versa acerca de la codificación y/o decodificación de una señal de audio, y más en particular, acerca de un procedimiento y un aparato para la codificación/decodificación de audio sin pérdida capaces de proporcionar una mayor relación de compresión que en un código Golomb en planos de bit (BPGC) utilizando un procedimiento de codificación basado en texto.
Los procedimientos de codificación de audio sin pérdida incluyen la codificación Meridian de compresión sin pérdida de audio, la codificación Monkey de audio, y la codificación libre de audio sin pérdida. Se aplica una compresión Meridian sin pérdida (MLP) y se utiliza en un disco versátil digital-audio (DVD-A).
Según aumenta el ancho de banda de la red de Internet, se puede proporcionar un gran volumen de contenidos multimedia. En el caso de contenidos de audio, se necesita un procedimiento de audio sin pérdida. En la Unión Europea (UE), ya se ha comenzado la emisión de audio digital a través de una emisión de audio digital (DAB), y para esto las estaciones emisoras y los proveedores de contenidos están utilizando procedimientos de codificación de audio sin pérdida. En respuesta a esto, el grupo MPEG también está continuando con la normalización de la compresión de audio sin pérdida bajo el nombre de ISO/IEC 14496-3:2001/AMD5, codificación escalable de audio sin pérdida (SLS). Esto proporciona una escalabilidad de grano fino (FGS) y permite la compresión de audio sin pérdida.
Se puede mejorar una relación de compresión, que es el factor más importante en una tecnología de compresión de audio sin pérdida, al eliminar información redundante entre elementos de datos. La información redundante puede ser eliminada mediante la predicción entre elementos contiguos de datos y también puede ser eliminada por un contexto entre elementos contiguos de datos.
Los coeficientes de la transformada discreta del coseno modificada (MDCT) en enteros muestran una distribución de Laplace, y en esta distribución, un procedimiento de compresión denominado código de Golomb muestra un resultado óptimo. Para proporcionar la FGS, se necesita una codificación en planos de bit y una combinación del código de Golomb y de la codificación en planos de bit se denomina una codificación Golomb en planos de bit (BPGC), que proporciona una relación óptima de compresión y de FGS. Sin embargo, en algunos casos la suposición de que los coeficientes de MDCT en enteros muestran una distribución de Laplace no es correcta en una distribución real de datos. Dado que la BPGC es un algoritmo concebido suponiendo que los coeficientes de la MDCT en enteros muestran una distribución de Laplace, si los coeficientes de la MDCT en enteros no muestran una distribución de Laplace, la BPGC no puede proporcionar una relación óptima de compresión sin tener en cuenta la suposición de que se necesitan que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.
En el documento ISO/IEC JTC/SC29/WG11 titulado "Improvement of coding efficiency in MPEG-4 audio scalable lossless coding", Eunmi Oh Et al, presentado en MPEG 2003 en diciembre de 2003, Hawái, EE. UU., páginas 1 a 11 se sugiere un procedimiento para mejorar la eficacia de codificación. En este procedimiento, se utilizan los contextos para mejorar la eficacia de codificación.
El documento WO03/077565 enseña un modelador de bits de coeficiente previsto para su uso en JPEG 2000. Los planos de bit están codificados en orden desde el bit más significativo hasta el bit menos significativo utilizando tres ciclos. Los bits están marcados como significativo o no significativo y se cambia este estado a significativo durante los primeros dos ciclos cuando se encuentra el bit más significativo para ese coeficiente.
En Yu et al, "A fine granular scalable perceptually lossy and lossless audio codec", presentado en la congreso internacional IEEE de 2003 sobre multimedia y exposiciones, julio de 2003, Baltimore, Maryland, EE. UU., y consignado en las actas correspondientes del congreso en el volumen 1 páginas 1-65 a 1-68, publicado por el IEEE, ISBN 0-7893-7965-9 se presentan códecs de audio. Los códecs utilizan una codificación Golomb en planos de bit.
La presente invención proporciona un procedimiento y un aparato de codificación/decodificación de audio sin pérdida que son capaces de proporcionar una mejor relación de compresión sin tener en cuenta la suposición de que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.
Conforme a un aspecto de la presente invención, se proporciona un procedimiento de codificación de audio sin pérdida conforme a la reivindicación 1.
En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y, al pasar las significaciones a binario, se concatena el valor del contexto de la muestra binaria.
En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen anterior a una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, se calcula el valor del contexto utilizando el número entero.
Conforme a aún otro aspecto de la presente invención, se proporciona un aparato de codificación de audio sin pérdida conforme a la reivindicación 7.
Conforme a un aspecto adicional de la presente invención, se proporciona un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13.
El cálculo del contexto puede incluir: calcular un primer contexto utilizando las significaciones de las muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada; y calcular un segundo contexto utilizando las significaciones de muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia antes de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada.
Conforme a un aspecto adicional de la presente invención, se proporciona un aparato de decodificación de audio sin pérdida conforme a la reivindicación 15.
La unidad de decodificación sin pérdida puede incluir: una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad de selección de muestras que selecciona una muestra binaria que se va a decodificar en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia a una mayor frecuencia; una unidad de cálculo del contexto que calcula el contexto de la muestra binaria seleccionada al utilizar la significación de los planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno a la que pertenece la muestra binaria seleccionada; una unidad de selección de modelo de probabilidad que selecciona un modelo de probabilidad al utilizar el parámetro Golomb y el contexto; y una unidad de decodificación aritmética que lleva a cabo una decodificación aritmética al utilizar el modelo seleccionado de probabilidad.
La unidad de cálculo del contexto puede incluir: una primera unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar las significaciones a binario, calculando un primer contexto; y una segunda unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica...
Reivindicaciones:
1. Un procedimiento de codificación de audio sin pérdida que comprende:
2. El procedimiento de la reivindicación 1, en el que en la etapa de calcular (630) el contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar la significación a binario, se calcula el valor del contexto de la muestra binaria.
3. El procedimiento de cualquier reivindicación precedente, en el que en el cálculo (630) del contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes antes de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación de cuántas muestras binarias entre la pluralidad de muestras binarias tienen una significación de "1" se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y, luego, se calcula el valor del contexto de la muestra binaria utilizando el número entero.
4. El procedimiento de cualquier reivindicación precedente, en el que el cálculo del contexto de la muestra binaria seleccionada comprende
calcular un primer contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una primera pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser codificada; y
calcular un segundo contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una segunda pluralidad de líneas de frecuencia anteriores a una línea de frecuencia a la que pertenece una muestra binaria que va a ser codificada.
5. El procedimiento de cualquier reivindicación precedente, en el que algunas muestras binarias en el plano de bits están codificadas con una probabilidad de 0,5.
6. Un procedimiento de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 1 a 5 que comprende:
7. Un aparato de codificación de audio sin pérdida que comprende:
8. El aparato de la reivindicación 7, que comprende, además, una unidad (300) de transformación de número entero/frecuencia que transforma una señal de audio en el dominio temporal en la señal espectral de audio en el dominio frecuencial que tiene valores de número entero.
9. El aparato de la reivindicación 8, en el que la unidad (300) transformación entera tiempo/frecuencia es una unidad transformada discreta del coseno modificada (MDCT) en enteros.
10. El aparato de la reivindicación 7, en el que la unidad de cálculo del contexto comprende:
11. El aparato de la reivindicación 7, en el que el aparato está dispuesto para codificar algunas muestras binarias en el plano de bits con la probabilidad de 0,5.
12. Un aparato de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 7 a 9, que comprende además:
13. Un procedimiento de decodificación de audio sin pérdida que comprende:
14. Un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13, en el que la diferencia de datos de audio codificado con pérdida y una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero es denominada datos de error, comprendiendo el procedimiento:
15. Un aparato de decodificación de audio sin pérdida que comprende:
16. El aparato de la reivindicación 15, en el que la unidad de cálculo del contexto comprende:
17. El aparato de la reivindicación 15 o 16, en el que se decodifican algunas muestras binarias en el plano de bits con una probabilidad de 0,5.
18. Un aparato de decodificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 15 a 17, en el que la diferencia de los datos de audio codificado con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero se denomina datos de error, comprendiendo el aparato:
19. El aparato de la reivindicación 18, en el que la unidad de decodificación con pérdida es una unidad de decodificación AAC.
20. El aparato de la reivindicación 18 o 19, que comprende además:
21. El aparato de la reivindicación 18, 19 o 20, que comprende además:
22. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 1 o 6.
23. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 13 o 14.
Patentes similares o relacionadas:
CODEC AUDIO SIN PÉRDIDA ESCALABLE Y HERRAMIENTA DE AUTORÍA, del 19 de Agosto de 2011, de DTS, INC: Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable; […]
CÓDEC DE AUDIO MULTI-CANAL SIN PÉRDIDAS, del 1 de Agosto de 2011, de DTS, INC: Un método para codificar sin pérdidas datos de audio de PCM, que comprende: poner en bloques la señal de audio multicanal en tramas de igual tiempo de duración; procesar […]
CODIFICACION DE AUDIO, del 19 de Enero de 2010, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con un medio para […]
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]