Normalización de transformada entera y cuantificación conjuntas usando una representación mantisa-exponente de un parámetro de cuantificación.

Método de descodificación de video para la reconstrucción de una muestra X' a partir de un valor cuantificado L que comprende:

una etapa (190) para introducir dicho valor cuantificado L;

una etapa de llevar a cabo la transformación entera inversa de dicho valor L para derivar un valor Y', donde todas las funciones base de la transformada entera inversa tienen una norma igual, y

una etapa de llevar a cabo una descuantificación y una normalización combinadas del valor Y' transformado del valor cuantificado L, para derivar un valor X' normalizado y descuantificado que representa la muestra reconstruida, donde la etapa combinada de cuantificación y normalización incluye:

introducir un parámetro de cuantificación QP (196); y

derivar dicho valor X' normalizado y descuantificado que representa la muestra reconstruida;

caracterizado porque

dicho valor X' normalizado y descuantificado que representa la muestra reconstruida se deriva, usando una parte de mantisa Bm(QP) que es una función de dicho parámetro de cuantificación QP y una parte exponencial Be(QP) que es una función de dicho parámetro de cuantificación QP y que representa un desplazamiento de normalización, como

donde N es un entero, la multiplicación por 2-N representa un desplazamiento de normalización final y dicha parte de mantisa Bm(QP) y dicha parte exponencial Be(QP) satisfacen las relaciones de recurrencia

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E05008245.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22 NAGAIKE-CHO ABENO-KU 545-8522 (OSAKA) JAPON.

Inventor/es: KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: 14 de Marzo de 2012.

Clasificación Internacional de Patentes:

G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
H03M7/24 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de códigos de coma flotante.
H03M7/30 H03M 7/00 […] › Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia.
H04N1/41 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).
H04N7/24 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00 tiene prioridad).
H04N7/26
H04N7/30
H04N7/50

PDF original: ES-2380936_T3.pdf

Fragmento de la descripción:

Normalización de transformada entera y cuantificación conjuntas usando una representación mantisa - exponente de un parámetro de cuantificación Solicitudes relacionadas Esta solicitud reivindica el beneficio de una solicitud provisional estadounidense titulada REDUCED BIT-DEPTH QUANTIZATION, inventada por Louis Kerofsky, nº de serie 06/311.436, presentada el 9 de agosto de 2001, nº de expediente SLA1110P y una solicitud provisional estadounidense titulada METHODS AND SYSTEMS FOR VIDEO CODING WITH JOINT QUANTIZATION AND NORMALIZATION PROCEDURES, inventada por Louis Kerofsky, nº de serie 06/319, 018, presentada el 30 de noviembre de 2001, nº de expediente SLA1110P y una solicitud de patente estadounidense titulada METHOD FOR REDUCED BIT-DEPTH QUANTIZATION, inventada por Louis Kerofsky, nº de serie 10/139.036, presentada el 2 de mayo de 2002, nº de expediente SLA1110.

Antecedentes de la invención

1. Campo de la invención

Esta invención se refiere en general a técnicas de compresión de video, y más en concreto a un método para reducir el tamaño de bits requerido en el cálculo de transformaciones de codificación de video.

2. Descripción de la técnica relacionada

Un formato de información de vídeo proporciona información visual adecuada para activar una pantalla de televisión o para el almacenamiento en una cinta de vídeo. En general, los datos de video se organizan en un orden jerárquico. Una secuencia de video se divide en grupos de cuadros, y cada grupo puede componerse de una serie de cuadros individuales. Cada cuadro es aproximadamente equivalente a una imagen fija, con las imágenes fijas actualizándose con la frecuencia suficiente como para simular la presentación de un movimiento continuo. Un cuadro se divide además en sectores, o secciones horizontales, lo que ayuda al diseño de la resistencia del sistema a errores. Cada sector se codifica de forma independiente de modo que los errores no se propagan a través de los sectores. Un sector consta de macrobloques. En los estándares H.26P y del Grupo de Expertos de Imágenes en Movimiento (MPEG) -X, un macrobloque se compone de 16 x 16 pixeles luma y de un conjunto correspondiente de pixeles chroma, en función del formato de video. Un macrobloque tiene siempre un número entero de bloques, siendo la unidad menor de codificación la matriz de 8 x 8 píxeles.

La compresión de video es un componente crítico para cualquier aplicación que requiera la transmisión o almacenamiento de datos de video. Las técnicas de compresión compensan el movimiento mediante reutilizar información almacenada en diferentes áreas del cuadro (redundancia temporal) . La compresión también se produce mediante transformar datos en el dominio espacial, al dominio de frecuencias. La compresión de video digital híbrida, que explota la redundancia temporal mediante compensación del movimiento y la redundancia espacial mediante transformación, tal como la transformada de coseno discreta (DCT, Discrete Cosine Transform) , ha sido adaptada como base en los estándares internacionales H.26P y MPEG-X.

Como se indica en la patente de EE.UU. 6 317 767 (de Wang) , la DCT y la transformada de coseno discreta inversa (IDCT, inverse discrete cosine transform) se utilizan ampliamente en el procesamiento de señales de datos de imagen. Por ejemplo, ambas se utilizan en los estándares internacionales para la compresión de video de imagen en movimiento, desarrollado por el MPEG. La DCT tiene ciertas propiedades que producen modelos de codificación simplificados y eficientes. Cuando se aplica a una matriz de datos de píxeles, la DCT es un método de descomposición de un bloque de datos en una suma ponderada de frecuencias espaciales, o coeficientes DCT. A la inversa, la IDCT se utiliza para transformar de vuelta una matriz de coeficientes DCT en los datos de píxeles.

Los codificadores-descodificadores de video digital (DV) son un ejemplo de un dispositivo que utiliza un método de compresión de datos basado en DCT. En la etapa de formación de bloques, el cuadro de imagen se divide en N por N bloques de información de píxeles que incluyen, por ejemplo, datos de brillo y color para cada píxel. Un tamaño de bloque común es ocho píxeles horizontales por ocho píxeles verticales. A continuación los bloques de píxeles se "mezclan" de modo que varios bloques de diferentes partes de la imagen se agrupan entre sí. El mezclado mejora la uniformidad en la calidad de la imagen.

Se graban diferentes campos en diferentes episodios de tiempo. Para cada bloque de datos de píxel, un detector de movimiento busca diferencias entre dos campos de un cuadro. La información del movimiento se envía a la siguiente etapa del proceso. En la siguiente etapa, la información de píxeles se transforma utilizando una DCT. Por ejemplo, una DCT 8-8 toma ocho entradas y devuelve ocho salidas en las direcciones vertical y horizontal. A continuación se ponderan coeficientes DCT resultantes, mediante multiplicar cada bloque de coeficientes DCT por constantes de ponderación.

Los coeficientes DCT ponderados se cuantifican en la siguiente etapa. La cuantificación redondea cada coeficiente de DCT dentro de cierto rango de valores, para que sean el mismo número. La cuantificación tiende a fijar a cero los componentes de mayor frecuencia de la matriz de frecuencias, lo que tiene como resultado una cantidad mucho menor de datos a almacenar. No obstante, puesto que el ojo humano es más sensible a bajas frecuencias, en esta etapa se pierde muy poca calidad de imagen perceptible.

La etapa de cuantificación incluye convertir la matriz bidimensional de coeficientes cuantificados en un flujo de datos lineal, unidimensional, mediante leer los valores de la matriz en un esquema en zigzag y dividir en segmentos el flujo lineal unidimensional de coeficientes cuantificados, donde cada segmento consiste en una cadena de coeficientes cero seguidos por un coeficiente cuantificado distinto de cero. A continuación se lleva a cabo codificación de longitud variable (VLC, variable length coding) mediante transformar cada segmento, que consiste en dicho número de coeficientes cero y la amplitud del coeficiente distinto de cero en el segmento, en una clave de longitud variable. Finalmente, un proceso de creación de cuadros empaqueta cada 30 bloques de coeficientes cuantificados codificados de longitud variable, en cinco bloques de sincronización de longitud fija.

La descodificación es esencialmente la inversa del proceso de codificación descrito arriba. En primer lugar se deshace la división del flujo digital en cuadros. A continuación la descodificación de longitud variable (VLD) desempaqueta los datos de modo que estos pueden restaurarse a los coeficientes individuales. Tras la cuantificación inversa de los coeficientes se aplica la ponderación inversa y la transformación coseno discreta inversa (IDCT) al resultado. Las ponderaciones inversas son los multiplicativos inversos de las ponderaciones que se aplica en el proceso de codificación. La salida de la función de ponderación inversa se procesa después mediante la IDCT.

Se ha llevado a cabo mucho trabajo estudiando medios para reducir la complejidad en el cálculo de la DCT y la IDCT. Los algoritmos que calculan IDCTs bidimensionales son denominados algoritmos del "tipo I". Los algoritmos del tipo I son fáciles de implementar en una máquina en paralelo, es decir en un ordenador compuesto de una pluralidad de procesadores que funcionan simultáneamente en paralelo. Por ejemplo, cuando se utiliza N procesadores en paralelo para realizar una multiplicación matricial de N por N matrices, puede realizarse simultáneamente multiplicaciones de N columnas. Adicionalmente, puede diseñarse una máquina en paralelo de forma que contenga equipamiento físico o instrucciones de software especiales para llevar a cabo transposición rápida de matrices.

Una desventaja de los algoritmos del tipo I es que se requiere más multiplicaciones. La secuencia de cálculo de los algoritmos del tipo I implica dos multiplicaciones de matrices separadas por una transposición de matriz que, si por ejemplo N = 4, requiere 64 sumas y 48 multiplicaciones para un número total de 112 instrucciones. Es bien sabido por los técnicos en la materia que la realización de multiplicaciones consume mucho tiempo en los procesadores, y que a menudo el rendimiento del sistema se optimiza mediante reducir el número de multiplicaciones realizadas.

También puede obtenerse una IDCT bidimensional mediante convertir la traspuesta de la matriz de entrada en un vector unidimensional, utilizando una función L. A continuación... [Seguir leyendo]

Reivindicaciones:

1. Método de descodificación de video para la reconstrucción de una muestra X' a partir de un valor cuantificado L que comprende:

una etapa (190) para introducir dicho valor cuantificado L;

una etapa de llevar a cabo la transformación entera inversa de dicho valor L para derivar un valor Y', donde todas las funciones base de la transformada entera inversa tienen una norma igual, y una etapa de llevar a cabo una descuantificación y una normalización combinadas del valor Y' transformado del valor cuantificado L, para derivar un valor X' normalizado y descuantificado que representa la muestra reconstruida, donde la etapa combinada de cuantificación y normalización incluye:

introducir un parámetro de cuantificación QP (196) ; y derivar dicho valor X' normalizado y descuantificado que representa la muestra reconstruida;

caracterizado porque dicho valor X' normalizado y descuantificado que representa la muestra reconstruida se deriva, usando una parte de mantisa Bm (QP) que es una función de dicho parámetro de cuantificación QP y una parte exponencial Be (QP) que 15 es una función de dicho parámetro de cuantificación QP y que representa un desplazamiento de normalización, como donde N es un entero, la multiplicación por 2-N representa un desplazamiento de normalización final y dicha parte de mantisa Bm (QP) y dicha parte exponencial Be (QP) satisfacen las relaciones de recurrencia y

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]