Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento.

Un procedimiento de codificación para codificar una imagen que va a codificarse, comprendiendo dicho procedimiento:

asignar, a una imagen de referencia a la que hará referencia la imagen que va a codificarse, un primer índice de referencia y un segundo índice de referencia

diferente del primer índice de referencia; generar un valor de píxel predictivo de la imagen que va a codificarse generando

(i) un valor de píxel predictivo de un primer bloque que va a codificarse usando un valor de píxel de un primer bloque de referencia y un primer conjunto de coeficientes de ponderación correspondiente al primer índice de referencia y (ii) un valor de píxel predictivo de un segundo bloque que va a codificarse usando un valor de píxel de un segundo bloque de referencia y un segundo conjunto de coeficientes de ponderación correspondiente al segundo índice de referencia, cuando el primer bloque que va a codificarse y el segundo bloque que va a codificarse están incluidos en la imagen que va codificarse, donde el primer bloque de referencia para el primer bloque que va a codificarse se identifica mediante el primer índice de referencia y donde el segundo bloque de referencia para el segundo bloque que va a codificarse se identifica mediante el segundo índice de referencia;

y codificar la imagen que va a codificarse usando el valor de píxel predictivo generado de la imagen que va a codificarse.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10178507.

Solicitante: Panasonic Intellectual Property Corporation of America.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 20000 Mariner Avenue, Suite 200 Torrance, CA 90503 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KADONO, SHINYA, HAGAI, MAKOTO, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > G06T9/00 (Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N))
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES... > Métodos o disposiciones para la lectura o el reconocimiento... > G06K9/36 (Pretratamiento de la imagen, es decir, tratamiento de la información imagen sin tener en cuenta la identidad de la imagen)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/577 (Compensación del movimiento con interpolación de fotogramas bidireccionales, es decir, utilizando imágenes B)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/58 (Compensación del movimiento con predicción a largo plazo, es decir, siendo el fotograma de referencia para el fotograma actual lejano a éste (H04N 19/23  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/573 (Compensación del movimiento con predicción de fotogrma (frame) múltiple utilizando dos o más sistemas de referencia en una dado una predicción de dirección)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/89 (implica métodos o sistemas para la detección de errores de transmisión en el decodificador)

PDF original: ES-2524117_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento Campo técnico La presente invención se refiere a un procedimiento de codificación de imágenes en movimiento y a un procedimiento de descodificación de imágenes en movimiento y, en particular, a un procedimiento de codificación y a un procedimiento de descodificación que utilizan una predicción inter-imagen con referencia a imágenes codificadas previamente.

Técnica anterior

Con el desarrollo de las aplicaciones multimedia, manejar de manera íntegra todo tipo de información multimedia tal

como vídeo, audio y texto se ha convertido en algo habitual. Para ese fin, la digitalización de toda esta información multimedia permite tratarla de manera íntegra. Sin embargo, puesto que las imágenes digitalizadas tienen una enorme cantidad de datos, las técnicas de compresión de información de imágenes son absolutamente necesarias para almacenar y transmitir tal información. También es importante normalizar tales técnicas de compresión para el interfuncionamiento de los datos de imágenes comprimidas. Existen normas internacionales para las técnicas de compresión de imágenes, tales como H.261 y H.263 normalizadas por la Unión Internacional de Telecomunicaciones

- Sector de Normalización de las Telecomunicaciones (ITU-T) y MPEG-1, MPEG-4 y otras normas normalizadas por la Organización Internacional de Normalización (ISO) . La ITU está trabajando actualmente en la normalización de H.26L como la norma más reciente para la codificación de imágenes.

En general, en la codificación de imágenes en movimiento, la cantidad de información se comprime reduciendo las redundancias tanto en direcciones temporales como espaciales. Por lo tanto, en la codificación de predicción interimagen, que tiene como objetivo reducir la redundancia temporal, el movimiento de una imagen actual se estima por cada bloque con referencia a imágenes anteriores o posteriores para crear una imagen predictiva, codificándose posteriormente valores diferenciales entre las imágenes predictivas obtenidas y la imagen actual.

En este caso, el término “imagen” representa una única capa de una imagen y representa un cuadro cuando se utiliza en el contexto de una imagen progresiva, mientras que representa un cuadro o un campo en el contexto de una imagen entrelazada. En este caso, la imagen entrelazada es un único cuadro que está formado por dos campos que tienen tiempos diferentes, respectivamente. En el proceso de codificación y de descodificación de la imagen entrelazada, un único cuadro puede tratarse como un cuadro, como dos campos, como una estructura de cuadros o una estructura de campos en cada bloque del cuadro.

La siguiente descripción se proporciona suponiendo que una imagen es un cuadro en una imagen progresiva, pero puede darse la misma descripción incluso suponiendo que una imagen es un cuadro o un campo en una imagen entrelazada.

La FIG. 30 es un diagrama que explica tipos de imágenes y las relaciones de referencia entre las mismas.

Una imagen tal como la imagen I1, que es una predicción intra-imagen codificada sin hacer referencia a ninguna 45 imagen, se denomina como una imagen I. Una imagen tal como la imagen P10, que es una predicción inter-imagen codificada con referencia a solamente una imagen, se denomina como una imagen P. Y una imagen, que puede ser una predicción inter-imagen codificada con referencia a dos imágenes al mismo tiempo, se denomina como una imagen B.

Las imágenes B, como las imágenes B6, B12 y B18, pueden hacer referencia a dos imágenes ubicadas en direcciones temporales arbitrarias. Las imágenes de referencia pueden estar designadas en cada bloque, con respecto a las cuales se estima el movimiento, y se discriminan entre una primera imagen de referencia descrita anteriormente en un flujo codificado obtenido codificando imágenes y una segunda imagen de referencia descrita posteriormente en el flujo codificado.

Sin embargo, para codificar y descodificar imágenes anteriores es necesario que las imágenes de referencia ya estén codificadas y descodificadas. Las FIG. 31A y 31B muestran ejemplos de orden de codificación y descodificación de imágenes B. La FIG. 31A muestra un orden de visualización de las imágenes, y la FIG. 31B muestra un orden de codificación y descodificación reordenado a partir del orden de visualización mostrado en la

FIG. 31A. Estos diagramas muestran que las imágenes se reordenan de manera que las imágenes a las que se hace referencia mediante las imágenes B3 y B6 ya están codificadas y descodificadas.

Un procedimiento para crear una imagen predictiva en caso de que la imagen B mencionada anteriormente esté 5 codificada con referencia a dos imágenes al mismo tiempo se explicará en detalle utilizando la FIG. 32. Debe observarse que una imagen predictiva se crea descodificándose exactamente de la misma manera.

La imagen B4 es una imagen B actual que va a codificarse, y los bloques BL01 y BL02 son bloques actuales que van a codificarse y que pertenecen a la imagen B actual. Haciendo referencia a un bloque BL11 que pertenece a la imagen P2 como una primera imagen de referencia y a un bloque BL21 que pertenece a la imagen P3 como una segunda imagen de referencia, se crea una imagen predictiva para el bloque BL01. Asimismo, haciendo referencia a un bloque BL12 que pertenece a la imagen P2 como una primera imagen de referencia y a un bloque BL22 que pertenece a la imagen P1 como una segunda imagen de referencia, se crea una imagen predictiva para el bloque BL02 (véase el documento 1, el cual no es una patente) .

La FIG. 33 es un diagrama que explica un procedimiento para crear una imagen predictiva para el bloque actual BL01 que va a codificarse utilizando los dos bloques BL11 y BL21 a los que se hace referencia. La siguiente explicación supondrá en este caso que el tamaño de cada bloque es de 4 por 4 píxeles. Suponiendo que Q1 (i) es un valor de píxel de BL11, que Q2 (i) es un valor de píxel de BL21 y que P (i) es un valor de píxel de la imagen predictiva para el bloque objetivo BL01, el valor de píxel P (i) puede calcularse mediante una ecuación de predicción lineal como la siguiente ecuación 1. “i” indica la posición de un píxel y, en este ejemplo, “i” tiene valores comprendidos entre 0 y 15.

(donde pow (2, d) indica la “d”-ésima potencia de 2)

“w1”, “w2”, “c” y “d” son los coeficientes para llevar a cabo una predicción lineal, y estos cuatro coeficientes se tratan como un conjunto de coeficientes de ponderación. Este conjunto de coeficientes de ponderación se determina mediante un índice de referencia que designa una imagen a la que cada bloque hace referencia. Por ejemplo, cuatro valores de w1_1, w2_1, c_1 y d_1 se utilizan para BL01, y w1_2, w2_2, c_2 y d_2 se utilizan para BL02, respectivamente.

A continuación, se explicarán los índices de referencia que designan imágenes de referencia con relación a la FIG.

34 y la FIG. 35. Un valor denominado como número de imagen, que aumenta en valores de uno cada vez que una imagen se almacena en una memoria, se asigna a cada imagen. Dicho de otro modo, un número de imagen con un valor resultante de sumar uno al valor máximo de números de imagen existentes, se asigna a una imagen recién almacenada. Sin embargo, una imagen de referencia no se designa realmente utilizando este número de imagen, sino utilizando un valor denominado como índice de referencia, el cual se define por separado. Los índices que indican primeras imágenes de referencia se denominan primeros índices de referencia, y los índices que indican segundas imágenes de referencia... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación para codificar una imagen que va a codificarse, comprendiendo dicho procedimiento:

asignar, a una imagen de referencia a la que hará referencia la imagen que va a codificarse, un primer índice de referencia y un segundo índice de referencia diferente del primer índice de referencia;

generar un valor de píxel predictivo de la imagen que va a codificarse generando (i) un valor de píxel predictivo de un primer bloque que va a codificarse usando un valor de píxel de un primer bloque de referencia y un primer conjunto de coeficientes de ponderación correspondiente al primer índice de referencia y (ii) un valor de píxel predictivo de un segundo bloque que va a codificarse usando un valor de píxel de un segundo bloque de referencia y un segundo conjunto de coeficientes de ponderación correspondiente al segundo índice de referencia, cuando el primer bloque que va a codificarse y el segundo bloque que va a codificarse están incluidos en la imagen que va codificarse, donde el primer bloque de referencia para el primer bloque que va a codificarse se identifica mediante el primer índice de referencia y donde el segundo bloque de referencia para el segundo bloque que va a codificarse se identifica mediante el segundo índice de referencia; y

codificar la imagen que va a codificarse usando el valor de píxel predictivo generado de la imagen que va a 20 codificarse.

2. Un aparato de codificación que codifica una imagen que va a codificarse, comprendiendo dicho aparato:

una unidad de asignación configurada para asignar, a una imagen de referencia a la que hará referencia la imagen que va a codificarse, un primer índice de referencia y un segundo índice de referencia diferente del primer índice de referencia;

una unidad de generación de imágenes predictivas configurada para generar un valor de píxel predictivo de la imagen que va a codificarse generando (i) un valor de píxel predictivo de un primer bloque que va a codificarse usando un valor de píxel de un primer bloque de referencia y un primer conjunto de coeficientes de ponderación correspondiente al primer índice de referencia y (ii) un valor de píxel predictivo de un segundo bloque que va a codificarse usando un valor de píxel de un segundo bloque de referencia y un segundo conjunto de coeficientes de ponderación correspondiente al segundo índice de referencia, cuando el primer bloque que va a codificarse y el

segundo bloque que va a codificarse están incluidos en la imagen que va codificarse, donde el primer bloque de referencia para el primer bloque que va a codificarse se identifica mediante el primer índice de referencia y donde el segundo bloque de referencia para el segundo bloque que va a codificarse se identifica mediante el segundo índice de referencia; y

una unidad de codificación configurada para codificar la imagen que va a codificarse usando el valor de píxel predictivo generado de la imagen que va a codificarse.