Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.

Un procedimiento de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo, estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho procedimiento de codificación:

la obtención de un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

la valoración

(S204) de que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia a la que se hace referencia por el bloque co-situado son idénticas, perteneciendo la imagen con codificación de campo y la imagen de campo de referencia a la misma trama como un campo superior y un campo inferior, y la valoración de que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

la generación de dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala puede realizarse, y la generación de los dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala no puede realizarse; y

la realización (S503, S505) de compensación de movimiento del bloque actual usando los dos vectores de movimiento generados en dicha generación,

en el que, en dicha generación, dicha conversión de escala se realiza basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09180894.

Solicitante: Panasonic Intellectual Property Corporation of America.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 20000 Mariner Avenue, Suite 200 Torrance, CA 90503 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KADONO, SHINYA, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > G06T9/00 (Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N))
  • H04N7/26
  • H04N7/50
  • H04N7/46
  • H04N7/34
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/16 (para un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/176 (siendo la región de un bloque, p. ej. un macrobloque)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/577 (Compensación del movimiento con interpolación de fotogramas bidireccionales, es decir, utilizando imágenes B)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/103 (Selección de modo de codificación o, de modo de predicción)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/109 (codificación predictiva entre una pluralidad de modos temporales)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/513 (Procesamiento de los vectores de movimiento)

PDF original: ES-2496979_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 2 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 3 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 4 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ver la galería de la patente con 12 ilustraciones.
Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.

Fragmento de la descripción:

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento 5

Campo técnico

La presente invención se refiere a un procedimiento de codificación de imágenes en movimiento, un procedimiento de decodificación de imágenes en movimiento, un aparato de codificación de imágenes en movimiento, un aparato de decodificación de imágenes en movimiento para codificación/decodificación de imágenes en movimiento, que usan una estructura de trama o una estructura de campo, y un programa para ejecutar estos procedimientos en software.

Antecedentes de la técnica

T. Wiegand: 'Text of Final Committee Draft of Joint Video Specification (ITU-T Rec. H.264 / ISO/IEC 14496-10 AVC) *, ISO/IEC JTC1/SC29/WG11, Doc. nº MPEG02/N4920, Klagenfurt, AT, julio de 2002, desvela el denominado modo de codificación directo que puede seleccionarse en la codificación de imágenes B.

En codificación de imágenes en movimiento, la compresión de volumen de información se realiza normalmente eliminando la redundancia en las direcciones espacial y temporal que tiene la imagen en movimiento. En este caso, se emplea codificación de predicción entre imágenes como un procedimiento de eliminación de la redundancia en la dirección temporal. La codificación de predicción entre imágenes usa la imagen anterior o posterior a una imagen actual que se va a codificar en orden de visualización como una imagen de referencia cuando se codifica una imagen. A continuación, se estima un movimiento usando las imágenes de referencia, y el volumen de información se comprime eliminando la redundancia en la dirección espacial para un valor diferencial entre una imagen para la que se realiza compensación de movimiento y la imagen actual.

En el procedimiento de codificación de imágenes en movimiento denominado H. 264 que es subyacente al proceso de estandarización, una imagen para la cual se realiza codificación de predicción intraimagen usando sólo una imagen actual que se va a codificar sin imágenes de referencia se denomina imagen I. En este contexto imagen significa una unidad de codificación que incluye una trama y un campo. Una imagen para la cual la codificación de predicción entre imágenes se realiza con referencia a una única imagen que ya ha sido codificada se denomina imagen P mientras que una imagen para la cual la codificación de predicción entre imágenes se realiza con referencia simultáneamente a dos imágenes que ya están codificadas se denomina imagen B.

La fig. 1 es un diagrama de patrones que muestra una relación de predicción de cada imagen en el procedimiento de codificación de imágenes en movimiento mencionado anteriormente. La línea vertical en la fig. 1 representa una única imagen, y su tipo de imagen (I, P y B) se indica abajo a la derecha de cada una de las imágenes. Las flechas en el diagrama indican que la codificación de predicción entre imágenes se realiza del modo siguiente: la imagen situada en el extremo de inicio de la flecha está relacionada con la imagen situada en el extremo de fin de la flecha como imagen de referencia. Por ejemplo, la imagen B situada en segundo lugar desde el encabezamiento se codifica usando la imagen I situada en el encabezamiento y la imagen P situada en cuarto lugar desde el encabezamiento como imágenes de referencia.

En virtud del procedimiento H. 264, puede seleccionarse un modo de codificación denominado modo directo en la codificación de imágenes B. El modo directo proporciona dos tipos de procedimientos: un procedimiento temporal y un procedimiento espacial. En el modo directo temporal, el bloque actual en sí no tiene vectores de movimiento y los vectores de movimiento usados para el bloque actual son estimados y generados mediante la realización de un 50 procesamiento de conversión de escala basándose en una relación de posición según el tiempo de visualización entre las imágenes, considerando el vector de movimiento de otra imagen que ya está codificada como un vector de movimiento de referencia. (Véase como referencia, por ejemplo, la solicitud de patente japonesa abierta a consulta por el público nº H11-75191) .

La fig. 2 es un diagrama de patrones que muestra un procedimiento de estimación y generación de vectores de movimiento en el modo directo temporal. P representa imagen P mientras que B representa imagen B y los números dispuestos en los tipos de imagen indican un orden de visualización de cada una de las imágenes. Cada una de las imágenes P1, B2, B3 y P4 tiene respectivamente su información de orden de visualización T1, T2, T3 y T4. Aquí, se ilustra un caso de codificación de un bloque BL0 en la imagen B3 mostrado en la fig. 2 en el modo directo temporal.

En este caso, se usa un vector de movimiento MV1 en un bloque BL1, situado en la misma posición que el bloque BL0 en la imagen P4 que ya ha sido codificada y está situada cerca de la imagen B3 en orden de visualización. El vector de movimiento MV1 se usa para codificación del bloque BL1 y está relacionado con la imagen P1. En este caso, los vectores de movimiento usados para codificación del bloque BL0 son los siguientes: un vector de movimiento MV_F con respecto a la imagen P1 y un vector de movimiento MV_B con respecto a la imagen P4. Suponiendo que el valor del vector de movimiento MV1 es MV, el valor del MV_F es MVf y el valor del vector de movimiento MV_B es MVb, MVf y MVb pueden obtenerse usando las ecuaciones 1a y 1b respectivas mostradas a continuación.

MVf = (T3-T1 / T4-T1) × MV (Ecuación 1a)

MVb = (T3-T4 / T4-T1) × MV (Ecuación 1b)

La compensación de movimiento se realiza así para el bloque BL0 basándose en las imágenes de referencia P1 y P4, usando los vectores de movimiento MV_F y el MV_B obtenidos realizando procesamiento de conversión de escala para el vector de movimiento MV1.

Por otra parte, en el modo directo espacial, el bloque actual en sí no tiene vectores de movimiento, como sucede en modo directo temporal, y los vectores de movimiento de los bloques codificados vecinos espacialmente al bloque actual se usan como referencia en la codificación.

La fig. 3 es un diagrama de patrones que muestra un procedimiento de estimación y generación de los vectores de movimiento en el modo directo espacial. P representa imagen P mientras que B representa imagen B, y los números dispuestos en los tipos de imagen indican el orden de visualización de cada una de las imágenes. Aquí, se ilustra un caso de codificación del bloque BL0 en la imagen B3 mostrada en la fig. 3 en el modo directo espacial.

En este caso, los vectores de movimiento que tienen relación con las imágenes codificadas que están situadas en las posiciones más cercanas al bloque actual en orden de visualización, entre los vectores de movimiento 30 respectivos MVA1, MVB1 y MVC1 de los bloques codificados respectivamente que incluyen uno de los tres píxeles A, B y C que están situados cerca del bloque actual BL0, se determinan como candidatos para un vector de movimiento del bloque actual. Cuando se determinan tres vectores de movimiento como candidatos, se obtiene un valor medio de los tres valores como un vector de movimiento para el bloque actual. Cuando se determinan dos vectores de movimiento como candidatos, se obtiene un valor promedio de los dos valores como un vector de 35 movimiento para el bloque actual. Cuando sólo se determina un vector de movimiento como candidato, el vector de movimiento determinado se obtiene como un vector de movimiento para el bloque actual. En el ejemplo mostrado en la fig. 3, los vectores de movimiento MVA1 y MVC1 se obtienen con referencia a la imagen P2 mientras que el vector de movimiento MVB1 se obtiene con referencia a la imagen P1. Por lo tanto,... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo, estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho procedimiento de codificación:

la obtención de un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

la valoración (S204) de que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia a la que se hace referencia por el bloque co-situado son idénticas, perteneciendo la imagen con codificación de campo y la imagen de campo de referencia a la misma trama como un campo superior y un campo inferior, y la valoración de que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

la generación de dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala puede realizarse, y la generación de los dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala no puede realizarse; y la realización (S503, S505) de compensación de movimiento del bloque actual usando los dos vectores de movimiento generados en dicha generación, en el que, en dicha generación, dicha conversión de escala se realiza basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.

2. Un aparato de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo, estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho aparato de codificación:

una unidad (106) accionable para obtener un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

una unidad de valoración de conversión de escala (109) accionable para valorar que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización 45 de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia y la imagen de campo de referencia que pertenecen a la misma trama como un campo superior y un campo inferior, y accionable para valorar que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de 50 la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

una unidad de generación de vectores de movimiento (107) accionable para generar dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, por parte de dicha unidad de valoración de conversión de escala, que dicha conversión de escala puede realizarse, y accionable para generar los 55 dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, por parte de dicha unidad de valoración, que dicha conversión de escala no puede realizarse; y 26

una unidad de compensación de movimiento (107) accionable para realizar compensación de movimiento del bloque actual usando los dos vectores de movimiento generados por dicha unidad de generación de vectores de movimiento, en el que dicha unidad de generación de vectores de movimiento (107) está adaptada para realizar dicha conversión de escala basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.