Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.

Un procedimiento de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo,

estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho procedimiento de codificación:

la obtención de un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

la valoración (S204) de que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia a la que se hace referencia por el bloque co-situado son idénticas, perteneciendo la imagen con codificación de campo y la imagen de campo de referencia a la misma trama como un campo superior y un campo inferior, y la valoración de que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

la generación de dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala puede realizarse, y la generación de los dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala no puede realizarse; y

la realización (S503, S505) de compensación de movimiento del bloque actual usando los dos vectores de movimiento generados en dicha generación,

en el que, en dicha generación, dicha conversión de escala se realiza basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09180894.

Solicitante: Panasonic Intellectual Property Corporation of America.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 20000 Mariner Avenue, Suite 200 Torrance, CA 90503 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KADONO, SHINYA, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06T9/00 FISICA.G06 CALCULO; CONTEO.G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL.Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
  • H04N19/103 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Selección de modo de codificación o, de modo de predicción.
  • H04N19/109 H04N 19/00 […] › codificación predictiva entre una pluralidad de modos temporales.
  • H04N19/16 H04N 19/00 […] › para un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva.
  • H04N19/176 H04N 19/00 […] › siendo la región de un bloque, p. ej. un macrobloque.
  • H04N19/513 H04N 19/00 […] › Procesamiento de los vectores de movimiento.
  • H04N19/577 H04N 19/00 […] › Compensación del movimiento con interpolación de fotogramas bidireccionales, es decir, utilizando imágenes B.
  • H04N19/61 H04N 19/00 […] › en combinación con codificación predictiva.
  • H04N7/26
  • H04N7/34
  • H04N7/46
  • H04N7/50

PDF original: ES-2496979_T3.pdf

 

Ilustración 1 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 2 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 3 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ilustración 4 de Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.
Ver la galería de la patente con 12 ilustraciones.
Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento.

Fragmento de la descripción:

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento 5

Campo técnico

La presente invención se refiere a un procedimiento de codificación de imágenes en movimiento, un procedimiento de decodificación de imágenes en movimiento, un aparato de codificación de imágenes en movimiento, un aparato de decodificación de imágenes en movimiento para codificación/decodificación de imágenes en movimiento, que usan una estructura de trama o una estructura de campo, y un programa para ejecutar estos procedimientos en software.

Antecedentes de la técnica

T. Wiegand: 'Text of Final Committee Draft of Joint Video Specification (ITU-T Rec. H.264 / ISO/IEC 14496-10 AVC) *, ISO/IEC JTC1/SC29/WG11, Doc. nº MPEG02/N4920, Klagenfurt, AT, julio de 2002, desvela el denominado modo de codificación directo que puede seleccionarse en la codificación de imágenes B.

En codificación de imágenes en movimiento, la compresión de volumen de información se realiza normalmente eliminando la redundancia en las direcciones espacial y temporal que tiene la imagen en movimiento. En este caso, se emplea codificación de predicción entre imágenes como un procedimiento de eliminación de la redundancia en la dirección temporal. La codificación de predicción entre imágenes usa la imagen anterior o posterior a una imagen actual que se va a codificar en orden de visualización como una imagen de referencia cuando se codifica una imagen. A continuación, se estima un movimiento usando las imágenes de referencia, y el volumen de información se comprime eliminando la redundancia en la dirección espacial para un valor diferencial entre una imagen para la que se realiza compensación de movimiento y la imagen actual.

En el procedimiento de codificación de imágenes en movimiento denominado H. 264 que es subyacente al proceso de estandarización, una imagen para la cual se realiza codificación de predicción intraimagen usando sólo una imagen actual que se va a codificar sin imágenes de referencia se denomina imagen I. En este contexto imagen significa una unidad de codificación que incluye una trama y un campo. Una imagen para la cual la codificación de predicción entre imágenes se realiza con referencia a una única imagen que ya ha sido codificada se denomina imagen P mientras que una imagen para la cual la codificación de predicción entre imágenes se realiza con referencia simultáneamente a dos imágenes que ya están codificadas se denomina imagen B.

La fig. 1 es un diagrama de patrones que muestra una relación de predicción de cada imagen en el procedimiento de codificación de imágenes en movimiento mencionado anteriormente. La línea vertical en la fig. 1 representa una única imagen, y su tipo de imagen (I, P y B) se indica abajo a la derecha de cada una de las imágenes. Las flechas en el diagrama indican que la codificación de predicción entre imágenes se realiza del modo siguiente: la imagen situada en el extremo de inicio de la flecha está relacionada con la imagen situada en el extremo de fin de la flecha como imagen de referencia. Por ejemplo, la imagen B situada en segundo lugar desde el encabezamiento se codifica usando la imagen I situada en el encabezamiento y la imagen P situada en cuarto lugar desde el encabezamiento como imágenes de referencia.

En virtud del procedimiento H. 264, puede seleccionarse un modo de codificación denominado modo directo en la codificación de imágenes B. El modo directo proporciona dos tipos de procedimientos: un procedimiento temporal y un procedimiento espacial. En el modo directo temporal, el bloque actual en sí no tiene vectores de movimiento y los vectores de movimiento usados para el bloque actual son estimados y generados mediante la realización de un 50 procesamiento de conversión de escala basándose en una relación de posición según el tiempo de visualización entre las imágenes, considerando el vector de movimiento de otra imagen que ya está codificada como un vector de movimiento de referencia. (Véase como referencia, por ejemplo, la solicitud de patente japonesa abierta a consulta por el público nº H11-75191) .

La fig. 2 es un diagrama de patrones que muestra un procedimiento de estimación y generación de vectores de movimiento en el modo directo temporal. P representa imagen P mientras que B representa imagen B y los números dispuestos en los tipos de imagen indican un orden de visualización de cada una de las imágenes. Cada una de las imágenes P1, B2, B3 y P4 tiene respectivamente su información de orden de visualización T1, T2, T3 y T4. Aquí, se ilustra un caso de codificación de un bloque BL0 en la imagen B3 mostrado en la fig. 2 en el modo directo temporal.

En este caso, se usa un vector de movimiento MV1 en un bloque BL1, situado en la misma posición que el bloque BL0 en la imagen P4 que ya ha sido codificada y está situada cerca de la imagen B3 en orden de visualización. El vector de movimiento MV1 se usa para codificación del bloque BL1 y está relacionado con la imagen P1. En este caso, los vectores de movimiento usados para codificación del bloque BL0 son los siguientes: un vector de movimiento MV_F con respecto a la imagen P1 y un vector de movimiento MV_B con respecto a la imagen P4. Suponiendo que el valor del vector de movimiento MV1 es MV, el valor del MV_F es MVf y el valor del vector de movimiento MV_B es MVb, MVf y MVb pueden obtenerse usando las ecuaciones 1a y 1b respectivas mostradas a continuación.

MVf = (T3-T1 / T4-T1) × MV (Ecuación 1a)

MVb = (T3-T4 / T4-T1) × MV (Ecuación 1b)

La compensación de movimiento se realiza así para el bloque BL0 basándose en las imágenes de referencia P1 y P4, usando los vectores de movimiento MV_F y el MV_B obtenidos realizando procesamiento de conversión de escala para el vector de movimiento MV1.

Por otra parte, en el modo directo espacial, el bloque actual en sí no tiene vectores de movimiento, como sucede en modo directo temporal, y los vectores de movimiento de los bloques codificados vecinos espacialmente al bloque actual se usan como referencia en la codificación.

La fig. 3 es un diagrama de patrones que muestra un procedimiento de estimación y generación de los vectores de movimiento en el modo directo espacial. P representa imagen P mientras que B representa imagen B, y los números dispuestos en los tipos de imagen indican el orden de visualización de cada una de las imágenes. Aquí, se ilustra un caso de codificación del bloque BL0 en la imagen B3 mostrada en la fig. 3 en el modo directo espacial.

En este caso, los vectores de movimiento que tienen relación con las imágenes codificadas que están situadas en las posiciones más cercanas al bloque actual en orden de visualización, entre los vectores de movimiento 30 respectivos MVA1, MVB1 y MVC1 de los bloques codificados respectivamente que incluyen uno de los tres píxeles A, B y C que están situados cerca del bloque actual BL0, se determinan como candidatos para un vector de movimiento del bloque actual. Cuando se determinan tres vectores de movimiento como candidatos, se obtiene un valor medio de los tres valores como un vector de movimiento para el bloque actual. Cuando se determinan dos vectores de movimiento como candidatos, se obtiene un valor promedio de los dos valores como un vector de 35 movimiento para el bloque actual. Cuando sólo se determina un vector de movimiento como candidato, el vector de movimiento determinado se obtiene como un vector de movimiento para el bloque actual. En el ejemplo mostrado en la fig. 3, los vectores de movimiento MVA1 y MVC1 se obtienen con referencia a la imagen P2 mientras que el vector de movimiento MVB1 se obtiene con referencia a la imagen P1. Por lo tanto, el valor promedio de los vectores de movimiento MVA1 y MVC1, en referencia a la imagen P2 que ya ha sido codificada y está situada en una posición más cercana a la imagen actual en orden de visualización, se obtiene como el primer vector de movimiento para el bloque actual, MV_F. Se aplica lo mismo cuando se obtiene el segundo vector de movimiento MV_B.

En el procedimiento de codificación del H. 264, en el caso de imagen progresiva, una imagen se codifica por trama como una trama y además, se permite que una imagen se codifique por campo como dos campos separados, un 45 campo superior y un campo inferior, como en el caso de imagen entrelazada.

Las fig. 4A y 4B son diagramas de patrones que muestran información de orden de visualización asignada para el campo de la imagen entrelazada y la imagen progresiva. Dos líneas verticales respectivamente que tienen el mismo número de trama representan que son campos. Para la imagen entrelazada, la información de... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo, estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho procedimiento de codificación:

la obtención de un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

la valoración (S204) de que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia a la que se hace referencia por el bloque co-situado son idénticas, perteneciendo la imagen con codificación de campo y la imagen de campo de referencia a la misma trama como un campo superior y un campo inferior, y la valoración de que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

la generación de dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala puede realizarse, y la generación de los dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, en dicha valoración, que dicha conversión de escala no puede realizarse; y la realización (S503, S505) de compensación de movimiento del bloque actual usando los dos vectores de movimiento generados en dicha generación, en el que, en dicha generación, dicha conversión de escala se realiza basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.

2. Un aparato de codificación en modo directo temporal para realizar codificación de campo de un bloque actual de una imagen usando un vector de movimiento de una imagen con codificación de campo, estando la imagen con codificación de campo situada cerca en orden de visualización de la imagen del campo actual en el que se incluye el bloque actual, comprendiendo dicho aparato de codificación:

una unidad (106) accionable para obtener un vector de movimiento de un bloque co-situado incluido en la imagen con codificación de campo, estando el bloque co-situado co-situado con el bloque actual incluido en la imagen de campo actual;

una unidad de valoración de conversión de escala (109) accionable para valorar que la conversión de escala del vector de movimiento del bloque co-situado no puede realizarse cuando (i) la información de orden de visualización 45 de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de una imagen de campo de referencia y la imagen de campo de referencia que pertenecen a la misma trama como un campo superior y un campo inferior, y accionable para valorar que la conversión de escala del vector de movimiento del bloque co-situado puede realizarse cuando (i) la información de orden de visualización de la imagen con codificación de campo que incluye el bloque co-situado y (ii) la información de orden de visualización de 50 la imagen de campo de referencia a la que se hace referencia por el bloque co-situado no son idénticas;

una unidad de generación de vectores de movimiento (107) accionable para generar dos vectores de movimiento del bloque actual a través de dicha conversión de escala en el caso en que se valore, por parte de dicha unidad de valoración de conversión de escala, que dicha conversión de escala puede realizarse, y accionable para generar los 55 dos vectores de movimiento del bloque actual fijando uno de los dos vectores de movimiento a un valor predeterminado y el otro vector de movimiento a otro valor predeterminado sin requerir la conversión de escala en el caso en que se valore, por parte de dicha unidad de valoración, que dicha conversión de escala no puede realizarse; y 26

una unidad de compensación de movimiento (107) accionable para realizar compensación de movimiento del bloque actual usando los dos vectores de movimiento generados por dicha unidad de generación de vectores de movimiento, en el que dicha unidad de generación de vectores de movimiento (107) está adaptada para realizar dicha conversión de escala basándose en una relación de posición temporal entre la imagen de campo actual y la imagen con codificación de campo y la imagen de campo de referencia según la información de orden de visualización.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .