Procedimiento de decodificación de imágenes.

Procedimiento de decodificación de imágenes, que comprende las etapas siguientes:

recibir un tren de bits codificado que incluye información de tramas I y P;

determinar si una trama actual del tren de bits codificado es una trama I o una trama P de acuerdo con la información del tipo de trama incluida en el tren de bits codificado; y

ejecutar una compensación de movimiento mediante la sintetización de una imagen de predicción de la trama actual utilizando una información de vector de movimiento incluida en el tren de bits codificado y una imagen de referencia que es una imagen previamente decodificada,

incluyendo la compensación de movimiento una interpolación de valores de píxel, en la que los valores de intensidad en los puntos, en los que no existen realmente píxeles en la imagen de referencia se calculan mediante interpolación bilineal utilizando un procedimiento de redondeo;

caracterizado por que, cuando la trama actual es una trama P, comprende

determinar si se utiliza el redondeo positivo o el redondeo negativo como el procedimiento de redondeo para la interpolación de valores de píxel en la compensación de movimiento, basándose en la información de procedimiento de redondeo que consiste en un bit en el tren de bits codificado, que incluye información relativa a la trama actual;

en el que la etapa de determinación no se ejecuta cuando la trama actual es una trama I; y

en el que la interpolación bilineal que utiliza dicho redondeo positivo se calcula según las ecuaciones:

Ib ≥ [

(La+Lb+1)/2],

Ic ≥ [(La+Lc+1)/2], y

Id ≥ [(La+Lb+Lc+Ld+2)/4], y

la interpolación de valores de píxel que utiliza dicho redondeo negativo se calcula según las ecuaciones:

Ib ≥ [(La+Lb)/2],

Ic ≥ [(La+Lc)/2], y

Id ≥ [(La+Lb+Lc+Ld+1)/4],

en las que La, Lb, Lc y Ld son, respectivamente, los valores de intensidad de un primer píxel, un segundo píxel que es horizontalmente adyacente a dicho primer píxel, un tercer píxel que es verticalmente adyacente a dicho primer píxel, y un cuarto píxel que es verticalmente adyacente a dicho segundo píxel y horizontalmente adyacente a dicho tercer píxel, e Ib, Ic e Id son, respectivamente, los valores de intensidad interpolados del punto medio entre dicho primer y segundo píxel, el punto medio entre dicho primer y tercer píxel, y el punto medio entre dicho primer, segundo, tercer y cuarto píxel.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10012309.

Solicitante: HITACHI, LTD..

Nacionalidad solicitante: Japón.

Dirección: 6-6, Marunouchi 1-chome Chiyoda-ku Tokyo 100-8280 JAPON.

Inventor/es: NAKAYA, YUICHIRO.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/117 (Filtros, p. ej. para el pre-tratamiento o post-procesamiento (bancos de filtros de subbanda H04N 19/635))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/159 (Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/172 (siendo la región una imagen, un fotograma o un campo)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/86 (que implica la reducción de artefactos de codificación, p. ej. de blockiness)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/46 (Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70  tienen prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/114 (La adaptación de la estrucutra del grupo de imágenes [GOP], p. ej número de B-fotogramas entre dos marcos de anclaje (H04N 19/107  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/523 (con precisión de sub-pixel)

PDF original: ES-2545089_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Procedimiento de decodificación de imágenes.
Ilustración 2 de Procedimiento de decodificación de imágenes.
Ilustración 3 de Procedimiento de decodificación de imágenes.
Ilustración 4 de Procedimiento de decodificación de imágenes.
Ver la galería de la patente con 13 ilustraciones.
Procedimiento de decodificación de imágenes.

Fragmento de la descripción:

Procedimiento de decodificación de imágenes.

Antecedentes de la invención Campo de la invención La presente invención se refiere a un procedimiento de decodificación de secuencias de imágenes que lleva a cabo una predicción de intertrama utilizando valores cuantificados para intensidad de luminancia o crominancia.

Descripción de la técnica relacionada En la codificación de secuencias de imágenes de alta eficacia, la técnica de predicción de intertrama (compensación de movimiento) , mediante la similitud de las tramas adyacentes a lo largo del tiempo, resulta de gran eficacia para la compresión de datos. El procedimiento de compensación de movimiento utilizado con más frecuencia actualmente es el de la correspondencia de bloques con una precisión de medio píxel, que se utiliza en los estándares internacionales H.263, MPEG1 y MPEG2. En este procedimiento, la imagen que se va a codificar se segmenta en bloques y los componentes horizontal y vertical de los vectores de movimiento de estos bloques se estiman como integrales múltiples de la mitad de la distancia entre píxeles adyacentes. Este procedimiento se describe mediante la siguiente ecuación:

[Ecuación 1]

** (Ver fórmula) **

en la que P (x, y) y R (x, y) denotan los valores de muestra (intensidad de luminancia o crominancia) de los píxeles situados en las coordenadas (x, y) de la imagen prevista P de la trama actual y la imagen de referencia (imagen decodificada de una trama que se ha codificado antes que la trama actual) R, respectivamente. X e y son enteros y se presupone que todos los píxeles están situados en puntos donde los valores de coordenadas son enteros. Además, se presupone que los valores de muestra de los píxeles se cuantifican como enteros no negativos. N, Bi y (ui, vi) denotan el número de bloques de la imagen, el grupo de píxeles incluidos en el i-ésimo bloque de la imagen y los vectores de movimiento del i-ésimo bloque, respectivamente.

Cuando los valores de ui y vi no son enteros, es necesario hallar el valor de intensidad en el punto concreto en el que no existen píxeles en la imagen de referencia. Actualmente, la interpolación bilineal mediante los cuatro píxeles adyacentes es el procedimiento utilizado con más frecuencia para este proceso. Este procedimiento de interpolación se describe mediante la siguiente ecuación:

[Ecuación 2]

** (Ver fórmula) **

en la que d es un entero positivo y p y q son inferiores a d pero no inferiores a 0. «//» denota una división entera que redondea el resultado de la división normal (división con números reales) al entero más cercano.

En la Fig. 1, se muestra un ejemplo de la estructura de un codificador de vídeo H.263. Como algoritmo de codificación, el H.263 adopta un procedimiento de codificación híbrido (procedimiento de codificación adaptativo de intertrama/intratrama) que es una combinación de la correspondencia de bloques y la DCT (transformada discreta de coseno) . Un restador 102 calcula la diferencia entre la imagen de entrada (imagen base de trama actual) 101 y la imagen de salida 113 (descrita más adelante) del selector de codificación de intertrama/intratrama 119 y, a continuación, proporciona una imagen de error 103. Esta imagen de error se cuantifica en un cuantificador 105 tras haber sido convertida en coeficientes DCT en un convertidor DCT 104, generándose coeficientes DCT cuantificados 106. Estos coeficientes DCT cuantificados se transmiten a través del canal de comunicación y, al mismo tiempo, se utilizan para sintetizar la imagen prevista de intertrama en el codificador. El procedimiento para sintetizar la imagen prevista se explicará a continuación. Los coeficientes DCT cuantificados 106 mencionados forman la imagen de error reconstruida 110 (igual que la imagen de error reconstruida de la sección de recepción) tras pasar por un decuantificador 108 y un convertidor DCT inverso 109. Esta imagen de error reconstruida y la imagen de salida 113 del selector de codificación de intertrama/intratrama 119 se suman en el sumador 111 y se obtiene la imagen decodificada 112 de la trama actual (la misma imagen que la imagen decodificada de la trama actual reconstruida en la sección del receptor) . Esta imagen se almacena en una memoria de trama 114 y se retarda un tiempo igual al intervalo de la trama. En consecuencia, en el momento actual, la memoria de trama 114 genera la imagen decodificada 115 de la trama anterior. Esta imagen decodificada de la trama anterior y la imagen original 101 de la

trama actual se introducen en la sección de correspondencia de bloques 116, donde se lleva a cabo la correspondencia de bloques entre estas imágenes. En el procedimiento de correspondencia de bloques, la imagen original de la trama actual se segmenta en diversos bloques, y la imagen prevista 117 de la trama actual se sintetiza extrayendo la sección que más se parece a estos bloques de la imagen decodificada de la trama anterior. En este procedimiento, es necesario estimar el movimiento entre la trama anterior y la trama actual para cada bloque. El vector de movimiento de cada bloque estimado en el procedimiento de estimación del movimiento se transmite a la sección del receptor como datos de vector de movimiento 120. En la sección del receptor, se sintetiza la misma imagen de predicción que en la sección del transmisor mediante la información del vector de movimiento y la imagen de decodificación de la trama anterior. La imagen de predicción 117 se introduce junto con una señal «0» 118 en el selector de codificación de intertrama/intratrama 119. Este conmutador 119 selecciona codificación de intertrama o codificación de intratrama seleccionando una de las dos entradas. Se efectúa codificación de intertrama cuando se selecciona la imagen de predicción 117 (es el caso mostrado en la Fig. 2) . En cambio, se efectúa codificación de intratrama cuando se selecciona la señal «0», puesto que la propia imagen de entrada se convierte en coeficientes DCT que se proporcionan al canal de comunicación. Para la correcta reconstrucción de la imagen codificada en la sección del receptor, es necesario indicar al receptor si se ha efectuado codificación de intratrama o codificación de intertrama en la sección del transmisor. En consecuencia, se proporciona un indicador de identificación 121 al circuito de comunicación. Por último, se obtiene un tren de bits con codificación H.263 multiplexando los coeficientes DCT cuantificados, los vectores de movimiento y la información del indicador de identificación de intertrama/intratrama en un multiplexor 122.

En la Fig. 2, se muestra la estructura de un decodificador 200 para recibir el tren de bits codificado desde el codificador de la Fig. 1. El tren de bits con codificación H.263 217 recibido se demultiplexa en coeficientes DCT cuantificados 201, datos de vector de movimiento 202 y un indicador de identificación de intertrama/intratrama 203 en el demultiplexor 216. Los coeficientes DCT cuantificados 201 se convierten en una imagen de error decodificada 206 tras ser procesados mediante un cuantificador inverso 204 y un convertidor DCT inverso 205. Esta imagen de error decodificada se suma a la imagen de salida 215 del selector de codificación de intertrama/intratrama 214 en el sumador 207 y la suma de estas imágenes se proporciona como imagen decodificada 208. La salida del selector de codificación de intertrama/intratrama se conmuta según el indicador de identificación de intertrama/intratrama 203. La imagen de predicción 212 utilizada en la codificación de intertrama se sintetiza en el sintetizador de imágenes de predicción 211. En este sintetizador, la posición de los bloques en la imagen decodificada 210 de la trama anterior almacenada en la memoria de trama 209 se desplaza según los datos del... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento de decodificación de imágenes, que comprende las etapas siguientes:

recibir un tren de bits codificado que incluye información de tramas I y P;

determinar si una trama actual del tren de bits codificado es una trama I o una trama P de acuerdo con la información del tipo de trama incluida en el tren de bits codificado; y ejecutar una compensación de movimiento mediante la sintetización de una imagen de predicción de la trama actual utilizando una información de vector de movimiento incluida en el tren de bits codificado y una imagen de referencia que es una imagen previamente decodificada, incluyendo la compensación de movimiento una interpolación de valores de píxel, en la que los valores de intensidad en los puntos, en los que no existen realmente píxeles en la imagen de referencia se calculan mediante interpolación bilineal utilizando un procedimiento de redondeo;

caracterizado por que, cuando la trama actual es una trama P, comprende determinar si se utiliza el redondeo positivo o el redondeo negativo como el procedimiento de redondeo para la interpolación de valores de píxel en la compensación de movimiento, basándose en la información de procedimiento de redondeo que consiste en un bit en el tren de bits codificado, que incluye información relativa a la trama actual;

en el que la etapa de determinación no se ejecuta cuando la trama actual es una trama I; y en el que la interpolación bilineal que utiliza dicho redondeo positivo se calcula según las ecuaciones:

Ib = [ (La+Lb+1) /2], Ic = [ (La+Lc+1) /2], y Id = [ (La+Lb+Lc+Ld+2) /4], y la interpolación de valores de píxel que utiliza dicho redondeo negativo se calcula según las ecuaciones:

Ib = [ (La+Lb) /2], Ic = [ (La+Lc) /2], y Id =