Ponderación adaptativa de imágenes de referencia en codificación de vídeo.

Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder

(712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular;

caracterizado por

codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia,

en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2003/021728.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.

Inventor/es: BOYCE,JILL,MACDONALD.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > G06T9/00 (Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N))
  • H04N7/26
  • H04N7/50
  • H04N7/46
  • H04N7/32
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/36 (Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit)

PDF original: ES-2536456_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Ponderación adaptativa de imágenes de referencia en codificación de vídeo Referencia cruzada a solicitudes relacionadas Esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.843 (expediente del agente Nº PU020340) , titulada "Adaptative Weighting Of Reference Pictures In Video CODEC" y presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad. Además, esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.874 (expediente del agente Nº PU020339) , titulada "Motion Estimation With Weighting Prediction" también presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad.

Campo de la invención La presente invención está dirigida a codificadores de vídeo y, en particular, a ponderación adaptativa de imágenes de referencia en codificadores de vídeo.

Antecedentes de la invención Los datos de vídeo son generalmente procesados y transferidos en forma de flujos de bits. Los codificadores y decodificadores de compresión de video típicos ("CODEC") obtienen mucha de su eficiencia de compresión formando una predicción de imagen de referencia de una imagen a ser codificada y codificando la diferencia entre la imagen actual y la predicción. Cuanto más próximamente este correlacionada la predicción con la imagen actual, menores bits son necesarios para comprimir esa imagen, aumentando por ello la eficiencia del proceso. De este modo, es deseable que sea formada la mejor predicción de imagen de referencia posible.

En muchos estándares de compresión de vídeo, incluyendo el Grupo de Expertos de Imagen en Movimiento (Moving Picture Experts Group) ("MPEG") -1, MPEG-2 y MPEG-4, una versión compensada de movimiento de una imagen de referencia previa se usa como predicción para la imagen actual y solamente se codifica la diferencia entre la imagen actual y la predicción. Cuando se usa una única predicción de imagen (imagen "P") , la imagen de referencia no se escala cuando se forma la predicción compensada de movimiento. Cuando se usan predicciones de imagen bidireccionales (imágenes "B") , las predicciones intermedias se forman a partir de dos imágenes diferentes y entonces las dos predicciones intermedias se promedian juntas, usando factores de ponderación iguales de (1/2, 1/2) para cada una, para formar una única predicción promediada. En estos estándares MPEG, las dos imágenes de referencia son siempre cada una de ellas de la dirección hacia delante y la dirección hacia atrás de las imágenes B.

El documento del estándar JVT-B075 titulado "Improved multiple frame motion compensation using frame interpolation" describe un método de compensación de movimiento mejorado para múltiples cuadros de referencia.

El documento del estándar JVT-C066 titulado "Multi-frame interpolative prediction with modified syntax" describe una sintaxis modificada en base a la imagen B que soporta predicción de interpolación multicuadro.

Compendio de la invención La invención es un método de codificación de vídeo como se define en las reivindicaciones adjuntas.

Breve descripción de los dibujos La ponderación adaptativa de imágenes de referencia en codificadores y decodificadores de vídeo según los principios de la presente invención se muestran en las siguientes figuras ejemplares, en las que:

la Figura 1 muestra un diagrama de bloques para un decodificador de vídeo estándar;

la Figura 2 muestra un diagrama de bloques para un decodificador de vídeo con bi-predicción adaptativa;

la Figura 3 muestra un diagrama de bloques para un decodificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 4 muestra un diagrama de bloques de un codificador de vídeo estándar;

la Figura 5 muestra un diagrama de bloques para un codificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 6 muestra una de flujo para un proceso de decodificación según los principios de la presente invención; y la Figura 7 muestra un diagrama de flujo para un proceso de codificación según los principios de la presente invención

Descripción detallada de las realizaciones preferidas En algunas secuencias de vídeo, en particular en aquellas con desvanecimiento, la imagen actual o bloque de imágenes a ser codificada está más fuertemente correlacionada con una imagen de referencia escalada por un factor de ponderación que la imagen de referencia en sí misma. Los CODEC de vídeo sin factores de ponderación aplicados a las imágenes de referencia codifican secuencias de desvanecimiento de manera muy ineficiente. Cuando se usan factores de ponderación en codificación, un codificador de vídeo necesita determinar tanto los factores de ponderación como los vectores de movimiento, pero la mejor elección para cada uno de estos depende del otro, con la estimación de movimiento que es típicamente la parte más intensiva desde el punto de vista del cálculo de un codificador de compresión de vídeo digital.

En el estándar de compresión de vídeo Joint Video Team ("JVT") propuesto, cada imagen P puede usar múltiples imágenes de referencia para formar una predicción de imagen, pero cada bloque de movimiento individual o región 8x8 de un macrobloque usa solamente una única imagen de referencia para la predicción. Además de codificar y transmitir los vectores de movimiento, un índice de imagen de referencia se transmite para cada bloque de movimiento o región de 8x8, indicando qué imagen de referencia se usa. Un conjunto limitado de posibles imágenes de referencia se almacena tanto en el codificador como en el decodificador y se transmite el número de imágenes de referencia permisible.

En el estándar JVT, para imágenes bi-predictivas (también llamadas imágenes "B") , se forman dos predictores para cada bloque de movimiento o región de 8x8, cada uno de los cuales puede ser de una imagen de referencia separada y los dos predictores se promedian juntos para formar un único predictor promediado. Para bloques de movimiento codificados de manera bi-predictiva, las imágenes de referencia pueden ser ambas de la dirección hacia delante, ser ambas de la dirección hacia atrás o cada una de las direcciones hacia delante y hacia atrás. Se mantienen dos listas de las imágenes de referencia disponibles que se pueden usar para la predicción. Las dos imágenes de referencia se conocen como los predictores de la lista 0 y la lista 1. Un índice para cada imagen de referencia se codifica y transmite, ref_idx_I0 y ref_idx_I1, para las imágenes de referencia de la lista 0 y la lista 1, respectivamente. Las imágenes bi-predictivas o "B" de Joint Video Team ("JVT") permiten una ponderación adaptativa entre las dos predicción, es decir, Pred = [ (P0) (Pred0] + [ (P1) (Pred1) ] + D, donde P0 y P1 son factores de ponderación, Pred0 y Pred1 son predicciones de la imagen de referencia para la lista 0 y la lista 1 respectivamente y D es un desplazamiento.

Se han propuesto dos métodos para la indicación de factores de ponderación. En el primero, los factores de ponderación se determinan por las direcciones que se usan para las imágenes de referencia. En este método, si el índice ref_idx_I0 es menor o igual que ref_idx_I1, se usan los factores de ponderación (, ) , de otro modo se usan (2, -1) .

En el segundo método ofrecido, cualquier número de factores de ponderación se transmite para cada segmento. Luego se trasmite un índice de factor de ponderación para cada bloque de movimiento o región 8x8 de un macrobloque que utiliza predicción bi-direccional. El decodificador... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder (712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular; caracterizado por codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia, en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

2. Un método como se define en la reivindicación 1, en el que la codificación comprende:

determinar un bloque de movimiento compensado a partir de la imagen de referencia particular;

ponderar el bloque de movimiento compensado usando el factor de ponderación para producir un bloque de movimiento compensado ponderado;

determinar un desplazamiento; y ajustar el bloque de movimiento compensado ponderado usando el desplazamiento para producir un bloque de 20 movimiento compensado ponderado ajustado.

3. Un método como se define en la reivindicación 2, en el que la codificación además comprende restar el bloque de movimiento compensado ponderado ajustado y el bloque de imagen.