Ponderación adaptativa de imágenes de referencia en codificación de vídeo.

Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen,

los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder (712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular;

caracterizado por

codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia,

en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2003/021728.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.

Inventor/es: BOYCE,JILL,MACDONALD.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06T9/00 SECCION G — FISICA.G06 COMPUTO; CALCULO; CONTEO.G06T TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL (especialmente adoptados para aplicaciones particulares, ver las subclases apropiadas, p. ej. G01C, G06K, G09G, H04N). › Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N).
  • H03M7/36 SECCION H — ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
  • H04N7/26
  • H04N7/32
  • H04N7/46
  • H04N7/50

PDF original: ES-2536456_T3.pdf

 


Fragmento de la descripción:

Ponderación adaptativa de imágenes de referencia en codificación de vídeo Referencia cruzada a solicitudes relacionadas Esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.843 (expediente del agente Nº PU020340) , titulada "Adaptative Weighting Of Reference Pictures In Video CODEC" y presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad. Además, esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.874 (expediente del agente Nº PU020339) , titulada "Motion Estimation With Weighting Prediction" también presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad.

Campo de la invención La presente invención está dirigida a codificadores de vídeo y, en particular, a ponderación adaptativa de imágenes de referencia en codificadores de vídeo.

Antecedentes de la invención Los datos de vídeo son generalmente procesados y transferidos en forma de flujos de bits. Los codificadores y decodificadores de compresión de video típicos ("CODEC") obtienen mucha de su eficiencia de compresión formando una predicción de imagen de referencia de una imagen a ser codificada y codificando la diferencia entre la imagen actual y la predicción. Cuanto más próximamente este correlacionada la predicción con la imagen actual, menores bits son necesarios para comprimir esa imagen, aumentando por ello la eficiencia del proceso. De este modo, es deseable que sea formada la mejor predicción de imagen de referencia posible.

En muchos estándares de compresión de vídeo, incluyendo el Grupo de Expertos de Imagen en Movimiento (Moving Picture Experts Group) ("MPEG") -1, MPEG-2 y MPEG-4, una versión compensada de movimiento de una imagen de referencia previa se usa como predicción para la imagen actual y solamente se codifica la diferencia entre la imagen actual y la predicción. Cuando se usa una única predicción de imagen (imagen "P") , la imagen de referencia no se escala cuando se forma la predicción compensada de movimiento. Cuando se usan predicciones de imagen bidireccionales (imágenes "B") , las predicciones intermedias se forman a partir de dos imágenes diferentes y entonces las dos predicciones intermedias se promedian juntas, usando factores de ponderación iguales de (1/2, 1/2) para cada una, para formar una única predicción promediada. En estos estándares MPEG, las dos imágenes de referencia son siempre cada una de ellas de la dirección hacia delante y la dirección hacia atrás de las imágenes B.

El documento del estándar JVT-B075 titulado "Improved multiple frame motion compensation using frame interpolation" describe un método de compensación de movimiento mejorado para múltiples cuadros de referencia.

El documento del estándar JVT-C066 titulado "Multi-frame interpolative prediction with modified syntax" describe una sintaxis modificada en base a la imagen B que soporta predicción de interpolación multicuadro.

Compendio de la invención La invención es un método de codificación de vídeo como se define en las reivindicaciones adjuntas.

Breve descripción de los dibujos La ponderación adaptativa de imágenes de referencia en codificadores y decodificadores de vídeo según los principios de la presente invención se muestran en las siguientes figuras ejemplares, en las que:

la Figura 1 muestra un diagrama de bloques para un decodificador de vídeo estándar;

la Figura 2 muestra un diagrama de bloques para un decodificador de vídeo con bi-predicción adaptativa;

la Figura 3 muestra un diagrama de bloques para un decodificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 4 muestra un diagrama de bloques de un codificador de vídeo estándar;

la Figura 5 muestra un diagrama de bloques para un codificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 6 muestra una de flujo para un proceso de decodificación según los principios de la presente invención; y la Figura 7 muestra un diagrama de flujo para un proceso de codificación según los principios de la presente invención

Descripción detallada de las realizaciones preferidas En algunas secuencias de vídeo, en particular en aquellas con desvanecimiento, la imagen actual o bloque de imágenes a ser codificada está más fuertemente correlacionada con una imagen de referencia escalada por un factor de ponderación que la imagen de referencia en sí misma. Los CODEC de vídeo sin factores de ponderación aplicados a las imágenes de referencia codifican secuencias de desvanecimiento de manera muy ineficiente. Cuando se usan factores de ponderación en codificación, un codificador de vídeo necesita determinar tanto los factores de ponderación como los vectores de movimiento, pero la mejor elección para cada uno de estos depende del otro, con la estimación de movimiento que es típicamente la parte más intensiva desde el punto de vista del cálculo de un codificador de compresión de vídeo digital.

En el estándar de compresión de vídeo Joint Video Team ("JVT") propuesto, cada imagen P puede usar múltiples imágenes de referencia para formar una predicción de imagen, pero cada bloque de movimiento individual o región 8x8 de un macrobloque usa solamente una única imagen de referencia para la predicción. Además de codificar y transmitir los vectores de movimiento, un índice de imagen de referencia se transmite para cada bloque de movimiento o región de 8x8, indicando qué imagen de referencia se usa. Un conjunto limitado de posibles imágenes de referencia se almacena tanto en el codificador como en el decodificador y se transmite el número de imágenes de referencia permisible.

En el estándar JVT, para imágenes bi-predictivas (también llamadas imágenes "B") , se forman dos predictores para cada bloque de movimiento o región de 8x8, cada uno de los cuales puede ser de una imagen de referencia separada y los dos predictores se promedian juntos para formar un único predictor promediado. Para bloques de movimiento codificados de manera bi-predictiva, las imágenes de referencia pueden ser ambas de la dirección hacia delante, ser ambas de la dirección hacia atrás o cada una de las direcciones hacia delante y hacia atrás. Se mantienen dos listas de las imágenes de referencia disponibles que se pueden usar para la predicción. Las dos imágenes de referencia se conocen como los predictores de la lista 0 y la lista 1. Un índice para cada imagen de referencia se codifica y transmite, ref_idx_I0 y ref_idx_I1, para las imágenes de referencia de la lista 0 y la lista 1, respectivamente. Las imágenes bi-predictivas o "B" de Joint Video Team ("JVT") permiten una ponderación adaptativa entre las dos predicción, es decir, Pred = [ (P0) (Pred0] + [ (P1) (Pred1) ] + D, donde P0 y P1 son factores de ponderación, Pred0 y Pred1 son predicciones de la imagen de referencia para la lista 0 y la lista 1 respectivamente y D es un desplazamiento.

Se han propuesto dos métodos para la indicación de factores de ponderación. En el primero, los factores de ponderación se determinan por las direcciones que se usan para las imágenes de referencia. En este método, si el índice ref_idx_I0 es menor o igual que ref_idx_I1, se usan los factores de ponderación (, ) , de otro modo se usan (2, -1) .

En el segundo método ofrecido, cualquier número de factores de ponderación se transmite para cada segmento. Luego se trasmite un índice de factor de ponderación para cada bloque de movimiento o región 8x8 de un macrobloque que utiliza predicción bi-direccional. El decodificador utiliza el índice de factor de ponderación recibido para elegir el factor de ponderación apropiado, a partir del conjunto trasmitido, para usar cuando se decodifique el bloque de movimiento o región 8x8. Por ejemplo, si se enviaron tres factores de ponderación en la capa de segmento, corresponderían a los índices de factor de ponderación 0, 1 y 2 respectivamente.

Las funciones de los distintos elementos mostrados en las figuras se pueden proporcionar a través del uso de un hardware dedicado así como un hardware capaz de ejecutar un software en asociación con un software apropiado. Cuando se proporcionan por un procesador, las funciones pueden ser proporcionadas por un único procesador dedicado, por un único procesador compartido o por una pluralidad de procesadores individuales, algunos de los cuales pueden ser compartidos. Además, el uso explícito del término "procesador" o "controlador" no se debería interpretar que se refiere exclusivamente a hardware... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder (712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular; caracterizado por codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia, en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

2. Un método como se define en la reivindicación 1, en el que la codificación comprende:

determinar un bloque de movimiento compensado a partir de la imagen de referencia particular;

ponderar el bloque de movimiento compensado usando el factor de ponderación para producir un bloque de movimiento compensado ponderado;

determinar un desplazamiento; y ajustar el bloque de movimiento compensado ponderado usando el desplazamiento para producir un bloque de 20 movimiento compensado ponderado ajustado.

3. Un método como se define en la reivindicación 2, en el que la codificación además comprende restar el bloque de movimiento compensado ponderado ajustado y el bloque de imagen.


 

Patentes similares o relacionadas:

Procedimiento de codificación de vídeo, procedimiento de decodificación de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, programa de codificación de vídeo y programa de decodificación de vídeo, del 1 de Mayo de 2019, de NTT DOCOMO, INC.: Procedimiento de decodificación de imágenes codificadas, comprendiendo el procedimiento: recibir una imagen codificada (n), una temporización de decodificación […]

Procedimiento de descodificación de imágenes y dispositivo de descodificación, del 3 de Abril de 2019, de Panasonic Intellectual Property Corporation of America: Un dispositivo de descodificación que descodifica un flujo de bits de una señal de imagen codificada (Str) que comprende un flujo de cabecera (Str_H) y un flujo de trama […]

Ponderación adaptativa de imágenes de referencia en codificación de vídeo, del 27 de Marzo de 2019, de InterDigital VC Holdings, Inc: Un aparato de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, incluyendo los datos de […]

Cálculo del vector de movimiento en modo directo evitando divisiones por cero, del 27 de Marzo de 2019, de Godo Kaisha IP Bridge 1: Un procedimiento de decodificación de modo directo temporal para la decodificación de un bloque actual de una imagen actual tanto por decodificación de imagen […]

Método de codificación de imágenes en movimiento y método de decodificación de imágenes en movimiento, del 30 de Enero de 2019, de Panasonic Intellectual Property Corporation of America: Un método de codificación y decodificación que incluye un método de codificación para codificar una imagen y un método de decodificación […]

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento, del 30 de Enero de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación y decodificación de imágenes que incluye un procedimiento de codificación de imágenes para codificar una imagen B objetivo […]

Método y aparato para representar la granularidad de imagen mediante uno o más parámetros, del 24 de Enero de 2019, de DOLBY INTERNATIONAL AB: Un método para proporcionar información del grano de película que comprende los pasos de: caracterizar un flujo de información de imagen antes de la codificación […]

Procedimiento de codificación de imágenes en movimiento y procedimiento de descodificación de imágenes en movimiento, del 9 de Enero de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación y de descodificación que incluye un procedimiento de codificación para codificar un bloque objetivo de codificación en una imagen objetivo […]

Otras patentes de THOMSON LICENSING