Ponderación adaptativa de imágenes de referencia en codificación de vídeo.

Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen,

los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder (712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular;

caracterizado por

codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia,

en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2003/021728.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.

Inventor/es: BOYCE,JILL,MACDONALD.

Fecha de Publicación: 1 de Abril de 2015.

Clasificación Internacional de Patentes:

G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
H03M7/36 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
H04N7/26
H04N7/32
H04N7/46
H04N7/50

PDF original: ES-2536456_T3.pdf

Fragmento de la descripción:

Ponderación adaptativa de imágenes de referencia en codificación de vídeo Referencia cruzada a solicitudes relacionadas Esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.843 (expediente del agente Nº PU020340) , titulada "Adaptative Weighting Of Reference Pictures In Video CODEC" y presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad. Además, esta solicitud reivindica el beneficio de la Solicitud de Patente Provisional de EE.UU. Nº de Serie 60/395.874 (expediente del agente Nº PU020339) , titulada "Motion Estimation With Weighting Prediction" también presentada el 15 de julio de 2002, que se incorpora por referencia en la presente memoria en su totalidad.

Campo de la invención La presente invención está dirigida a codificadores de vídeo y, en particular, a ponderación adaptativa de imágenes de referencia en codificadores de vídeo.

Antecedentes de la invención Los datos de vídeo son generalmente procesados y transferidos en forma de flujos de bits. Los codificadores y decodificadores de compresión de video típicos ("CODEC") obtienen mucha de su eficiencia de compresión formando una predicción de imagen de referencia de una imagen a ser codificada y codificando la diferencia entre la imagen actual y la predicción. Cuanto más próximamente este correlacionada la predicción con la imagen actual, menores bits son necesarios para comprimir esa imagen, aumentando por ello la eficiencia del proceso. De este modo, es deseable que sea formada la mejor predicción de imagen de referencia posible.

En muchos estándares de compresión de vídeo, incluyendo el Grupo de Expertos de Imagen en Movimiento (Moving Picture Experts Group) ("MPEG") -1, MPEG-2 y MPEG-4, una versión compensada de movimiento de una imagen de referencia previa se usa como predicción para la imagen actual y solamente se codifica la diferencia entre la imagen actual y la predicción. Cuando se usa una única predicción de imagen (imagen "P") , la imagen de referencia no se escala cuando se forma la predicción compensada de movimiento. Cuando se usan predicciones de imagen bidireccionales (imágenes "B") , las predicciones intermedias se forman a partir de dos imágenes diferentes y entonces las dos predicciones intermedias se promedian juntas, usando factores de ponderación iguales de (1/2, 1/2) para cada una, para formar una única predicción promediada. En estos estándares MPEG, las dos imágenes de referencia son siempre cada una de ellas de la dirección hacia delante y la dirección hacia atrás de las imágenes B.

El documento del estándar JVT-B075 titulado "Improved multiple frame motion compensation using frame interpolation" describe un método de compensación de movimiento mejorado para múltiples cuadros de referencia.

El documento del estándar JVT-C066 titulado "Multi-frame interpolative prediction with modified syntax" describe una sintaxis modificada en base a la imagen B que soporta predicción de interpolación multicuadro.

Compendio de la invención La invención es un método de codificación de vídeo como se define en las reivindicaciones adjuntas.

Breve descripción de los dibujos La ponderación adaptativa de imágenes de referencia en codificadores y decodificadores de vídeo según los principios de la presente invención se muestran en las siguientes figuras ejemplares, en las que:

la Figura 1 muestra un diagrama de bloques para un decodificador de vídeo estándar;

la Figura 2 muestra un diagrama de bloques para un decodificador de vídeo con bi-predicción adaptativa;

la Figura 3 muestra un diagrama de bloques para un decodificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 4 muestra un diagrama de bloques de un codificador de vídeo estándar;

la Figura 5 muestra un diagrama de bloques para un codificador de vídeo con ponderación de imagen de referencia según los principios de la presente invención;

la Figura 6 muestra una de flujo para un proceso de decodificación según los principios de la presente invención; y la Figura 7 muestra un diagrama de flujo para un proceso de codificación según los principios de la presente invención

Descripción detallada de las realizaciones preferidas En algunas secuencias de vídeo, en particular en aquellas con desvanecimiento, la imagen actual o bloque de imágenes a ser codificada está más fuertemente correlacionada con una imagen de referencia escalada por un factor de ponderación que la imagen de referencia en sí misma. Los CODEC de vídeo sin factores de ponderación aplicados a las imágenes de referencia codifican secuencias de desvanecimiento de manera muy ineficiente. Cuando se usan factores de ponderación en codificación, un codificador de vídeo necesita determinar tanto los factores de ponderación como los vectores de movimiento, pero la mejor elección para cada uno de estos depende del otro, con la estimación de movimiento que es típicamente la parte más intensiva desde el punto de vista del cálculo de un codificador de compresión de vídeo digital.

En el estándar de compresión de vídeo Joint Video Team ("JVT") propuesto, cada imagen P puede usar múltiples imágenes de referencia para formar una predicción de imagen, pero cada bloque de movimiento individual o región 8x8 de un macrobloque usa solamente una única imagen de referencia para la predicción. Además de codificar y transmitir los vectores de movimiento, un índice de imagen de referencia se transmite para cada bloque de movimiento o región de 8x8, indicando qué imagen de referencia se usa. Un conjunto limitado de posibles imágenes de referencia se almacena tanto en el codificador como en el decodificador y se transmite el número de imágenes de referencia permisible.

En el estándar JVT, para imágenes bi-predictivas (también llamadas imágenes "B") , se forman dos predictores para cada bloque de movimiento o región de 8x8, cada uno de los cuales puede ser de una imagen de referencia separada y los dos predictores se promedian juntos para formar un único predictor promediado. Para bloques de movimiento codificados de manera bi-predictiva, las imágenes de referencia pueden ser ambas de la dirección hacia delante, ser ambas de la dirección hacia atrás o cada una de las direcciones hacia delante y hacia atrás. Se mantienen dos listas de las imágenes de referencia disponibles que se pueden usar para la predicción. Las dos imágenes de referencia se conocen como los predictores de la lista 0 y la lista 1. Un índice para cada imagen de referencia se codifica y transmite, ref_idx_I0 y ref_idx_I1, para las imágenes de referencia de la lista 0 y la lista 1, respectivamente. Las imágenes bi-predictivas o "B" de Joint Video Team ("JVT") permiten una ponderación adaptativa entre las dos predicción, es decir, Pred = [ (P0) (Pred0] + [ (P1) (Pred1) ] + D, donde P0 y P1 son factores de ponderación, Pred0 y Pred1 son predicciones de la imagen de referencia para la lista 0 y la lista 1 respectivamente y D es un desplazamiento.

Se han propuesto dos métodos para la indicación de factores de ponderación. En el primero, los factores de ponderación se determinan por las direcciones que se usan para las imágenes de referencia. En este método, si el índice ref_idx_I0 es menor o igual que ref_idx_I1, se usan los factores de ponderación (, ) , de otro modo se usan (2, -1) .

En el segundo método ofrecido, cualquier número de factores de ponderación se transmite para cada segmento. Luego se trasmite un índice de factor de ponderación para cada bloque de movimiento o región 8x8 de un macrobloque que utiliza predicción bi-direccional. El decodificador utiliza el índice de factor de ponderación recibido para elegir el factor de ponderación apropiado, a partir del conjunto trasmitido, para usar cuando se decodifique el bloque de movimiento o región 8x8. Por ejemplo, si se enviaron tres factores de ponderación en la capa de segmento, corresponderían a los índices de factor de ponderación 0, 1 y 2 respectivamente.

Las funciones de los distintos elementos mostrados en las figuras se pueden proporcionar a través del uso de un hardware dedicado así como un hardware capaz de ejecutar un software en asociación con un software apropiado. Cuando se proporcionan por un procesador, las funciones pueden ser proporcionadas por un único procesador dedicado, por un único procesador compartido o por una pluralidad de procesadores individuales, algunos de los cuales pueden ser compartidos. Además, el uso explícito del término "procesador" o "controlador" no se debería interpretar que se refiere exclusivamente a hardware... [Seguir leyendo]

Reivindicaciones:

1. Un método de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, los datos de vídeo que incluyen datos codificados para un bloque de imagen de la pluralidad de bloques de imagen y que incluyen al menos un índice de imagen de referencia, el método que comprende:

acceder (712) al bloque de imagen y a un índice de imagen de referencia para predecir el bloque de imagen, el único índice de imagen de referencia accedido que corresponde a una imagen de referencia particular; caracterizado por codificar (724) el bloque de imagen usando la imagen de referencia particular que corresponde al único índice de imagen de referencia y usando un factor de ponderación, determinado a partir de un conjunto de factores de ponderación y que corresponde al único índice de imagen de referencia, en donde (714) el único índice de imagen de referencia determina tanto la imagen de referencia particular como el factor de ponderación y cada factor de ponderación en el conjunto de factores de ponderación corresponde a una imagen de referencia particular diferente.

2. Un método como se define en la reivindicación 1, en el que la codificación comprende:

determinar un bloque de movimiento compensado a partir de la imagen de referencia particular;

ponderar el bloque de movimiento compensado usando el factor de ponderación para producir un bloque de movimiento compensado ponderado;

determinar un desplazamiento; y ajustar el bloque de movimiento compensado ponderado usando el desplazamiento para producir un bloque de 20 movimiento compensado ponderado ajustado.

3. Un método como se define en la reivindicación 2, en el que la codificación además comprende restar el bloque de movimiento compensado ponderado ajustado y el bloque de imagen.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]