Ponderación adaptativa de imágenes de referencia en decodificación de video.

Un método (600) para decodificar datos de vídeo para una imagen que tiene una pluralidad de bloques,

comprendiendo el método las etapas de:

recibir (614) los datos de vídeo, incluyendo los datos de vídeo recibidos un índice de imagen de referencia único para predecir un bloque de una pluralidad de bloques e incluir datos codificados para el bloque, correspondiendo el índice de imagen de referencia único a una única imagen de referencia particular; y

descodificar prediciendo el bloque utilizando la imagen de referencia particular única correspondiente al único índice de imagen de referencia y utilizando el factor de ponderación asociado con la imagen de referencia particular única, y que corresponde al índice de imagen de referencia único recibido, en donde el índice de imagen de referencia único recibido determina tanto la imagen de referencia particular única como el factor de ponderación.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2003/021735.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.

Inventor/es: BOYCE,JILL,MACDONALD.

Fecha de Publicación: 14 de Marzo de 2012.

Clasificación Internacional de Patentes:

G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
H03M7/36 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
H04N1/00 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles.
H04N7/12 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas en los cuales la señal de televisión es transmitida vía uno o varios canales paralelos, siendo el ancho de banda de cada canal inferior al ancho de banda de la señal de televisión (H04N 7/24 tiene prioridad).
H04N7/26
H04N7/32
H04N7/36
H04N7/46
H04N7/50

PDF original: ES-2380920_T3.pdf

Fragmento de la descripción:

Ponderación adaptativa de imagenes de referencia en decodificación de video CAMPO DE LA INVENCION

La presente invención esta dirigida a decodificadores de video, y en particular, a la utilización de ponderación adaptativa de imagenes de referencia en decodificadores de video.

ANTECEDENTES DE LA INVENCION

Los datos de video son generalmente procesados y transferidos en forma de cadenas de bits. Los codificadores y decodificadores de video tipicos ("CODECs") obtienen mucha de su eficiencia de compresión formado una predicción de imagen de referencia de una imagen que va ser codificada, y codificando la diferencia entre la imagen actual y la predicción. Cuanto mas próximamente este correlacionada la predicción con la imagen actual, menores bits son necesarios para comprimir esa imagen, por lo que se incrementa la eficiencia del proceso. De este modo, es deseable que sea formada la mejor preedición de imagen de referencia posible.

En muchas normas de compresión de video, incluyendo Moving Picture Experts Group ("MPEG") -1, MPEG-2 y MPEG-4, una versión compensada de movimiento de una imagen de referencia previa se utiliza como predicción para la imagen actual, y sólo la diferencia entre la imagen actual y la predicción se codifica. Cuando se utiliza una unica predicción de imagen (imagen de "P") , la imagen de referencia no es escalada cuando se forma la predicción compensada de movimiento. Cuando se utilizan predicciones de imagen bi-direccionales (imagenes "B") , las predicciones intermedias se forman a partir de dos imagenes diferentes, y despues las dos predicciones intermedias se promedian jutas, utilizando factores de ponderación iguales de (1/2, 1/2) para cada una, para formar una unica predicción promediada. En estas normas MPEG, las dos imagenes de referencia son siempre cada una de ellas a partir de la dirección hacia delante y la dirección hacia atras de las imagenes B.

SUMARIO DE LA INVENCION

Estas desventajas y desventajas de la tecnica anterior son tratadas mediante un metodo, un aparato y un dispositivo de almacenamiento de programa, de acuerdo con la reivindicaciones adjuntas.

BREVE DESCRIPCION DE LOS DIBUJOS

La ponderación adaptativa de imagenes de referencia en codificadores y decodificadores de video de acuerdo con los principios de la presente invención se muestran en las siguientes figuras a modo de ejemplo, en las que:

la Figura 1 muestra un diagrama de bloques para un decodificador de video estandar;

la Figura 2 muestra un diagrama de bloques para un decodificador de video con bi-predicción adaptativa;

la Figura 3 muestra un diagrama de bloques para un decodificador de video con ponderación de imagen de referencia de acuerdo con los principios de la presente invención;

la Figura 4 muestra un diagrama de bloques de un codificador de video estandar;

la Figura 5 muestra un diagrama de bloques para un codificador de video con ponderación de imagen de referencia de acuerdo con los principios de la presente invención;

la Figura 6 muestra una de flujo para un proceso de decodificación de acuerdo con los principios de la presente invención; y la Figura 7 muestra una carta de flujo para un proceso de codificación de acuerdo con los principios de la presente invención DESCRIPCION DETALLADA DE LAS REALIZACIONES PREFERIDAS

La presente invención presenta un metodo y un aparato para asignación de factor de ponderación de imagen de referencia adaptativa. En algunas secuencias de video, en particular en aquellas con desvanecimiento, la imagen actual o bloque de imagenes que va ser codificado esta mas correlacionada con una imagen de referencia escalada por un factor de ponderación que la propia imagen de referencia. Los CODECs de video sin factores de ponderación aplicados a las imagenes de referencia codifican secuencias de desvanecimiento de manera muy ineficiente. Cuando se utilizan factores de ponderación en codificación, un codificador de video necesita determinar tanto los factores de ponderación como los vectores de movimiento, pero la mejor elección para cada uno de ellos depende del otro, con la estimación del movimiento siendo tipicamente la parte mas intensiva desde el punto de vista de la computación, de un codificador de compresión de video digital.

En la norma de compresión de video Joint Video Team ("JVT") propuesta, cada imagen P puede utilizar multiples imagenes de referencia para formar una predicción de imagen, pero cada región de bloque de movimiento individual de 8x8 de un macrobloque utiliza una unica imagen de predicción. Ademas de codificar y transmitir los vectores de movimiento, un indice de imagen de referencia es transmitido para cada bloque de movimiento o región de 8x8, indicando que imagen de referencia es utilizada. Un conjunto limitado de posibles imagenes de referencia es almacenado tanto en el codificador como en el decodificador, y el numero de imagenes de referencia permitidas es transmitido.

En la norma JVT, para imagenes bi-predictivas (tambien llamadas imagenes "B") , dos predictores son formados en cada bloque de movimiento o región de 8x8, cada uno de los cuales puede proceder de una imagen de referencia separada, y los dos predictores son promediados juntos para formar un unico predictor promediado. Para bloques de movimiento codificados de manera bi-predictiva, las imagenes de referencia pueden proceder ambas a partir de la dirección hacia delante, ambas de la dirección hacia atras, o una a partir de cada una de las direcciones hacia delante y hacia atras. Son mantenidas dos listas de las imagenes de referencia disponibles que se pueden utilizar para la predicción. Las dos imagenes de referencia estan referenciadas como los predictores de la lista 0 y la lista 1. Un indice para cada imagen de referencia es codificado y transmitido, ref idx I0 y ref idx I1, para las imagenes de referencia de la lista 0 y la lista 1, respectivamente. Las imagenes bi-predictivas de Joint Video Team ("JVT") o "B" permiten la ponderación adaptativa entre las dos predicción, es decir, Pred = [ (P0) (Pred0]+ [ (P1) (Pred1) ] +D, en donde P0 y P1 son factores de ponderación, Pred0 y Pred1 son predicciones de imagen de referencia para la lista 0 y la lista 1 respectivamente, y D es un desplazamiento.

Se han propuesto dos metodos para la indicación de factores de ponderación. En el primero, los factores de ponderación son determinados por las direcciones que son utilizadas para las imagenes de referencia. En este metodo, si el indice ref idx I0 es menor o igual que ref idx I1, son utilizados los factores de ponderación (Y, Y) , si no, son utilizados (2, -1) .

Este primer metodo para la indicación de factores de ponderación de describe en Kikuchi: "Multi-frame interpolative prediction with modified syntax" Joint Video Team (JVT) de ISO/IEC MPEG ITU-T VCEG (ISO/IEC JTC1/SC29/IG 11 e ITU-T SG 16 0.6) , no. JVT-CO66, 10 de mayo de 2002, XP 030005175.

En el segundo metodo propuesto, cualquier numero de factores de ponderación se transmite para cada partición o "slice". Despues se trasmite un indice de factor de ponderación para cada bloque de movimiento o región 8x8 de un macrobloque que utiliza predicción bi-direccional. El decodificador utiliza el indice de factor de ponderación recibido para elegir el factor de ponderación apropiado, a partir del conjunto trasmitido, para utilizar cuando se decodifique el bloque de movimiento o región 8x8. Por ejemplo, si se envian tres factores de ponderación en la capa de partición, corresponderia a los indices de factor de ponderación 0, 1 y 2 respectivamente. Todas las afirmaciones hechas aqui que mencionan principios, aspectos y realizaciones de la invención, asi como ejemplos especificos de la misma, estan destinados a abarcar tanto equivalentes estructurales como funcionales de la misma. Adicionalmente estan previsto que tales equivalentes incluyen tanto equivalentes actualmente conocidos como equivalentes desarrollados en el futuro, es decir cualesquiera elementos desarrollados que realicen la misma función independientemente de la estructura.

De este modo, por ejemplo, los expertos en la tecnica apreciaran que los diagramas de bloques representan aqui vistas conceptuales de circuitos ilustrativos que representan los principios de la invención. De manera similar, se apreciara que cualesquiera cartas de flujo, diagramas de flujo, diagramas de transición de estado, pseudocódigo, y similares representan diversos procesos que se pueden representar sustancialmente... [Seguir leyendo]

Reivindicaciones:

1. Un metodo (600) para decodificar datos de video para una imagen que tiene una pluralidad de bloques, comprendiendo el metodo las etapas de:

recibir (614) los datos de video, incluyendo los datos de video recibidos un indice de imagen de referencia unico para predecir un bloque de una pluralidad de bloques e incluir datos codificados para el bloque, correspondiendo el indice de imagen de referencia unico a una unica imagen de referencia particular; y descodificar prediciendo el bloque utilizando la imagen de referencia particular unica correspondiente al unico indice de imagen de referencia y utilizando el factor de ponderación asociado con la imagen de referencia particular unica, y que corresponde al indice de imagen de referencia unico recibido, en donde el indice de imagen de referencia unico recibido determina tanto la imagen de referencia particular unica como el factor de ponderación.

2. Un metodo como el definido en la Reivindicación 1, en el que la predicción comprende:

compensar el movimiento (620) de un bloque a partir de la imagen de referencia particular unica para formar un bloque de movimiento compensado;

ponderar (622) el bloque de movimiento compensado utilizando el factor de ponderación para formar un bloque de movimiento compensado ponderado;

determinar un desplazamiento (617) ; y ajustar (623) el bloque de movimiento compensado ponderado utilizando el desplazamiento para formar un bloque de movimiento compensado ajustado.

3. Un metodo como el definido en la reivindicación 2, que ademas comprende sumar el bloque de movimiento compensado ponderado a los datos residuales para el bloque de la imagen para predecir el bloque de la imagen.

4. Un metodo como el definido en cualquiera de las reivindicaciones 1 a 3, que ademas comprende recibir un conjunto de factores de ponderación para la imagen.

5. Un metodo como el definido en cualquiera de las reivindicaciones 1 a 3, que ademas comprende recibir un conjunto de factores de ponderación para una partición de imagen.

6. Un metodo como el definido en cualquiera de las reivindicaciones 1 a 3, que ademas comprende recibir un encabezador de partición (o "slice") para una partición de imagen, y en el que el encabezador de partición recibido incluye datos que indican un numero de imagenes de referencia aceptables para la partición.

7. Un metodo como el definido en cualquiera de las reivindicaciones 4 a 6, en el que cada factor de ponderación de cada conjunto de factores de ponderación corresponde a una imagen de referencia separada, y corresponde a sólo una imagen de referencia.

8. Un metodo como el definido en cualquiera de las reivindicaciones 4 a 7, en el que cada imagen de referencia aceptable tiene sólo un correspondiente factor de ponderación a partir del conjunto de factores de ponderación.

9. Un aparato (300) configurado para realizar uno o mas de los metodos de las reivindicaciones 1-8.

10. Un dispositivo de almacenamiento de programa leible por una maquina, que encarna de forma tangible un programa de instrucciones ejecutables por la maquina para realizar las etapas de programa para decodificar datos de video, incluyendo las etapas de programa las etapas de uno o mas de los metodos de las reivindicaciones 1-8.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]