Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Un método para codificar una instantánea en una secuencia de imágenes, que comprende:

dividir dicha instantánea en una pluralidad de pares de macrobloques verticalmente adyacentes;

codificar de manera selectiva al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de cuadro donde el al menos uno de dicha pluralidad de pares de macrobloques incluye macrobloques de cuadro incluyendo cada uno tanto píxeles de campo superior como inferior

, y al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de campo donde el al menos uno de dicha pluralidad de pares de macrobloques se divide en macrobloques de campo incluyendo cada uno píxeles de campo superior o inferior;

y

obtener al menos dos vectores de movimiento y dos instantáneas de referencia asociadas para al menos un bloque de dicho al menos un par de macrobloques de dicha pluralidad de pares de macrobloques,

donde dicho al menos un bloque tiene un tamaño más pequeño que dicho al menos uno de la pluralidad de pares de macrobloques.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10182654.

Solicitante: Google Technology Holdings LLC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1600 AMPHITHEATRE PARKWAY MOUNTAIN VIEW, CA 94043 ESTADOS UNIDOS DE AMERICA.

Inventor/es: LUTHRA, AJAY, PANUSOPONE,KRIT, WANG,LIMIN, GANDHI,RAJEEV.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/10 (utilizando codificación adaptativa)

PDF original: ES-2545394_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.
Ilustración 2 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.
Ilustración 3 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.
Ilustración 4 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.
Ver la galería de la patente con 8 ilustraciones.
Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Fragmento de la descripción:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital

Campo técnico

La presente invención se refiere a codificación y decodificación de contenido de vídeo digital. Más específicamente, la presente invención se refiere a codificación de modo de cuadro y de modo de campo de contenido de vídeo digital a un nivel de macrobloques como se usa en la norma de codificación de vídeo de la norma MPEG-4 Parte 10 AVC/H.264.

Antecedentes

La compresión de vídeo se usa en muchos productos actuales y emergentes. Está en el corazón de los receptores de salón de televisión digital (STB) , sistemas de satélite digital (DSS) , decodificadores de televisión de alta definición (HDTV) , reproductores de disco versátil digital (DVD) , videoconferencia, contenido de vídeo y multimedia de internet y otras aplicaciones de vídeo digital. Sin la compresión de vídeo, el contenido de vídeo digital puede ser extremadamente grande, haciendo difícil o incluso imposible que se almacene, transmita o visualice eficazmente el contenido de vídeo digital.

El contenido de vídeo digital comprende un flujo de instantáneas que pueden presentarse como una imagen en un receptor de televisión, monitor de ordenador o algún otro dispositivo electrónico que pueda presentar contenido de vídeo digital. Una instantánea que se presenta en el tiempo antes de una instantánea particular está en la "dirección hacia atrás" en relación con la instantánea particular. De manera similar, una instantánea que se presenta en el tiempo después de una instantánea particular está en la "dirección hacia delante" en relación con la instantánea particular.

La compresión de vídeo se consigue en un proceso de codificación en el que cada instantánea se codifica como un cuadro o como dos campos. Cada cuadro comprende un número de líneas de información espacial. Por ejemplo, un cuadro típico contiene 480 líneas horizontales. Cada campo contiene la mitad del número de líneas en el cuadro. Por ejemplo, si el cuadro comprende 480 líneas horizontales, cada campo comprende 240 líneas horizontales. En una configuración típica, uno de los campos comprende las líneas con número impar en el cuadro y el otro campo comprende las líneas con número par en el cuadro. El campo que comprende las líneas con número impar se denominará como el campo "superior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. De manera similar, el campo que comprende las líneas con número par se denominará como el campo "inferior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. Los dos campos pueden entrelazarse juntos para formar un cuadro entrelazado.

La idea general detrás de la codificación de vídeo es eliminar datos del contenido de vídeo digital que sean "no esenciales". La cantidad reducida de datos a continuación requiere menos ancho de banda para difusión o transmisión. Después de que se hayan transmitido los datos de vídeo comprimido, deben decodificarse, o descomprimirse. En este proceso, los datos de vídeo transmitido se procesan para generar datos de aproximación que se sustituyen en los datos de vídeo para reemplazar los datos "no esenciales" que se eliminaron en el proceso de codificación.

La codificación de vídeo transforma el contenido de vídeo digital en una forma comprimida que puede almacenarse usando menos espacio y transmitirse usando menos ancho de banda que el contenido de vídeo digital no comprimido. Se hace aprovechando las redundancias temporales y espaciales en las instantáneas del contenido de vídeo. El contenido de vídeo digital puede almacenarse en un medio de almacenamiento tal como un disco duro, DVD o alguna otra unidad de almacenamiento no volátil.

Existen numerosos métodos de codificación de vídeo que comprimen el contenido de vídeo digital. En consecuencia, las normas de codificación de vídeo se han desarrollado para normalizar los diversos métodos de codificación de vídeo de modo que el contenido de vídeo digital comprimido se representa en formatos que puede reconocer una 55 mayoría de codificadores y decodificadores de vídeo. Por ejemplo, el Grupo de Expertos en Imagen en Movimiento (MPEG) y la Unión Internacional de Telecomunicaciones (ITU-T) han desarrollado normas de codificación de vídeo que se usan ampliamente. Ejemplos de estas normas incluyen las normas MPEG-1, MPEG-2, MPEG-4, ITU-T H261 e ITU-T H263.

La mayoría de las normas de codificación de vídeo modernas, tales como aquellas desarrolladas mediante el MPEG y la ITU-T, están basadas en parte en una predicción temporal con algoritmo de compensación de movimiento (MC) . La predicción temporal con compensación de movimiento se usa para eliminar la redundancia temporal entre instantáneas sucesivas en una difusión de vídeo digital.

La predicción temporal con algoritmo de compensación de movimiento utiliza típicamente una o dos instantáneas de referencia para codificar una instantánea particular. Una instantánea de referencia es una instantánea que ya se ha

codificado. Comparando la instantánea particular que se ha de codificar con una de las instantáneas de referencia, la predicción temporal con algoritmo de compensación de movimiento puede aprovechar la redundancia temporal que existe entre la instantánea de referencia y la instantánea particular que se ha de codificar y codificar la instantánea con una cantidad superior de compresión que si la instantánea se codificara sin usar la predicción temporal con algoritmo de compensación de movimiento. Una de las instantáneas de referencia puede estar en la dirección hacia atrás en relación con la instantánea particular que se ha de codificar. La otra instantánea de referencia está en la dirección hacia delante en relación con la instantánea particular que se ha de codificar.

Sin embargo, a medida que aumenta la demanda de resoluciones superiores, el contenido gráfico más complejo y el tiempo de transmisión más rápido, también lo hace la necesidad de mejores métodos de compresión de vídeo. Para este fin, se está desarrollando actualmente una nueva norma de codificación de vídeo conjuntamente mediante la ISO y la ITU-T. Esta nueva norma de codificación de vídeo se denomina la norma MPEG-4 Codificación de Vídeo Avanzada (AVC) /H. 264.

P.BORGWARDT: "Core Experiment on Interlaced Video coding VCEG-N85" ITU -TELECOMMUNICATIONS STANDARDIZATION SECTOR ITU-T Q.6/SG16 VIDEO CODING EXPERT GROUP (VCEG) , 24 de septiembre de 2001, páginas 1-10, evalúa diferentes cambios de sintaxis a exploración de campos entrelazados. Analiza exploración de campos entrelazados junto con codificación de cuadro/campo adaptativa de macrobloques.

La Patente de Estados Unidos Nº US 6.226.327 describe un método y aparato de codificación de vídeo que selecciona entre los modos predictivos basados en cuadro y basados en campo. El documento describe predicción basada en cuadro de cada macrobloque. Para la predicción de movimiento basada en campo de los de los macrobloques, un macrobloque y el macrobloque inmediatamente inferior se consideran como un grupo de macrobloques y se produce la predicción de agrupación de macrobloques mediante agrupación de macrobloques.

Sumario de la invención

De acuerdo con los aspectos de la invención se proporciona un método para codificar, un método para decodificar, un aparato para codificar y un aparato para decodificar, como se indica en las reivindicaciones adjuntas. En una de muchas posibles realizaciones, la presente invención proporciona un método para codificar, decodificar y la generación de flujos de bits de contenido... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para codificar una instantánea en una secuencia de imágenes, que comprende:

dividir dicha instantánea en una pluralidad de pares de macrobloques verticalmente adyacentes; codificar de manera selectiva al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de cuadro donde el al menos uno de dicha pluralidad de pares de macrobloques incluye macrobloques de cuadro incluyendo cada uno tanto píxeles de campo superior como inferior, y al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de campo donde el al menos uno de dicha pluralidad de pares de macrobloques se divide en macrobloques de campo incluyendo cada uno píxeles de campo superior o inferior; y obtener al menos dos vectores de movimiento y dos instantáneas de referencia asociadas para al menos un bloque de dicho al menos un par de macrobloques de dicha pluralidad de pares de macrobloques, donde dicho al menos un bloque tiene un tamaño más pequeño que dicho al menos uno de la pluralidad de pares de macrobloques.

2. El método de la reivindicación 1, donde dichos al menos dos vectores de movimiento se calculan a partir de un bloque co-localizado en una de dichas dos instantáneas de referencia asociadas.

3. Un aparato para codificar una instantánea en una secuencia de imágenes, que comprende:

medios para dividir dicha instantánea en una pluralidad de pares de macrobloques verticalmente adyacentes; medios para codificar de manera selectiva al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de cuadro donde el al menos uno de dicha pluralidad de pares de macrobloques incluye macrobloques de cuadro incluyendo cada uno tanto píxeles de campo superior como inferior, y al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de campo donde el al menos uno de dicha pluralidad de pares de macrobloques se divide en macrobloques de campo incluyendo cada uno píxeles de campo superior o inferior; y medios para obtener al menos dos vectores de movimiento y dos instantáneas de referencia asociadas para al menos un bloque de dicho al menos un par de macrobloques de dicha pluralidad de pares de macrobloques, donde dicho al menos un bloque tiene un tamaño más pequeño que dicho al menos uno de la pluralidad de pares de macrobloques.

4. El aparato de la reivindicación 3, donde dichos al menos dos vectores de movimiento se calculan a partir de un bloque co-localizado en una de dichas dos instantáneas de referencia asociadas.

5. Un método para decodificar una instantánea codificada que tiene una pluralidad de pares de macrobloques a partir de un flujo de bits, que comprende:

decodificar al menos uno de una pluralidad de pares de macrobloques verticalmente adyacentes en un momento en modo de codificación de cuadro donde el al menos uno de dicha pluralidad de pares de macrobloques incluye macrobloques de cuadro incluyendo cada uno tanto píxeles de campo superior como inferior, y al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de campo donde el al 45 menos uno de dicha pluralidad de pares de macrobloques se divide en macrobloques de campo incluyendo cada uno píxeles de campo superior o inferior; obtener al menos dos vectores de movimiento y dos instantáneas de referencia asociadas para al menos un bloque de un par de macrobloques de dicha pluralidad de pares de macrobloques; y usar dicha pluralidad de pares de macrobloques decodificados y dichos al menos dos vectores de movimiento para al menos un bloque de dicho par de macrobloques, de dicha pluralidad de pares de macrobloques para construir una instantánea decodificada, donde dicho al menos un bloque tiene un tamaño más pequeño que dicho al menos uno de la pluralidad de pares de macrobloques.

6. El método de la reivindicación 5, donde dichos al menos dos vectores de movimiento se calculan a partir de un bloque co-localizado en una de dichas dos instantáneas o campos de referencia asociados.

7. El método de la reivindicación 5, donde dichas al menos dos instantáneas o campos de referencia se obtienen a partir de un bloque co-localizado.

8. El método de la reivindicación 6, donde dicho bloque co-localizado en una de dichas dos instantáneas de referencia asociadas se codifica en dicho modo de codificación de cuadro o dicho modo de codificación de campo.

9. Un aparato para decodificar una instantánea codificada que tiene una pluralidad de pares de macrobloques a 65 partir de un flujo de bits, que comprende:

medios para decodificar al menos uno de una pluralidad de pares de macrobloques verticalmente adyacentes en un momento en modo de codificación de cuadro donde el al menos uno de dicha pluralidad de pares de macrobloques incluye macrobloques de cuadro incluyendo cada uno tanto píxeles de campo superior como inferior, y al menos uno de dicha pluralidad de pares de macrobloques en un momento en modo de codificación de campo donde el al menos uno de dicha pluralidad de pares de macrobloques se divide en macrobloques de campo incluyendo cada uno píxeles de campo superior o inferior; medios para obtener al menos dos vectores de movimiento y dos instantáneas de referencia asociadas para al menos un bloque de un par de macrobloques de dicha pluralidad de pares de macrobloques; y medios para usar dicha pluralidad de pares de macrobloques decodificados y dichos al menos dos vectores de movimiento para al menos un bloque de dicho par de macrobloques de dicha pluralidad de pares de macrobloques para construir una instantánea decodificada, donde dicho al menos un bloque tiene un tamaño más pequeño que dicho al menos uno de la pluralidad de pares de macrobloques.

10. El aparato de la reivindicación 9, donde el al menos un bloque se divide en bloques con tamaño más pequeño que incluyen los mismos posibles tamaños de bloque cuando está en el modo de codificación de cuadro o en el modo de codificación de campo, los bloques con tamaño más pequeño son para uso en predicción temporal con compensación de movimiento.

11. El aparato de una cualquiera de las reivindicaciones 9 a 10, donde el al menos un bloque es para uso en predicción temporal con compensación de movimiento con un tamaño de bloque que incluye 16 por 16 píxeles, 16 por 8 píxeles, 8 por 16 píxeles, 8 por 8 píxeles, 8 por 4 píxeles, 4 por 8 píxeles o 4 por 4 píxeles.

12. El aparato de una cualquiera de las reivindicaciones 9 a 11, donde cada uno de la pluralidad de pares de macrobloques está asociado con una bandera de cuadro/campo, indicando la bandera de cuadro/campo el modo de codificación de cuadro o modo de codificación de campo.

13. El aparato de una cualquiera de las reivindicaciones 9 a 12, donde el al menos uno de dicha pluralidad de pares de macrobloques decodificado en modo de codificación de campo que incluye un bloque de campo superior y un bloque de campo inferior, donde los medios para usar están configurados para:

tomar una porción superior de dicho bloque de campo superior para formar un campo superior de un primer macrobloque;

tomar una porción inferior de dicho bloque de campo superior para formar un campo superior de un segundo macrobloque; tomar una porción superior de dicho bloque de campo inferior para formar un campo inferior del primer macrobloque; y tomar una porción inferior de dicho bloque de campo inferior para formar un campo inferior del segundo macrobloque.

14. El aparato de una cualquiera de las reivindicaciones 9 a 13, donde dichos al menos dos vectores de movimiento se calculan a partir de un bloque co-localizado en una de dichas dos instantáneas de referencia asociadas.

15. El aparato de una cualquiera de las reivindicaciones 9 a 14, donde dichas al menos dos instantáneas de referencia se obtienen a partir de un bloque co-localizado.

16. El aparato de una cualquiera de las reivindicaciones 9 a 15, donde dicho bloque co-localizado en una de dichas dos instantáneas de referencia asociadas se codifica en dicho modo de codificación de cuadro o dicho modo de 50 codificación de campo.