Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Un método para codificar o decodificar contenido de vídeo digital, comprendiendo dicho contenido de vídeo digital un flujo de instantáneas que puede ser cada una de intra instantáneas

, instantáneas predichas o bi-predichas, comprendiendo cada una de dichas instantáneas macrobloques, comprendiendo dicho método las etapas de:

seleccionar para codificar o decodificar cada par de macrobloques verticalmente adyacentes en un modo de cuadro o un modo de campo;

disponer dicho par de macrobloques en macrobloques de cuadro o macrobloques de campo de acuerdo con el uno seleccionado de dicho modo de cuadro o dicho modo de campo; y

codificar o decodificar dichos macrobloques de cuadro o dichos macrobloques de campo, donde la etapa de disponer dicho par de macrobloques en macrobloques de cuadro o macrobloques de campo incluye la etapa de: en dicho modo de cuadro, procesar conjuntamente dos campos en dicho par de macrobloques, estando dividido dicho par de macrobloques en macrobloques de cuadro, e incluyendo cada uno de dichos macrobloques de cuadro tanto píxeles de campo superior como inferior;

en dicho modo de campo, procesar por separado dos campos de dicho par de macrobloques, estando partido dicho par de macrobloques en macrobloques de campo, e incluyendo cada uno de dichos macrobloques de campo píxeles de campo superior o inferior, y

donde dichos macrobloques de cuadro y dichos macrobloques de campo son del mismo tamaño.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2002/037739.

Solicitante: Google Technology Holdings LLC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1600 AMPHITHEATRE PARKWAY MOUNTAIN VIEW, CA 94043 ESTADOS UNIDOS DE AMERICA.

Inventor/es: LUTHRA, AJAY, PANUSOPONE,KRIT, WANG,LIMIN, GANDHI,RAJEEV.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/10 (utilizando codificación adaptativa)

PDF original: ES-2545177_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital

Campo técnico

La presente invención se refiere a codificación y decodificación de contenido de vídeo digital. Más específicamente, la presente invención se refiere a codificación de modo de cuadro y de modo de campo de contenido de vídeo digital a un nivel de macrobloques como se usa en la norma de codificación de vídeo de la norma MPEG-4 Parte 10 AVC/H.264.

Antecedentes

La compresión de vídeo se usa en muchos productos actuales y emergentes. Está en el corazón de los receptores de salón de televisión digital (STB) , sistemas de satélite digital (DSS) , decodificadores de televisión de alta definición (HDTV) , reproductores de disco versátil digital (DVD) , videoconferencia, contenido de vídeo y multimedia de internet y otras aplicaciones de vídeo digital. Sin la compresión de vídeo, el contenido de vídeo digital puede ser extremadamente grande, haciendo difícil o incluso imposible que se almacene, transmita o visualice eficazmente el contenido de vídeo digital.

El contenido de vídeo digital comprende un flujo de instantáneas que pueden presentarse como una imagen en un receptor de televisión, monitor de ordenador o algún otro dispositivo electrónico que pueda presentar contenido de vídeo digital. Una instantánea que se presenta en el tiempo antes de una instantánea particular está en la "dirección hacia atrás" en relación con la instantánea particular. De manera similar, una instantánea que se presenta en el tiempo después de una instantánea particular está en la "dirección hacia delante" en relación con la instantánea particular.

La compresión de vídeo se consigue en un proceso de codificación en el que cada instantánea se codifica como un cuadro o como dos campos. Cada cuadro comprende un número de líneas de información espacial. Por ejemplo, un cuadro típico contiene 480 líneas horizontales. Cada campo contiene la mitad del número de líneas en el cuadro. Por ejemplo, si el cuadro comprende 480 líneas horizontales, cada campo comprende 240 líneas horizontales. En una configuración típica, uno de los campos comprende las líneas con número impar en el cuadro y el otro campo comprende las líneas con número par en el cuadro. El campo que comprende las líneas con número impar se denominará como el campo "superior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. De manera similar, el campo que comprende las líneas con número par se denominará como el campo "inferior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. Los dos campos pueden entrelazarse juntos para formar un cuadro entrelazado.

La idea general detrás de la codificación de vídeo es eliminar datos del contenido de vídeo digital que sean "no esenciales". La cantidad reducida de datos a continuación requiere menos ancho de banda para difusión o transmisión. Después de que se hayan transmitido los datos de vídeo comprimido, deben decodificarse, o descomprimirse. En este proceso, los datos de vídeo transmitido se procesan para generar datos de aproximación que se sustituyen en los datos de vídeo para reemplazar los datos "no esenciales" que se eliminaron en el proceso de codificación.

La codificación de vídeo transforma el contenido de vídeo digital en una forma comprimida que puede almacenarse usando menos espacio y transmitirse usando menos ancho de banda que el contenido de vídeo digital no comprimido. Se hace aprovechando las redundancias temporales y espaciales en las instantáneas del contenido de vídeo. El contenido de vídeo digital puede almacenarse en un medio de almacenamiento tal como un disco duro, DVD o alguna otra unidad de almacenamiento no volátil.

Existen numerosos métodos de codificación de vídeo que comprimen el contenido de vídeo digital. En consecuencia, las normas de codificación de vídeo se han desarrollado para normalizar los diversos métodos de codificación de vídeo de modo que el contenido de vídeo digital comprimido se representa en formatos que puede reconocer una 55 mayoría de codificadores y decodificadores de vídeo. Por ejemplo, el Grupo de Expertos en Imagen en Movimiento (MPEG) y la Unión Internacional de Telecomunicaciones (ITU-T) han desarrollado normas de codificación de vídeo que se usan ampliamente. Ejemplos de estas normas incluyen las normas MPEG-1, MPEG-2, MPEG-4, ITU-T H261 e ITU-T H263.

La mayoría de las normas de codificación de vídeo modernas, tales como aquellas desarrolladas mediante el MPEG y la ITU-T, están basadas en parte en una predicción temporal con algoritmo de compensación de movimiento (MC) . La predicción temporal con compensación de movimiento se usa para eliminar la redundancia temporal entre instantáneas sucesivas en una difusión de vídeo digital.

La predicción temporal con algoritmo de compensación de movimiento utiliza típicamente una o dos instantáneas de referencia para codificar una instantánea particular. Una instantánea de referencia es una instantánea que ya se ha

codificado. Comparando la instantánea particular que se ha de codificar con una de las instantáneas de referencia, la predicción temporal con algoritmo de compensación de movimiento puede aprovechar la redundancia temporal que existe entre la instantánea de referencia y la instantánea particular que se ha de codificar y codificar la instantánea con una cantidad superior de compresión que si la instantánea se codificara sin usar la predicción temporal con algoritmo de compensación de movimiento. Una de las instantáneas de referencia puede estar en la dirección hacia atrás en relación con la instantánea particular que se ha de codificar. La otra instantánea de referencia está en la dirección hacia delante en relación con la instantánea particular que se ha de codificar.

Sin embargo, a medida que aumenta la demanda de resoluciones superiores, el contenido gráfico más complejo y el tiempo de transmisión más rápido, también lo hace la necesidad de mejores métodos de compresión de vídeo. Para este fin, se está desarrollando actualmente una nueva norma de codificación de vídeo conjuntamente mediante la ISO y la ITU-T. Esta nueva norma de codificación de vídeo se denomina la norma MPEG-4 Codificación de Vídeo Avanzada (AVC) / H. 264.

El documento titulado "Adaptive Field/Frame block coding experiment proposal VCEG N-76" ITU-TELECOMMUNICATIONS STANDARDIZATION SECTOR ITU-T Q.S/SG16 VIDEO CODING EXPERT GROUP (VCEG) , 24 de septiembre de 2001 desvela un proyecto de propuesta para codificar o decodificar contenido de vídeo digital.

La Patente de Estados Unidos Nº US 6.226.327 describe un método y aparato de codificación de vídeo que selecciona entre los modos predictivos basados en cuadro y basados en campo. El documento describe predicción basada en cuadro de cada macrobloque. Para la predicción de movimiento basada en campo de los de los macrobloques, un macrobloque y el macrobloque inmediatamente inferior se consideran como un grupo de macrobloques y se produce la predicción de agrupación de macrobloques mediante agrupación de macrobloques.

Sumario de la invención

Se proporciona un método para codificar y decodificar contenido de vídeo digital como se expone en la reivindicación 1 y un aparato como se expone en la reivindicación 13. En una de muchas posibles realizaciones, la presente invención proporciona un método para codificar, decodificar y la generación de flujos de bits de contenido de vídeo digital. El contenido de vídeo digital comprende un flujo de instantáneas que puede ser cada una de intra instantáneas, instantáneas... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para codificar o decodificar contenido de vídeo digital, comprendiendo dicho contenido de vídeo digital un flujo de instantáneas que puede ser cada una de intra instantáneas, instantáneas predichas o bi-predichas, 5 comprendiendo cada una de dichas instantáneas macrobloques, comprendiendo dicho método las etapas de:

seleccionar para codificar o decodificar cada par de macrobloques verticalmente adyacentes en un modo de cuadro o un modo de campo; disponer dicho par de macrobloques en macrobloques de cuadro o macrobloques de campo de acuerdo con el uno seleccionado de dicho modo de cuadro o dicho modo de campo; y codificar o decodificar dichos macrobloques de cuadro o dichos macrobloques de campo, donde la etapa de disponer dicho par de macrobloques en macrobloques de cuadro o macrobloques de campo incluye la etapa de:

en dicho modo de cuadro, procesar conjuntamente dos campos en dicho par de macrobloques, estando dividido dicho par de macrobloques en macrobloques de cuadro, e incluyendo cada uno de dichos macrobloques de cuadro tanto píxeles de campo superior como inferior; en dicho modo de campo, procesar por separado dos campos de dicho par de macrobloques, estando partido dicho par de macrobloques en macrobloques de campo, e incluyendo cada uno de dichos macrobloques de campo píxeles de campo superior o inferior, y donde dichos macrobloques de cuadro y dichos macrobloques de campo son del mismo tamaño.

2. El método de la reivindicación 1, donde cada uno de dichos macrobloques de cuadro y cada uno de dichos macrobloques de campo son de 16 por 16 píxeles.

3. El método de la reivindicación 1 o 2, donde el par de macrobloques es de 32 por 16 píxeles.

4. El método de una cualquiera de las reivindicaciones 1 a 3, donde al menos uno de dichos macrobloques de campo o dichos macrobloques de cuadro se divide adicionalmente en bloques con tamaño más pequeño incluyendo los mismos posibles tamaños de bloque en el modo de cuadro o el modo de campo, los bloques con tamaño más pequeño son para uso en la predicción temporal con compensación de movimiento.

5. El método de la reivindicación 4, donde los bloques con tamaño más pequeño incluyen 16 por 8 píxeles, 8 por 16 píxeles, 8 por 8 píxeles, 8 por 4 píxeles, 4 por 8 píxeles o 4 por 4 píxeles.

6. El método de la reivindicación 1, 2 o 3, donde al menos uno de dichos macrobloques de cuadro o de campo se divide adicionalmente en bloques con tamaño más pequeño, incluyendo los bloques con tamaño más pequeño 16 por 8 píxeles, 8 por 16 píxeles, 8 por 8 píxeles, 8 por 4 píxeles, 4 por 8 píxeles o 4 por 4 píxeles.

7. El método de la reivindicación 4, 5 o 6, que comprende adicionalmente calcular vectores de predicción de 40 movimiento para dichos bloques con tamaño más pequeño.

8. El método de una cualquiera de las reivindicaciones 1 a 7, que comprende adicionalmente usar una bandera de cuadro/campo para el par de macrobloques para indicar modo de cuadro o modo de campo.

9. El método de una cualquiera de las reivindicaciones 1 a 8, donde la selección para codificar o decodificar en un modo de cuadro o un modo de campo incluye codificar o decodificar en una instantánea.

10. El método de la reivindicación 1, que comprende adicionalmente codificar dicho macrobloque de cuadro o dicho macrobloque de campo en modo directo en dichas instantáneas bi-predichas. 50

11. El método de la reivindicación 1, que comprende adicionalmente predecir de manera espacial valores de píxeles para dicho macrobloque de cuadro o dicho macrobloque de campo en dichas intra instantáneas, dichas instantáneas predichas o dichas instantáneas bi-predichas.

12. El método de la reivindicación 1, que comprende adicionalmente predecir temporalmente valores de píxeles para dicho macrobloque de cuadro o dicho macrobloque de campo en dichas instantáneas predichas o dichas instantáneas bi-predichas.

13. Aparato adaptado para realizar las etapas del método como se indican en cualquier reivindicación anterior. 60