Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Un método para codificar una instantánea en una secuencia de imágenes,

que comprende:

dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dichas porciones más pequeñas es un par de macrobloques verticalmente adyacentes;

codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en un momento en, modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de codificación de campo; y

codificar de manera selectiva al menos un bloque en dicha al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de intra codificación.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10182624.

Solicitante: Google Technology Holdings LLC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1600 AMPHITHEATRE PARKWAY MOUNTAIN VIEW, CA 94043 ESTADOS UNIDOS DE AMERICA.

Inventor/es: LUTHRA, AJAY, PANUSOPONE,KRIT, WANG,LIMIN, GANDHI,RAJEEV.

Fecha de Publicación: 9 de Septiembre de 2015.

Clasificación Internacional de Patentes:

H04N19/10 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › utilizando codificación adaptativa.

PDF original: ES-2548384_T3.pdf

Ilustración 1 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 2 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 3 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 4 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ver la galería de la patente con 8 ilustraciones.

Fragmento de la descripción:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital Campo técnico

La presente invención se refiere a codificación y decodificación de contenido de video digital. Más específicamente, la presente invención se refiere a codificación de modo de cuadro y de modo de campo de contenido de vídeo digital a un nivel de macrobloques como se usa en la norma de codificación de vídeo de la norma MPEG-4 Parte 10

AVC/H.264.

Antecedentes

La compresión de vídeo se usa en muchos productos actuales y emergentes. Está en el corazón de los receptores de salón de televisión digital (STB), sistemas de satélite digital (DSS), decodificadores de televisión de alta definición (HDTV), reproductores de disco versátil digital (DVD), videoconferencia, contenido de vídeo y multimedia de internet y otras aplicaciones de vídeo digital. Sin la compresión de vídeo, el contenido de vídeo digital puede ser extremadamente grande, haciendo difícil o incluso imposible que se almacene, transmita o visualice eficazmente el contenido de vídeo digital.

El contenido de vídeo digital comprende un flujo de instantáneas que pueden presentarse como una imagen en un receptor de televisión, monitor de ordenador o algún otro dispositivo electrónico que pueda presentar contenido de vídeo digital. Una instantánea que se presenta en el tiempo antes de una instantánea particular está en la "dirección hacia atrás" en relación con la instantánea particular. De manera similar, una instantánea que se presenta en el tiempo después de una instantánea particular está en la "dirección hacia delante" en relación con la instantánea particular.

La compresión de vídeo se consigue en un proceso de codificación en el que cada instantánea se codifica como un cuadro o como dos campos. Cada cuadro comprende un número de líneas de información espacial. Por ejemplo, un cuadro típico contiene 480 líneas horizontales. Cada campo contiene la mitad del número de líneas en el cuadro. Por ejemplo, si el cuadro comprende 480 líneas horizontales, cada campo comprende 240 líneas horizontales. En una configuración típica, uno de los campos comprende las líneas con número impar en el cuadro y el otro campo comprende las líneas con número par en el cuadro. El campo que comprende las líneas con número impar se denominará como el campo "superior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. De manera similar, el campo que comprende las líneas con número par se denominará como el campo "inferior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. Los dos campos pueden entrelazarse juntos para formar un cuadro entrelazado.

La idea general detrás de la codificación de vídeo es eliminar datos del contenido de vídeo digital que sean "no esenciales". La cantidad reducida de datos a continuación requiere menos ancho de banda para difusión o transmisión. Después de que se hayan transmitido los datos de vídeo comprimido, deben decodificarse, o descomprimirse. En este proceso, los datos de vídeo transmitido se procesan para generar datos de aproximación que se sustituyen en los datos de vídeo para reemplazar los datos "no esenciales" que se eliminaron en el proceso de codificación.

La codificación de vídeo transforma el contenido de vídeo digital en una forma comprimida que puede almacenarse usando menos espacio y transmitirse usando menos ancho de banda que el contenido de vídeo digital no comprimido. Se hace aprovechando las redundancias temporales y espaciales en las instantáneas del contenido de vídeo. El contenido de vídeo digital puede almacenarse en un medio de almacenamiento tal como un disco duro, DVD o alguna otra unidad de almacenamiento no volátil.

Existen numerosos métodos de codificación de vídeo que comprimen el contenido de vídeo digital. En consecuencia, las normas de codificación de vídeo se han desarrollado para normalizar los diversos métodos de codificación de vídeo de modo que el contenido de vídeo digital comprimido se representa en formatos que puede reconocer una mayoría de codificadores y decodificadores de vídeo. Por ejemplo, el Grupo de Expertos en Imagen en Movimiento (MPEG) y la Unión Internacional de Telecomunicaciones (ITU-T) han desarrollado normas de codificación de vídeo que se usan ampliamente. Ejemplos de estas normas incluyen las normas MPEG-1, MPEG-2, MPEG-4, ITU-T H261 e ITU-T H263.

La mayoría de las normas de codificación de vídeo modernas, tales como aquellas desarrolladas mediante el MPEG y la ITU-T, están basadas en parte en una predicción temporal con algoritmo de compensación de movimiento (MC). La predicción temporal con compensación de movimiento se usa para eliminar la redundancia temporal entre instantáneas sucesivas en una difusión de vídeo digital.

La predicción temporal con algoritmo de compensación de movimiento utiliza típicamente una o dos instantáneas de referencia para codificar una instantánea particular. Una instantánea de referencia es una instantánea que ya se ha

codificado. Comparando la instantánea particular que se ha de codificar con una de las instantáneas de referencia, la predicción temporal con algoritmo de compensación de movimiento puede aprovechar la redundancia temporal que existe entre la instantánea de referencia y la instantánea particular que se ha de codificar y codificar la instantánea con una cantidad superior de compresión que si la instantánea se codificara sin usar la predicción temporal con algoritmo de compensación de movimiento. Una de las instantáneas de referencia puede estar en la dirección hacia atrás en relación con la instantánea particular que se ha de codificar. La otra instantánea de referencia está en la dirección hacia delante en relación con la instantánea particular que se ha de codificar.

Sin embargo, a medida que aumenta la demanda de resoluciones superiores, el contenido gráfico más complejo y el tiempo de transmisión más rápido, también lo hace la necesidad de mejores métodos de compresión de vídeo. Para este fin, se está desarrollando actualmente una nueva norma de codificación de vídeo conjuntamente mediante la ISO y la ITU-T. Esta nueva norma de codificación de vídeo se denomina la norma MPEG-4 Codificación de Vídeo Avanzada (AVC) / H. 264.

El documento de P. BORGWARDT: "Core Experiment on Interlaced Video coding VCEG-N85" ITU - TELECOMMUNICATIONS STANDARDIZATION SECTOR ITU-T Q.6/SG16 VIDEO CODING EXPERT GROUP (VCEG), 24 de septiembre de 2001, páginas 1-10, evalúa diferentes cambios de sintaxis a exploración de campo entrelazado. Analiza la exploración de campo entrelazado junto con codificación de cuadro/campo adaptativa de macrobloques.

Un artículo titulado `Hybrid extended MPEG video coding algorithm for general video applications por Chen-Tie Chen et al. en Signal Processing: Image Communication 5 (1993) páginas 21-27, Elsevier Science Publishers B.V. describe un esquema de codificación de DCT/DPCM híbrido originalmente basado en un algoritmo de MPEG1 modificado para instantáneas de resolución CCIR601 entrelazadas codificadas a tasas superiores. Las características del algoritmo incluyen predicción e interpolación compensada de movimiento basada en campo, codificación y cuantificación de DCT basada en cuadro, asignación de bits y asignación de cuantificador de cuadro optimizada, y tablas de código de Huffman adaptativas para coeficientes de transformación.

La Patente de Estados Unidos N° US 6.226.327 describe un método y aparato de codificación de vídeo que selecciona entre los modos predictivos basados en cuadro y basados en campo. El documento describe predicción basada en cuadro de cada macrobloque. Para la predicción de movimiento basada en campo de los de los macrobloques, un macrobloque y el macrobloque inmediatamente inferior se consideran como un grupo de macrobloques y se produce la predicción de agrupación de macrobloques mediante agrupación de macrobloques.

Sumario de la invención

De acuerdo con los aspectos de la invención, se proporciona un método para codificar, un método para decodificar, un aparato para codificar y un aparato para decodificar, como se indica en las reivindicaciones adjuntas. En una de muchas posibles realizaciones, la presente invención proporciona un método para codificar, decodificar y la generación de flujos de bits de contenido de vídeo digital. El contenido de vídeo digital comprende un flujo de instantáneas que puede ser cada una de intra instantáneas, instantáneas predichas o bi-predichas. Cada una de las instantáneas comprende macrobloques que pueden dividirse adicionalmente... [Seguir leyendo]

Reivindicaciones:

1. Un método para codificar una instantánea en una secuencia de imágenes, que comprende:

dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dichas porciones más pequeñas es un par de macrobloques verticalmente adyacentes;

codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en un momento en, modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de codificación de campo; y

codificar de manera selectiva al menos un bloque en dicha al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de intra codificación.

2. El método de la reivindicación 1, donde dicho modo de intra codificación emplea codificación espacialmente predictiva para un bloque actual de acuerdo con una pluralidad de bloques vecinos a dicho bloque actual.

3. Un aparato para codificar una instantánea en una secuencia de imágenes, que comprende:

medios para dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dichas porciones más pequeñas es un par de macrobloques verticalmente adyacentes;

medios para codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de codificación de campo; y

medios para codificar de manera selectiva al menos un bloque en al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de intra codificación.

4. El aparato de la reivindicación 3, donde dicho modo de intra codificación emplea codificación espacialmente predictiva para un bloque actual de acuerdo con una pluralidad de bloques vecinos a dicho bloque actual.

5. Un método para decodificar una instantánea codificada que tiene una pluralidad de porciones más pequeñas desde un flujo de bits, que comprende:

decodificar de manera selectiva al menos una de una pluralidad de porciones más pequeñas en un momento en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en un momento en modo de codificación de campo, donde cada una de dichas porciones más pequeñas es un par de macrobloques verticalmente adyacentes, donde al menos un bloque en dicha al menos una de dicha pluralidad de porciones más pequeñas se codifica en modo de intra codificación en un momento; y usar dicha pluralidad de porciones más pequeñas decodificadas para construir una instantánea decodificada.

6. El método de la reivindicación 5, donde dicho modo de intra codificación emplea codificación espacialmente predictiva para un bloque actual de acuerdo con una pluralidad de bloques vecinos a dicho bloque actual.

7. El método de la reivindicación 5, donde un tamaño de dicho bloque actual se selecciona de acuerdo con cualquier tamaño de bloque definido en transformaciones de bloque adaptativas.

8. El método de la reivindicación 6, donde para dicho bloque actual, dichos bloques vecinos comprenden al menos uno de un bloque vecino que es izquierdo de dicho bloque actual a codificar y un bloque vecino que está por encima de dicho bloque actual a codificar.

9. El método de la reivindicación 8, donde una de una pluralidad de direcciones de predicción se considera que es un modo más probable para dicho bloque actual.

10. El método de la reivindicación 9, que comprende adicionalmente: recibir al menos una palabra de código en dicho flujo de bits, donde dicha al menos una palabra de código indica si se usa dicho modo de codificación de predicción más probable.

11. El método de la reivindicación 9, donde dicho modo de predicción más probable para un bloque actual se selecciona de acuerdo con un bloque vecino que es izquierdo de dicho bloque actual a codificar y un bloque vecino que está por encima de dicho bloque actual a codificar, donde si uno de dichos bloques vecinos está fuera de un sector, entonces dicho modo de predicción más probable para dicho bloque actual es predicción DC, y donde si ambos de dichos bloques vecinos están dentro de dicho sector, entonces dicho modo de predicción más probable para dicho bloque actual se selecciona de acuerdo con un mínimo de modos de predicción usados para dicho bloque vecino izquierdo y dicho bloque vecino superior.

12. Un aparato para decodificar una instantánea codificada desde un flujo de bits, que comprende

medios para decodificar de manera selectiva al menos una de una pluralidad de porciones más pequeñas en un momento de la instantánea codificada que se codifica en modo de codificación de cuadro y al menos una de dicha

pluralidad de porciones más pequeñas en un momento de la instantánea codificada en modo de codificación de campo, donde cada una de dichas porciones más pequeñas es un par de macrobloques verticalmente adyacentes, donde al menos un bloque en al menos una de dicha pluralidad de porciones más pequeñas se codifica en modo de intra codificación en un momento; y

5 medios para usar dicha pluralidad de porciones más pequeñas decodificadas para construir una instantánea decodificada.

13. El aparato de la reivindicación 12, donde el al menos un bloque se divide adicionalmente en bloques con tamaño más pequeño que incluyen los mismos tamaños de bloque posibles en el modo de codificación de cuadro o el modo

10 de codificación de campo, los bloques con tamaño más pequeño son para uso en codificación espacialmente predictiva.

14. El aparato de una cualquiera de las reivindicaciones 12 a 13, donde el al menos un bloque es para uso en codificación espacialmente predictiva con un tamaño de bloque que incluye 16 por 16 píxeles o 4 por 4 píxeles.

15. El aparato de una cualquiera de las reivindicaciones 12 a 14, donde cada una de la pluralidad de porciones más pequeñas desde el flujo de bits se asocia con una bandera de cuadro/campo, indicando la bandera de cuadro/campo modo de codificación de cuadro o modo de codificación de campo.

Patentes similares o relacionadas:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 26 de Agosto de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imágenes, que comprende: dividir dicha instantánea en una pluralidad de porciones […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 29 de Julio de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imágenes, que comprende: dividir dicha instantánea en una pluralidad de pares […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 22 de Julio de 2015, de Google Technology Holdings LLC: Un método para codificar o decodificar contenido de vídeo digital, comprendiendo dicho contenido de vídeo digital un flujo de instantáneas que puede […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 22 de Julio de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imagen, que comprende: dividir dicha instantánea en una pluralidad de porciones más pequeñas, […]

Modo truco en fotogramas predictivos bidireccionales, del 23 de Julio de 2014, de THOMSON LICENSING: Un método para llevar a cabo una congelación de imagen en modo truco en una señal de vídeo, que incluye los pasos de: - recibir una instrucción de congelación de […]