Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Un método para codificar una instantánea en una secuencia de imagen,

que comprende:

dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dicha pluralidad de porciones más pequeñas es un par de macrobloques verticalmente adyacentes; y

codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de campo,

donde ambos campos de cada uno de dichos macrobloques se codifican conjuntamente si se selecciona dicho modo de codificación de cuadro.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10182726.

Solicitante: Google Technology Holdings LLC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1600 AMPHITHEATRE PARKWAY MOUNTAIN VIEW, CA 94043 ESTADOS UNIDOS DE AMERICA.

Inventor/es: LUTHRA, AJAY, PANUSOPONE,KRIT, WANG,LIMIN, GANDHI,RAJEEV.

Fecha de Publicación: 22 de Julio de 2015.

Clasificación Internacional de Patentes:

H04N19/10 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › utilizando codificación adaptativa.

PDF original: ES-2545213_T3.pdf

Ilustración 1 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 2 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 3 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ilustración 4 de Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital.

Ver la galería de la patente con 8 ilustraciones.

Fragmento de la descripción:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital

Campo técnico

La presente invención se refiere a codificación y decodificación de contenido de vídeo digital. Más específicamente, la presente invención se refiere a codificación de modo de cuadro y de modo de campo de contenido de vídeo digital a un nivel de macrobloques como se usa en la norma de codificación de vídeo de la norma MPEG-4 Parte 10 AVC/H.264.

Antecedentes La compresión de vídeo se usa en muchos productos actuales y emergentes. Está en el corazón de los receptores de salón de televisión digital (STB) , sistemas de satélite digital (DSS) , decodificadores de televisión de alta definición (HDTV) , reproductores de disco versátil digital (DVD) , videoconferencia, contenido de vídeo y multimedia de internet y otras aplicaciones de vídeo digital. Sin la compresión de vídeo, el contenido de vídeo digital puede ser extremadamente grande, haciendo difícil o incluso imposible que se almacene, transmita o visualice eficazmente el contenido de vídeo digital.

El contenido de vídeo digital comprende un flujo de instantáneas que pueden presentarse como una imagen en un receptor de televisión, monitor de ordenador o algún otro dispositivo electrónico que pueda presentar contenido de vídeo digital. Una instantánea que se presenta en el tiempo antes de una instantánea particular está en la "dirección hacia atrás" en relación con la instantánea particular. De manera similar, una instantánea que se presenta en el tiempo después de una instantánea particular está en la "dirección hacia delante" en relación con la instantánea particular.

La compresión de vídeo se consigue en un proceso de codificación en el que cada instantánea se codifica como un cuadro o como dos campos. Cada cuadro comprende un número de líneas de información espacial. Por ejemplo, un cuadro típico contiene 480 líneas horizontales. Cada campo contiene la mitad del número de líneas en el cuadro. Por ejemplo, si el cuadro comprende 480 líneas horizontales, cada campo comprende 240 líneas horizontales. En una configuración típica, uno de los campos comprende las líneas con número impar en el cuadro y el otro campo comprende las líneas con número par en el cuadro. El campo que comprende las líneas con número impar se denominará como el campo "superior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. De manera similar, el campo que comprende las líneas con número par se denominará como el campo "inferior" en lo sucesivo y en las reivindicaciones adjuntas, a menos que se indique específicamente de otra manera. Los dos campos pueden entrelazarse juntos para formar un cuadro entrelazado.

La idea general detrás de la codificación de vídeo es eliminar datos del contenido de vídeo digital que sean "no esenciales". La cantidad reducida de datos a continuación requiere menos ancho de banda para difusión o transmisión. Después de que se hayan transmitido los datos de vídeo comprimido, deben decodificarse, o descomprimirse. En este proceso, los datos de vídeo transmitido se procesan para generar datos de aproximación que se sustituyen en los datos de vídeo para reemplazar los datos "no esenciales" que se eliminaron en el proceso de codificación.

La codificación de vídeo transforma el contenido de vídeo digital en una forma comprimida que puede almacenarse usando menos espacio y transmitirse usando menos ancho de banda que el contenido de vídeo digital no comprimido. Se hace aprovechando las redundancias temporales y espaciales en las instantáneas del contenido de vídeo. El contenido de vídeo digital puede almacenarse en un medio de almacenamiento tal como un disco duro, DVD o alguna otra unidad de almacenamiento no volátil.

Existen numerosos métodos de codificación de vídeo que comprimen el contenido de vídeo digital. En consecuencia, las normas de codificación de vídeo se han desarrollado para normalizar los diversos métodos de codificación de vídeo de modo que el contenido de vídeo digital comprimido se representa en formatos que puede reconocer una 55 mayoría de codificadores y decodificadores de vídeo. Por ejemplo, el Grupo de Expertos en Imagen en Movimiento (MPEG) y la Unión Internacional de Telecomunicaciones (ITU-T) han desarrollado normas de codificación de vídeo que se usan ampliamente. Ejemplos de estas normas incluyen las normas MPEG-1, MPEG-2, MPEG-4, ITU-T H261 e ITU-T H263.

La mayoría de las normas de codificación de vídeo modernas, tales como aquellas desarrolladas mediante el MPEG y la ITU-T, están basadas en parte en una predicción temporal con algoritmo de compensación de movimiento (MC) . La predicción temporal con compensación de movimiento se usa para eliminar la redundancia temporal entre instantáneas sucesivas en una difusión de vídeo digital.

La predicción temporal con algoritmo de compensación de movimiento utiliza típicamente una o dos instantáneas de referencia para codificar una instantánea particular. Una instantánea de referencia es una instantánea que ya se ha

codificado. Comparando la instantánea particular que se ha de codificar con una de las instantáneas de referencia, la predicción temporal con algoritmo de compensación de movimiento puede aprovechar la redundancia temporal que existe entre la instantánea de referencia y la instantánea particular que se ha de codificar y codificar la instantánea con una cantidad superior de compresión que si la instantánea se codificara sin usar la predicción temporal con algoritmo de compensación de movimiento. Una de las instantáneas de referencia puede estar en la dirección hacia atrás en relación con la instantánea particular que se ha de codificar. La otra instantánea de referencia está en la dirección hacia delante en relación con la instantánea particular que se ha de codificar.

Sin embargo, a medida que aumenta la demanda de resoluciones superiores, el contenido gráfico más complejo y el tiempo de transmisión más rápido, también lo hace la necesidad de mejores métodos de compresión de vídeo. Para este fin, se está desarrollando actualmente una nueva norma de codificación de vídeo conjuntamente mediante la ISO y la ITU-T. Esta nueva norma de codificación de vídeo se denomina la norma MPEG-4 Codificación de Vídeo Avanzada (AVC) / H. 264.

El documento P.BORGWARDT: "Core Experiment on Interlaced Video coding VCEG-N85" ITU -TELECOMMUNICATIONS STANDARDIZATION SECTOR ITU-T Q.6/SG16 VIDEO CODING EXPERT GROUP (VCEG) , 24 de septiembre de 2001, páginas 1-10, evalúa diferentes cambios de sintaxis a exploración de campo entrelazado. Analiza exploración de campo entrelazado junto con codificación adaptativa de cuadro/campo de macrobloques.

Un artículo titulado `Hybrid extended MPEG video coding algorithm for general video applications por Chen-Tie Chen et al., en Signal Processing: Image Communication 5 (1993) páginas 21-27, Elsevier Science Publishers B.V. describe un esquema de codificación DCT/DPCM híbrido originalmente basado en un algoritmo MPEG1 modificado para instantáneas de resolución CCIR601 entrelazadas codificadas a tasas superiores. Las características del algoritmo incluyen predicción e interpolación compensadas de movimiento basado en campo, codificación y cuantificación DCT basada en cuadro, asignación de bits de cuadro y asignación de cuantificador optimizadas y tablas de código de Huffman adaptativas para coeficientes de transformación.

La Patente de Estados Unidos Nº US 6.226.327 describe un método y aparato de codificación de vídeo que selecciona entre los modos predictivos basados en cuadro y basados en campo. El documento describe predicción basada en cuadro de cada macrobloque. Para la predicción de movimiento basada en campo de los de los macrobloques, un macrobloque y el macrobloque inmediatamente inferior se consideran como un grupo de macrobloques y se produce la predicción de agrupación de macrobloques mediante agrupación de macrobloques.

Sumario de la invención

De acuerdo con aspectos de la invención, se proporciona un método para codificar, un método para decodificar, un aparato para codificar y un aparato para decodificar, como se indica en las reivindicaciones adjuntas. En una de muchas posibles realizaciones, la presente invención proporciona un método para codificar, decodificar y la generación de flujos de bits de contenido de vídeo digital. El contenido de vídeo digital comprende un flujo de instantáneas que puede ser cada una de intra instantáneas, instantáneas predichas o bi-predichas. Cada una de las instantáneas comprende macrobloques que pueden dividirse... [Seguir leyendo]

Reivindicaciones:

1. Un método para codificar una instantánea en una secuencia de imagen, que comprende:

dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dicha pluralidad de porciones más pequeñas es un par de macrobloques verticalmente adyacentes; y codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de campo, donde ambos campos de cada uno de dichos macrobloques se codifican conjuntamente si se selecciona dicho modo de codificación de cuadro.

2. El método de la reivindicación 1, que comprende adicionalmente: formar dicho par de macrobloques a partir de un bloque de campo superior y un bloque de campo inferior cuando dicho par de macrobloques se ha de codificar en 15 dicho modo de codificación de campo.

3. El método de la reivindicación 2, donde dicha etapa de formación comprende:

tomar una porción superior de dicho bloque de campo superior para formar un campo superior de un primer macrobloque de dicho par de macrobloques; tomar una porción inferior de dicho bloque de campo superior para formar un campo superior de un segundo macrobloque de dicho par de macrobloques; tomar una porción superior de dicho bloque de campo inferior para formar un campo inferior de un primer macrobloque de dicho par de macrobloques; y tomar una porción inferior de dicho bloque de campo inferior para formar un campo inferior de un segundo macrobloque de dicho par de macrobloques.

4. Un método para decodificar una instantánea codificada que tiene una pluralidad de porciones más pequeñas a partir de un flujo de bits, que comprende:

decodificar al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de campo, donde cada una de dicha pluralidad de porciones más pequeñas es un par de macrobloques verticalmente adyacentes; y usar dicha pluralidad de porciones más pequeñas decodificadas para construir una instantánea decodificada, donde ambos campos de cada uno de dichos macrobloques se decodifican conjuntamente si se selecciona dicho modo de codificación de cuadro.

5. El método de la reivindicación 4, que comprende adicionalmente: formar dicho par de macrobloques a partir de un bloque de campo superior y un bloque de campo inferior cuando dicho par de macrobloques se codifica en dicho modo de codificación de campo.

6. El método de la reivindicación 5, donde dicha etapa de formación comprende:

tomar una porción superior de dicho bloque de campo superior para formar un campo superior de un primer 45 macrobloque de dicho par de macrobloques; tomar una porción inferior de dicho bloque de campo superior para formar un campo superior de un segundo macrobloque de dicho par de macrobloques; tomar una porción superior de dicho bloque de campo inferior para formar un campo inferior de un primer macrobloque de dicho par de macrobloques; y tomar una porción inferior de dicho bloque de campo inferior para formar un campo inferior de un segundo macrobloque de dicho par de macrobloques.

7. Un aparato para codificar una instantánea en una secuencia de imagen, que comprende:

medios para dividir dicha instantánea en una pluralidad de porciones más pequeñas, donde cada una de dicha pluralidad de porciones más pequeñas es un par de macrobloques verticalmente adyacentes; y medios para codificar de manera selectiva al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de campo, donde dicha codificación se aplica a un par de macrobloques, y donde ambos campos de cada uno de dichos macrobloques se codifican conjuntamente si se selecciona dicho modo de codificación de cuadro.

8. El aparato de la reivindicación 7, que comprende adicionalmente:

medios para formar dicho par de macrobloques a partir de un bloque de campo superior y un bloque de campo 16

inferior cuando dicho par de macrobloques se codifica en dicho modo de codificación de campo.

9. El aparato de la reivindicación 8, donde dichos medios para formar toman una porción superior de dicho bloque de campo superior para formar un campo superior de un primer macrobloque de dicho par de macrobloques, y toman una porción inferior de dicho bloque de campo superior para formar un campo superior de un segundo macrobloque de dicho par de macrobloques, y toman una porción superior de dicho bloque de campo inferior para formar un campo inferior de un primer macrobloque de dicho par de macrobloques, y toman una porción inferior de dicho bloque de campo inferior para formar un campo inferior de un segundo macrobloque de dicho par de macrobloques.

10. Un aparato para decodificar una instantánea codificada que tiene una pluralidad de porciones más pequeñas a partir de un flujo de bits, que comprende:

medios para decodificar al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de cuadro y al menos una de dicha pluralidad de porciones más pequeñas en modo de codificación de campo, donde cada una de dicha pluralidad de porciones más pequeñas es un par de macrobloques verticalmente adyacentes; y medios para usar dicha pluralidad de porciones más pequeñas decodificadas para construir una instantánea decodificada, donde ambos campos de cada uno de dichos macrobloques se decodifican conjuntamente si se selecciona dicho modo de codificación de cuadro.

11. El aparato de la reivindicación 10, que comprende adicionalmente:

medios para formar dicho par de macrobloques a partir de un bloque de campo superior y un bloque de campo 25 inferior cuando dicho par de macrobloques se codifica en dicho modo de codificación de campo.

12. El aparato de la reivindicación 11, donde dichos medios para formar toman una porción superior de dicho bloque de campo superior para formar un campo superior de un primer macrobloque de dicho par de macrobloques, y toman una porción inferior de dicho bloque de campo superior para formar un campo superior de un segundo macrobloque de dicho par de macrobloques, y toman una porción superior de dicho bloque de campo inferior para formar un campo inferior de un primer macrobloque de dicho par de macrobloques, y toman una porción inferior de dicho bloque de campo inferior para formar un campo inferior de un segundo macrobloque de dicho par de macrobloques.

13. El aparato de una cualquiera de las reivindicaciones 10 a 12, donde al menos uno de dicha pluralidad de pares de macrobloques incluye bloques que incluyen los mismos posibles tamaños de bloque en el modo de codificación de cuadro o el modo de codificación de campo, los bloques son para uso en predicción temporal con compensación de movimiento.

14. El aparato de una cualquiera de las reivindicaciones 10 a 13, donde al menos uno de dicha pluralidad de pares de macrobloques incluye bloques que tienen un tamaño de bloque que incluye 16 por 16 píxeles, 16 por 8 píxeles, 8 por 16 píxeles, 8 por 8 píxeles, 8 por 4 píxeles, 4 por 8 píxeles o 4 por 4 píxeles en modo de codificación de campo o en modo de codificación de cuadro.

15. El aparato de una cualquiera de las reivindicaciones 10 a 14, donde al menos un bloque a partir de al menos uno de dicha pluralidad de pares de macrobloques es para uso en predicción temporal con compensación de movimiento con un tamaño de bloque que incluye 16 por 16 píxeles, 16 por 8 píxeles, 8 por 16 píxeles, 8 por 8 píxeles, 8 por 4 píxeles, 4 por 8 píxeles o 4 por 4 píxeles.

16. El aparato de una cualquiera de las reivindicaciones 10 a 15, donde al menos uno de dicha pluralidad de pares de macrobloques está asociado con una bandera de cuadro/campo, indicando la bandera de cuadro/campo modo de codificación de cuadro o modo de codificación de campo.

Patentes similares o relacionadas:

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 9 de Septiembre de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imágenes, que comprende: dividir dicha instantánea en una pluralidad de porciones más […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 26 de Agosto de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imágenes, que comprende: dividir dicha instantánea en una pluralidad de porciones […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 29 de Julio de 2015, de Google Technology Holdings LLC: Un método para codificar una instantánea en una secuencia de imágenes, que comprende: dividir dicha instantánea en una pluralidad de pares […]

Codificación de cuadro/campo adaptativa de nivel de macrobloques para contenido de vídeo digital, del 22 de Julio de 2015, de Google Technology Holdings LLC: Un método para codificar o decodificar contenido de vídeo digital, comprendiendo dicho contenido de vídeo digital un flujo de instantáneas que puede […]

Modo truco en fotogramas predictivos bidireccionales, del 23 de Julio de 2014, de THOMSON LICENSING: Un método para llevar a cabo una congelación de imagen en modo truco en una señal de vídeo, que incluye los pasos de: - recibir una instrucción de congelación de […]