COMPENSACION DE MOVIMIENTO GLOBAL PARA IMAGENES DE VIDEO.

Un método para la descompresión de datos de video para cuadros de video que comprenden una pluralidad de bloques de imagen,

en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjunto a partir de un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el método comprende las operacio- nes de: descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual en el que la corriente de bits de datos es descodificada de acuerdo a un modo IGMC o de acuerdo al modo copy, en el que dicho modo IGMC com- prende: predecir un vector de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el bloque de imagen codificado copiando desde un cuadro anterior un bloque adjunto dislocado por el vector de movimiento predicho

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2002/002206.

Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: ERICSSON AB PATENT UNIT SERVICE LAYER & MULTIMEDIA TORSHAMNSGATAN 21-23 S-164 80 STOCKHOLM SUECIA.

Inventor/es: FROJDH,PER, SJOBERG,RICKARD, EINARSSON,TORBJORN.

Fecha de Publicación: 30 de Noviembre de 2010.

Fecha Solicitud PCT: 29 de Noviembre de 2002.

Fecha Concesión Europea: 30 de Junio de 2010.

Clasificación PCT:

H04N7/26

Clasificación antigua:

H04N7/26

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

COMPENSACION DE MOVIMIENTO GLOBAL PARA IMAGENES DE VIDEO.

Fragmento de la descripción:

ANTECEDENTES DEL INVENTO

El invento descrito y reivindicado aquí pertenece generalmente a un método para la compresión de datos de señal de vídeo. Más particularmente, el invento pertenece a un método del tipo anterior que emplea la compensación de movimiento global. Incluso más particularmente, algunas realizaciones del invento pertenecen a un método del tipo anterior en el que macrobloques son agrupados en rebanadas y la información de la compensación de movimiento global es transmitida con rebanadas codificadas.

Se ha anticipado que podrían usarse realizaciones del invento en conexión con descodificadores de televisión de señales de TV digital de definición estándar (SDTV) y de alta definición (HDTV), como una parte de sistemas de videoconferencias, y en ordenadores, incluyendo ordenadores personales (PC), ordenadores portátiles y similares para descodificar video. Las realizaciones podrían ser también usadas en dispositivos móviles tales como teléfonos móviles y agendas electrónicas (PDA), como una parte de un descodificador en un proyector de cine digital, y en grabadores, reproductores de video y sistemas de entretenimiento domésticos. Sin embargo, no se ha pretendido limitar el invento a tales realizaciones.

Las señales de video digital, en forma no comprimida, contienen típicamente grandes cantidades de datos. Sin embargo, el contenido de información necesaria real es considerablemente menor debido a correlaciones temporales y espaciales elevadas. Por consiguiente, la compresión de video, o codificación, es usada para reducir la cantidad de datos que es realmente requerida para ciertas tareas, tales como almacenamiento de las señales de video o para transmitirlas desde un lugar a otro. En el proceso de codificación puede usarse la redundancia temporal haciendo predicciones denominadas de movimiento compensado, dónde regiones de un cuadro de video son predichas a partir de regiones similares de un cuadro previo. Es decir, pueden ser partes de un cuadro que contiene pequeños cambios o que no contiene ningún cambio de las partes correspondientes del cuadro previo. Tales regiones pueden ser así omitidas o no codificadas, con el fin de maximizar la eficiencia de compresión. Por otro lado, si no puede encontrarse una buena coincidencia con un cuadro previo, pueden usarse predicciones dentro de un cuadro para reducir la redundancia espacial. Con un esquema de predicción satisfactorio, el error de predicción será pequeño y la cantidad de información que ha de ser codificada será reducida ampliamente. Además, transformando los píxel (elementos de imagen) a un dominio de frecuencia, por ejemplo, usando la transformación de coseno discreta, las correlaciones espaciales proporcionan ganancias de eficiencia adicionales.

Aquí, los términos “imagen” y “cuadro” son usados de forma intercambiable para referirse a un cuadro de datos de imagen en una secuencia de video.

Las correlaciones temporales elevadas son características del video. De ahí, mucho esfuerzo en la optimización de la compresión de video está focalizado en hacer predicciones temporales exactas de regiones de un cuadro. Cuanto mejor es la predicción menos bits son necesarios para codificar la discrepancia. La propia predicción es codificada como instrucciones de cómo traducir, o incluso escalar o rotar, una región codificada previamente. Si muchas regiones de un cuadro tienen un movimiento similar, tal como en una panorámica o zum, otras mejoras en la eficiencia de compresión pueden resultar de codificar un movimiento global por separado, que a continuación se aplica a todas o a algunas regiones del cuadro. Esta técnica es a menudo denominada como una compensación de movimiento global (GMC).

Hay varias razones, sin embargo, por las que no se debería acceder al cuadro entero cuando se ha usado la compensación de movimiento global. La primera razón es la resistencia al error. Con el fin de impedir la propagación de errores desde la partes corrompidas de una imagen, la predicción es a menudo restringida dentro de segmentos limitados denominados rebanadas. Cada rebanada de un cuadro debería por ello estar autocontenida con respecto a la información de movimiento global. Otra razón es que la compensación de movimiento global puede no ser relevante para un cuadro entero, incluso aunque partes menores del cuadro puedan beneficiarse de la compensación de movimiento global aplicada a cada parte de forma separada.

Codificación de imagen fija frente a compensación de movimiento

Un códec de video típico, tal como Recomendaciones de ITU-T, H.261 y H.263, parte 2 de MPEG-1, parte 2 de MPEG-2 (H.262), o parte 2 de MPEG-4, funciona codificando secuencialmente una secuencia de video cuadro a cuadro. Un cuadro está además dividido en bloques que son codificados secuencialmente fila por fila, empezando en la esquina superior izquierda y terminando en la esquina inferior derecha. Un tamaño de bloque típico es el de un macrobloque (MB) que cubre 16x16 píxel de luminancia.

El primer cuadro en la secuencia es codificado como una imagen fija, denominada intra-cuadros. Tal cuadro es autocontenido y no depende de cuadros previamente codificados. Sin embargo, no son usados solamente al inicio de la secuencia, sino que también pueden ser usados ventajosamente en casos en los que el video cambia bruscamente, tales como cortes de escena, o en los que es deseable tener un punto de acceso aleatorio, desde el que un descodificador puede iniciar la descodificación sin tener que descodificar la parte previa de la corriente de bits. Los valores de píxel de macrobloques intracodificados son usualmente transformados a un dominio de frecuencia, por ejemplo usando la transformación de coseno discreta y la transformación de coeficientes cuantificados con el fin de reducir el tamaño de la corriente de bits resultante.

Por el contrario, un inter-cuadros es codificado como una imagen de diferencia de movimiento compensado en relación con un cuadro anterior. Usando como referencia un cuadro ya descodificado (cuadro reconstruido), el codificador de video puede señalar para cada macrobloque un conjunto de vectores de movimiento (MV) y coeficientes. Los vectores de movimiento (uno o varios dependiendo de cómo esté divido el macrobloque) informan al descodificador de cómo traducir espacialmente las regiones correspondientes del cuadro de referencia con el fin de hacer una predicción para el macrobloque en consideración. Esto es denominado como una compensación de movimiento. La diferencia entre la predicción y el original es codificada en términos de coeficientes de transformación. Sin embargo, no todos los macrobloques de un inter-cuadro necesitan ser de movimiento compensado. Si el cambio del macrobloque de referencia al macrobloque en curso es pequeño, el macrobloque puede ser codificado en modo COPY, es decir, no codificado per se sino señalado como para ser copiado. Véase la sección 5.3.1 de la Recomendación H.263 de ITU-T “Indicación de macrobloque codificado (COD) (1 bit)” para un ejemplo de una puesta en práctica de modo COPY. Por otro lado, si los macrobloques difieren sustancialmente, puede ser mejor codificarlos como un intra-macrobloques.

Compensación de movimiento global en H.263

En vez de acceder a la compensación de movimiento solamente sobre una base de bloques, podría ser ventajoso extraer el movimiento global de un cuadro de forma separada y codificar las desviaciones a partir del movimiento global para cada bloque. En una secuencia de toma panorámica o de zum, o cuando un objeto grande se mueve sobre el cuadro, la información de movimiento total es probablemente mantenida al mínimo por tal esquema. Una técnica bien conocida es añadir una operación adicional en el proceso de codificación antes de que un inter-cuadros sea codificado. El anexo P de H.263 “Nuevo Muestreo de Imagen de Referencia” proporciona un método para “alabear” la

H00VHV

imagen de referencia dados cuatro vectores de desplazamiento v00, v, v, y vque especifican los desplazamientos de los píxel de esquina de un cuadro. La fig. 1 muestra un cuadro de referencia, con estos vectores extendiéndose respectivamente desde los píxel de esquina 8. Los desplazamientos de todos los demás píxel son dados por una interpolación bilineal de estos vectores, es decir:

≈Δ «

...

Reivindicaciones:

1. Un método para la descompresión de datos de video para cuadros de video que comprenden una pluralidad de bloques de imagen, en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjunto a partir de un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el método comprende las operaciones de: descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual en el que la corriente de bits de datos es descodificada de acuerdo a un modo IGMC o de acuerdo al modo copy, en el que dicho modo IGMC comprende: predecir un vector de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el bloque de imagen codificado copiando desde un cuadro anterior un bloque adjunto dislocado por el vector de movimiento predicho.

2. El método según la reivindicación 1, en el que: una conmutación entre dichos modos IGMC y COPY es señalizada explícitamente por una palabra de código.

3. El método según la reivindicación 1, en el que: una conmutación entre dichos modos IGMC y COPY es señalizada implícitamente por elementos de código descodificados previamente.

4. El método según la reivindicación 1, en el que: dicha predicción de vector de movimiento es calculada, para cada componente de vector individualmente, como la media de tres vectores de movimiento cercanos.

5. Un descodificador de video para descodificar cuadros de video que comprende una pluralidad de bloques de imagen, en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjuntado desde un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el descodificador de video comprende medios para descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual, en el que la corriente de bits de datos es descodificada de

acuerdo con un modo IGMC o de acuerdo con el modo copy, en el que el descodificador de video comprende medios para descodificar el bloque de imagen codificado de acuerdo al modo IGMC calculando un vector de movimiento predicho prediciendo vectores de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el bloque de imagen codificado copiando desde un cuadro previo un bloque adjunto dislocado por el vector de movimiento predicho.

6. El descodificador de video según la reivindicación previa, en el que el descodificador comprende medios para calcular dicho vector de movimiento predicho, para cada componente de vector individualmente, como la media de tres vectores de movimiento contiguos.

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]