Método para derivar datos de movimiento para imágenes de alta resolución a partir de datos de movimiento de imágenes de baja resolución y dispositivos codificadores y descodificadores que ponen en práctica dicho método.

Método para la obtención de datos de movimiento para al menos un macrobloque de una imagen de alta resolución dividido en bloques elementales que no solapan,

llamado macrobloque de capa alta, a partir de datos de movimiento asociados a macrobloques de una imagen de baja resolución, llamados macrobloques de la capa de base, estando un modo de codificación de macrobloque, entre el modo de fotograma y el modo de campo, asociado a cada macrobloque y estando un modo de codificación de imagen asociado a la mencionada imagen de alta resolución y a la mencionada imagen de baja resolución, caracterizado porque comprende las siguientes etapas:

- computar (2200), para cada bloque elemental de dicho al menos un macrobloque, una posición intermedia dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base virtual (vbl_pos), a partir de la posición del mencionado bloque elemental dentro de la mencionada imagen de alta resolución dependiendo del modo de codificación del mencionado macrobloque de capa alta y dependiendo de los modos de codificación de imagen de las mencionadas imágenes de alta y baja resolución;

- identificar (2300), para cada bloque elemental, el macrobloque de la capa de base, llamado base_MB, que comprende el píxel situado en la mencionada posición de la capa de base virtual;

- computar (2400), para cada bloque elemental, una posición final dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base real, a partir de la mencionada posición de la capa de base virtual dependiendo de los modos de codificación del mencionado base_MB y de los macrobloques de la capa alta;

- identificar (2500), para cada bloque elemental del mencionado al menos un macrobloque, el macrobloque de la capa de base, llamado real_base_MB, que comprende el píxel situado en la citada posición de la capa de base real; y

- obtener (2600) los datos de movimiento, para el mencionado macrobloque de la capa alta, a partir de los datos de movimiento del macrobloque de la capa de base identificado real_base_MB para cada bloque elemental.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2007/056640.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.

Inventor/es: FRANCOIS,EDOUARD, BOTTREAU,Vincent, VIERON,Jérome, CHEVANCE,Christophe.

Fecha de Publicación: 25 de Abril de 2012.

Clasificación Internacional de Patentes:

H04N7/26
H04N7/46

PDF original: ES-2379399_T3.pdf

Fragmento de la descripción:

Método para derivar datos de movimiento para imágenes de alta resolución a partir de datos de movimiento de imágenes de baja resolución y dispositivos codificadores y descodificadores que ponen en práctica dicho método.

1. Campo de la invención

La invención se refiere a un método para obtener datos de movimiento para al menos un macrobloque de una imagen de alta resolución, llamado macrobloque de capa alta, a partir de los datos de movimiento asociados al menos a un macrobloque de una imagen de baja resolución, llamado macrobloque de capa de base. La invención también se refiere a los dispositivos de codificación y decodificación que implementan dicho método.

2. Antecedentes de la Invención

Los métodos de codificación jerárquica y escalable del estado de la técnica permiten codificar la información jerárquicamente con el fin de que pueda ser descodificada con diferente resolución y/o niveles de calidad. Un flujo de datos generado por un dispositivo de codificación escalable se divide así en varias capas, una capa de base y una o más capas de mejora. Estos dispositivos permiten adaptar un único flujo de datos a unas condiciones de transmisión variables (ancho de banda, tasa de error…) y también a las capacidades de los dispositivos de recepción (CPU, características del dispositivo de reproducción…) . Un método de codificación (o descodificación) jerárquico espacialmente escalable codifica (o descodifica) una primera parte de los datos llamada capa de base que se refiere a imágenes de baja resolución llamadas también imágenes de capa de base (imágenes BL) , y a partir de esta capa de base codifica (o descodifica) al menos otra parte de los datos llamada capa de mejora que se refiere a imágenes de alta resolución llamadas también imágenes de capa alta (imágenes HL) o imágenes de capa de mejora. Los datos de movimiento que se refieren a la capa de mejora posiblemente se adquieren (es decir, se obtienen) de los datos de movimiento que se refieren a la capa de base mediante un método llamado método de predicción de capa intermedia o método de adquisición de capa intermedia. Por lo tanto cada macrobloque de una imagen de alta resolución se predice bien según un modo de predicción temporal o espacial clásico (por ejemplo predicción interna, modo de predicción bidireccional, modo de predicción directo, predicción adelante/atrás…) o bien según un método de predicción de capa intermedia. En este primer caso, los datos de movimiento asociados a un macrobloque de alta resolución deben ser obtenidos o adquiridos de los datos de movimiento (llamados también información de movimiento) asociados a los macrobloques de las imágenes de baja resolución sea cual sea el formato de las imágenes de alta o baja resolución, es decir, progresivo o entrelazado. En este contexto la expresión "datos de movimiento" no sólo incluye vectores de movimiento sino más generalmente información de codificación tal como patrones de fraccionamiento asociados a los macrobloques/bloques de píxeles de la imagen de alta resolución para la división de los macrobloques/bloques mencionados en varios sub-bloques, modos de codificación asociados a los bloques mencionados e índices de referencia de la imagen asociados a algunos bloques que permiten hacer referencia a la imagen utilizada para predecir dicho bloque.

El documento JVT-S018 del Joint Video Team (JVT) de la ISO/IEC MPEG & ITU-T VCEG, titulado << CE4: predicción de capa intermedia para SVC entrelazado/progresivo >>, describe un proceso de predicción de capa intermedia que soporta cualesquiera combinaciones de escalabilidad entrelazada/progresiva.

3. Sumario de la invención La invención tiene el objetivo de aliviar al menos uno de estos inconvenientes. En particular el que se refiere a un método para obtener datos de movimiento para al menos un macrobloque de una imagen de alta resolución, llamado macrobloque de capa alta, a partir de los datos de movimiento asociados a macrobloques de una imagen de baja resolución, llamado macrobloque de capa de base, un modo de codificar macrobloques entre el modo de fotograma y el modo de campo que esté asociado a cada macrobloque y un modo de codificar imágenes que esté asociado a la imagen de alta resolución y a la imagen de baja resolución. El método comprende las siguientes etapas:

- dividir el macrobloque de capa alta en bloques elementales que no se solapen;

- computar, para cada bloque elemental, un posición intermedia dentro de la imagen de baja resolución, llamada posición de capa de base virtual (vbl_pos) , a partir de la posición del bloque elemental dentro de la imagen de alta resolución que depende del modo de codificación del macrobloque de capa alta y que depende de los modos de codificación de imagen de las imágenes de alta y baja resolución;

- identificar, para cada bloque elemental, el macrobloque de capa de base, llamado base_MB, que comprende el pixel situado en la posición de la capa de base virtual;

- computar, para cada bloque elemental, una posición final dentro de la imagen de baja resolución, llamada posición de la capa de base real, a partir de la posición de la capa de base virtual que depende de los modos de codificación del base_MB y de los macrobloques de capa alta y que depende de los modos de codificación de imagen de las imágenes de alta y baja resolución;

- identificar, para cada bloque elemental, el macrobloque de capa de base, llamado real_base_MB, que comprende el píxel situado en la posición de la capa de base real; y

- obtener los datos de movimiento, para el macrobloque de capa alta, a partir de los datos de movimiento del macrobloque de capa de base identificado real_base_MB para cada bloque elemental.

Según una realización preferida, los macrobloques de la capa de base están fraccionados y los datos de movimiento están asociados a cada una de las fracciones. Dicho método comprende además una etapa para identificar, para cada bloque elemental, la fracción (mbPartldxBase) del real_base_MB que comprende el pixel situado en la posición de la capa de base real después de la etapa de la identificación, para cada bloque elemental, el macrobloque de la capa de base, llamado real_base_MB, que comprende el pixel situado en la posición de la capa de base real.

Preferentemente, la etapa para obtener datos de movimiento para el macrobloque de la capa alta comprende las etapas de:

- fraccionar el macrobloque de la capa alta que depende del macrobloque de capa de base identificado real_base_MB y del fraccionamiento identificado del del macrobloque de la capa de base real_base_MB para cada bloque elemental; y

- obtener vectores de movimiento para cada fracción del macrobloque de la capa alta a partir de los datos de movimiento del macrobloque de capa de base identificado real_base_MB para cada bloque elemental.

Según una realización preferida, el macrobloque de la capa alta es un bloque de 16 por 16 píxeles y en el que cada bloque elemental es un bloque de 4 por 4 píxeles.

De manera ventajosa, el método es parte de un proceso para codificación de señales de video y es parte de un proceso para descodificación de señales de video.

La invención también se refiere a un dispositivo para la codificación de una secuencia de imágenes de alta resolución y de una secuencia de imágenes de baja resolución, siendo dividida cada imagen en macrobloques que no se solapan, un modo de codificar macrobloques entre el modo de fotograma y el modo de campo que esté asociado a cada macrobloque y un modo de codificar imágenes que esté asociado a las imágenes de alta resolución y a las imágenes de baja resolución. El dispositivo de codificación comprende:

- primeros medios de codificación para la codificación de imágenes de baja resolución, generando los primeros medios de codificación datos de movimiento para los macrobloques de las imágenes de baja resolución y un flujo de datos de la capa de base;

- medios de adquisición para obtener los datos de movimiento para al menos un macrobloque de una imagen de alta resolución, llamado macrobloque de alta resolución a partir de los datos de movimiento de los macrobloques de una imagen de baja resolución, llamados macrobloques de baja resolución; y

- segundos medios de codificación para codificar las imágenes de alta resolución que utilizan los datos de movimiento obtenidos, generando los segundos medios de codificación un flujo de datos de capa de mejora.

La invención también se refiere al dispositivo para descodificar al menos una secuencia de imágenes de alta resolución, apareciendo las imágenes... [Seguir leyendo]

Reivindicaciones:

1. Método para la obtención de datos de movimiento para al menos un macrobloque de una imagen de alta resolución dividido en bloques elementales que no solapan, llamado macrobloque de capa alta, a partir de datos de movimiento asociados a macrobloques de una imagen de baja resolución, llamados macrobloques de la capa de base, estando un modo de codificación de macrobloque, entre el modo de fotograma y el modo de campo, asociado a cada macrobloque y estando un modo de codificación de imagen asociado a la mencionada imagen de alta resolución y a la mencionada imagen de baja resolución, caracterizado porque comprende las siguientes etapas:

- computar (2200) , para cada bloque elemental de dicho al menos un macrobloque, una posición intermedia dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base virtual (vbl_pos) , a partir de la posición del mencionado bloque elemental dentro de la mencionada imagen de alta resolución dependiendo del modo de codificación del mencionado macrobloque de capa alta y dependiendo de los modos de codificación de imagen de las mencionadas imágenes de alta y baja resolución;

- identificar (2300) , para cada bloque elemental, el macrobloque de la capa de base, llamado base_MB, que comprende el píxel situado en la mencionada posición de la capa de base virtual;

- computar (2400) , para cada bloque elemental, una posición final dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base real, a partir de la mencionada posición de la capa de base virtual dependiendo de los modos de codificación del mencionado base_MB y de los macrobloques de la capa alta;

- identificar (2500) , para cada bloque elemental del mencionado al menos un macrobloque, el macrobloque de la capa de base, llamado real_base_MB, que comprende el píxel situado en la citada posición de la capa de base real; y

- obtener (2600) los datos de movimiento, para el mencionado macrobloque de la capa alta, a partir de los datos de movimiento del macrobloque de la capa de base identificado real_base_MB para cada bloque elemental.

2. El método según la reivindicación 1, en el que los macrobloques de la capa de base están fraccionados y los datos de movimiento se asocian a cada una de las fracciones y en el que dicho método comprende además una etapa para identificar, para cada bloque elemental, la fracción (mbPartldxBase) de dicho real_base_MB que comprende el píxel situado en la mencionada posición de la capa de base real después de la etapa de identificación (2500) , comprendiendo el macrobloque de la capa de base, llamado real_base_MB, para cada bloque elemental, el píxel situado en la mencionada posición de la capa de base real.

3. El método según la reivindicación 2, en el que la etapa (2600) para obtener los datos de movimiento para el mencionado macrobloque de la capa alta comprende las etapas de:

- fraccionar el macrobloque de la capa alta mencionado dependiendo del mencionado macrobloque de la capa de base identificado real_base_MB y dependiendo de dicho fraccionamiento identificado de dicho macrobloque de la capa de base real_base_MB para cada bloque elemental; y

- obtener vectores de movimiento para cada fracción del mencionado macrobloque de la capa alta a partir de datos de movimiento del mencionado macrobloque de la capa de base identificado real_base_MB para cada bloque elemental.

4. El método según cualquiera de las reivindicaciones 1 a 3, en el que dicho macrobloque de la capa alta es un bloque de 16 por 16 píxeles y en el que cada bloque elemental es un bloque de 4 por 4 píxeles.

5. El método según cualquiera de las reivindicaciones 1 a 4, en el que dicho método es parte de un proceso para la codificación de señales de video.

6. El método según cualquiera de las reivindicaciones 1 a 4, en el que dicho método es parte de un proceso para la descodificación de señales de video.

7. El dispositivo (8) para la codificación de una secuencia de imágenes de alta resolución y una secuencia de imágenes de baja resolución, siendo cada imagen dividida en macrobloques que no se solapan divididos a su vez en bloques elementales que no se solapan, estando asociado a cada macrobloque un modo de codificación de macrobloque entre el modo de fotograma y el modo de campo y estando asociado a las mencionadas imágenes de

alta resolución y a las mencionadas imágenes de baja resolución un modo de codificación de imagen, comprendiendo dicho dispositivo:

- primeros medios de codificación (80) para la codificación de las mencionadas imágenes de baja resolución, generando dichos primeros medios de codificación datos de movimiento para los macrobloques de las mencionadas imágenes de baja resolución y un flujo de datos de la capa de base;

- medios de adquisición (82) para la obtención de datos de movimiento para al menos un macrobloque de una imagen de alta resolución, llamado macrobloque de capa alta, a partir de los datos de movimiento de los macrobloques de una imagen de baja resolución, llamados macrobloques de la capa de base; y

- segundos medios de codificación (81) para la codificación de las mencionadas imágenes de alta resolución usando los mencionados datos de movimiento obtenidos, generando dichos segundos medios de codificación un flujo de datos de la capa de mejora;

caracterizado porque los medios de adquisición (82) comprenden:

- medios para computar, para cada bloque elemental del mencionado al menos un macrobloque, una posición intermedia dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base virtual (vbl_pos) , a partir de la posición de los mencionados bloques elementales dentro de la mencionada imagen de alta resolución dependiendo del modo de codificación del mencionado macrobloque de la capa alta y dependiendo de los modos de codificación de imagen de las mencionadas imágenes de alta y baja resolución;

- medios para identificar, para cada bloque elemental, el macrobloque de la capa de base, llamado base_MB, que comprende el píxel situado en la mencionada posición de la capa de base virtual;

- medios para computar, para cada bloque elemental, una posición final dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base real, a partir de la posición mencionada de la capa de base virtual dependiendo de los modos de codificación del mencionado base_MB y de los macrobloques de la capa alta;

- medios para identificar, para cada bloque elemental del mencionado al menos un macrobloque, el macrobloque de la capa de base, llamado real_base_MB, que comprende el píxel situado en la mencionada posición de la capa de base real; y

- medios para obtener datos de movimiento, para el mencionado macrobloque de la capa alta, a partir de datos de movimiento del mencionado macrobloque de la capa de base identificado real_base_MB para cada bloque elemental.

8. Un dispositivo según la reivindicación 7, en el que los mencionados primeros medios de codificación son un codificador de video MPEG-4 AVC.

9. Un dispositivo según la reivindicación 7 u 8, en el que el mencionado dispositivo comprende además medios (83) para combinar el flujo de datos de la capa de base y el flujo de datos de la capa de mejora en un único flujo de datos.

10. Un dispositivo (9) para la descodificación de al menos una secuencia de imágenes de alta resolución, surgiendo las imágenes codificadas en forma de un flujo de datos, en el que cada imagen está dividida en macrobloques que no se solapan divididos en bloques elementales que no se solapan, estando asociado un modo de codificación de macrobloque entre el modo de fotograma y el modo de campo a cada macrobloque y estando asociado un modo de codificación de imagen a las mencionadas imágenes de alta y a las mencionadas imágenes de baja resolución, comprendiendo el mencionado dispositivo:

- medios de descodificación principales (91) para descodificar al menos una primera parte del mencionado flujo de datos con el fin de generar imágenes de baja resolución y datos de movimiento para los macrobloques de la mencionada imagen de baja resolución;

- medios de adquisición (82) para obtener datos de movimiento para al menos un macrobloque de una imagen de alta resolución, llamado macrobloque de la capa alta, a partir de los datos de movimiento de macrobloques de una imagen de baja resolución, llamados macrobloques de la capa de base; y

- segundos medios de descodificación (92) para descodificar al menos una segunda parte del mencionado flujo de datos usando los mencionados datos de movimiento obtenidos con el fin de generar imágenes de alta resolución;

caracterizado porque los medios de adquisición (82) comprenden:

- medios para identificar, para cada bloque elemental, el macrobloque de la capa de base, llamado base_MB, que comprende el píxel situado en la mencionada posición de la capa de base virtual;

- medios para computar, para cada bloque elemental, una posición final dentro de la mencionada imagen de baja resolución, llamada posición de la capa de base real, a partir de la mencionada posición de la capa de base virtual dependiendo de los modos de codificación del mencionado base_MB y de los macrobloques de la capa alta;

- medios para obtener datos de movimiento, para el macrobloque de la capa alta mencionado, a partir de datos de movimiento del mencionado macrobloque de la capa de base identificado real_base_MB para cada bloque elemental.

11. Un dispositivo según la reivindicación 10, en el que los mencionados primeros medios de descodificación son un descodificador de video MPEG-4 AVC.

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]