Procedimiento de decodificación de vectores de movimiento.

Un procedimiento de decodificación de vectores de movimiento para decodificación de un vector demovimiento codificado de un bloque actual en una imagen en movimiento,

que comprende:

una etapa de especificación de bloque vecino (S200, S400) para especificar un bloque vecino que está situado en lavecindad del bloque actual y que ya ha sido decodificado;

una etapa de valoración (S202, S402) para valorar si el bloque vecino ha sido decodificado o no usando un vector demovimiento de otro bloque;

una etapa de predicción (S206, S410) para obtener un vector de movimiento predictivo del bloque actual usando unvector de movimiento calculado a partir del vector de movimiento de dicho otro bloque como un vector demovimiento del bloque vecino, cuando se valora en la etapa de valoración (S202, S402) que el bloque vecino ha sidodecodificado usando el vector de movimiento de dicho otro bloque;

una etapa de decodificación de vectores de movimiento diferencial para decodificar el vector de movimientocodificado del bloque actual para obtener un vector de movimiento diferencial decodificado del bloque actual; yuna etapa de recuperación (S210, S416) para recuperar el vector de movimiento del bloque actual añadiendo elvector de movimiento diferencial decodificado del bloque actual y el vector de movimiento predictivo;

en el que en un caso en que dicho otro bloque tiene dos vectores de movimiento, el vector de movimiento predictivose obtiene en sentido directo temporalmente y en sentido inverso temporalmente por separado en la etapa depredicción (S206, S410), y el vector de movimiento codificado del bloque actual se decodifica en sentido directotemporalmente y en sentido inverso temporalmente por separado en la etapa de decodificación.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10169926.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: KADONO, SHINYA, HAGAI, MAKOTO, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H03M7/36 ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
  • H04N7/26
  • H04N7/32
  • H04N7/34
  • H04N7/36

PDF original: ES-2410533_T3.pdf

 


Fragmento de la descripción:

Procedimiento de decodificación de vectores de movimiento.

Campo técnico La presente invención se refiere a un procedimiento de codificación de vectores de movimiento y un procedimiento de decodificación de vectores de movimiento usando codificación de predicción entre imágenes.

Técnica anterior

En la era multimedia que maneja de forma integral audio, vídeo y otra información, los medios de información existentes, es decir, periódicos, revistas, televisiones, radios, teléfonos y otros medios a través de los cuales se transmite la información a las personas, se han incluido recientemente en el ámbito multimedia. En general, multimedia se refiere a algo que se representa asociando no sólo caracteres, sino también gráficos, voz y especialmente imágenes y similares conjuntamente, pero con el fin de incluir los medios de información existentes mencionados anteriormente en el ámbito multimedia, parece que un requisito previo es representar dicha información en forma digital.

Sin embargo, cuando se calcula la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente en forma de cantidad de información digital, mientras que la cantidad de información por carácter es de 1~2 bytes, la cantidad de información que se requerirá para voz es de 64 Kbits o más por segundo (calidad telefónica) , y 100 Mbits o más por segundo para imágenes en movimiento (calidad actual de recepción en televisión) , y no es realista que los medios de información mencionados anteriormente manejen una cantidad de información tan enorme como ésta en forma digital. Por ejemplo, aunque los videoteléfonos están ya en uso real por medio de la Red Digital de Servicios Integrados (RDSI) que ofrece una velocidad de transmisión de 64 Kbps/s~1, 5 Mbps/s, no es práctico emitir tomas de vídeo por cámaras de televisión directamente a través de RDSI.

Sobre este telón de fondo, han empezado a requerirse técnicas de compresión de información, y se emplean técnicas de compresión de imágenes en movimiento que cumplen con las normas H.261 y H.263 normalizadas internacionalmente por la ITU-T (Unión Internacional de Telecomunicación-Sector de Normalización de Telecomunicación) para videoteléfonos, por ejemplo (Véase, por ejemplo, Information technology – Coding of audiovisual objects - Part 2: video (ISO/IEC 14496-2) , pág. 146-148, 1999.12.1) . Por otra parte, según técnicas de compresión de información que cumplen con la norma MPEG-1, es posible almacenar información de imágenes en un CD (disco compacto) de música corriente junto con información sonora.

Aquí, MPEG (Moving Picture Experts Group) es una norma internacional sobre compresión de señales de imágenes en movimiento, y MPEG-1 es una norma para compresión de información de señales de televisión aproximadamente en una centésima parte de manera que las señales de imágenes en movimiento pueden emitirse a una velocidad de 1, 5 Mbps. Además, como la velocidad de transmisión dentro del ámbito de la norma MPEG-1 está limitada principalmente a 1, 5 Mbps aproximadamente, MPEG-2, que fue normalizada con vistas a satisfacer los requisitos de una calidad de imagen mejorada, permite la transmisión de datos de señales de imágenes en movimiento a una velocidad de 2~15 Mbps. Además, MPEG-4 que consigue una relación de compresión superior que la de MPEG-1 y MPEG-2, permite la codificación, decodificación y operación en una unidad objeto, y realiza un nuevo funcionamiento requerido para la era multimedia, ha sido normalizada por el grupo de trabajo (ISO/IEC JTC1/SC29/WG11) que se ha comprometido en la normalización de MPEG-1 y MPEG-2. MPEG-4 se dirigió inicialmente a la normalización de un procedimiento de codificación para una velocidad binaria baja, pero ahora se ha extendido a la normalización de un procedimiento de codificación más versátil para imágenes en movimiento que incluye formas de imágenes entrelazadas y velocidades binarias superiores.

En la codificación de imágenes en movimiento mencionada anteriormente, la cantidad de información se comprime aprovechando las redundancias en las direcciones espacial y temporal. Aquí, se usa la codificación de predicción entre imágenes como un procedimiento de uso de las redundancias temporales. En la codificación de predicción entre imágenes, una imagen se codifica usando una imagen en sentido inverso o en sentido directo temporalmente como imagen de referencia. Se estima el movimiento (un vector de movimiento) de la imagen actual que se codificará a partir de la imagen de referencia, y se calcula la diferencia entre la imagen obtenida por la compensación de movimiento y la imagen actual. A continuación, se eliminan las redundancias espaciales de esta diferencia, con lo que se comprime la cantidad de información de la imagen en movimiento.

El documento “H.26L Test Model Long Term Number 6 (TML-6) draft0” (Sector de Normalización de Telecomunicaciones de ITU, Ginebra, Suiza, VCEG-L45d0.doc, 3 de marzo de 2001) es una descripción de un procedimiento de codificación de referencia que se usará para el desarrollo de una recomendación-H.26L de ITU-T para un nuevo procedimiento de compresión. La configuración básica del algoritmo es similar a H.263. Algunas de las diferencias con respecto a H.263 son:

- Sólo se usa una VLC regular para la codificación de símbolos.

- Se usan posiciones de 1/4 píxel para la predicción de movimiento.

- Se usa una serie de diferentes tamaños de bloque para la predicción de movimiento.

- La codificación residual se basa en bloques 4 x 4 y se usa una transformada de números enteros.

- Pueden usarse múltiples tramas de referencia para la predicción y se considera que sustituyen cualquier uso de tramas B.

En un procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-1, MPEG-2, MPEG-4, H.263, H.26L o similares, una imagen que no se codifica como predicción entre imágenes, es decir, que se codifica intraimagen, se denomina imagen I. Aquí, una imagen significa una unidad de codificación única que incluye tanto una trama como un campo. Además, una imagen que se codifica como predicción entre imágenes con referencia a una imagen se denomina imagen P, y una imagen que se codifica como predicción entre imágenes con referencia a las dos imágenes procesadas anteriormente se denomina imagen B.

La fig. 1 es un diagrama que muestra una relación predictiva entre imágenes en el procedimiento de codificación de imágenes en movimiento mencionado anteriormente.

En la fig. 1, una línea vertical indica una imagen, con un tipo de imagen (I, P o B) indicado en el extremo inferior de la misma. Además, la fig. 1 indica que una imagen a la que apunta una flecha se codifica como predicción entre imágenes usando una imagen situada en el otro extremo de la punta de flecha como imagen de referencia. Por ejemplo, una imagen B que es la segunda desde la izquierda se codifica usando la primera imagen I y la cuarta imagen P como imágenes de referencia.

En el procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-4, H.26L o similar, puede seleccionarse un modo de codificación denominado modo directo para codificar una imagen B.

Se explicará un procedimiento de codificación de predicción entre imágenes en modo directo con referencia a la fig.

2.

La fig. 2 es una ilustración para explicar el procedimiento de codificación de predicción entre imágenes en modo directo.

Se supone ahora que un bloque C en una imagen B3 se codifica en modo directo. En este caso, un vector de movimiento MVp de un bloque X en una imagen de referencia (una imagen P4 que es una imagen de referencia en sentido inverso, en este caso) que ha sido codificada inmediatamente antes de que se aproveche la imagen B3, en el que el bloque X está situado junto al bloque C. El vector de movimiento MVp es un vector de movimiento que se usó cuando se codificó el bloque X, y se refiere a una imagen P1. El bloque C se predice bidireccionalmente a partir de las imágenes de referencia, es decir, la imagen P1 y la imagen P4, usando vectores de movimiento paralelos al vector de movimiento MVp. Los vectores de movimiento usados para codificar el bloque C son, en este caso, un vector de movimiento MVFc para la imagen P1 y un vector de movimiento MVBc para la imagen P4.

En el procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-4, H.26L o similar, se codifica una diferencia entre un valor predictivo obtenido de vectores de movimiento de bloques vecinos y un vector de movimiento de un bloque actual que se codificará para codificar el vector de movimiento. En la siguiente... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de decodificación de vectores de movimiento para decodificación de un vector de movimiento codificado de un bloque actual en una imagen en movimiento, que comprende:

una etapa de especificación de bloque vecino (S200, S400) para especificar un bloque vecino que está situado en la vecindad del bloque actual y que ya ha sido decodificado;

una etapa de valoración (S202, S402) para valorar si el bloque vecino ha sido decodificado o no usando un vector de movimiento de otro bloque;

una etapa de predicción (S206, S410) para obtener un vector de movimiento predictivo del bloque actual usando un vector de movimiento calculado a partir del vector de movimiento de dicho otro bloque como un vector de movimiento del bloque vecino, cuando se valora en la etapa de valoración (S202, S402) que el bloque vecino ha sido decodificado usando el vector de movimiento de dicho otro bloque;

una etapa de decodificación de vectores de movimiento diferencial para decodificar el vector de movimiento codificado del bloque actual para obtener un vector de movimiento diferencial decodificado del bloque actual; y

una etapa de recuperación (S210, S416) para recuperar el vector de movimiento del bloque actual añadiendo el vector de movimiento diferencial decodificado del bloque actual y el vector de movimiento predictivo;

en el que en un caso en que dicho otro bloque tiene dos vectores de movimiento, el vector de movimiento predictivo se obtiene en sentido directo temporalmente y en sentido inverso temporalmente por separado en la etapa de predicción (S206, S410) , y el vector de movimiento codificado del bloque actual se decodifica en sentido directo temporalmente y en sentido inverso temporalmente por separado en la etapa de decodificación.

2. El procedimiento de decodificación de vectores de movimiento según la reivindicación 1,

en el que en un caso en que dicho otro bloque tiene un vector de movimiento especificado en sentido directo temporalmente y un vector de movimiento especificado en sentido inverso temporalmente, el vector de movimiento predictivo que incluye dos vectores de movimiento predictivo se obtiene en la etapa de predicción (S206, S410) , uno en sentido directo temporalmente y el otro en sentido inverso temporalmente por separado, y el vector de movimiento codificado del bloque actual que incluye dos vectores de movimiento se decodifica en la etapa de decodificación, uno en sentido directo temporalmente y el otro en sentido inverso temporalmente por separado.


 

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Imagen de 'Filtro de desbloqueo condicionado por el brillo de los píxeles'Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .