Procedimiento de decodificación de vectores de movimiento.
Un procedimiento de decodificación de vectores de movimiento para la decodificación de un vector de movimiento de un bloque actual en una imagen en movimiento,
que comprende:
especificar (S210, S400) tres bloques vecinos, estando los tres bloques vecinos situados en una vecindad del bloque actual y habiendo sido ya decodificados;
valorar (S202, S402) si cada uno de los tres bloques vecinos ha sido decodificado o no usando un vector de movimiento de otro bloque y si una imagen de referencia referida en la decodificación del bloque actual es la misma
o no que cada una de las imágenes de referencia referidas en una decodificación de cada uno de los tres bloques vecinos;
extraer (S206, S410) un vector de movimiento predictivo del bloque actual usando al menos uno de los vectores de movimiento de la pluralidad de bloques vecinos, teniendo cada uno de los bloques vecinos de la pluralidad un vector de movimiento el cual se obtiene usando el vector de movimiento del otro bloque cuando se valora en dicha valoración (S202, 402) que cada uno de los bloques vecinos de la pluralidad han sido decodificados usando el vector de movimiento del otro bloque;
decodificar el vector de movimiento codificado para obtener un vector de movimiento de diferencia decodificado del bloque actual; y
recuperar el vector de movimiento del bloque actual añadiendo (S210, S416) el vector de movimiento de diferencia decodificado del bloque actual y el vector de movimiento predictivo,
en el que, en dicha extracción (S206, S410), cuando se valora en dicha valoración (S202, S402) que tres bloques vecinos se refieren a la misma imagen de referencia que el bloque actual, el vector de movimiento predictivo del bloque actual se ajusta a una mediana de los vectores de movimiento de los tres bloques vecinos.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10187156.
Solicitante: PANASONIC CORPORATION.
Nacionalidad solicitante: Japón.
Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.
Inventor/es: KADONO, SHINYA, HAGAI, MAKOTO, ABE, KIYOFUMI, KONDO, SATOSHI.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04N7/36
PDF original: ES-2392513_T3.pdf
Fragmento de la descripción:
Procedimiento de decodificación de vectores de movimiento.
Campo técnico
La presente invención se refiere a un procedimiento de codificación de vectores de movimiento y un procedimiento de decodificación de vectores de movimiento usando codificación de predicción entre imágenes.
Técnica anterior
En la era multimedia que maneja de forma integral audio, vídeo y otra información, los medios de información existentes, es decir, periódicos, revistas, televisiones, radios, teléfonos y otros medios a través de los cuales se transmite la información a las personas, se han incluido recientemente en el ámbito multimedia. En general, multimedia se refiere a algo que se representa asociando no sólo caracteres, sino también gráficos, voz y especialmente imágenes y similares conjuntamente, pero con el fin de incluir los medios de información existentes mencionados anteriormente en el ámbito multimedia, parece que un requisito previo es representar dicha información en forma digital.
Sin embargo, cuando se calcula la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente en forma de cantidad de información digital, mientras que la cantidad de información por carácter es de 1~2 bytes, la cantidad de información que se requerirá para voz es de 64 Kbits o más por segundo (calidad telefónica) , y 100 Mbits o más por segundo para imágenes en movimiento (calidad actual de recepción en televisión) , y no es realista que los medios de información mencionados anteriormente manejen una cantidad de información tan enorme como ésta en forma digital. Por ejemplo, aunque los videoteléfonos están ya en uso real por medio de la Red Digital de Servicios Integrados (RDSI) que ofrece una velocidad de transmisión de 64 Kbps/s~1, 5 Mbps/s, no es práctico emitir tomas de vídeo por cámaras de televisión directamente a través de RDSI.
Sobre este telón de fondo, han empezado a requerirse técnicas de compresión de información, y se emplean técnicas de compresión de imágenes en movimiento que cumplen con las normas H.261 y H.263 normalizadas internacionalmente por la ITU-T (Unión Internacional de Telecomunicación-Sector de Normalización de Telecomunicación) para videoteléfonos, por ejemplo (Véase, por ejemplo, Information technology – Coding of audiovisual objects - Part 2: video (ISO/IEC 14496-2) , pág. 146-148, 1999.12.1) . Por otra parte, según técnicas de compresión de información que cumplen con la norma MPEG-1, es posible almacenar información de imágenes en un CD (disco compacto) de música corriente junto con información sonora.
Aquí, MPEG (Moving Picture Experts Group) es una norma internacional sobre compresión de señales de imágenes en movimiento, y MPEG-1 es una norma para compresión de información de señales de televisión aproximadamente en una centésima parte de manera que las señales de imágenes en movimiento pueden emitirse a una velocidad de 1, 5 Mbps. Además, como la velocidad de transmisión dentro del ámbito de la norma MPEG-1 está limitada principalmente a 1, 5 Mbps aproximadamente, MPEG-2, que fue normalizada con vistas a satisfacer los requisitos de una calidad de imagen mejorada, permite la transmisión de datos de señales de imágenes en movimiento a una velocidad de 2~15 Mbps. Además, MPEG-4 que consigue una relación de compresión superior que la de MPEG-1 y MPEG-2, permite la codificación, decodificación y operación en una unidad objeto, y realiza un nuevo funcionamiento requerido para la era multimedia, ha sido normalizada por el grupo de trabajo (ISO/IEC JTC1/SC29/WG11) que se ha comprometido en la normalización de MPEG-1 y MPEG-2. MPEG-4 se dirigió inicialmente a la normalización de un procedimiento de codificación para una velocidad binaria baja, pero ahora se ha extendido a la normalización de un procedimiento de codificación más versátil para imágenes en movimiento que incluye formas de imágenes entrelazadas y velocidades binarias superiores.
En la codificación de imágenes en movimiento mencionada anteriormente, la cantidad de información se comprime aprovechando las redundancias en las direcciones espacial y temporal. Aquí, se usa la codificación de predicción entre imágenes como un procedimiento de uso de las redundancias temporales. En la codificación de predicción entre imágenes, una imagen se codifica usando una imagen en sentido inverso o en sentido directo temporalmente como imagen de referencia. Se estima el movimiento (un vector de movimiento) de la imagen actual que se codificará a partir de la imagen de referencia, y se calcula la diferencia entre la imagen obtenida por la compensación de movimiento y la imagen actual. A continuación, se eliminan las redundancias espaciales de esta diferencia, con lo que se comprime la cantidad de información de la imagen en movimiento.
El documento “H.26L Test Model Long Term 6 (TML-6) draft0” (Sector de Normalización de Telecomunicaciones de ITU, Ginebra, Suiza, VCEG-L45d0.doc, 3 de marzo de 2001) es una descripción de un procedimiento de codificación de referencia que se usará para el desarrollo de una recomendación-H.26L de ITU-T para un nuevo procedimiento de compresión. La configuración básica del algoritmo es similar a H.263. Algunas de las diferencias con respecto a
H.263 son:
- Sólo se usa una VLC regular para codificación de símbolos.
- Se usan posiciones de 1/4 píxel para predicción de movimiento.
- Se usa una serie de diferentes tamaños de bloque para predicción de movimiento.
- La codificación residual se basa en bloques 4 x 4 y se usa una transformada de números enteros.
- Pueden usarse múltiples tramas de referencia para predicción y se considera que sustituyen cualquier uso de tramas B.
En un procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-1, MPEG-2, MPEG-4, H.263, H.26L o similares, una imagen que no se codifica como predicción entre imágenes, es decir, que se codifica intraimagen, se denomina imagen I. Aquí, una imagen significa una unidad de codificación única que incluye tanto una trama como un campo. Además, una imagen que se codifica como predicción entre imágenes con referencia a una imagen se denomina imagen P, y una imagen que se codifica como predicción entre imágenes con referencia a las dos imágenes procesadas anteriormente se denomina imagen B.
La fig. 1 es un diagrama que muestra una relación predictiva entre imágenes en el procedimiento de codificación de imágenes en movimiento mencionado anteriormente.
En la fig. 1, una línea vertical indica una imagen, con un tipo de imagen (I, P o B) indicado en el extremo inferior derecho de la misma. Además, la fig. 1 indica que una imagen a la que apunta una flecha se codifica como predicción entre imágenes usando una imagen situada en el otro extremo de la punta de flecha como imagen de referencia. Por ejemplo, una imagen B que es la segunda desde la izquierda se codifica usando la primera imagen I y la cuarta imagen P como imágenes de referencia.
En el procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-4, H.26L o similar, puede seleccionarse un modo de codificación denominado modo directo para codificar una imagen B.
Se explicará un procedimiento de codificación de predicción entre imágenes en modo directo con referencia a la fig.
2.
La fig. 2 es una ilustración para explicar el procedimiento de codificación de predicción entre imágenes en modo directo.
Se supone ahora que un bloque C en una imagen B3 se codifica en modo directo. En este caso, un vector de movimiento MVp de un bloque X en una imagen de referencia (una imagen P4 que es una imagen de referencia en sentido inverso, en este caso) que ha sido codificada inmediatamente antes de que se aproveche la imagen B3, en el que el bloque X está situado junto al bloque C. El vector de movimiento MVp es un vector de movimiento que se usó cuando se codificó el bloque X, y se refiere a una imagen P1. El bloque C se predice bidireccionalmente a partir de las imágenes de referencia, es decir, la imagen P1 y la imagen P4, usando vectores de movimiento paralelos al vector de movimiento MVp. Los vectores de movimiento usados para codificar el bloque C son, en este caso, un vector de movimiento MVFc para la imagen P1 y un vector de movimiento MVBc para... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento de decodificación de vectores de movimiento para la decodificación de un vector de movimiento de un bloque actual en una imagen en movimiento, que comprende:
especificar (S210, S400) tres bloques vecinos, estando los tres bloques vecinos situados en una vecindad del bloque actual y habiendo sido ya decodificados;
valorar (S202, S402) si cada uno de los tres bloques vecinos ha sido decodificado o no usando un vector de movimiento de otro bloque y si una imagen de referencia referida en la decodificación del bloque actual es la misma
o no que cada una de las imágenes de referencia referidas en una decodificación de cada uno de los tres bloques vecinos;
extraer (S206, S410) un vector de movimiento predictivo del bloque actual usando al menos uno de los vectores de movimiento de la pluralidad de bloques vecinos, teniendo cada uno de los bloques vecinos de la pluralidad un vector de movimiento el cual se obtiene usando el vector de movimiento del otro bloque cuando se valora en dicha valoración (S202, 402) que cada uno de los bloques vecinos de la pluralidad han sido decodificados usando el vector de movimiento del otro bloque;
decodificar el vector de movimiento codificado para obtener un vector de movimiento de diferencia decodificado del bloque actual; y
recuperar el vector de movimiento del bloque actual añadiendo (S210, S416) el vector de movimiento de diferencia decodificado del bloque actual y el vector de movimiento predictivo,
en el que, en dicha extracción (S206, S410) , cuando se valora en dicha valoración (S202, S402) que tres bloques vecinos se refieren a la misma imagen de referencia que el bloque actual, el vector de movimiento predictivo del bloque actual se ajusta a una mediana de los vectores de movimiento de los tres bloques vecinos.
2. El procedimiento de decodificación de vectores de movimiento según la reivindicación 1,
en el que, en dicha extracción (S206, S410) , cuando se valora en dicha valoración (S202, S402) que solo dos bloques vecinos de entre los tres bloques vecinos se refieren a la misma imagen de referencia que el bloque actual, un vector de movimiento del otro bloque vecino del bloque actual se ajusta a cero y el movimiento predictivo se ajusta a una mediana de los vectores de movimiento de los tres bloques vecinos.
3. Un aparato de decodificación de vectores de movimiento (700) para la decodificación de un vector de movimiento de un bloque actual en una imagen en movimiento, comprendiendo dicho aparato:
una unidad de especificación de bloque vecino (711) accionable para especificar tres bloques vecinos, estando situados los tres bloques vecinos en la vecindad del bloque actual y habiendo sido ya decodificados;
una unidad de valoración (711) accionable para valorar si cada uno de los tres bloques vecinos ha sido decodificado
o no usando un vector de movimiento de otro bloque y si una imagen de referencia referida en la decodificación del bloque actual es la misma o no que cada una de las imágenes de referencia referidas en una decodificación de cada uno de los tres bloques vecinos;
una unidad de predicción (711) accionable para extraer un vector de movimiento predictivo del bloque actual usando al menos uno de los vectores de movimiento de la pluralidad de bloques vecinos, teniendo cada uno de los bloques vecinos de la pluralidad un vector de movimiento el cual se obtiene usando el vector de movimiento del otro bloque cuando se valora en dicha unidad de valoración (711) que de los bloques vecinos de la pluralidad han sido decodificados usando el vector de movimiento del otro bloque;
una unidad de decodificación (711) accionable para decodificar el vector de movimiento codificado para obtener vector de movimiento de diferencia del bloque actual; y
una unidad de recuperación (711) accionable para recuperar el vector de movimiento del bloque actual añadiendo el vector de movimiento de diferencia decodificado del bloque actual y el vector de movimiento predictivo,
en el que dicha unidad de predicción de extracción (711) cuando se valora por medio de dicha unidad de valoración
(711) que los tres bloques vecinos se refieren a la misma imagen de referencia que el bloque actual, es accionable para ajustar el vector de movimiento predictivo del bloque actual a una mediana de vectores de movimiento de los tres bloques vecinos.
Patentes similares o relacionadas:
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Procedimiento de compresión de información de vídeo, del 30 de Octubre de 2019, de Broadmedia GC Corporation: Un procedimiento de compresión de información de vídeo, que comprende las etapas de: - proyectar puntos de una imagen siguiente en puntos proyectados […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una […]
Procedimiento de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación de imágenes para codificar un bloque actual incluido en una imagen actual, comprendiendo el procedimiento […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una imagen actual […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un método de codificación de imágenes para codificar un bloque actual incluido en una imagen actual en modo directo, comprendiendo el método de codificación de imágenes: […]