Procedimiento de codificación de imágenes y aparato de codificación de imágenes.
Un aparato de codificación de imágenes que codifica una imagen en movimiento,
comprendiendodicho aparato:
una unidad de especificación de bloques vecinos accionable para especificar un bloque vecino que está situado enla vecindad del bloque actual y que ya ha sido codificado,
una unidad de valoración accionable para valorar si el bloque vecino ha sido o no codificado usando un vector demovimiento calculado a partir de un vector de movimiento de otro bloque situado temporalmente después del bloquevecino;
una unidad de determinación accionable para determinar un vector de movimiento del bloque vecino que será unvector de movimiento real usado en la realización de compensación de movimiento en el bloque vecino cuandodicha unidad de valoración valora que el bloque vecino ha sido codificado usando el vector de movimiento calculadoa partir del vector de movimiento de dicho otro bloque;
una unidad de predicción de vector de movimiento (116) accionable para obtener un vector de movimiento predictivodel bloque actual usando varios vectores de movimiento de varios bloques vecinos;
una unidad de codificación de vector de movimiento (117) accionable para codificar un valor de diferencia entre unvector de movimiento del bloque actual y el vector de movimiento predictivo obtenido de dicha unidad de predicciónde vector de movimiento;
una unidad de compensación de movimiento (109) accionable para generar una imagen con compensación demovimiento usando el vector de movimiento del bloque actual y una imagen de referencia correspondiente al vectorde movimiento del bloque actual; y
una unidad de codificación de imágenes (103) accionable para codificar un error de predicción entre el bloque actualy la imagen con compensación de movimiento,
en el que dicho otro bloque es un bloque incluido en una imagen diferente a la imagen que incluye el bloque vecino,y el vector de movimiento real del bloque vecino se calcula a partir del vector de movimiento de dicho otro bloque.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10169923.
Solicitante: PANASONIC CORPORATION.
Nacionalidad solicitante: Japón.
Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.
Inventor/es: KADONO, SHINYA, HAGAI, MAKOTO, ABE, KIYOFUMI, KONDO, SATOSHI.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04N7/36
PDF original: ES-2441222_T3.pdf
Fragmento de la descripción:
Procedimiento de codificación de imágenes y aparato de codificación de imágenes
Campo técnico La presente invención se refiere a un procedimiento de codificación de vectores de movimiento y un procedimiento de decodificación de vectores de movimiento usando codificación de predicción entre imágenes.
Técnica anterior
En la era multimedia que maneja de forma integral audio, vídeo y otra información, los medios de información existentes, es decir, periódicos, revistas, televisiones, radios, teléfonos y otros medios a través de los cuales se transmite la información a las personas, se han incluido recientemente en el ámbito multimedia. En general,
multimedia se refiere a algo que se representa asociando no sólo caracteres, sino también gráficos, voz y especialmente imágenes y similares conjuntamente, pero con el fin de incluir los medios de información existentes mencionados anteriormente en el ámbito multimedia, parece que un requisito previo es representar dicha información en forma digital.
Sin embargo, cuando se calcula la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente en forma de cantidad de información digital, mientras que la cantidad de información por carácter es de 1~2 bytes, la cantidad de información que se requerirá para voz es de 64 Kbits o más por segundo (calidad telefónica) , y 100 Mbits o más por segundo para imágenes en movimiento (calidad actual de recepción en televisión) , y no es realista que los medios de información mencionados anteriormente manejen una cantidad de información tan enorme como ésta en forma digital. Por ejemplo, aunque los videoteléfonos están ya en uso real por medio de la Red Digital de Servicios Integrados (RDSI) que ofrece una velocidad de transmisión de 64 Kbps/s~1, 5 Mbps/s, no es práctico emitir tomas de vídeo por cámaras de televisión directamente a través de RDSI.
Sobre este telón de fondo, han empezado a requerirse técnicas de compresión de información, y se emplean técnicas de compresión de imágenes en movimiento que cumplen con las normas H.261 y H.263 normalizadas internacionalmente por la ITU-T (Unión Internacional de Telecomunicación-Sector de Normalización de Telecomunicación) para videoteléfonos, por ejemplo (Véase, por ejemplo, Information technology – Coding of audiovisual objects - Part 2: video (ISO/IEC 14496-2) , pág. 146-148, 1999.12.1) . Por otra parte, según técnicas de compresión de información que cumplen con la norma MPEG-1, es posible almacenar información de imágenes en un CD (disco compacto) de música corriente junto con información sonora.
Aquí, MPEG (Moving Picture Experts Group) es una norma internacional sobre compresión de señales de imágenes en movimiento, y MPEG-1 es una norma para compresión de información de señales de televisión aproximadamente en una centésima parte de manera que las señales de imágenes en movimiento pueden emitirse a una velocidad de 40 1, 5 Mbps. Además, como la velocidad de transmisión dentro del ámbito de la norma MPEG-1 está limitada principalmente a 1, 5 Mbps aproximadamente, MPEG-2, que fue normalizada con vistas a satisfacer los requisitos de una calidad de imagen mejorada, permite la transmisión de datos de señales de imágenes en movimiento a una velocidad de 2~15 Mbps. Además, MPEG-4 que consigue una relación de compresión superior que la de MPEG-1 y MPEG-2, permite la codificación, decodificación y operación en una unidad objeto, y realiza un nuevo 45 funcionamiento requerido para la era multimedia, ha sido normalizada por el grupo de trabajo (ISO/IEC JTC1/SC29/WG11) que se ha comprometido en la normalización de MPEG-1 y MPEG-2. MPEG-4 se dirigió inicialmente a la normalización de un procedimiento de codificación para una velocidad binaria baja, pero ahora se ha extendido a la normalización de un procedimiento de codificación más versátil para imágenes en movimiento que incluye formas de imágenes entrelazadas y velocidades binarias superiores.
En la codificación de imágenes en movimiento mencionada anteriormente, la cantidad de información se comprime aprovechando las redundancias en las direcciones espacial y temporal. Aquí, se usa la codificación de predicción entre imágenes como un procedimiento de uso de las redundancias temporales. En la codificación de predicción entre imágenes, una imagen se codifica usando una imagen en sentido inverso o en sentido directo temporalmente 55 como imagen de referencia. Se estima el movimiento (un vector de movimiento) de la imagen actual que se codificará a partir de la imagen de referencia, y se calcula la diferencia entre la imagen obtenida por la compensación de movimiento y la imagen actual. A continuación, se eliminan las redundancias espaciales de esta diferencia, con lo que se comprime la cantidad de información de la imagen en movimiento.
El documento “H.26L Test Model Long Term Number 6 (TML-6) draft0” (Sector de Normalización de Telecomunicaciones de ITU, Ginebra, Suiza, VCEG-L45d0.doc, 3 de marzo de 2001) es una descripción de un procedimiento de codificación de referencia que se usará para el desarrollo de una recomendación-H.26L de ITU-T para un nuevo procedimiento de compresión. La configuración básica del algoritmo es similar a H.263. Algunas de las diferencias con respecto a H.263 son:
- Sólo se usa una VLC regular para codificación de símbolos.
- Se usan posiciones de 1/4 píxel para predicción de movimiento. 10
-Se usa una serie de diferentes tamaños de bloque para predicción de movimiento.
-La codificación residual se basa en bloques 4 x 4 y se usa una transformada de números enteros.
- Pueden usarse múltiples tramas de referencia para predicción y se considera que sustituyen cualquier uso de tramas B.
En un procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-1, MPEG-2, MPEG-4, H.263, H.26L o similares, una imagen que no se codifica como predicción entre imágenes, es decir, que se codifica intraimagen, se denomina imagen I. Aquí, una imagen significa una unidad de codificación única que incluye tanto una trama como un campo. Además, una imagen que se codifica como predicción entre imágenes con referencia a una imagen se denomina imagen P, y una imagen que se codifica como predicción entre imágenes con referencia a las dos imágenes procesadas anteriormente se denomina imagen B.
La fig. 1 es un diagrama que muestra una relación predictiva entre imágenes en el procedimiento de codificación de imágenes en movimiento mencionado anteriormente.
En la fig. 1, una línea vertical indica una imagen, con un tipo de imagen (I, P o B) indicado en la parte inferior derecha de la misma. Además, la fig. 1 indica que una imagen a la que apunta una flecha se codifica como predicción entre imágenes usando una imagen situada en el otro extremo de la punta de flecha como imagen de referencia. Por ejemplo, una imagen B que es la segunda desde la izquierda se codifica usando la primera imagen I y la cuarta imagen P como imágenes de referencia.
En el procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-4, H.26L o similar, puede 35 seleccionarse un modo de codificación denominado modo directo para codificar una imagen B.
Se explicará un procedimiento de codificación de predicción entre imágenes en modo directo con referencia a la fig.
2.
La fig. 2 es una ilustración para explicar el procedimiento de codificación de predicción entre imágenes en modo directo.
Se supone ahora que un bloque C en una imagen B3 se codifica en modo directo. En este caso, un vector de movimiento MVp de un bloque X en una imagen de referencia (una imagen P4 que es una imagen de referencia en 45 sentido inverso, en este caso) que ha sido codificada inmediatamente antes de que se aproveche la imagen B3, en el que el bloque X está situado junto al bloque C. El vector de movimiento MVp es un vector de movimiento que se usó cuando se codificó el bloque X, y se refiere a una imagen P1. El bloque C se predice bidireccionalmente a partir de las imágenes de referencia, es decir, la imagen P1 y la imagen P4, usando vectores de movimiento paralelos al vector de movimiento MVp. Los vectores de movimiento usados para codificar el bloque C son, en este caso, un 50 vector de movimiento MVFc para la imagen P1 y un vector de movimiento MVBc para la imagen P4.
En el procedimiento de codificación de imágenes en movimiento de acuerdo con MPEG-4, H.26L o similar, se codifica una diferencia entre un valor predictivo obtenido de vectores de movimiento de bloques vecinos y un vector de movimiento de un bloque actual que se codificará... [Seguir leyendo]
Reivindicaciones:
1. Un aparato de codificación de imágenes que codifica una imagen en movimiento, comprendiendo dicho aparato:
una unidad de especificación de bloques vecinos accionable para especificar un bloque vecino que está situado en la vecindad del bloque actual y que ya ha sido codificado,
una unidad de valoración accionable para valorar si el bloque vecino ha sido o no codificado usando un vector de 10 movimiento calculado a partir de un vector de movimiento de otro bloque situado temporalmente después del bloque vecino;
una unidad de determinación accionable para determinar un vector de movimiento del bloque vecino que será un vector de movimiento real usado en la realización de compensación de movimiento en el bloque vecino cuando 15 dicha unidad de valoración valora que el bloque vecino ha sido codificado usando el vector de movimiento calculado a partir del vector de movimiento de dicho otro bloque;
una unidad de predicción de vector de movimiento (116) accionable para obtener un vector de movimiento predictivo del bloque actual usando varios vectores de movimiento de varios bloques vecinos;
una unidad de codificación de vector de movimiento (117) accionable para codificar un valor de diferencia entre un vector de movimiento del bloque actual y el vector de movimiento predictivo obtenido de dicha unidad de predicción de vector de movimiento;
una unidad de compensación de movimiento (109) accionable para generar una imagen con compensación de movimiento usando el vector de movimiento del bloque actual y una imagen de referencia correspondiente al vector de movimiento del bloque actual; y
una unidad de codificación de imágenes (103) accionable para codificar un error de predicción entre el bloque actual 30 y la imagen con compensación de movimiento,
en el que dicho otro bloque es un bloque incluido en una imagen diferente a la imagen que incluye el bloque vecino, y el vector de movimiento real del bloque vecino se calcula a partir del vector de movimiento de dicho otro bloque.
2. Un procedimiento de codificación de imágenes para codificar una imagen en movimiento, comprendiendo dicho procedimiento:
una etapa de especificación de bloque vecino (S100, S300) para la especificación de un bloque vecino que está situado en la vecindad del bloque actual y que ya ha sido codificado,
una etapa de valoración (S102, S302) para valorar si el bloque vecino ha sido o no codificado usando un vector de movimiento calculado a partir de un vector de movimiento de otro bloque situado temporalmente después del bloque vecino;
una etapa de determinación para determinar un vector de movimiento del bloque vecino que será un vector de movimiento real usado en la realización de compensación de movimiento en el bloque vecino, cuando se valora, en dicha etapa de valoración (S102, S302) , que el bloque vecino ha sido codificado usando el vector de movimiento calculado a partir del vector de movimiento de dicho otro bloque;
una etapa de predicción de vector de movimiento (S106, S310) para obtener un vector de movimiento predictivo del bloque actual usando varios vectores de movimiento de varios bloques vecinos;
una etapa de codificación de vector de movimiento (S110, S316) para codificar un valor de diferencia entre un vector de movimiento del bloque actual y el vector de movimiento predictivo obtenido en dicha etapa de predicción de 55 vector de movimiento;
una etapa de compensación de movimiento para generar una imagen con compensación de movimiento usando el vector de movimiento del bloque actual y una imagen de referencia correspondiente al vector de movimiento del bloque actual; y una etapa de codificación de imágenes para codificar un error de predicción entre el bloque actual y la imagen con compensación de movimiento,
en el que dicho otro bloque es un bloque incluido en una imagen diferente de una imagen que incluye el bloque vecino, y el vector de movimiento real del bloque vecino para el que se valora que ha sido codificado usando el vector de movimiento de dicho otro bloque en la etapa de valoración (S102, S302) se calcula a partir del vector de movimiento de dicho otro bloque.
Patentes similares o relacionadas:
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Procedimiento de compresión de información de vídeo, del 30 de Octubre de 2019, de Broadmedia GC Corporation: Un procedimiento de compresión de información de vídeo, que comprende las etapas de: - proyectar puntos de una imagen siguiente en puntos proyectados […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un método de codificación de imágenes para codificar un bloque actual incluido en una imagen actual en modo directo, comprendiendo el método de codificación de imágenes: […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una […]
Procedimiento de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación de imágenes para codificar un bloque actual incluido en una imagen actual, comprendiendo el procedimiento […]
Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una imagen actual […]