Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos.

Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque

, comprendiendo el aparato de codificación de imágenes:

una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y

una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen,

en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10165422.

Solicitante: Panasonic Intellectual Property Corporation of America.

Inventor/es: KADONO, SHINYA, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > G06T9/00 (Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/159 (Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/50 (utilizando codificación predictiva (H04N 19/61  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/91 (Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/13 (Codificación de entropía adaptativa, p. ej. codificación adaptativa de longitud variable [AVLC] o codificación adaptativa de contexto de aritmética binaria [CABAC])
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/46 (Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70  tienen prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/70 (caracterizado por los aspectos relacionados con la sintaxis de codificación de vídeo, p. ej en relación con los estándares de compresión)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/503 (que implica predicción temporal (codificación adaptativa con la selección adaptativa entre codificación predictiva espacial y temporal H04N 19/107; codificación adaptativa con la selección adaptativa entre una pluralidad de modos codificación predictiva temporales H04N 19/109))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/85 (utiliazando pre-tratamiento o post-procesamiento adaptado especialmente para la compresión de vídeo)

PDF original: ES-2535957_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos

Campo de la técnica La presente invención se refiere a un aparato de codificación y a un aparato de descodificación para codificar y descodificar imágenes en movimiento, en especial a un aparato de codificación de imágenes y a un aparato de descodificación de imágenes para realizar una estimación de movimiento usando factores de ponderación y los métodos de los mismos.

Antecedentes de la técnica Recientemente, con la llegada de la época de la multimedia que maneja de forma integral audio, imagen, otros contenidos o similares, en la actualidad es posible obtener o transmitir la información transportada por los medios de información existentes, es decir, periódicos, revistas, TV, radios y teléfonos y otros medios, usando un único terminal. Hablando en términos generales, multimedia se refiere a algo que se representa en asociación no solo con caracteres sino también con gráficos, audio y en especial imágenes y similares de forma conjunta. No obstante, con el fin de incluir los medios de información existentes que se han mencionado en lo que antecede en el alcance de la multimedia, aparece como un prerrequisito la representación de tal información en forma digital.

No obstante, cuando se estima la cantidad de información que está contenida en cada uno de los medios de información que se han mencionado en lo que antecede como la cantidad de información digital, la cantidad de información por carácter requiere 1 ~ 2 bytes mientras que el audio requiere más de 64 kbits (calidad de teléfono)

por segundo y cuando se trata de la imagen en movimiento, esta requiere más de 100 Mbits (la calidad de recepción de televisión) por segundo. Por lo tanto, no es realista manejar la vasta información directamente en forma digital por medio de los medios de información que se han mencionado en lo que antecede. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono por medio de Red Digital de Servicios Integrados (ISDN, Integrated Services Digital Network) con una tasa de transmisión de 64 kbps ~ 1, 5 Mbps, no obstante, no es práctico transmitir la imagen en movimiento que se captura en la pantalla de TV o que se filma por una cámara de TV.

Por lo tanto, esto requiere técnicas de compresión de información, y por ejemplo, en el caso del videoteléfono se usan técnicas de compresión de imágenes en movimiento conformes a las normas H.261 y H.263 normalizadas a nivel internacional por la UIT-T (Unión Internacional de Telecomunicaciones -Sector de Normalización de las Telecomunicaciones) . De acuerdo con técnicas de compresión de información conformes a la norma MPEG-1, en un CD (Compact Disc, disco compacto) de música ordinario puede almacenarse información de imagen así como información de música.

La norma MPEG (Moving Picture Experts Group, grupo de expertos en imágenes en movimiento) es una norma internacional para la compresión de señales de imágenes en movimiento y MPEG-1 es una norma que comprime señales de imágenes en movimiento hasta 1, 5 Mbps, de decir, para comprimir información de señales de TV aproximadamente hasta una centésima parte. La tasa de transmisión dentro del alcance de la norma MPEG-1 se limita principalmente a aproximadamente 1, 5 Mbps, por lo tanto, MPEG-2, que se normalizó con vistas a cumplir los requisitos de las imágenes de alta calidad, permite una transmisión de datos de señales de imágenes en movimiento 45 a una tasa de 2 ~ 15 Mbps. En las presentes circunstancias, un grupo de trabajo (ISO / IEC JTC1 / SC29 / WG11) a cargo de la normalización de la norma MPEG-1 y la norma MPEG-2 ha normalizado MPEG-4 que logra una tasa de compresión que va más allá de la que se consigue por la norma MPEG-1 y la norma MPEG-2, realiza unas operaciones de codificación / descodificación de una forma en función del objeto así como una nueva función que es requerida por la época de la multimedia (véase la referencia, por ejemplo, a las especificaciones de las normas MPEG-1, MPEG-2 y MPEG-4 producidas por la ISO) . La norma MPEG-4 no solo realiza un método de codificación sumamente eficiente para una baja tasa de bits sino que también introduce unas potentes técnicas de resistencia a errores que pueden minimizar un deterioro de la calidad de pantalla incluso cuando se halla un error en una línea de transmisión. Así mismo, la ISO / IEC y la UIT trabajan de forma conjunta en una normalización de MPEG-4 AVC / ITU H. 264 como un método de codificación de imágenes de la siguiente generación.

La codificación de imágenes en movimiento, en general, comprime el volumen de información mediante la reducción de la redundancia en las direcciones tanto temporal como espacial. Por lo tanto, una codificación de predicción de inter-imagen, que se dirige a reducir la redundancia temporal, estima un movimiento y genera una imagen predictiva de una forma de bloque a bloque con referencia a imágenes previas y subsiguientes con respecto a una imagen actual que va a codificarse y, a continuación, codifica un valor diferencial entre la imagen predictiva obtenida y la imagen actual. En el presente caso, la expresión “imagen” representa una única pantalla mientras que esta representa una trama cuando se usa en un contexto de imagen progresiva así como una trama o un campo en un contexto de una imagen entrelazada. En el presente caso, la imagen entrelazada es una imagen en la que una única trama consiste en dos campos que tienen un tiempo diferente. En el proceso de codificación y descodificación de la 65 imagen entrelazada, son posibles tres formas: manejar una única trama o bien como una trama, o bien como dos campos o bien como una estructura de tramas o una estructura de campos dependiendo de un bloque en la trama.

La figura 1 es un diagrama que muestra un ejemplo de tipos de imágenes y cómo las imágenes están relacionadas unas con otras. Las imágenes rayadas en la figura 1 son unas imágenes que van a almacenarse en una memoria debido a que se hace referencia a las mismas por otras imágenes. En lo que respecta a las flechas que se usan en la figura 1, la punta de la flecha apunta a una imagen de referencia alejándose de una imagen que se refiere a la imagen de referencia. En el presente caso, las imágenes se encuentran en orden de visualización.

I0 (la imagen 0) es una imagen intra-codificada (imagen I) que se codifica independientemente de otras imágenes (en concreto, sin hacer referencia a otras imágenes) . P4 (la imagen 4) y P7 (la imagen 7) son unas imágenes codificadas de predicción hacia delante (imagen P) que se codifican de forma predictiva con referencia a imágenes I que están ubicadas temporalmente previas con respecto a la imagen actual u otras imágenes P. B1 ~ B3 (las imágenes 1 ~ 3) , B5 (la imagen 5) y B6 (la imagen 6) son unas imágenes codificadas de predicción bidireccional (imagen B) que se codifican de forma predictiva con referencia a otras imágenes tanto temporalmente previas como subsiguientes con respecto a la imagen actual.

La figura 2 es un diagrama que muestra otro ejemplo de los tipos de imágenes y cómo las imágenes están relacionadas unas con otras. La diferencia entre la figura 2 y la figura 1 es que una posición temporal de las imágenes a las que se hace referencia por una imagen B no se limita a las imágenes que están ubicadas temporalmente previas y subsiguientes con respecto a la imagen B. Por ejemplo, la B5 puede referirse a dos imágenes arbitrarias de entre I0 (la imagen 0) , P3 (la imagen 3) y P6 (la imagen 6) . En concreto, la I0 y la P3, temporalmente ubicadas previamente, pueden usarse como imágenes de referencia. Un método de referencia de este tipo ya se reconoce en la especificación de la... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque, comprendiendo el aparato de codificación de imágenes:

una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel

de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.

2. Un método de codificación de imágenes para codificar una imagen de una forma de bloque a bloque, comprendiendo el método de codificación de imágenes:

generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.