Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos.

Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque,

comprendiendo el aparato de codificación de imágenes:

una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y

una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen,

en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10165422.

Solicitante: Panasonic Intellectual Property Corporation of America.

Inventor/es: KADONO, SHINYA, ABE, KIYOFUMI, KONDO, SATOSHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06T9/00 SECCION G — FISICA.G06 COMPUTO; CALCULO; CONTEO.G06T TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL (especialmente adoptados para aplicaciones particulares, ver las subclases apropiadas, p. ej. G01C, G06K, G09G, H04N). › Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N).
  • H04N19/13 SECCION H — ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Codificación de entropía adaptativa, p. ej. codificación adaptativa de longitud variable [AVLC] o codificación adaptativa de contexto de aritmética binaria [CABAC].
  • H04N19/159 H04N 19/00 […] › Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional.
  • H04N19/46 H04N 19/00 […] › Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70  tienen prioridad).
  • H04N19/50 H04N 19/00 […] › utilizando codificación predictiva (H04N 19/61  tiene prioridad).
  • H04N19/503 H04N 19/00 […] › que implica predicción temporal (codificación adaptativa con la selección adaptativa entre codificación predictiva espacial y temporal H04N 19/107; codificación adaptativa con la selección adaptativa entre una pluralidad de modos codificación predictiva temporales H04N 19/109).
  • H04N19/70 H04N 19/00 […] › caracterizado por los aspectos relacionados con la sintaxis de codificación de vídeo, p. ej en relación con los estándares de compresión.
  • H04N19/85 H04N 19/00 […] › utiliazando pre-tratamiento o post-procesamiento adaptado especialmente para la compresión de vídeo.
  • H04N19/91 H04N 19/00 […] › Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética.

PDF original: ES-2535957_T3.pdf

 


Fragmento de la descripción:

Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos

Campo de la técnica La presente invención se refiere a un aparato de codificación y a un aparato de descodificación para codificar y descodificar imágenes en movimiento, en especial a un aparato de codificación de imágenes y a un aparato de descodificación de imágenes para realizar una estimación de movimiento usando factores de ponderación y los métodos de los mismos.

Antecedentes de la técnica Recientemente, con la llegada de la época de la multimedia que maneja de forma integral audio, imagen, otros contenidos o similares, en la actualidad es posible obtener o transmitir la información transportada por los medios de información existentes, es decir, periódicos, revistas, TV, radios y teléfonos y otros medios, usando un único terminal. Hablando en términos generales, multimedia se refiere a algo que se representa en asociación no solo con caracteres sino también con gráficos, audio y en especial imágenes y similares de forma conjunta. No obstante, con el fin de incluir los medios de información existentes que se han mencionado en lo que antecede en el alcance de la multimedia, aparece como un prerrequisito la representación de tal información en forma digital.

No obstante, cuando se estima la cantidad de información que está contenida en cada uno de los medios de información que se han mencionado en lo que antecede como la cantidad de información digital, la cantidad de información por carácter requiere 1 ~ 2 bytes mientras que el audio requiere más de 64 kbits (calidad de teléfono)

por segundo y cuando se trata de la imagen en movimiento, esta requiere más de 100 Mbits (la calidad de recepción de televisión) por segundo. Por lo tanto, no es realista manejar la vasta información directamente en forma digital por medio de los medios de información que se han mencionado en lo que antecede. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono por medio de Red Digital de Servicios Integrados (ISDN, Integrated Services Digital Network) con una tasa de transmisión de 64 kbps ~ 1, 5 Mbps, no obstante, no es práctico transmitir la imagen en movimiento que se captura en la pantalla de TV o que se filma por una cámara de TV.

Por lo tanto, esto requiere técnicas de compresión de información, y por ejemplo, en el caso del videoteléfono se usan técnicas de compresión de imágenes en movimiento conformes a las normas H.261 y H.263 normalizadas a nivel internacional por la UIT-T (Unión Internacional de Telecomunicaciones -Sector de Normalización de las Telecomunicaciones) . De acuerdo con técnicas de compresión de información conformes a la norma MPEG-1, en un CD (Compact Disc, disco compacto) de música ordinario puede almacenarse información de imagen así como información de música.

La norma MPEG (Moving Picture Experts Group, grupo de expertos en imágenes en movimiento) es una norma internacional para la compresión de señales de imágenes en movimiento y MPEG-1 es una norma que comprime señales de imágenes en movimiento hasta 1, 5 Mbps, de decir, para comprimir información de señales de TV aproximadamente hasta una centésima parte. La tasa de transmisión dentro del alcance de la norma MPEG-1 se limita principalmente a aproximadamente 1, 5 Mbps, por lo tanto, MPEG-2, que se normalizó con vistas a cumplir los requisitos de las imágenes de alta calidad, permite una transmisión de datos de señales de imágenes en movimiento 45 a una tasa de 2 ~ 15 Mbps. En las presentes circunstancias, un grupo de trabajo (ISO / IEC JTC1 / SC29 / WG11) a cargo de la normalización de la norma MPEG-1 y la norma MPEG-2 ha normalizado MPEG-4 que logra una tasa de compresión que va más allá de la que se consigue por la norma MPEG-1 y la norma MPEG-2, realiza unas operaciones de codificación / descodificación de una forma en función del objeto así como una nueva función que es requerida por la época de la multimedia (véase la referencia, por ejemplo, a las especificaciones de las normas MPEG-1, MPEG-2 y MPEG-4 producidas por la ISO) . La norma MPEG-4 no solo realiza un método de codificación sumamente eficiente para una baja tasa de bits sino que también introduce unas potentes técnicas de resistencia a errores que pueden minimizar un deterioro de la calidad de pantalla incluso cuando se halla un error en una línea de transmisión. Así mismo, la ISO / IEC y la UIT trabajan de forma conjunta en una normalización de MPEG-4 AVC / ITU H. 264 como un método de codificación de imágenes de la siguiente generación.

La codificación de imágenes en movimiento, en general, comprime el volumen de información mediante la reducción de la redundancia en las direcciones tanto temporal como espacial. Por lo tanto, una codificación de predicción de inter-imagen, que se dirige a reducir la redundancia temporal, estima un movimiento y genera una imagen predictiva de una forma de bloque a bloque con referencia a imágenes previas y subsiguientes con respecto a una imagen actual que va a codificarse y, a continuación, codifica un valor diferencial entre la imagen predictiva obtenida y la imagen actual. En el presente caso, la expresión “imagen” representa una única pantalla mientras que esta representa una trama cuando se usa en un contexto de imagen progresiva así como una trama o un campo en un contexto de una imagen entrelazada. En el presente caso, la imagen entrelazada es una imagen en la que una única trama consiste en dos campos que tienen un tiempo diferente. En el proceso de codificación y descodificación de la 65 imagen entrelazada, son posibles tres formas: manejar una única trama o bien como una trama, o bien como dos campos o bien como una estructura de tramas o una estructura de campos dependiendo de un bloque en la trama.

La figura 1 es un diagrama que muestra un ejemplo de tipos de imágenes y cómo las imágenes están relacionadas unas con otras. Las imágenes rayadas en la figura 1 son unas imágenes que van a almacenarse en una memoria debido a que se hace referencia a las mismas por otras imágenes. En lo que respecta a las flechas que se usan en la figura 1, la punta de la flecha apunta a una imagen de referencia alejándose de una imagen que se refiere a la imagen de referencia. En el presente caso, las imágenes se encuentran en orden de visualización.

I0 (la imagen 0) es una imagen intra-codificada (imagen I) que se codifica independientemente de otras imágenes (en concreto, sin hacer referencia a otras imágenes) . P4 (la imagen 4) y P7 (la imagen 7) son unas imágenes codificadas de predicción hacia delante (imagen P) que se codifican de forma predictiva con referencia a imágenes I que están ubicadas temporalmente previas con respecto a la imagen actual u otras imágenes P. B1 ~ B3 (las imágenes 1 ~ 3) , B5 (la imagen 5) y B6 (la imagen 6) son unas imágenes codificadas de predicción bidireccional (imagen B) que se codifican de forma predictiva con referencia a otras imágenes tanto temporalmente previas como subsiguientes con respecto a la imagen actual.

La figura 2 es un diagrama que muestra otro ejemplo de los tipos de imágenes y cómo las imágenes están relacionadas unas con otras. La diferencia entre la figura 2 y la figura 1 es que una posición temporal de las imágenes a las que se hace referencia por una imagen B no se limita a las imágenes que están ubicadas temporalmente previas y subsiguientes con respecto a la imagen B. Por ejemplo, la B5 puede referirse a dos imágenes arbitrarias de entre I0 (la imagen 0) , P3 (la imagen 3) y P6 (la imagen 6) . En concreto, la I0 y la P3, temporalmente ubicadas previamente, pueden usarse como imágenes de referencia. Un método de referencia de este tipo ya se reconoce en la especificación de la norma MPEG-4 AVC / H.264 en septiembre de 2001. Por lo tanto, se amplía un rango para seleccionar una imagen predictiva óptima y, por lo tanto, la tasa de compresión puede mejorarse.

La figura 3 es un diagrama que muestra un ejemplo de una estructura de flujo de datos de imagen. Tal como se muestra en la figura 3, el flujo incluye un área de información común tal como un encabezamiento o similares y un área de GOP (Group of Pictures, grupo de imágenes) . El área de GOP incluye un área de información común tal como un encabezamiento o similares y una pluralidad de áreas de imagen. El área de imagen incluye un área de información común tal como un encabezamiento o similares y una pluralidad de áreas de datos de sector. El área de datos de sector incluye un área de información común tal como un encabezamiento y una pluralidad de áreas de datos de macrobloque.

En el área de información común de imagen, el factor de ponderación necesario para realizar... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque, comprendiendo el aparato de codificación de imágenes:

una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel

de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.

2. Un método de codificación de imágenes para codificar una imagen de una forma de bloque a bloque, comprendiendo el método de codificación de imágenes:

generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.


 

Patentes similares o relacionadas:

Procedimiento de codificación de vídeo, procedimiento de decodificación de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, programa de codificación de vídeo y programa de decodificación de vídeo, del 1 de Mayo de 2019, de NTT DOCOMO, INC.: Procedimiento de decodificación de imágenes codificadas, comprendiendo el procedimiento: recibir una imagen codificada (n), una temporización de decodificación […]

Procedimiento de descodificación de imágenes y dispositivo de descodificación, del 3 de Abril de 2019, de Panasonic Intellectual Property Corporation of America: Un dispositivo de descodificación que descodifica un flujo de bits de una señal de imagen codificada (Str) que comprende un flujo de cabecera (Str_H) y un flujo de trama […]

Ponderación adaptativa de imágenes de referencia en codificación de vídeo, del 27 de Marzo de 2019, de InterDigital VC Holdings, Inc: Un aparato de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, incluyendo los datos de […]

Cálculo del vector de movimiento en modo directo evitando divisiones por cero, del 27 de Marzo de 2019, de Godo Kaisha IP Bridge 1: Un procedimiento de decodificación de modo directo temporal para la decodificación de un bloque actual de una imagen actual tanto por decodificación de imagen […]

Método de codificación de imágenes en movimiento y método de decodificación de imágenes en movimiento, del 30 de Enero de 2019, de Panasonic Intellectual Property Corporation of America: Un método de codificación y decodificación que incluye un método de codificación para codificar una imagen y un método de decodificación […]

Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento, del 30 de Enero de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación y decodificación de imágenes que incluye un procedimiento de codificación de imágenes para codificar una imagen B objetivo […]

Método y aparato para representar la granularidad de imagen mediante uno o más parámetros, del 24 de Enero de 2019, de DOLBY INTERNATIONAL AB: Un método para proporcionar información del grano de película que comprende los pasos de: caracterizar un flujo de información de imagen antes de la codificación […]

Procesamiento de imágenes, del 9 de Enero de 2019, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un decodificador de bloqueo que comprende: un genrador de color configurado para generar, basándose en un código de color […]

Otras patentes de Panasonic Intellectual Property Corporation of America