Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos.
Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque,
comprendiendo el aparato de codificación de imágenes:
una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y
una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen,
en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10165422.
Solicitante: Panasonic Intellectual Property Corporation of America.
Inventor/es: KADONO, SHINYA, ABE, KIYOFUMI, KONDO, SATOSHI.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
- H04N19/13 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Codificación de entropía adaptativa, p. ej. codificación adaptativa de longitud variable [AVLC] o codificación adaptativa de contexto de aritmética binaria [CABAC].
- H04N19/159 H04N 19/00 […] › Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional.
- H04N19/46 H04N 19/00 […] › Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70 tienen prioridad).
- H04N19/50 H04N 19/00 […] › utilizando codificación predictiva (H04N 19/61 tiene prioridad).
- H04N19/503 H04N 19/00 […] › que implica predicción temporal (codificación adaptativa con la selección adaptativa entre codificación predictiva espacial y temporal H04N 19/107; codificación adaptativa con la selección adaptativa entre una pluralidad de modos codificación predictiva temporales H04N 19/109).
- H04N19/70 H04N 19/00 […] › caracterizado por los aspectos relacionados con la sintaxis de codificación de vídeo, p. ej en relación con los estándares de compresión.
- H04N19/85 H04N 19/00 […] › utiliazando pre-tratamiento o post-procesamiento adaptado especialmente para la compresión de vídeo.
- H04N19/91 H04N 19/00 […] › Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética.
PDF original: ES-2535957_T3.pdf
Fragmento de la descripción:
Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos
Campo de la técnica La presente invención se refiere a un aparato de codificación y a un aparato de descodificación para codificar y descodificar imágenes en movimiento, en especial a un aparato de codificación de imágenes y a un aparato de descodificación de imágenes para realizar una estimación de movimiento usando factores de ponderación y los métodos de los mismos.
Antecedentes de la técnica Recientemente, con la llegada de la época de la multimedia que maneja de forma integral audio, imagen, otros contenidos o similares, en la actualidad es posible obtener o transmitir la información transportada por los medios de información existentes, es decir, periódicos, revistas, TV, radios y teléfonos y otros medios, usando un único terminal. Hablando en términos generales, multimedia se refiere a algo que se representa en asociación no solo con caracteres sino también con gráficos, audio y en especial imágenes y similares de forma conjunta. No obstante, con el fin de incluir los medios de información existentes que se han mencionado en lo que antecede en el alcance de la multimedia, aparece como un prerrequisito la representación de tal información en forma digital.
No obstante, cuando se estima la cantidad de información que está contenida en cada uno de los medios de información que se han mencionado en lo que antecede como la cantidad de información digital, la cantidad de información por carácter requiere 1 ~ 2 bytes mientras que el audio requiere más de 64 kbits (calidad de teléfono)
por segundo y cuando se trata de la imagen en movimiento, esta requiere más de 100 Mbits (la calidad de recepción de televisión) por segundo. Por lo tanto, no es realista manejar la vasta información directamente en forma digital por medio de los medios de información que se han mencionado en lo que antecede. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono por medio de Red Digital de Servicios Integrados (ISDN, Integrated Services Digital Network) con una tasa de transmisión de 64 kbps ~ 1, 5 Mbps, no obstante, no es práctico transmitir la imagen en movimiento que se captura en la pantalla de TV o que se filma por una cámara de TV.
Por lo tanto, esto requiere técnicas de compresión de información, y por ejemplo, en el caso del videoteléfono se usan técnicas de compresión de imágenes en movimiento conformes a las normas H.261 y H.263 normalizadas a nivel internacional por la UIT-T (Unión Internacional de Telecomunicaciones -Sector de Normalización de las Telecomunicaciones) . De acuerdo con técnicas de compresión de información conformes a la norma MPEG-1, en un CD (Compact Disc, disco compacto) de música ordinario puede almacenarse información de imagen así como información de música.
La norma MPEG (Moving Picture Experts Group, grupo de expertos en imágenes en movimiento) es una norma internacional para la compresión de señales de imágenes en movimiento y MPEG-1 es una norma que comprime señales de imágenes en movimiento hasta 1, 5 Mbps, de decir, para comprimir información de señales de TV aproximadamente hasta una centésima parte. La tasa de transmisión dentro del alcance de la norma MPEG-1 se limita principalmente a aproximadamente 1, 5 Mbps, por lo tanto, MPEG-2, que se normalizó con vistas a cumplir los requisitos de las imágenes de alta calidad, permite una transmisión de datos de señales de imágenes en movimiento 45 a una tasa de 2 ~ 15 Mbps. En las presentes circunstancias, un grupo de trabajo (ISO / IEC JTC1 / SC29 / WG11) a cargo de la normalización de la norma MPEG-1 y la norma MPEG-2 ha normalizado MPEG-4 que logra una tasa de compresión que va más allá de la que se consigue por la norma MPEG-1 y la norma MPEG-2, realiza unas operaciones de codificación / descodificación de una forma en función del objeto así como una nueva función que es requerida por la época de la multimedia (véase la referencia, por ejemplo, a las especificaciones de las normas MPEG-1, MPEG-2 y MPEG-4 producidas por la ISO) . La norma MPEG-4 no solo realiza un método de codificación sumamente eficiente para una baja tasa de bits sino que también introduce unas potentes técnicas de resistencia a errores que pueden minimizar un deterioro de la calidad de pantalla incluso cuando se halla un error en una línea de transmisión. Así mismo, la ISO / IEC y la UIT trabajan de forma conjunta en una normalización de MPEG-4 AVC / ITU H. 264 como un método de codificación de imágenes de la siguiente generación.
La codificación de imágenes en movimiento, en general, comprime el volumen de información mediante la reducción de la redundancia en las direcciones tanto temporal como espacial. Por lo tanto, una codificación de predicción de inter-imagen, que se dirige a reducir la redundancia temporal, estima un movimiento y genera una imagen predictiva de una forma de bloque a bloque con referencia a imágenes previas y subsiguientes con respecto a una imagen actual que va a codificarse y, a continuación, codifica un valor diferencial entre la imagen predictiva obtenida y la imagen actual. En el presente caso, la expresión “imagen” representa una única pantalla mientras que esta representa una trama cuando se usa en un contexto de imagen progresiva así como una trama o un campo en un contexto de una imagen entrelazada. En el presente caso, la imagen entrelazada es una imagen en la que una única trama consiste en dos campos que tienen un tiempo diferente. En el proceso de codificación y descodificación de la 65 imagen entrelazada, son posibles tres formas: manejar una única trama o bien como una trama, o bien como dos campos o bien como una estructura de tramas o una estructura de campos dependiendo de un bloque en la trama.
La figura 1 es un diagrama que muestra un ejemplo de tipos de imágenes y cómo las imágenes están relacionadas unas con otras. Las imágenes rayadas en la figura 1 son unas imágenes que van a almacenarse en una memoria debido a que se hace referencia a las mismas por otras imágenes. En lo que respecta a las flechas que se usan en la figura 1, la punta de la flecha apunta a una imagen de referencia alejándose de una imagen que se refiere a la imagen de referencia. En el presente caso, las imágenes se encuentran en orden de visualización.
I0 (la imagen 0) es una imagen intra-codificada (imagen I) que se codifica independientemente de otras imágenes (en concreto, sin hacer referencia a otras imágenes) . P4 (la imagen 4) y P7 (la imagen 7) son unas imágenes codificadas de predicción hacia delante (imagen P) que se codifican de forma predictiva con referencia a imágenes I que están ubicadas temporalmente previas con respecto a la imagen actual u otras imágenes P. B1 ~ B3 (las imágenes 1 ~ 3) , B5 (la imagen 5) y B6 (la imagen 6) son unas imágenes codificadas de predicción bidireccional (imagen B) que se codifican de forma predictiva con referencia a otras imágenes tanto temporalmente previas como subsiguientes con respecto a la imagen actual.
La figura 2 es un diagrama que muestra otro ejemplo de los tipos de imágenes y cómo las imágenes están relacionadas unas con otras. La diferencia entre la figura 2 y la figura 1 es que una posición temporal de las imágenes a las que se hace referencia por una imagen B no se limita a las imágenes que están ubicadas temporalmente previas y subsiguientes con respecto a la imagen B. Por ejemplo, la B5 puede referirse a dos imágenes arbitrarias de entre I0 (la imagen 0) , P3 (la imagen 3) y P6 (la imagen 6) . En concreto, la I0 y la P3, temporalmente ubicadas previamente, pueden usarse como imágenes de referencia. Un método de referencia de este tipo ya se reconoce en la especificación de la norma MPEG-4 AVC / H.264 en septiembre de 2001. Por lo tanto, se amplía un rango para seleccionar una imagen predictiva óptima y, por lo tanto, la tasa de compresión puede mejorarse.
La figura 3 es un diagrama que muestra un ejemplo de una estructura de flujo de datos de imagen. Tal como se muestra en la figura 3, el flujo incluye un área de información común tal como un encabezamiento o similares y un área de GOP (Group of Pictures, grupo de imágenes) . El área de GOP incluye un área de información común tal como un encabezamiento o similares y una pluralidad de áreas de imagen. El área de imagen incluye un área de información común tal como un encabezamiento o similares y una pluralidad de áreas de datos de sector. El área de datos de sector incluye un área de información común tal como un encabezamiento y una pluralidad de áreas de datos de macrobloque.
En el área de información común de imagen, el factor de ponderación necesario para realizar... [Seguir leyendo]
Reivindicaciones:
1. Un aparato de codificación de imágenes que codifica una imagen de una forma de bloque a bloque, comprendiendo el aparato de codificación de imágenes:
una unidad de compensación de movimiento configurada para generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y para generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel
de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y una unidad de codificación de longitud variable configurada para codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.
2. Un método de codificación de imágenes para codificar una imagen de una forma de bloque a bloque, comprendiendo el método de codificación de imágenes:
generar, cuando se realiza una codificación de tramas sobre un bloque que está incluido en la imagen, una imagen predictiva usando i) valores de píxel de una trama de referencia a la que hace referencia el bloque y ii) un factor de ponderación de tramas, y generar, cuando se realiza una codificación de campos sobre el bloque, una imagen predictiva usando i) valores de píxel de un campo de referencia al que hace referencia el bloque y ii) un factor de ponderación de campos; y codificar solo el factor de ponderación de tramas sin codificar el factor de ponderación de campos y emitir una señal codificada que incluye i) una imagen codificada que se genera usando la imagen predictiva y ii) el factor de ponderación de tramas codificado, cuando la imagen tiene una estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen, en donde el factor de ponderación de campos se genera a partir el factor de ponderación de tramas cuando la imagen tiene la estructura de tramas y la conmutación entre la codificación de tramas y la codificación de campos se realiza de forma adaptativa por bloque que está incluido en la imagen.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]
Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]
Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]
Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]