Técnica de llenado de datos para compresión de documentos compuestos.

Método que comprende:

recibir una imagen y una máscara asociada con la imagen para generar un documento compuesto;

y

realizar un proceso de llenado de datos de múltiples pasos iterativo, basado en bloques para llenar una capa como parte de una compresión de documentos compuestos, comprendiendo la capa píxeles de importancia relevantes para la reconstrucción y píxeles sin importancia irrelevantes para la reconstrucción,

clasificar bloques de al menos una de las capas de primer plano y segundo plano,

en el que la clasificación de bloques comprende identificar cada bloque que tiene sólo píxeles de importancia con píxeles de borde, cada bloque que tiene sólo píxeles de importancia sin píxeles de borde, cada bloque que contiene sólo píxeles sin importancia con píxeles de borde, cada bloque que contiene sólo píxeles sin importancia sin píxeles de borde y cada bloque que contiene un borde creado por al menos un píxel de importancia que es adyacente a al menos un píxel sin importancia, en el que un píxel se detecta como píxel de borde si tiene un valor de máscara diferente de cualquiera de sus vecinos;

y la realización de un proceso de llenado de datos de múltiples pasos iterativo basado en bloques comprende, para cada bloque durante un primer paso:

llenar todos los píxeles de importancia no de borde con sus valores originales, asignar cada píxel de borde y píxel sin importancia en cada bloque clasificado como que contiene sólo píxeles de importancia con píxeles de borde, que contiene sólo píxeles de importancia sin píxeles de borde, que contiene sólo píxeles sin importancia con píxeles de borde o que contiene un borde creado por al menos un píxel de importancia que es adyacente a al menos un píxel sin importancia con un valor basándose en un promedio de píxeles de importancia no de borde en una ventana que contiene cada uno de dichos bloques, en el que la ventana es más grande que el tamaño de bloque; y

asignar cada píxel de importancia en cada bloque que contiene sólo píxeles sin importancia sin píxeles de borde a los correspondientes valores de píxel del correspondiente bloque en la imagen.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E07114947.

Solicitante: RICOH COMPANY, LTD..

Nacionalidad solicitante: Japón.

Dirección: 3-6, NAKAMAGOME 1-CHOME OHTA-KU TOKYO 143-8555 JAPON.

Inventor/es: FENG,GUOTONG, GORMISH,MICHAEL J.

Fecha de Publicación: 15 de Enero de 2014.

Clasificación Internacional de Patentes:

H04N1/41 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).

PDF original: ES-2457524_T3.pdf

Fragmento de la descripción:

Técnica de llenado de datos para compresión de documentos compuestos

CAMPO DE LA INVENCIÓN

La presente invención se refiere al campo de la compresión de documentos compuestos; más particularmente, la presente invención se refiere a una técnica de llenado de datos para su uso en la compresión de documentos compuestos.

ANTECEDENTES DE LA INVENCIÓN

Contenido mixto de gráficos (MRC) es una norma ITU (T.44) para la compresión de documentos compuestos, en la que una imagen de documento se separa en múltiples capas, y cada capa se comprime mediante un codificador específico que es adecuado para esa capa. Un documento de MRC de 3 capas típico contiene una máscara binaria, una capa de primer plano y una capa de segundo plano, en el que se usa cada valor de píxel de la máscara para seleccionar entre los píxeles de primer plano y segundo plano en la reconstrucción de la imagen de gráficos por puntos. En general, un codificador de MRC de 3 capas incluye la generación de máscaras, el llenado de datos (generación de primer plano y segundo plano) , ajuste a escala de primer plano y segundo plano, seguidos por una compresión separada de cada capa.

Aunque la generación de máscaras es crítica, el llenado de datos también es muy importante para conseguir un alto rendimiento de compresión. En general, se requiere un método de llenado de datos para un codificador basado en MRC para llenar todos los píxeles “sin importancia” (es decir, los píxeles irrelevantes para la reconstrucción) en las capas tanto de primer plano como de segundo plano. Con una compresión sin pérdidas, los píxeles “sin importancia” afectan sólo a la tasa de transmisión de bits. Sin embargo, cuando se usa una compresión con pérdidas para obtener menores tasas de transmisión de bits, una mala elección de los píxeles “sin importancia” puede cambiar los píxeles “de importancia” (es decir, los píxeles relevantes para la reconstrucción) durante la decodificación. Aunque los píxeles “sin importancia” no son directamente relevantes para la reconstrucción de la imagen, la selección de valores para estos píxeles puede tener un impacto significativo sobre el rendimiento de distorsión de tasa de la compresión. Por ejemplo, supongamos que los píxeles sin importancia en las capas de primer plano y segundo plano se llenan con un valor de color único. En este caso, pueden producirse artefactos de anillo inaceptables en la imagen descomprimida en el límite del primer plano y segundo plano con cualquier compresión con pérdidas tal como JPEG y JPEG2000, y por tanto el beneficio de la compresión de MRC se pierde significativamente.

Hay varios enfoques que se han propuesto para resolver estos problemas. Estos métodos pueden clasificarse en tres categorías: llenado de datos de dominio espacial; llenado de datos de dominio de frecuencia iterativo; y transformada dependiente de máscara.

Los enfoques de llenado de datos de dominio espacial son generalmente sencillos y rápidos. Los enfoques de llenado de datos de dominio de frecuencia iterativo proporcionan mayor compresión, pero son más caros desde el punto de vista computacional. Los enfoques de transformada dependiente de máscara dan como resultado una compresión muy alta, pero requieren una interacción entre la máscara y el primer plano/segundo plano para la compresión de las capas de primer plano y segundo plano y, por tanto, no cumplen completamente con MRC.

Más específicamente hay varios algoritmos de llenado de datos de dominio espacial, algunos de los cuales se describen a continuación. En un enfoque de llenado de datos de dominio espacial, se realizan múltiples pasos en cada bloque que contiene una mezcla de píxeles de importancia y sin importancia. En cada paso, cada píxel no llenado se determina por el promedio de los píxeles de importancia vecinos. Este procedimiento se repite hasta que todos los “espacios” se llenen. Para más información, véase De Querioz, “On Data-Filling Algorithms for MRC Layers”, Proc. IEEE Intl. Conf. on Image Processing, ICIP, Vancouver, Canadá, vol. II, págs. 586-589, septiembre de 2000.

Otro enfoque de llenado de datos de dominio espacial realiza un método de separación de capa con correspondencia de codificador que incluye un algoritmo de llenado de datos basado en bloques de un paso para la interpolación de píxeles sin importancia. Más específicamente, para cada bloque que contiene una mezcla de píxeles de importancia y sin importancia, los valores de los píxeles sin importancia se asignan basándose en el promedio de los píxeles de importancia de ese bloque. Cada bloque sin importancia se llena por o bien un valor predefinido o bien el valor promedio del bloque llenado previo. Para más información, véase la patente estadounidense n.º 6.941.024, titulada “Coder Matched Layer Separation and Interpolation for Compression of Compound Documents”, presentada en septiembre de 2005.

Otro enfoque de llenado de datos de dominio espacial se implementa en LuraDocuments desarrollado por Luratech. En este enfoque, se generan un primer plano y un segundo plano a una resolución reducida por un factor de 3. En cada bloque de 3x3 que contiene píxeles tanto de importancia como sin importancia, se toma un promedio de todos los píxeles de importancia excepto los píxeles de borde. Entonces, se usa un filtro de promediado de 5 x 5 para interpolar de manera iterativa los píxeles sin importancia usando estos valores promedio hasta que se llenen todos los “espacios”. Este método sí considera excluir los píxeles de borde en el promediado, reduciendo de ese modo un artefacto de anillo. Para más información, véase Thierschmann, et aI., “A Scalable DSP Architecture For High-Speed Color Document Compression”, Document Recognition and Retrieval VIII, Kantor, et aI., Editors, Proceedings of SPIE vol. 4307 (2001) , San José, CA, enero de 2001.

Segmentación y llenado de múltiple resolución (MSF) es un algoritmo de llenado de datos de múltiple resolución usado en el dominio de tren de ondas. El método usa una idea de “borde con pérdidas” que gestiona el efecto de borde para el llenado de datos. Para más información, véase la patente estadounidense con número de serie 10/927.323, titulada “Multi-resolution Segmentation and Fill”, presentada el 25 de agosto de 2004.

Pavlidis G. et al., “Compressing the background layer in compound images using JPEG and data filling” en Signal Processing: Image Communication, Elsevier Science Publishers, Ámsterdam, NL, volumen 20, n.º 5, junio de 2005, páginas 487 a 502, da a conocer un codificador de contenido adaptativo para comprimir documentos compuestos de gráficos por puntos. Puede conseguirse adaptividad de contenido empleando un enfoque por capas. En este enfoque, una imagen compuesta se segmenta en capas de modo que pueden usarse codificadores apropiados para comprimir estas capas individualmente. Se usan técnicas de llenado de datos para llenar las capas inicialmente dispersas para adaptar las características de las capas a las de los codificadores.

SUMARIO DE LA INVENCIÓN

En la reivindicación 1 se define un método para llenado de datos según la invención.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La presente invención se entenderá más completamente a partir de la descripción detallada proporcionada a continuación y a partir de los dibujos adjuntos de diversas realizaciones de la invención que, sin embargo, no deben limitar la invención a las realizaciones específicas, sino que sólo son para su explicación y entendimiento.

La figura 1 es un ejemplo de una imagen original y una máscara con indicadores para capas de primer plano y segundo plano.

La figura 2 es un diagrama de bloques de una realización de un sistema de compresión de documentos compuestos.

La figura 3 ilustra un ejemplo para los tres tipos de bloques de clasificación, incluyendo un bloque interior, un bloque sin importancia y un bloque de borde.

La figura 4 ilustra una ventana de 24x24 colocada en el ejemplo de la figura 3.

La figura 5 ilustra un ejemplo de un procedimiento de llenado de datos.

La figura 6 ilustra una detección de píxeles de borde en una proximidad de 3x3 en la zona de máscara.

La figura 7 ilustra un ejemplo para los cinco tipos de bloques de clasificación, incluyendo un bloque interior con píxeles de borde, un bloque interior sin píxeles de borde, un bloque sin importancia con píxeles de borde, un bloque sin importancia sin píxeles de borde y un bloque de borde.

La figura 8 ilustra los pasos secuenciales y la tabla de... [Seguir leyendo]

Reivindicaciones:

1. Método que comprende:

recibir una imagen y una máscara asociada con la imagen para generar un documento compuesto; y

realizar un proceso de llenado de datos de múltiples pasos iterativo, basado en bloques para llenar una capa como parte de una compresión de documentos compuestos, comprendiendo la capa píxeles de importancia relevantes para la reconstrucción y píxeles sin importancia irrelevantes para la reconstrucción,

clasificar bloques de al menos una de las capas de primer plano y segundo plano,

en el que la clasificación de bloques comprende identificar cada bloque que tiene sólo píxeles de importancia con píxeles de borde, cada bloque que tiene sólo píxeles de importancia sin píxeles de borde, cada bloque que contiene sólo píxeles sin importancia con píxeles de borde, cada bloque que contiene sólo píxeles sin importancia sin píxeles de borde y cada bloque que contiene un borde creado por al menos un píxel de importancia que es adyacente a al menos un píxel sin importancia, en el que un píxel se detecta como píxel de borde si tiene un valor de máscara diferente de cualquiera de sus vecinos;

y la realización de un proceso de llenado de datos de múltiples pasos iterativo basado en bloques comprende, para cada bloque durante un primer paso:

llenar todos los píxeles de importancia no de borde con sus valores originales, asignar cada píxel de borde y píxel sin importancia en cada bloque clasificado como que contiene sólo píxeles de importancia con píxeles de borde, que contiene sólo píxeles de importancia sin píxeles de borde, que contiene sólo píxeles sin importancia con píxeles de borde o que contiene un borde creado por al menos un píxel de importancia que es adyacente a al menos un píxel sin importancia con un valor basándose en un promedio de píxeles de importancia no de borde en una ventana que contiene cada uno de dichos bloques, en el que la ventana es más grande que el tamaño de bloque; y

asignar cada píxel de importancia en cada bloque que contiene sólo píxeles sin importancia sin píxeles de borde a los correspondientes valores de píxel del correspondiente bloque en la imagen.

2. Método según la reivindicación 1, en el que la realización de un proceso de llenado de datos de múltiples pasos iterativo basado en bloques comprende además realizar un paso posterior para cada bloque no llenado que incluye:

mantener cada uno de dichos bloques no llenados sin llenar si ninguno de un conjunto de bloques vecinos se llena en un paso inmediatamente anterior; y

asignar cada píxel de cada uno de dichos bloques no llenados con un valor que consiste en un promedio de las medias de bloques vecinos que se habían llenado en el paso inmediatamente anterior.

3. Método según la reivindicación 2, que comprende además repetir la realización del paso posterior para cada bloque no llenado hasta que todos los bloques de la capa se hayan llenado.

4. Método según la reivindicación 2, que comprende además:

repetir la realización del paso posterior para un número establecido de pasos; y

después de realizar el número establecido de pasos, asignar cada píxel no determinado en un bloque en la capa a un valor en un grupo que consiste en un promedio de valores de píxel en otro bloque más cercano al bloque y un valor de punto medio de nivel de gris.

5. Método según la reivindicación 1, en el que la realización del proceso de llenado de datos de múltiples pasos iterativo basado en bloques comprende mantener una tabla de estado de llenado de datos para tener un seguimiento del estado de llenado de cada bloque en cada paso del proceso de llenado de datos de múltiples pasos.

6. Método según la reivindicación 1, en el que la máscara es una máscara binaria que se genera a partir de una máscara de nivel de gris.

7. Método según la reivindicación 1, en el que la realización del proceso de llenado de datos de múltiples pasos iterativo, basado en bloques comprende adaptar un tamaño de bloque basándose en uno o más de un grupo que consiste en qué paso está realizándose y el contenido de la imagen que corresponde al

bloque.

8. Método según la reivindicación 1, que comprende además realizar un ajuste a escala combinado con el proceso de llenado de datos de múltiples pasos iterativo, basado en bloques mediante el que se usa una memoria intermedia para una versión de tamaño a escala de una imagen llenada que tiene un tamaño menor que el tamaño de la imagen.

Patentes similares o relacionadas:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Un método de descodificación para descodificar una imagen digital dividida en bloques, comprendiendo el método: seleccionar un bloque objetivo […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 10 de Julio de 2019, de DOLBY INTERNATIONAL AB: Un sistema de extracción de tejido que comprende: un introductor alargado que tiene una luz hueca formada en el mismo; una bolsa de extracción de […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un sistema de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que codifica una señal de imagen procedente de una fotografía […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Procedimiento de codificación de vídeo, procedimiento de decodificación de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, programa de codificación de vídeo y programa de decodificación de vídeo, del 1 de Mayo de 2019, de NTT DOCOMO, INC.: Procedimiento de decodificación de imágenes codificadas, comprendiendo el procedimiento: recibir una imagen codificada (n), una temporización de decodificación […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited-Harneys Services (Cayman) Limited: Un sistema de compresión de imágenes, que comprende: un mapeador de espacio de color que mapea una imagen de entrada con una representación de espacio de color YCoCg […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited: Un procedimiento para mapear un espacio de color, que comprende: recibir una entrada RGB, comprendiendo la entrada RGB un componente […]