COMPRESIÓN DE IMAGEN POR DCT DE TAMAÑO DE BLOQUE ADAPTATIVO EN BASE A LA VARIANZA.
Un procedimiento para la determinación de una asignación de tamaño de bloque para un bloque entrante de píxeles de imagen que va a ser utilizado en la compresión de dicho bloque entrante,
que comprende las etapas de: la lectura de un boque de datos de píxeles;
la generación de una asignación de tamaño de bloque para el bloque de datos de píxeles en base a las varianzas de los valores de píxeles de dicho bloque de datos de píxeles y de bloques subdivididos de dicho bloque de datos de píxeles, en el que dicha etapa de generación comprende así mismo las etapas de: la determinación de una varianza de valores de píxeles para dicho bloque de datos de píxeles, en el que la varianza se calcula sobre todos los píxeles del bloque;
la comparación de dicha varianza con un umbral, en el quel dicho umbral es una función del valor de píxel medio del bloque que está siendo evaluado;
la toma de una decisión para subdividir dicho bloque si dicha varianza es mayor que dicho umbral;
si dicha decisión es la de subdividir dicho bloque, entonces la repetición de las etapas de determinación, comparación y toma de decisión para cada bloque subdividido hasta que se satisfaga un criterio predeterminado; y
la designación como dicha asignación de tamaño de bloque a cada bloque que no está más subdividido; y
la provisión de una estructura de datos que contenga la información acerca de dicha asignación de tamaño de bloque.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2000/030883.
Solicitante: QUALCOMM INCORPORATED.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 5775 MOREHOUSE DRIVE SAN DIEGO, CA 92121-1714 ESTADOS UNIDOS DE AMERICA.
Inventor/es: MERRITT, MICHAEL, J., THYAGARAJAN,KADAYAM.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
- H03M7/30 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia.
- H03M7/40 H03M 7/00 […] › Conversión en, o a partir de códigos la longitud variable, p. ej. código Shanno-Fano, código Huffman, código Morse.
- H04N7/26
- H04N7/30
PDF original: ES-2376540_T3.pdf
Fragmento de la descripción:
Compresion de imagen por DCT de tamaro de bloque adaptativo en base a la varianza Antecedentes de la invención
I. Campo de la invención
La presente invencion se refiere al campo del procesamiento de imagen. Mas concretamente, la presente invencion se refiere a un esquema de compresion para serales de imagen que utiliza unos bloques y subbloques dimensionados de manera adaptativa de los datos de coeficientes codificados de la transformada de coseno discreta.
II. Descripción de la técnica relacionada
En el campo de la transmision y recepcion de serales de video tal y como se utilizan para la proyeccion de "filmes"
o "peliculas", se han realizado diversas mejoras respecto de las tecnicas de compresion de imagen. Muchos de los sistemas de video actuales y propuestos hacen uso de tecnicas de codificacion digital. La codificacion digital proporciona una robustez en el enlace de comunicaciones la cual ofrece resistencia a problemas tales como el desvanecimiento por multitrayectoria y la perturbacion o la transferencia de la seral, cada una de las cuales podria en otro caso provocar una seria degradacion de la calidad de la imagen. Asi mismo, las tecnicas digitales facilitan el uso de tecnicas de encriptacion de la seral, las cuales han resultado utiles o incluso necesarias en aplicaciones gubernamentales y en otras muchas de difusion comercial recientemente desarrolladas.
El video de alta definicion es un area que aprovecha las tecnicas mejoradas de compresion de imagenes. Cuando se propuso por primera vez, la transmision por las ondas del video de alta definicion (o incluso la transmision cableada o por fibra optica parecio escasamente practica debido a los excesivos condicionamientos del ancho de banda. Los sistemas de transmision inalambricos tipicos, o de otro tipo que se estaban diserando no se ajustaban con facilidad en la medida suficiente al ancho de banda. Sin embargo, se ha llegado al convencimiento de que la compresion de serales de video digitales puede conseguirse hasta un nivel que permita la transmision utilizando anchos de banda razonables. Dichos niveles de compresion de la seral, acoplados con la transmision digital de la seral, permitira un sistema de video que transmita con menor potencia y con una mayor inmunidad respecto de las perturbaciones del canal ocupando al tiempo un ancho de banda mas conveniente y util.
Una tecnica de compresion capaz de ofrecer niveles significativos de compresion preservando al tiempo el nivel de calidad deseado de las serales de video utiliza un bloque y unos subbloques dimensionados de forma adaptativa de los datos de coeficientes codificados de la Transformada de Coseno Discreta (DCT) . Esta tecnica se designara en lo sucesivo como el procedimiento de la Transformada de Coseno Diferencial del Tamaro de Bloque Adaptativo (ABSDCT) . Esta tecnica se divulga en la Patente estadounidense No. 5, 021, 891, titulada "Procedimiento y Sistema de Compresión de Imágenes del Tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Method And System”1 transferida al cesionario de la presente invencion. Las tecnicas de DCT se divulgan, asi mismo, en la Patente estadounidense No. 5, 107, 345, titulada "Procedimiento Y Sistema de Compresión de Imágenes del tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Method And System”1 transferida al cesionario de la presente invencion. Asi mismo, el uso de la tecnica ABSDCT en combinacion con la tecnica de la Transformada de Arbol Cuaternario Diferencial se analiza en la Patente estadounidense No. 5, 452, 104, titulada "Procedimiento Y Sistema de Compresión de Imágenes del tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Image Method And System”1, transferido, tambien al cesionario de la presente invencion. Los sistemas divulgados en estas patentes utilizan lo que se designa como una codificacion "intertramass", en la que cada trama de los datos de imagen es codificada sin consideracion al contenido de cualquier otra trama. Al utilizar la tecnica ABSDCT, puede ser reducida la tasa de transmision de datos obtenible desde alrededor de 1, 5 miles de millones de bits por segundo hasta aproximadamente 50 millones de bits por segundo sin una degradacion apreciable de la calidad de la imagen.
La tecnica ABSDCT puede ser utilizada para comprimir una imagen o seral ya sea en blanco o negro o en color que represente la imagen. La seral entrante de color puede concretarse en un formato YIQ, siendo Y la luminancia, o el brillo, la muestra, y siendo I y Q la crominancia o el color, las muestras para cada bloque de pixeles de 4 x 4. Pueden, asi mismo, ser utilizados otros formatos conocidos como por ejemplo los formatos YUV o RGB. Debido a la baja sensibilidad espacial del ojo al color, la mayor parte de la investigacion ha mostrado que una submuestra de los componentes de color mediante un factor de cuatro en las direcciones horizontal y vertical es razonable. De acuerdo con ello, una seral de video puede ser representada por cuatro componentes de luminancia y dos componentes de crominancia.
Utilizando la ABSDCT, una seral de video resultara segmentada, en terminos generales, en bloques de pixeles para su procesamiento. Para cada bloque, los componentes de luminancia y crominancia son transferidos a un intercalador de bloques. Por ejemplo, un bloque de 16 x 16 (pixeles) puede ser presentado al intercalador de bloques, el cual ordena y organiza las muestras de imagenes dentro de cada bloque de 16 x 16 para producir bloques y subbloques compuestos de datos para el analisis de la transformada de coseno discreta (DCT) . El operador de la DCT es un procedimiento de conversion de una seral muestreada en funcion del tiempo en una representacion frecuencial de la misma seral. Mediante la conversion en una representacion frecuencial, las tecnicas de la DCT se ha demostrado que permiten muy elevados niveles de compresion, en cuanto unos cuantificadores pueden ser diserados para aprovechar las caracteristicas de distribucion de frecuencias de una imagen. En una forma de realizacion, DCT de 16 x 16 es aplicada en una primera ordenacion, cuatro DCTs de 8 x 8 son aplicadas en una segunda ordenacion. 16 DCTs de 4 x 4 son aplicadas en una tercera ordenacion y 64 DCTs de 2 x 2 son aplicadas en una cuarta ordenacion.
La operacion de la DCT reduce la redundancia espacialinherente en la fuente de video. Despues de que se ha llevado a cabo la DCT, la mayoria de la energia de las serales de video tiende a concentrarse en unos pocos coeficientes de la DCT. Una transformada adicional, la Transformada de Arbol Cuaternario Diferencial (DQT) , puede ser utilizada para reducir la redundancia entre dos coeficientes de la DCT.
Para el bloque de 16 x 16 y para cada subbloque, los valores de los coeficientes de la DCT y el valor de la DQT (si se ut iliza l a D QT) so n anal izados para d eterminar el numero d e bi ts r equerido par a co dificar el bloque o el subbloque. A continuacion, el bloque o la combinacion de subbloques que requiera la codificacion del menor numero posible de bits, es elegido para representar el segmento de imagen. Por ejemplo, dos subbloques de 8 x 8, seis subbloques de 4 x 4 y ocho subbloque de 2 x 2 pueden ser elegidos para representar el segmento de imagen.
El bloque o combinacion de subbloques elegido es, a continuacion, adecuadamente dispuesto por orden en un bloque de 16 x 16. Los valores de los coeficientes de las DCT / DQT pueden a continuacion ser sometidas a una ponderacion de frecuencias, a una codificacion y a una cuantificacion (como por ejemplo una codificacion de longitud variable) como preparacion para la transmision.
Aunque la tecnica ABSDCT descrita con anterioridad funciona sorprendentemente bien, es intensiva desde el punto de vista computacional. Asi, puede resultar dificil la implementacion de la tecnica con un hardware compacto. Se desea una tecnica alternativa que consiga una implementacion del hardware mas eficiente. Un procedimiento y un sistema de compresion de imagen que es mas eficiente desde el punto de vista computacional se proporciona mediante la presente invencion de la manera descrita en las lineas que siguen.
El trabajo "Compresion de Imagen Segmentacion de Tamaros de Bloque Variables" ["Image Compression with Variable Block Size Segmentation"1, de Vaisey J. et al., IEEE Transactions on SignalProcessing, vol. 40, No. 8 agosto de 1 992, p aginas 2040 - 2060 descr ibe un pr ocedimiento d e co mpresion de i magen m ediante la segmentacion de una imagen en zonas de tamaros diferentes.
Divulga un procedimiento para la determinacion de una asignacion de tamaro... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento para la determinacion de una asignacion de tamaro de bloquepara un bloque entrante de pixeles de imagen que va a ser utilizado en la compresion de dicho bloque entrante, que comprende las etapas de:
la lectura de un boque de datos de pixeles; la generacion de una asignacion de tamaro de bloque para el bloque de datos de pixeles en base a las varianzas de los valores de pixeles de dicho bloque de datos de pixeles y de bloques subdivididos de dicho bloque de datos de pixeles, en el que dicha etapa de generacion comprende asi mismo las etapas de:
la determinacion de una varianza de valores de pixeles para dicho bloque de datos de pixeles, en el que la varianza se calcula sobre todos los pixeles del bloque; la comparacion de dicha varianza con un umbral, en el quel dicho umbral es una funcion del valor de pixel medio del bloque que esta siendo evaluado;
la toma de una decision para subdividir dicho bloque si dicha varianza es mayor que dicho umbral; si di cha d ecision es la de subdividir di cho bl oque, ent onces la r epeticion de l as etapas de determinacion, co mparacion y t oma de decision p ara c ada bloque s ubdividido has ta que s e satisfaga un criterio predeterminado; y la designacion como dicha asignacion de tamaro de bloque a cada bloque que no esta mas subdividido; y la provision de una estructura de datos que contenga la informacion acerca de dicha asignacion de tamaro de bloque.
2. Un procedimiento para la compresionde un bloque de datos de pixeles de una imagen, que comprende las etapas de:
la determinacion de una asignacion de tamaro de bloque para el bloque de datos de pixeles de acuerdo con el procedimiento de la reivindicacion 1; la transformacion de dichos datos de pixeles de bloques seleccionados de acuerdo con lo indicado por dicha estructura de datos en una representacion en el dominio frecuencial; la cuantificacion de dichos datos en el dominio frecuencial; el escaneo de dichos datos cuantificados para obtener un flujo serializado de datos; y la codificacion de dicho flujo serializado de datos en preparacion para una transmision.
3. El procedimiento de la reivindicacion 2, en el que la Transformada de Coseno Discreta se lleva a cabo seguida por una Transformada de Arbol Cuaternario Diferencial durante dicha etapa de transformacion.
4. El procedimiento de la reivindicacion 2, en el que una Transformada de Coseno Discreta se lleva a cabo seguida por una Transformada de Arbol Cuaternario Diferencial durante dicha etapa de transformacion.
5. El procedimiento de la reivindicacion 2, en el que se lleva a cabo un escaneo en zigzag durante dicha etapa de escaneo.
6. El procedimiento de la reivindicacion 5, en el que el escaneo en zigzag se lleva a cabo utilizando un tamaro de bloque de 8 x 8.
7. El procedimiento de la reivindicacion 2, en el que se lleva a cabo una codificacion de ºuffman durante dicha etapa de codificacion.
8. El procedimiento de la reivindicacion 7, en el que dicha codificacion de ºuffman emplea multiples tablas de consulta para codificar valores de longitud de recorrido y no nulos.
9. El procedimiento de la reivindicacion 8, en el que hay tres tablas de consulta.
10. El procedimiento de las reivindicaciones 1 o 2, en el que dicho umbral cambia para cada nivel de subdivision.
11. El procedimiento de las reivindicaciones 1 o 2, en el que dicho criterio predeterminado para no seguir repitiendo las etapas de det erminacion, co mparacion y t oma d e deci siones, se basa en u n tamaro de b loque m inimo preseleccionado de datos de pixeles.
12. Un sistema de compresion de imagen para comprimir un bloque de datos de pixeles, que comprende:
un medio de asignacion detamaro de bloque para la seleccion de dicho bloque o de dichos bloques subdivididos de dicho bloque que va a ser comprimido en base a las varianzas de los valores de pixeles de dicho bloque de datos de pixeles y de bloques subdivididos de dicho bloque de datos de pixeles, en el que dicho medio de asignacion de tamaro de bloque:
determina una varianza de valores de pixeles para dicho bloque de datos de pixeles, en el que la varianza se calcula sobre todos los pixeles del bloque, compara dicha varianza con un umbral, en el que dicho umbral es una funcion del valor de pixel medio del bloque que esta siendo evaluado;
la toma de una decision para subdividir dicho bloque si dicha varianza es mayor que dicho umbral, si dicha decision es la de subdividir dicho bloque, a continuacion repite la determinacion de la varianza, la comparacion con un umbral, y la decision de subdividir para cada bloque subdivido hasta que satisfaga un criterio predeterminado; y designa como dicha asignacion de tamaro de bloque cada bloque que no se subdivide mas un medio de transformacion para la transformacion del tamaro de pixeles de dicho bloque seleccionado o de dichos bloques subdivididos en datos en el dominio frecuencial;
un medio cuantificado para la cuantificacion de dichos datos en el dominio frecuencial;
un medio de serializador para escanear dichos datos cuantificados para obtener un flujo serializado de datos; y un medio de codificacion de longitud variable para la codificacion de dicho flujo de datos serializado en preparacion para la transmision.
13. El sistema de la reivindicacion 12, en el que dicho umbral cambia para cada nivel de subdivision.
14. El sistema de la reivindicacion 12, en el que dicho criterio predeterminado para no seguir subdividendo se basa en un tamaro de bloque minimo preseleccionado de los datos de pixeles que estan siendo conseguidos.
15. El sistema de la reivindicacion 12, en el que dicho medio de transformacion lleva a cabo una Transformada de Coseno Discreta.
16. El sistema de la reivindicacion 12, en el que dicho medio de transformacion lleva a cabo una Transformada de Coseno Discreta seguida por una Transformada de Arbol Cuaternario Diferencial.
17. El sistema de la reivindicacion 12, en el que dicho medio serializador comprende un escaneador en zigzag.
18. El sistema de la reivindicacion 17, en el que el escaneador en zigzag emplea un tamaro de bloque de 8 x 8 para el escaneo en zigzag.
19. El sistema de la reivindicacion 12, en el que dicho medio de codificacion de longitud variable comprende un codificador de ºuffman, 20. El sistema de la reivindicacion 19, en el que dicho codificador de ºuffman emplea multiples tablas de consulta para codificar valores de longitud de recorrido y valores no nulos.
21. El sistema de la reivindicacion 20, en el que hay tres tablas de consulta.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]
Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]
Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]
Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]