Método y sistema para mejorar la información de crominancia de un imagen comprimida.

Un método para compresión de una imagen de vídeo en color en un sistema de compresión de imágenes devídeo,

consistente en

utilizar un primer valor del parámetro de cuantización para un canal de luminancia (Y) de la imagen de vídeo encolor, y un segundo valor del parámetro de cuantización para al menos uno de dos canales de crominancia (U, V) dela imagen de vídeo en color, en que el segundo valor del parámetro de cuantización es determinado aplicando unvalor de sesgo del parámetro de cuantización al primer valor del parámetro de cuantización,y transmitir el valor de sesgo del parámetro de cuantización desde un codificador a un descodificador.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10007124.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103 ESTADOS UNIDOS DE AMERICA.

Inventor/es: DEMOS,GARY,A.

Fecha de Publicación: 9 de Mayo de 2012.

Clasificación Internacional de Patentes:

G06T3/40 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › G06T 3/00 Transformación geométrica de la imagen en el plano de la imagen. › Cambio de escala de una imagen completa o de una parte de imagen.
G06T9/00 G06T […] › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
H04N11/04 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 11/00 Sistemas de televisión en color (detalles H04N 9/00). › que utilizan la modulación por impulsos codificados.
H04N7/12 H04N […] › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas en los cuales la señal de televisión es transmitida vía uno o varios canales paralelos, siendo el ancho de banda de cada canal inferior al ancho de banda de la señal de televisión (H04N 7/24 tiene prioridad).
H04N7/26
H04N7/30

PDF original: ES-2386872_T3.pdf

Fragmento de la descripción:

Método y sistema para mejorar la información de crominancia de una imagen comprimida

CAMPO TÉCNICO

Esta invención se refiere a compresión de vídeo, y más particularmente a métodos, sistemas y programas de

ordenador para mejorar la información de crominancia de imágenes comprimidas en sistemas de compresión de vídeo similares a los estándares MPEG (del inglés “Moving Pictures Expert Group”, grupo de expertos de imágenes en movimiento) .

ANTECEDENTES

Antecedentes de MPEG

MPEG-2 y MPEG-4 son estándares internacionales de compresión de vídeo que definen una sintaxis de vídeo que proporciona un modo eficiente para representar secuencias de imágenes en forma de datos codificados de modo más compacto. El lenguaje de los bits codificados es la “sintaxis”. Por ejemplo, unos pocos símbolos pueden representar un bloque entero de muestras (por ejemplo, 64 muestras para MPEG-2) . Ambos estándares MPEG también describen un proceso de descodificación (reconstrucción) en que los bits codificados son transformados

desde la representación compacta a una aproximación del formato original de la secuencia de imágenes. Por ejemplo, una bandera en el flujo de bits codificado señaliza si los siguientes bits deben ser precedidos por un algoritmo de predicción antes de ser descodificados con un algoritmo de transformada de coseno discreta (DCT, del inglés “Discrete Cosine Transform”) . Los algoritmos que comprenden el proceso de descodificación están regulados por la semántica definida por estos estándares MPEG. Esta sintaxis puede aplicarse para explotar características de

vídeo comunes tales como redundancia espacial, redundancia temporal, movimiento uniforme, enmascaramiento espacial, etc. En la práctica, estos estándares MPEG definen un lenguaje de programación así como un formato de datos. Un descodificador MPEG debe ser capaz de analizar y descodificar un flujo de datos entrante, pero en la medida en que el flujo de datos siga la sintaxis MPEG correspondiente, pueden usarse una amplia variedad de estructuras de datos y técnicas de compresión posibles (aunque técnicamente esto se desvía del estándar dado que

estas semánticas no son conformes) . Es también posible llevar la semántica necesaria dentro de una sintaxis alternativa.

Estos estándares MPEG usan una variedad de métodos de compresión, incluyen métodos intra-fotograma e interfotogramas. En la mayoría de las escenas de vídeo, el fondo se mantiene relativamente estable mientras que la acción tiene lugar en el primer plano. El fondo puede cambiar, pero una gran parte de la escena es redundante. 30 Estos estándares MPEG comienzan la compresión empiezan la compresión creando un fotograma de referencia denominado fotograma “intra” o “fotograma I”. Los fotogramas I son comprimidos sin referencia a otros fotogramas y contienen por ello un fotograma entero de información de vídeo. Los fotogramas I proporcionan puntos de entrada a un flujo de bits de datos para acceso aleatorio, pero sólo pueden ser comprimidos moderadamente. Típicamente, los datos que representan los fotogramas I son colocados en el flujo de bits cada 12 a 15 fotogramas (aunque también

es útil en algunas circunstancias usar un espaciado mucho mayor entre fotogramas I) . Tras ello, dado que sólo una pequeña parte de los fotogramas que caen entre los fotogramas I de referencia son diferentes de los fotogramas I de agrupamiento, sólo las diferencias de imagen son capturadas, comprimidas y almacenadas. Se usan dos tipos de fotogramas para tales diferencias – fotogramas predictivos o P, y fotogramas interpolados bidireccionales o fotogramas B.

Los fotogramas P son codificados en general con referencia a un fotograma pasado (bien un fotograma I o un fotograma P previo) , y, en general, se usan como referencia para fotogramas P subsiguientes. Los fotogramas P reciben una cantidad bastante grande de compresión. Los fotogramas B proporcionan la cantidad más alta de compresión pero requieren un fotograma de referencia tanto pasado como futuro con el fin de ser codificados. Los fotogramas bidireccionales no se usan nunca para fotogramas de referencia en técnicas de compresión estándar.

45 Los macrobloques son regiones de píxeles de imagen. En el estándar MPEG-2, un macrobloque es una agrupación de 16x16 píxeles de cuatro bloques 8x8 DCT, junto con un vector de movimiento para fotogramas P, y uno o dos vectores de movimiento para fotogramas B. Los macrobloques dentro de fotogramas P pueden ser codificados individualmente usando codificación (predictiva) o bien intra-fotograma o inter-fotogramas. Los macrobloques dentro de fotogramas B pueden ser codificados individualmente usando codificación intra-fotograma, codificación predictiva

50 hacia delante, codificación predictiva hacia atrás, o codificación predictiva tanto hacia delante como hacia atrás (es decir, con interpolación bidireccional) . Una estructura ligeramente diferente pero similar se usa en codificación de vídeo MPEG-4.

Tras la codificación, un flujo de bits de datos MPEG comprende una secuencia de fotogramas I, P y B. Una secuencia puede consistir en cualquier patrón de fotogramas I, P y B (hay unas pocas restricciones semánticas

55 menores sobre su colocación) . Sin embargo, es común en la práctica industrial tener un patrón fijo (por ejemplo, IBBPBBPBBPBBPBB) .

2 2

Representación MPEG de espacio de color

Los estándares MPEG-1, MPEG-2 y MPEG-4 utilizan todos un espacio de color Y, U, V para compresión. Hay opciones para la ecuación de luminancia, pero una transformación de conversión típica de RGB (del inglés “RedGreen-Blue”, rojo-verde-azul) a una representación YUV se expresa como:

5 Y = 0, 59 G + 0, 29 R + 0, 12 R

U = R - Y

V = B - Y

Los factores de luminancia Y para el verde varían desde 0, 55 hasta 0, 75, dependiendo del sistema de colores. Los factores para el verde varían desde 0, 2 hasta 0, 3, y los factores para el azul varían desde 0, 05 hasta 0, 15.

Esta transformación puede ser expresada como una transformación matricial, que es un operador lineal destinado al uso con señales lineales. Sin embargo, esta transformación sencilla se realiza en los estándares MPEG 1, 2 y 4 en el espacio de vídeo no lineal, generando diversos artefactos y problemas.

Es típico en los estándares MPEG reducir la resolución de los canales de crominancia U y V para conseguir una mayor compresión. La reducción de resolución más habitualmente usada consiste en usar la mitad de resolución 15 tanto vertical como horizontalmente. El estándar MPEG-2 soporta crominancia a resolución plena, así como la mitad de resolución horizontalmente. Sin embargo, los perfiles MPEG-2 más habitualmente usados, Perfil Principal a Nivel Principal (MP @ ML, del inglés “Main Profile at Main Level”) y Perfil Principal a Nivel Alto (MP @ HL, del inglés “Main Profile at High Level”) , usan la mitad de resolución horizontal y verticalmente. Las versiones 1 y 2 del estándar MPEG-4 usan la mitad de resolución vertical y horizontalmente. Obsérvese que la resolución plena de crominancia

se denomina a menudo 4:4:4, la mitad de resolución horizontal de crominancia se denomina a menudo 4:2:2, y la mitad de resolución vertical y horizontal se denomina a menudo 4:2:0. (Debe observarse que la nomenclatura 4:x:x tiene fallos en su significado y derivación, pero es una práctica común usarla para describir la relación de la resolución de crominancia a luminancia.)

El filtro que reduce la resolución horizontal y vertical de crominancia bajo los diversos estándares MPEG se aplica a

señales de vídeo no lineales al ser transformadas a la representación de colores U y V. Cuando se aplica la transformación inversa para recuperar la representación RGB, las señales no lineales y los filtros interaccionan de tal modo que producen artefactos y problemas. Estos problemas pueden generalizarse como “diafonía” entre los canales de luminancia Y y de crominancia U y V, junto con solapamiento espacial de frecuencias.

Puede encontrarse información adicional sobre representaciones y transformaciones lineales frente a no lineales en

... [Seguir leyendo]

Reivindicaciones:

1. Un método para compresión de una imagen de vídeo en color en un sistema de compresión de imágenes de vídeo, consistente en

utilizar un primer valor del parámetro de cuantización para un canal de luminancia (Y) de la imagen de vídeo en color, y un segundo valor del parámetro de cuantización para al menos uno de dos canales de crominancia (U, V) de la imagen de vídeo en color, en que el segundo valor del parámetro de cuantización es determinado aplicando un valor de sesgo del parámetro de cuantización al primer valor del parámetro de cuantización,

y transmitir el valor de sesgo del parámetro de cuantización desde un codificador a un descodificador.

2. El método según la reivindicación 1, en que se usan valores de sesgo diferentes del parámetro de cuantización para los dos canales de crominancia (U, V) .

3. El método según la reivindicación 1 ó 2, en que el segundo valor del parámetro de cuantización es determinado restando el valor de sesgo del parámetro de cuantización al primer valor del parámetro de cuantización.

4. El método según cualquiera de las reivindicaciones 1 a 3, en que el valor de sesgo del parámetro de cuantización

es transmitido desde el codificador al codificador para al menos uno de cada grupo de gráficos, fotograma o región de imagen.

5. Un sistema de compresión de imágenes de vídeo para la compresión de una imagen de vídeo en color adaptado para llevar a cabo el método definido en cualquiera de las reivindicaciones 1 a 4.

6. Un método para la descompresión de una imagen de vídeo en color en un sistema de descompresión de 20 imágenes de vídeo, consistente en

recibir una imagen de vídeo en color comprimida,

recibir un primer valor del parámetro de cuantización para un canal de luminancia (Y) ; recibir un valor de sesgo del parámetro de cuantización;

determinar un segundo valor del parámetro de cuantización para al menos uno de dos canales de crominancia (U, V)

de la imagen de vídeo en color sumando el valor de sesgo del parámetro de cuantización al primer valor del parámetro de cuantización para el canal de luminancia (Y) ;

descomprimir la señal de vídeo comprimida usando el primer valor del parámetro de cuantización para el canal de luminancia (Y) y el segundo valor del parámetro de cuantización para al menos uno de los dos canales de crominancia (U, V) .

7. El método según la reivindicación 6, en que valores de sesgo del parámetro de cuantización diferentes son recibidos y usados para los dos canales de crominancia (U, V) .

8. El método según la reivindicación 6 ó 7, en que el valor de sesgo del parámetro de cuantización es recibido para al menos uno de cada grupo de gráficos, fotograma o región de imagen.

9. Un sistema de descompresión de imágenes de vídeo para descompresión de una imagen de vídeo en color 35 adaptado para llevar a cabo el método según cualquiera de las reivindicaciones 6 a 8.

10. Un producto de programa de ordenador que comprende instrucciones, que cuando se ejecutan en un sistema de ordenador, hacen que el sistema de ordenador lleve a cabo el método según cualquiera de las reivindicaciones 1 a 4 y 6 a 8.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]