Método de extracción de distorsión de codificación.

Un método de extracción de distorsión de codificación para quitar la distorsión de codificación en pixels de dos bloques de transformación adyacentes que son compensados en movimiento y tienen un error de compensación de movimiento codificado igual a cero y están situados dentro de un mismo macrobloque,

siendo el bloque de transformación una unidad para la que se aplica una transformación de frecuencia, incluyendo el método: determinar si uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes, siendo cada uno de los dos bloques de compensación de movimiento adyacentes una unidad para la que se aplica una compensación de movimiento, y quitar la distorsión de codificación en pixels en el límite de bloque entre los dos bloques de transformación adyacentes cuando uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes, donde la extracción de distorsión de codificación no se realiza cuando ambos bloques de transformación adyacentes están situados dentro de un bloque de compensación de movimiento, donde un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es menor 20 que un tamaño de bloque del macrobloque, y un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es más grande que un tamaño de bloque del bloque de transformación

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08157918.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: KADONO, SHINYA, SHEN, SHENG MEI, LEE, CHAK JOO, FOO,TECK WEE, XUE,ZHONG.

Fecha de Publicación: 21 de Mayo de 2014.

Clasificación Internacional de Patentes:

G06T9/00 FISICA. › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Codificación de imagen, (reducción del ancho de banda o de la redundancia para imagenes estáticas H04N 1/41; codificación o descodificación de señales de imagenes de color estáticas H04N 1/64; métodos o disposiciones para la codificación, descodificación, compresión o descompresión de señales de video digital H04N 19/00).
H04N19/105 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Selección de la unidad de referencia para la predicción dentro de un modo de codificación o la predicción seleccionada, p. ej elección de adaptación de posición y el número de píxeles utilizados para la predicción.
H04N19/112 H04N 19/00 […] › según un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva.
H04N19/117 H04N 19/00 […] › Filtros, p. ej. para el pre-tratamiento o post-procesamiento (bancos de filtros de subbanda H04N 19/635).
H04N19/137 H04N 19/00 […] › Movimiento dentro de una unidad de codificación, p. ej. media del campo, marco o diferencia de bloque.
H04N19/154 H04N 19/00 […] › Calidad visual medida o estimada subjetivamente después de la decodificación, p. ej medida de la distorsión (utilización de criterios tasa de distorsión H04N 19/147).
H04N19/159 H04N 19/00 […] › Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional.
H04N19/16 H04N 19/00 […] › para un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva.
H04N19/172 H04N 19/00 […] › siendo la región una imagen, un fotograma o un campo.
H04N19/174 H04N 19/00 […] › siendo la región de un sector, p. ej. una línea de bloques o un grupo de bloques.
H04N19/176 H04N 19/00 […] › siendo la región de un bloque, p. ej. un macrobloque.
H04N19/61 H04N 19/00 […] › en combinación con codificación predictiva.
H04N19/82 H04N 19/00 […] › que implica el filtrado dentro del bucle de predicción.
H04N19/86 H04N 19/00 […] › que implica la reducción de artefactos de codificación, p. ej. de blockiness.
H04N19/895 H04N 19/00 […] › en combinación con la supresión de errores.
H04N7/26
H04N7/50

PDF original: ES-2467940_T3.pdf

Fragmento de la descripción:

Método de extracción de distorsión de codificación

Campo técnico La presente invención se refiere a un método de extracción de la distorsión de codificación para quitar la distorsión de codificación que tiene lugar al codificar una señal vídeo, un método de codificación y un método de decodificación para incrementar la tasa de compresión usando este método de extracción de la distorsión de codificación, y un medio de registro de datos que guarda un programa para implementar estos métodos en software.

Antecedentes de la invención Mediante los avances en tecnologías digitales que combinan múltiples tipos de audio, vídeo, y otros tipos de corrientes de píxel en una sola corriente de transmisión, los medios de información convencionales, es decir, los medios de comunicar información a personas tales como periódicos, revistas, televisión, radio, y teléfono, pueden ser usados ahora para comunicación multimedia. “Multimedia” se refiere en general a texto, gráficos, audio y vídeo unidos conjuntamente en una sola corriente de transmisión, pero los medios de información convencionales deben ser digitalizados primero antes de que la información pueda ser manejada en un formato multimedia.

La capacidad estimada de almacenamiento necesaria para almacenar la información transportada por medios de información convencionales, cuando se convierte a datos digitales, es solamente de 1 o 2 bytes por carácter para texto, pero de 64 kbits para un segundo de audio de calidad telefónica, y 100 Mbits para un segundo de vídeo de la calidad de un receptor de televisión corriente. Por lo tanto, no es práctico manejar estas cantidades masivas de información en forma digital en los medios de información anteriores. Por ejemplo, el servicio de telefonía vídeo está disponible en líneas RDSI (red digital de servicios integrados) con una velocidad de transmisión de 64 Kbps a 1, 5 Mbps, pero no se puede enviar vídeo de calidad de cámara de televisión tal cual por líneas RDSI.

Por lo tanto, la compresión de datos es esencial. El servicio de telefonía vídeo, por ejemplo, se implementa usando técnicas de compresión vídeo internacionalmente estandarizadas en las Recomendaciones H.261 y H.263 de la ITU-T (Unión Internacional de Telecomunicaciones, Sector de Estandarización de las Telecomunicaciones) . Usando los métodos de compresión de datos definidos en MPEG-1, se puede grabar información vídeo con audio en un CD audio convencional (disco compacto) .

El MPEG (Grupo de Expertos en Imágenes en Movimiento) es una norma internacional para comprimir digitalmente señales de imágenes en movimiento (vídeo) . MPEG-1 permite comprimir una señal vídeo a 1, 5 Mbps, es decir, comprimir la información en una señal de televisión a aproximadamente 100:1. Además, dado que la velocidad de transmisión para vídeo MPEG-1 se limita a aproximadamente 1, 5 Mbps, MPEG-2, que se estandarizó para cumplir la demanda de una calidad de imagen aún mayor, permite comprimir una señal de imagen en movimiento a 2 Mbps a 15 Mbps.

MPEG-4 con una tasa de compresión aún más alta también ha sido estandarizado por el grupo de trabajo (ISO/IEC JTC1/SC29NVG11) que ha avanzado la estandarización de MPEG-1 y MPEG-2. MPEG-4 no solamente permite una codificación a baja tasa de bits y alta eficiencia, también introduce una potente tecnología de resistencia al error capaz de reducir la degradación subjetiva de la imagen incluso cuando se producen errores del recorrido de transmisión. La ITU-T también trabaja en estandarizar la Recomendación H.26L como un método de codificación de imágenes de la próxima generación.

“H.26L Test Model Long-Term Number 8 (TML-) draft 0” por Gisle Bjontegaard (ITU Q.6/SG16, VCEG, VCEG-N10 proporciona una descripción de un método de codificación de referencia a usar para el desarrollo del nuevo método de compresión ITU-T recomendación H.26L, donde la configuración básica del algoritmo es similar a H.263.

A diferencia de las técnicas convencionales de codificación vídeo, H.26L usa un método de extracción de la distorsión de codificación acompañado por procesado complejo para quitar la distorsión de codificación. Es sabido que los métodos de codificación unitaria de bloques usando transformadas ortogonales, como las técnicas DCT ampliamente usadas en codificación vídeo, están sujetos a una distorsión a modo de rejilla conocida como distorsión de bloque en los límites del bloque de codificación. Dado que la pérdida de calidad de imagen en componentes de baja frecuencia es más visible que la pérdida de calidad de imagen en componentes de alta frecuencia, los componentes de baja frecuencia son codificados más fielmente que los componentes de alta frecuencia en codificación de unidad de bloque. Además, dado que las imágenes naturales capturadas con una cámara, por ejemplo, contienen más componentes de baja frecuencia que componentes de alta frecuencia, los bloques de codificación contienen más componentes de baja frecuencia que componentes de alta frecuencia. Por lo tanto, los bloques de codificación tienen a no tener sustancialmente componentes de alta frecuencia y los píxeles adyacentes en un bloque tienden a tener sustancialmente el mismo valor de píxeles.

Además, dado que la codificación es por unidad de bloque, no hay certeza de que los valores de píxel sean sustancialmente los mismos en el límite entre bloques adyacentes, es decir, que los valores de píxel cambiarán de forma continua a través del límite de bloques, aunque los valores de píxel sean sustancialmente idénticos dentro de cada bloque. El resultado es que, como se representa en la figura 31 que describe el concepto de extracción de distorsión de codificación, aunque el cambio en valores de píxel sea suave y continuo en la imagen fuente a través del límite de bloques indicado por la línea de puntos como se representa en la figura 31 (a) , y los valores de píxel cambian de forma continua dentro de cada bloque como se representa en la figura 31 (b) después de que la imagen fuente es codificada por unidad de bloque, se produce distorsión de bloque, es decir, una discontinuidad en los valores de píxel solamente en el límite de bloque. La distorsión de bloque es así un problema significativo de la calidad de la imagen resultante de la codificación de imagen, pero se puede reducir corrigiendo los valores de píxel de manera que sean continuos a través del límite de bloque como se representa en la figura 31 (c) . Este proceso de reducir la distorsión de bloque se denomina extracción de distorsión de codificación (también denominada “desbloqueo”) .

Cuando se aplica desbloqueo en la etapa de decodificación vídeo, el filtro de desbloqueo puede ser usado como un postfiltro como se representa en el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional en la figura 32, o puede ser usado como un filtro en bucle como se representa en el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional en la figura 33. Las configuraciones representadas en estos diagramas de bloques se describen a continuación.

En el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional representado en la figura 32, un decodificador de longitud variable 52 decodifica en longitud variable la señal codificada Str y envía un componente de código de frecuencia DCoef. Una unidad de exploración de deszigzagueo 54 redispone los componentes de frecuencia del componente de código de frecuencia DCoef en bloques bidimensionales, y envía el componente de frecuencia FCoef, los componentes de frecuencia de unidad de bloque. La unidad de transformada del coseno inversa 56 aplica descuantificación y operaciones DCT inversa al componente de frecuencia FCoef, y envía la imagen de diferencia DifCoef.

El compensador de movimiento 60 envía el píxel en la posición indicada por el vector de movimiento introducido externamente MV de la imagen de referencia Ref acumulada en la memoria 64 como imagen de movimiento compensado MCpel. El sumador 58 añade imagen de diferencia DifCoef e imagen de movimiento compensado MCpel a imagen reconstruida salida Coef. El filtro de desbloqueo 62 aplica extracción de distorsión de codificación a la imagen reconstruida Coef, y envía la señal de imagen decodificada Vout. La imagen reconstruida Coef se almacena en la memoria 64, y usa como imagen de referencia Ref para la decodificación de la imagen siguiente.

El diagrama de bloques de la figura 33 de un decodificador vídeo que usa un método de decodificación convencional, es sustancialmente idéntico al diagrama de bloques de un decodificador... [Seguir leyendo]

Reivindicaciones:

1. Un método de extracción de distorsión de codificación para quitar la distorsión de codificación en pixels de dos bloques de transformación adyacentes que son compensados en movimiento y tienen un error de compensación de movimiento codificado igual a cero y están situados dentro de un mismo macrobloque, siendo el bloque de transformación una unidad para la que se aplica una transformación de frecuencia, incluyendo el método:

determinar si uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes,

siendo cada uno de los dos bloques de compensación de movimiento adyacentes una unidad para la que se aplica una compensación de movimiento, y

quitar la distorsión de codificación en pixels en el límite de bloque entre los dos bloques de transformación adyacentes cuando uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes,

donde la extracción de distorsión de codificación no se realiza cuando ambos bloques de transformación adyacentes están situados dentro de un bloque de compensación de movimiento,

donde un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es menor que un tamaño de bloque del macrobloque, y un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es más grande que un tamaño de bloque del bloque de transformación.

2. El método de extracción de distorsión de codificación según la reivindicación 1, donde un tamaño de bloque del macrobloque es un tamaño de 16x16 pixels, un tamaño de bloque del bloque de transformación es un tamaño de 4x4 pixels.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Método para el movimiento de diente como una bandada, del 24 de Junio de 2020, de ULAB SYSTEMS, INC: Método de control de movimientos de diente para corregir maloclusiones, que comprende: recibir una pluralidad de modelos de diente digitales […]

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes, del 18 de Marzo de 2020, de KABUSHIKI KAISHA TOSHIBA: Un procedimiento de decodificación que comprende: determinar, mediante una unidad de decodificación, un modo de predicción según un modo […]

Método y aparato para representar granularidad de imagen mediante uno o más parámetros, del 26 de Febrero de 2020, de DOLBY INTERNATIONAL AB: Un método para simular grano de película, que comprende: recibir un flujo de vídeo codificado; recibir información codificada de grano de película, […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Codificación de imagen usando unidades de transformación grandes, del 13 de Noviembre de 2019, de SAMSUNG ELECTRONICS CO., LTD.: Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada […]