Método de extracción de distorsión de codificación.

Un método de extracción de distorsión de codificación para quitar la distorsión de codificación en pixels de dos bloques de transformación adyacentes que son compensados en movimiento y tienen un error de compensación de movimiento codificado igual a cero y están situados dentro de un mismo macrobloque

, siendo el bloque de transformación una unidad para la que se aplica una transformación de frecuencia, incluyendo el método: determinar si uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes, siendo cada uno de los dos bloques de compensación de movimiento adyacentes una unidad para la que se aplica una compensación de movimiento, y quitar la distorsión de codificación en pixels en el límite de bloque entre los dos bloques de transformación adyacentes cuando uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes, donde la extracción de distorsión de codificación no se realiza cuando ambos bloques de transformación adyacentes están situados dentro de un bloque de compensación de movimiento, donde un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es menor 20 que un tamaño de bloque del macrobloque, y un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es más grande que un tamaño de bloque del bloque de transformación

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08157918.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: KADONO, SHINYA, SHEN, SHENG MEI, LEE, CHAK JOO, FOO,TECK WEE, XUE,ZHONG.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > G06T9/00 (Codificación de imagen, p. ej. desde un mapeado binario para obtener un mapeado no binario (compresión en general H03M; compresión para la transmisión de imágenes H04N))
  • H04N7/26
  • H04N7/50
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/154 (Calidad visual medida o estimada subjetivamente después de la decodificación, p. ej medida de la distorsión (utilización de criterios tasa de distorsión H04N 19/147))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/105 (Selección de la unidad de referencia para la predicción dentro de un modo de codificación o la predicción seleccionada, p. ej elección de adaptación de posición y el número de píxeles utilizados para la predicción)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/112 (según un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/117 (Filtros, p. ej. para el pre-tratamiento o post-procesamiento (bancos de filtros de subbanda H04N 19/635))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/137 (Movimiento dentro de una unidad de codificación, p. ej. media del campo, marco o diferencia de bloque)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/159 (Tipo de predicción, p. ej. intra-fotograma, entre-fotograma (frame) o predicción fotograma bidireccional)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/16 (para un modo de visualización dado, p. ej. para el modo de pantalla entrelazada o progresiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/172 (siendo la región una imagen, un fotograma o un campo)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/174 (siendo la región de un sector, p. ej. una línea de bloques o un grupo de bloques)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/176 (siendo la región de un bloque, p. ej. un macrobloque)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/82 (que implica el filtrado dentro del bucle de predicción)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/86 (que implica la reducción de artefactos de codificación, p. ej. de blockiness)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/895 (en combinación con la supresión de errores)

PDF original: ES-2467940_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método de extracción de distorsión de codificación

Campo técnico La presente invención se refiere a un método de extracción de la distorsión de codificación para quitar la distorsión de codificación que tiene lugar al codificar una señal vídeo, un método de codificación y un método de decodificación para incrementar la tasa de compresión usando este método de extracción de la distorsión de codificación, y un medio de registro de datos que guarda un programa para implementar estos métodos en software.

Antecedentes de la invención Mediante los avances en tecnologías digitales que combinan múltiples tipos de audio, vídeo, y otros tipos de corrientes de píxel en una sola corriente de transmisión, los medios de información convencionales, es decir, los medios de comunicar información a personas tales como periódicos, revistas, televisión, radio, y teléfono, pueden ser usados ahora para comunicación multimedia. “Multimedia” se refiere en general a texto, gráficos, audio y vídeo unidos conjuntamente en una sola corriente de transmisión, pero los medios de información convencionales deben ser digitalizados primero antes de que la información pueda ser manejada en un formato multimedia.

La capacidad estimada de almacenamiento necesaria para almacenar la información transportada por medios de información convencionales, cuando se convierte a datos digitales, es solamente de 1 o 2 bytes por carácter para texto, pero de 64 kbits para un segundo de audio de calidad telefónica, y 100 Mbits para un segundo de vídeo de la calidad de un receptor de televisión corriente. Por lo tanto, no es práctico manejar estas cantidades masivas de información en forma digital en los medios de información anteriores. Por ejemplo, el servicio de telefonía vídeo está disponible en líneas RDSI (red digital de servicios integrados) con una velocidad de transmisión de 64 Kbps a 1, 5 Mbps, pero no se puede enviar vídeo de calidad de cámara de televisión tal cual por líneas RDSI.

Por lo tanto, la compresión de datos es esencial. El servicio de telefonía vídeo, por ejemplo, se implementa usando técnicas de compresión vídeo internacionalmente estandarizadas en las Recomendaciones H.261 y H.263 de la ITU-T (Unión Internacional de Telecomunicaciones, Sector de Estandarización de las Telecomunicaciones) . Usando los métodos de compresión de datos definidos en MPEG-1, se puede grabar información vídeo con audio en un CD audio convencional (disco compacto) .

El MPEG (Grupo de Expertos en Imágenes en Movimiento) es una norma internacional para comprimir digitalmente señales de imágenes en movimiento (vídeo) . MPEG-1 permite comprimir una señal vídeo a 1, 5 Mbps, es decir, comprimir la información en una señal de televisión a aproximadamente 100:1. Además, dado que la velocidad de transmisión para vídeo MPEG-1 se limita a aproximadamente 1, 5 Mbps, MPEG-2, que se estandarizó para cumplir la demanda de una calidad de imagen aún mayor, permite comprimir una señal de imagen en movimiento a 2 Mbps a 15 Mbps.

MPEG-4 con una tasa de compresión aún más alta también ha sido estandarizado por el grupo de trabajo (ISO/IEC JTC1/SC29NVG11) que ha avanzado la estandarización de MPEG-1 y MPEG-2. MPEG-4 no solamente permite una codificación a baja tasa de bits y alta eficiencia, también introduce una potente tecnología de resistencia al error capaz de reducir la degradación subjetiva de la imagen incluso cuando se producen errores del recorrido de transmisión. La ITU-T también trabaja en estandarizar la Recomendación H.26L como un método de codificación de imágenes de la próxima generación.

“H.26L Test Model Long-Term Number 8 (TML-) draft 0” por Gisle Bjontegaard (ITU Q.6/SG16, VCEG, VCEG-N10 proporciona una descripción de un método de codificación de referencia a usar para el desarrollo del nuevo método de compresión ITU-T recomendación H.26L, donde la configuración básica del algoritmo es similar a H.263.

A diferencia de las técnicas convencionales de codificación vídeo, H.26L usa un método de extracción de la distorsión de codificación acompañado por procesado complejo para quitar la distorsión de codificación. Es sabido que los métodos de codificación unitaria de bloques usando transformadas ortogonales, como las técnicas DCT ampliamente usadas en codificación vídeo, están sujetos a una distorsión a modo de rejilla conocida como distorsión de bloque en los límites del bloque de codificación. Dado que la pérdida de calidad de imagen en componentes de baja frecuencia es más visible que la pérdida de calidad de imagen en componentes de alta frecuencia, los componentes de baja frecuencia son codificados más fielmente que los componentes de alta frecuencia en codificación de unidad de bloque. Además, dado que las imágenes naturales capturadas con una cámara, por ejemplo, contienen más componentes de baja frecuencia que componentes de alta frecuencia, los bloques de codificación contienen más componentes de baja frecuencia que componentes de alta frecuencia. Por lo tanto, los bloques de codificación tienen a no tener sustancialmente componentes de alta frecuencia y los píxeles adyacentes en un bloque tienden a tener sustancialmente el mismo valor de píxeles.

Además, dado que la codificación es por unidad de bloque, no hay certeza de que los valores de píxel sean sustancialmente los mismos en el límite entre bloques adyacentes, es decir, que los valores de píxel cambiarán de forma continua a través del límite de bloques, aunque los valores de píxel sean sustancialmente idénticos dentro de cada bloque. El resultado es que, como se representa en la figura 31 que describe el concepto de extracción de distorsión de codificación, aunque el cambio en valores de píxel sea suave y continuo en la imagen fuente a través del límite de bloques indicado por la línea de puntos como se representa en la figura 31 (a) , y los valores de píxel cambian de forma continua dentro de cada bloque como se representa en la figura 31 (b) después de que la imagen fuente es codificada por unidad de bloque, se produce distorsión de bloque, es decir, una discontinuidad en los valores de píxel solamente en el límite de bloque. La distorsión de bloque es así un problema significativo de la calidad de la imagen resultante de la codificación de imagen, pero se puede reducir corrigiendo los valores de píxel de manera que sean continuos a través del límite de bloque como se representa en la figura 31 (c) . Este proceso de reducir la distorsión de bloque se denomina extracción de distorsión de codificación (también denominada “desbloqueo”) .

Cuando se aplica desbloqueo en la etapa de decodificación vídeo, el filtro de desbloqueo puede ser usado como un postfiltro como se representa en el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional en la figura 32, o puede ser usado como un filtro en bucle como se representa en el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional en la figura 33. Las configuraciones representadas en estos diagramas de bloques se describen a continuación.

En el diagrama de bloques de un decodificador vídeo usando un método de decodificación convencional representado en la figura 32, un decodificador de longitud variable 52 decodifica en longitud variable la señal codificada Str y envía un componente de código de frecuencia DCoef. Una unidad de exploración de deszigzagueo 54 redispone los componentes de frecuencia del componente de código de frecuencia DCoef en bloques bidimensionales, y envía el componente de frecuencia FCoef, los componentes de frecuencia de unidad de bloque. La unidad de transformada del coseno... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de extracción de distorsión de codificación para quitar la distorsión de codificación en pixels de dos bloques de transformación adyacentes que son compensados en movimiento y tienen un error de compensación de movimiento codificado igual a cero y están situados dentro de un mismo macrobloque, siendo el bloque de transformación una unidad para la que se aplica una transformación de frecuencia, incluyendo el método:

determinar si uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes,

siendo cada uno de los dos bloques de compensación de movimiento adyacentes una unidad para la que se aplica una compensación de movimiento, y

quitar la distorsión de codificación en pixels en el límite de bloque entre los dos bloques de transformación adyacentes cuando uno de los dos bloques de transformación adyacentes está situado fuera de un bloque de compensación de movimiento en el que está situado el otro de los dos bloques de transformación adyacentes,

donde la extracción de distorsión de codificación no se realiza cuando ambos bloques de transformación adyacentes están situados dentro de un bloque de compensación de movimiento,

donde un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es menor que un tamaño de bloque del macrobloque, y un tamaño de bloque de cada uno de los dos bloques de compensación de movimiento adyacentes es más grande que un tamaño de bloque del bloque de transformación.

2. El método de extracción de distorsión de codificación según la reivindicación 1, donde un tamaño de bloque del macrobloque es un tamaño de 16x16 pixels, un tamaño de bloque del bloque de transformación es un tamaño de 4x4 pixels.