Aparato para codificar información de textura entrelazada de macrobloques.

Un aparato para codificar información de textura entrelazada por cada macrobloque de textura utilizando una predicción de bloque de campo entre un VOP actual y un VOP de referencia,

comprendiendo el aparato:

un estimador de movimiento (116) para determinar un vector de movimiento de campo para cada bloque de campo superior o inferior actual por cada campo;

un compensador de movimiento (118) para proporcionar el bloque de campo candidato óptimo como un bloque de campo superior o inferior estimado para cada bloque de campo superior o inferior actual;

un restador (104) para sustraer el bloque de campo superior o inferior estimado de cada bloque de campo superior o inferior actual por cada píxel correspondiente para obtener el bloque de campo de error;

un circuito de codificación de textura (106) para aplicar la transformada discreta del coseno al bloque de campo de error por cada bloque DCT, y para cuantificar los coeficientes a los que se les ha aplicado la transformada discreta del coseno;

un circuito de codificación estadística (108) para llevar a cabo una codificación estadística en los coeficientes cuantificados introducidos desde el circuito de codificación de textura (106) y el vector de movimiento de campo para cada bloque de campo superior o inferior actual introducido desde el estimador de movimiento (116);

un circuito de reconstrucción de textura (110) para llevar a cabo una cuantificación inversa y una transformada inversa en los coeficientes de transformada cuantificados para obtener un bloque de campo de error reconstruido;

un sumador (112) para combinar el bloque de campo de error reconstruido del circuito de reconstrucción de textura (110) y el bloque de campo superior o inferior estimado del compensador de movimiento (118) por cada píxel; y un circuito de procesamiento de cuadro anterior (114) para rellenar un bloque de campo superior o inferior reconstruido en función de información de forma para el VOP actual, para almacenar de ese modo los bloques de campo superior o inferior rellenados como información de textura entrelazada de referencia, comprendiendo el circuito de procesamiento de cuadro de referencia:

un primer dispositivo de relleno para rellenar el píxel de textura no definida en una fila del bloque de campo que presenta al menos una textura definida en función de uno o más de los píxeles de textura definida en dicha fila, un segundo dispositivo de relleno para rellenar el píxel de textura no definida en una fila del bloque de campo que presenta al menos una textura definida en función de uno o más de los píxeles de textura definida en una o más filas en dicho bloque de campo, y un tercer dispositivo de relleno para rellenar con un valor constante el bloque de campo de un VOP frontera que presenta solamente los píxeles de textura no definida.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08004286.

Solicitante: DAEWOO ELECTRONICS CORPORATION.

Nacionalidad solicitante: República de Corea.

Dirección: 686, AHYEON-DONG MAPO-GU SEOUL REPUBLICA DE COREA.

Inventor/es: LEE, SANG HOON.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H04N7/24 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00  tiene prioridad).
  • H04N7/26
  • H04N7/30
  • H04N7/32
  • H04N7/34
  • H04N7/50

PDF original: ES-2380502_T3.pdf

 


Fragmento de la descripción:

Aparato para codificar información de textura entrelazada de macrobloques.

Campo técnico de la invención

La presente invención se refiere a un aparato para codificar información de textura entrelazada de macrobloques.

Técnica anterior

En los sistemas televisados de manera digital tales como videotelefonía, teleconferencia y sistemas de televisión de alta definición, se necesita una gran cantidad de datos digitales para definir cada señal de cuadro de vídeo ya que una señal de línea de vídeo en la señal de cuadro de vídeo comprende una secuencia de datos digitales denominada como valores de píxel. Sin embargo, puesto que el ancho de banda de frecuencia disponible de un canal de transmisión convencional es limitado, para transmitir la gran cantidad de datos digitales a través del mismo es necesario comprimir o reducir el volumen de datos mediante la utilización de varias técnicas de compresión de datos, especialmente en el caso de codificadores de señales de vídeo de baja velocidad binaria tales como sistemas de videotelefonía y de teleconferencia.

Una de estas técnicas para codificar señales de vídeo para un sistema de codificación de baja velocidad binaria es la denominada técnica de codificación de análisis-síntesis orientada a objetos, en la que una imagen de vídeo de entrada se divide en objetos, y tres conjuntos de parámetros que definen los datos de movimiento, de contorno y de píxeles de cada objeto se procesan a través de diferentes canales de codificación.

Un ejemplo del esquema de codificación orientado a objetos es la denominada fase 4 de MPEG (grupo de expertos en imágenes en movimiento, Moving Picture Express Group) (MPEG-4) , que está diseñada para proporcionar una norma de codificación audiovisual para permitir una interactividad basada en contenido, una eficacia de codificación mejorada y/o una accesibilidad universal en aplicaciones tales como una comunicación de baja velocidad binaria, sistemas multimedia interactivos (por ejemplo, juegos, TV interactiva, etc.) y vigilancia de zona (véase, por ejemplo, el modelo de verificación de vídeo MPEG-4 versión 7.0, Organización Internacional de Normalización, ISO/IEC JTC1/SC29/WG11 MPEG97/N1642, abril de 1997) .

Según MPEG-4, una imagen de vídeo de entrada se divide en una pluralidad de planos de objetos de vídeo (VOP) , que corresponden a entidades de un flujo de bits a las que un usuario puede acceder y manipular. Un VOP puede denominarse como un objeto y puede representarse mediante un rectángulo delimitador cuya anchura y altura puede ser el múltiplo más pequeño de 16 píxeles (un tamaño de macrobloque) que rodea a cada objeto de manera que el codificador puede procesar la imagen de vídeo de entrada por cada VOP, es decir, por cada objeto.

Cada VOP en MPEG-4 se describe mediante tres conjuntos de parámetros que definen la información de forma, la información de movimiento y la información de textura, es decir, información de color de los mismos, donde la información de forma representada mediante, por ejemplo, una máscara binaria corresponde al contorno de cada dicho VOP, es decir, el borde de un objeto; la información de movimiento representa la correlación espacial entre un cuadro actual y un cuadro anterior correspondiente; y la información de textura consiste en datos de luminancia y de crominancia.

Por otro lado, puesto que la información de textura para dos imágenes de vídeo de entrada recibidas secuencialmente tiene naturalmente redundancia de tiempo, es deseable eliminar la redundancia de tiempo en la misma utilizando una estimación de movimiento y una técnica de compensación con el fin de codificar de manera eficaz la información de textura en MPEG-4.

Una técnica de relleno progresivo de imágenes, es decir, una técnica de relleno repetitivo convencional, se aplica por cada cuadro en el VOP antes de la estimación y compensación de movimiento. En principio, la técnica de relleno repetitivo llena el área transparente fuera del objeto del VOP repitiendo píxeles frontera del objeto, donde los píxeles frontera están ubicados en el contorno del objeto. Es preferible llevar a cabo la técnica de relleno repetitivo con respecto a la información de forma reconstruida, que se genera descodificando la información de forma codificada en el orden inverso a lo largo del esquema de codificación. Cada píxel frontera se repite hacia el exterior del objeto. Si los píxeles transparentes del área transparente fuera del objeto pueden llenarse mediante la repetición de más de un píxel frontera, es preferible tomar el promedio de los valores repetidos como un valor de relleno. Este proceso de relleno progresivo se divide generalmente en tres etapas, a saber, un relleno repetitivo horizontal, un relleno repetitivo vertical y un relleno exterior (véase el modelo de verificación de vídeo MPEG-4 versión 7.0) .

Aunque la técnica de relleno progresivo se utiliza para llevar a cabo la estimación y compensación de movimiento en función de cada cuadro generado cada 1/30 segundos tal y como se ha descrito anteriormente, se necesita una técnica de relleno entrelazado para llevar a cabo la estimación y compensación de movimiento por cada campo, donde dos campos, a saber, un campo superior y un campo inferior, se combinan para reconstruirse como un cuadro, es decir, una imagen de textura entrelazada. La técnica de codificación entrelazada para llevar a cabo la estimación y compensación de movimiento por cada campo puede utilizarse de manera adecuada para codificar de manera precisa la información de textura entrelazada para los movimientos rápidos, tales como en un deporte, en una carrera de caballos y en una carrera de coches, o con una correlación de campo poco frecuente, es decir, con una correlación temporal poco frecuente entre el campo superior y el campo inferior.

Sin embargo, si el relleno para cada bloque de campo se realiza de manera independiente sin considerar su correlación de campo basada en la información de textura entrelazada tal y como se describe en la técnica de relleno progresivo, puede haber algún píxel que no se modifique en función de solamente los píxeles de objeto del objeto, sino que se modificará mediante relleno cuando se tenga en cuenta su correlación de campo, necesitándose dos campos consecutivos, es decir, el campo superior y el campo inferior, incluidos en la información de textura entrelazada.

El documento "Modelo de verificación de vídeo MPEG-4, versión 7.0, capítulo 3: Definición de codificador", grupo ad hoc sobre edición VM de MPEG-Video, Organización Internacional de Normalización, páginas 1, 17 a 122, 1 de abril de 1997, desvela una técnica de relleno repetitivo para VOP antes de la estimación/compensación de movimiento (sección 3.3.2) , una técnica de relleno de extrapolación de paso bajo antes de realizar una DCT (sección 3.4.1) y una DCT adaptativa de cuadro/campo para vídeo entrelazado (sección 3.4.1) .

Divulgación de la invención

Por lo tanto, un objeto de la invención es proporcionar un aparato para codificar información de textura entrelazada por cada macrobloque de textura.

Según la invención se proporciona un aparato según la reivindicación 1; realizaciones preferidas de la misma se definen en las reivindicaciones dependientes.

Breve descripción de los dibujos

Los objetos y características anteriores, así como otros adicionales, de la presente invención resultarán evidentes a partir de la siguiente descripción de realizaciones preferidas proporcionadas junto con los dibujos adjuntos, en los que:

La Fig. 1 muestra un diagrama de bloques esquemático de un aparato convencional para codificar información de textura entrelazada de un objeto en una señal de vídeo;

La Fig. 2 presenta un diagrama de flujo para ilustrar el funcionamiento del circuito de procesamiento de cuadro anterior mostrado en la Fig. 1 según la presente invención;

Las Fig. 3A y 3B describen un macrobloque frontera a modo de ejemplo y un bloque de campo frontera superior y otro inferior para el macrobloque frontera, respectivamente;

Las Fig. 3C a 3E representan un procedimiento de relleno de los bloques de campo frontera superior e inferior de manera secuencial según la presente invención; y La Fig. 4 ilustra una pluralidad de bloques adyacentes no definidos para un VOP a modo de ejemplo y las direcciones de relleno para cada bloque adyacente no definido.

Modo de llevar a cabo la invención

Haciendo... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato para codificar información de textura entrelazada por cada macrobloque de textura utilizando una predicción de bloque de campo entre un VOP actual y un VOP de referencia, comprendiendo el aparato:

un estimador de movimiento (116) para determinar un vector de movimiento de campo para cada bloque de campo superior o inferior actual por cada campo;

un compensador de movimiento (118) para proporcionar el bloque de campo candidato óptimo como un bloque de campo superior o inferior estimado para cada bloque de campo superior o inferior actual;

un restador (104) para sustraer el bloque de campo superior o inferior estimado de cada bloque de campo superior o inferior actual por cada píxel correspondiente para obtener el bloque de campo de error;

un circuito de codificación de textura (106) para aplicar la transformada discreta del coseno al bloque de campo de error por cada bloque DCT, y para cuantificar los coeficientes a los que se les ha aplicado la transformada discreta del coseno;

un circuito de codificación estadística (108) para llevar a cabo una codificación estadística en los coeficientes cuantificados introducidos desde el circuito de codificación de textura (106) y el vector de movimiento de campo para cada bloque de campo superior o inferior actual introducido desde el estimador de movimiento (116) ;

un circuito de reconstrucción de textura (110) para llevar a cabo una cuantificación inversa y una transformada inversa en los coeficientes de transformada cuantificados para obtener un bloque de campo de error reconstruido;

un sumador (112) para combinar el bloque de campo de error reconstruido del circuito de reconstrucción de textura (110) y el bloque de campo superior o inferior estimado del compensador de movimiento (118) por cada píxel; y un circuito de procesamiento de cuadro anterior (114) para rellenar un bloque de campo superior o inferior reconstruido en función de información de forma para el VOP actual, para almacenar de ese modo los bloques de campo superior o inferior rellenados como información de textura entrelazada de referencia, comprendiendo el circuito de procesamiento de cuadro de referencia:

un primer dispositivo de relleno para rellenar el píxel de textura no definida en una fila del bloque de campo que presenta al menos una textura definida en función de uno o más de los píxeles de textura definida en dicha fila, un segundo dispositivo de relleno para rellenar el píxel de textura no definida en una fila del bloque de campo que presenta al menos una textura definida en función de uno o más de los píxeles de textura definida en una o más filas en dicho bloque de campo, y un tercer dispositivo de relleno para rellenar con un valor constante el bloque de campo de un VOP frontera que presenta solamente los píxeles de textura no definida.

2. El aparato según la reivindicación 1, en el que el circuito de procesamiento de cuadro de referencia (114) comprende además:

un circuito de relleno de macrobloque adyacente para expandir un macrobloque adyacente no definido en función del macrobloque frontera rellenado, donde el macrobloque adyacente no definido es adyacente al macrobloque frontera rellenado y solo presenta píxeles de textura no definida, y un circuito de relleno de macrobloque restante para rellenar con un valor constante el macrobloque exterior no adyacente al macrobloque frontera rellenado.

3. El aparato según la reivindicación 2, en el que el circuito de relleno de macrobloque adyacente incluye:

un selector para seleccionar, si dicho bloque adyacente no definido está rodeado por una pluralidad de macrobloques frontera rellenados, uno de los macrobloques frontera extrapolados izquierdo, superior, derecho e inferior de dicho macrobloque adyacente no definido en esta prioridad, y medios para duplicar hacia la derecha, hacia abajo, hacia la izquierda o hacia arriba un borde vertical o un borde horizontal del macrobloque frontera rellenado seleccionado.

4. El aparato según la reivindicación 1, en el que el valor constante e.

2. 1, y L es el número de bits asignados a cada píxel.

5. El aparato según la reivindicación 1, en el que dicho relleno del bloque de campo con un valor constante incluye rellenar dicho bloque de campo con un valor constante de 128. 10


 

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Imagen de 'Filtro de desbloqueo condicionado por el brillo de los píxeles'Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .