Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes.

Un sistema de codificación de imagen para codificar una imagen digital que comprende:

medios para codificar cada uno de los bloques en los que está dividida una imagen

,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser codificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 67,5 grados desde la horizontal; una predicción horizontal hacia abajo utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal; un modo de predicción vertical utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 67,5 grados desde la horizontal; y un modo de predicción horizontal arriba utilizando la dirección especificada que está diagonalmente hacia arriba a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción codifican la primera información y la segunda información;

la primera información muestra si un modo de predicción real es igual o no al modo de predicción que se ha estimado en los medios de estimación; y

la segunda información está codificada en un caso donde el modo de predicción real es diferente del modo de predicción que se ha estimado en los medios de estimación para mostrar el modo de predicción real;

en el que la segunda información es una referencia al orden de modo de un conjunto de modos de predicción reordenados realizada eliminando el modo de predicción estimado por los medios de estimación del grupo ordenado.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10179568.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22, NAGAIKE-CHO ABENO-KU OSAKA-SHI, OSAKA 545-8522 JAPON.

Inventor/es: SUN,SHIJUN, KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Exploración, transmisión o reproducción de documentos... > H04N1/41 (Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17))
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/36 (Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/51 (Estimación del movimiento o de compensación del movimiento)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/593 (implica técnicas de predicción espacial)

PDF original: ES-2525557_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes Antecedentes

Las realizaciones de la presente invención se refieren a intra-predicción para una imagen.

El vídeo digital necesita una gran cantidad de datos para representar todas y cada una de las imágenes de una secuencia de vídeo digital (por ejemplo, series de imágenes) de forma descomprimida. Para la mayoría de las aplicaciones no es viable transmitir vídeo digital descomprimido a través de redes informáticas debido a las limitaciones de ancho de banda. Adicionalmente, el vídeo digital descomprimido necesita una gran cantidad de espacio de almacenamiento. Normalmente el vídeo digital es codificado de alguna forma para reducir las necesidades de almacenamiento y reducir las necesidades de ancho de banda.

Una técnica para codificar vídeo digital es la codificación entre imágenes. La codificación entre imágenes explota el hecho de que distintas imágenes de vídeo incluyen típicamente regiones de píxeles, normalmente seleccionadas como bloques de x por x, que permanecen sustancialmente iguales. Durante el proceso de codificación, un vector de movimiento interrelaciona el movimiento de un bloque de píxeles en una imagen, con un bloque de píxeles similares en otra imagen. Por consiguiente, no se necesita que el sistema codifique dos veces el bloque de píxeles, sino que codifica una vez el bloque de píxeles y proporciona un vector de movimiento para predecir el otro bloque de píxeles.

Otra técnica para codificar vídeo digital es la codificación intra-imágenes. La codificación intra-imágenes codifica una imagen o una parte de esta sin referencia a píxeles en otras imágenes. La codificación intra-imágenes codifica típicamente la imagen, o porciones de esta, sobre una base bloque por bloque. Por ejemplo, en MPEG-2, la codificación intra-imágenes hace uso de transformaciones de coseno discreto, de un bloque de píxeles y la subsiguiente codificación de los coeficientes transformados. Existen otras técnicas de codificación intra-imágenes, como son por ejemplo; la codificación de ondas pequeñas.

En general, estas técnicas utilizan tablas de datos relativamente grandes para hacer referencia a los modos de predicción. La memoria para estas tablas de datos puede ser excesivamente costosa para muchas máquinas de bajo coste. Además, también es excesivamente costoso proporcionar la suficiente memoria dentro de los dispositivos de procesamiento para almacenar la tabla de datos. Además, el sistema resultante tiene una complejidad incrementada con la tabla de datos grande.

Breve descripción de los dibujos

Los siguientes dibujos describen solo realizaciones típicas de la presente invención y por lo tanto no deben considerarse limitativos de su alcance, la invención será descrita y explicada con especificidad y detalle adicionales, mediante el uso de los dibujos anexos, en los que:

la figura 1 ilustra algunas formas de adyacencia de bloques;

la figura 2 ilustra un bloque de píxeles y los píxeles adyacentes para la predicción;

la figura 3 ilustra direcciones generales del modo de predicción;

la figura 4 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 5 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 6 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 7 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 8 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 9 es un diagrama de bloques que ilustra la estimación del modo en algunas realizaciones de la presente invención;

la figura 10 es un diagrama de bloques que ilustra la estimación del modo en realizaciones con un conjunto ordenado de modos de predicción;

la figura 11 es un diagrama de bloques que ilustra la estimación del modo con conjuntos ordenados asociados con valores numéricos;

la figura 12 es un diagrama de bloques que ilustra las opciones de estimación del modo cuando no están disponibles algunos datos de bloque adyacente;

la figura 13 es un diagrama de bloques que ilustra la modificación del orden de modos en algunas realizaciones de la presente invención,

la figura 14 es un diagrama de bloques que ilustra los métodos de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el uso del orden de modos; y

la figura 15 es un diagrama de bloques que ilustra el método de una realización de la presente invención en la que se utiliza un modo estimado para modificar el orden de modos utilizando designadores específicos.

Descripción detallada

Las realizaciones de la presente invención comprenden métodos y sistemas relacionados con la intra-predicción de imágenes. Puesto que todas las realizaciones están relacionadas con la intra-predicción, los términos "intra-predicción" y "predicción" pueden utilizarse de forma intercambiable para referirse a los procesos de intra-predicción.

Las realizaciones de la presente invención utilizan codificación intra-imágenes o intra-codificación para explotar las redundancias espaciales dentro de una imagen de vídeo. Puesto que los bloques adyacentes generalmente tienen atributos similares, la eficiencia del proceso de codificación se mejora al relacionarse con la correlación espacial entre bloques adyacentes. Esta correlación puede explotarse mediante la predicción de un bloque objetivo en base a los modos de predicción utilizados en los bloques adyacentes.

Una imagen digital puede ser dividida en bloques para un procesamiento más eficiente o por otras razones. Como se ha ilustrado en la figura 1, un bloque objetivo "C" 12 puede estar situado junto a un bloque adyacente "A" 14, que está localizado inmediatamente sobre el bloque objetivo "C" 12. Otro bloque adyacente "B" 16 está localizado inmediatamente a la izquierda del bloque objetivo "C" 12. Otros bloques que comparten límites con el bloque objetivo "C" 12, pueden considerarse también bloques adyacentes al bloque "C" 12.

Los bloques pueden comprender diversos números de píxeles en diferentes configuraciones. Por ejemplo, un bloque puede comprender un conjunto de 4 x4 píxeles. Un bloque puede también comprender un conjunto de 16 x 16 píxeles o un conjunto de 8 x 8. Otras configuraciones de píxeles, incluyendo conjuntos tanto cuadrados como rectangulares pueden también constituir un bloque.

Cada píxel en un bloque objetivo puede predecirse con referencia a los datos de los píxeles relacionados en los bloques adyacentes. Estos datos de píxeles adyacentes o datos de bloques adyacentes comprenden los modos de predicción utilizados para predecir esos bloques adyacentes o píxeles adyacentes. Los píxeles adyacentes concretos y los píxeles dentro de un bloque objetivo pueden ser aludidos utilizando un índice alfanumérico como el ilustrado en la figura 2. La figura 2 ilustra un bloque objetivo de 4 x 4, tal como el bloque "C" 12, que comprende 16 píxeles designados por caracteres alfabéticos en minúscula 22. Los píxeles en un bloque adyacente inmediatamente superior al bloque objetivo se designan mediante caracteres alfabéticos en mayúscula 24. Los píxeles en un bloque adyacente inmediatamente a la izquierda del bloque objetivo se designan mediante caracteres alfabéticos en mayúscula 26.

Los modos de predicción pueden comprender instrucciones o algoritmos para predecir píxeles específicos en... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema de codificación de imagen para codificar una imagen digital que comprende: medios para codificar cada uno de los bloques en los que está dividida una imagen,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser codificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 67,5 grados desde la horizontal; una predicción horizontal hacia abajo utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal; un modo de predicción vertical utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 67,5 grados desde la horizontal; y un modo de predicción horizontal arriba utilizando la dirección especificada que está diagonalmente hacia arriba a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción codifican la primera información y la segunda información;

la primera información muestra si un modo de predicción real es igual o no al modo de predicción que se ha estimado en los medios de estimación; y

la segunda información está codificada en un caso donde el modo de predicción real es diferente del modo de predicción que se ha estimado en los medios de estimación para mostrar el modo de predicción real;

en el que la segunda información es una referencia al orden de modo de un conjunto de modos de predicción reordenados realizada eliminando el modo de predicción estimado por los medios de estimación del grupo ordenado.

2. Un método de codificación de imagen para codificar una imagen digital codificando cada uno de los bloques en los que una imagen se divide, comprendiendo el método:

una etapa de intra-predicción de predecir un valor de píxel de un bloque objetivo a predecirse usando un valor de píxel de un bloque adyacente, y

una etapa de estimación de modo de predicción de estimar un modo de predicción para el bloque objetivo;

en el que la etapa de intra-predicción utiliza al menos un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel del segundo bloque localizado junto al lado izquierdo del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción vertical abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 67,5 grados desde la horizontal; un modo de predicción horizontal hacia abajo utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de

22,5 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 67,5 grados desde la horizontal; una predicción horizontal hacia abajo utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal; un modo de predicción vertical derecho utilizando la 5 dirección especificada que es diagonalmente hacia abajo a la izquierda a aproximadamente un ángulo de 67,5 grados desde la horizontal; y un modo de predicción horizontal arriba utilizando la dirección especificada que está diagonalmente hacia arriba a la derecha a aproximadamente un ángulo de 22,5 grados desde la horizontal;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, 10 el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba y

la etapa de estimación de modos de predicción determina que un modo de predicción tiene el menor número de modo 15 entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción para el bloque objetivo; y

la etapa de intra-predicción codifica la primera información y la segunda información;

la primera información muestra si un modo de predicción real es igual o no al modo de predicción que se ha estimado en los medios de estimación; y

la segunda información está codificada en un caso donde el modo de predicción real es diferente del modo de predicción que se ha estimado en la etapa de estimación para mostrar el modo de predicción real;

en el que la segunda información es una referencia al orden de modo de un conjunto de modos de predicción reordenados realizada eliminando el modo de predicción estimado en la etapa de estimación del conjunto ordenado.