Métodos y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes.

Un sistema de descodificación de imágenes para descodificar una imagen digital

, que comprende:

medios para descodificar cada uno de los bloques en los que está dividida una imagen;

medios intra-predicción para predecir un valor de píxel de un bloque objetivo a descodificar, mediante utilizar un valor de píxel de un bloque adyacente; y

medios de estimación del modo de predicción, para estimar un modo de predicción para el bloque objetivo; en el que los medios de intra-predicción incluyen un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67,5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22,5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67,5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22,5 grados respecto de la horizontal;

los modos de predicción están numerados con números crecientes, en el orden del modo de predicción vertical, el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha, el modo de predicción vertical derecha, el modo de predicción horizontal abajo, el modo de predicción vertical izquierda y el modo de predicción horizontal arriba,

el medio de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción descodifican la primera información y la segunda información; la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido estimado en el medio de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en el medio de estimación, para mostrar el modo de predicción real.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10179572.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22, NAGAIKE-CHO, ABENO-KU OSAKA-SHI, OSAKA 545-8522 JAPON.

Inventor/es: SUN,SHIJUN, KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Exploración, transmisión o reproducción de documentos... > H04N1/41 (Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17))
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/36 (Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/51 (Estimación del movimiento o de compensación del movimiento)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/593 (implica técnicas de predicción espacial)

PDF original: ES-2467696_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Métodos y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes ANTECEDENTES

Las realizaciones de la presente invención se refieren a intra-predicción para una imagen.

El video digital necesita una gran cantidad de datos para representar todas y cada una de las imágenes de una secuencia de video digital (por ejemplo series de imágenes) de forma descomprimida. Para la mayoría de las aplicaciones, no es viable transmitir video digital descomprimido a través de redes informáticas, debido a las limitaciones de ancho de banda. Adicionalmente, el video digital descomprimido necesita una gran cantidad de espacio de almacenamiento. Normalmente el video digital es codificado de alguna forma, para reducir las necesidades de almacenamiento y reducir las necesidades de ancho de banda.

Una técnica para codificar video digital es la codificación entre imágenes. La codificación entre imágenes explota el hecho de que distintas imágenes de video incluyen típicamente regiones de píxeles, normalmente seleccionadas como bloques de x por x, que permanecen sustancialmente iguales. Durante el proceso de codificación, un vector de movimiento interrelaciona el movimiento de un bloque de píxeles en una imagen, con un bloque de píxeles similares en otra imagen. Por consiguiente, no se necesita que el sistema codifique dos veces el bloque de píxeles, sino que codifica una vez el bloque de píxeles y proporciona un vector de movimiento para predecir el otro bloque de píxeles.

Otra técnica para codificar video digital es la codificación intra-imágenes. La codificación intra-imágenes codifica una imagen o una parte de ésta, sin referencia a píxeles en otras imágenes. La codificación intra-imágenes codifica típicamente la imagen, o porciones de ésta, sobre una base bloque por bloque. Por ejemplo en MPEG-2, la codificación intra-imágenes hace uso de transformaciones de coseno discreto, de un bloque de píxeles, y la subsiguiente codificación de los coeficientes transformados. Existen otras técnicas de codificación intra-imágenes, como son por ejemplo la codificación de ondas pequeñas.

En general, estas técnicas utilizan tablas de datos relativamente grandes para hacer referencia a los modos de predicción. La memoria para estas tablas de datos puede ser excesivamente costosa para muchas máquinas de bajo coste. Además, también es excesivamente costoso proporcionar la suficiente memoria dentro de los dispositivos de procesamiento, para almacenar las tablas de datos. Además, el sistema resultante tiene una complejidad incrementada con las grandes tablas de datos.

El documento de Karczewicz, M. y otros: "Analysis and Simplification of Intra Prediction", JVT (ISO/IEC JCTC1/SC29/WG11 y ITU-T SG16 Q.6) , JVT-D025, da a conocer intra-predicción en el contexto del estándar JVT. Los modos de intra-predicción se ordenan como sigue:

Modo 0: predicción Vertical

Modo 1: predicción Horizontal

Modo 2: predicción DC

Modo 3: predicción Diagonal Abajo / Izquierda Modo 4: predicción Diagonal Abajo / Derecha Modo 5: predicción Vertical Izquierda Modo 6: predicción Horizontal Abajo Modo 7: predicción Vertical Derecha Modo 8: predicción Horizontal Arriba Un modo de predicción estimado para el bloque C se escoge como el mínimo de los modos utilizados para los bloques adyacentes A y B. Si se utiliza el modo de predicción estimado, el codificador envía un valor de un bit. Si no se utiliza el modo de predicción estimado, se envía un número de código desde 0 hasta 7, para indicar cuál de los 8 modos restantes debería utilizarse.

El documento de Sun, S. y otros: "Intra-Prediction-Mode Ordering end Coding", JVT (ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6) , JVT-D027, da a conocer el siguiente ordenamiento de modos:

Mode 0: predicción Horizontal

Modo 1: predicción Vertical

Modo 2: predicción DC

Modo 3: predicción Diagonal Abajo / Izquierda Modo 4: predicción Horizontal Abajo Modo 5: predicción Diagonal Abajo / Derecha Modo 6: predicción Vertical Derecha Modo 7: predicción Vertical Izquierda Modo 8: predicción Horizontal Arriba La invención da a conocer una mejora sobre lo que se da a conocer en cada uno de los documentos identificados anteriores. La invención da a conocer un sistema de descodificación de imágenes según la reivindicación 1, y un método de descodificación de imágenes según la reivindicación 2.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Los siguientes dibujos describen realizaciones de la presente invención, y por lo tanto no deben considerarse

limitativos de su alcance, y la invención será descrita y explicada con especificidad y detalle adicionales, mediante el uso de los dibujos adjuntos, en los cuales: la figura 1 ilustra algunas formas de adyacencia de bloques; la figura 2 ilustra un bloque de píxeles y los píxeles adyacentes, para la predicción; la figura 3 ilustra direcciones generales del modo de predicción; la figura 4 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 5 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 6 ilustra las direcciones generales de los modos de predicción, en una realización de la presente invención; la figura 7 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 8 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 9 es un diagrama de bloques que ilustra la estimación del modo, en algunas realizaciones de la presente

invención;

la figura 10 es un diagrama de bloques que ilustra la estimación del modo, en realizaciones con un conjunto ordenado de modos de predicción; la figura 11 es un diagrama de bloques que ilustra la estimación del modo, con conjuntos ordenados asociados con

valores numéricos;

la figura 12 es un diagrama de bloques que ilustra las opciones de estimación del modo, cuando no están disponibles algunos datos de bloque adyacente; la figura 13 es un diagrama de bloques que ilustra la modificación del orden de modos, en algunas realizaciones de

la presente invención,

la figura 14 es un diagrama de bloques que ilustra los métodos de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el uso del orden de modos; y

la figura 15 es un diagrama de bloques que ilustra el método de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el orden de modos utilizando designadores específicos.

DESCRIPCIÓN DETALLADA

Las realizaciones de la presente invención comprenden métodos y sistemas relacionados con la intra-predicción de imágenes. Puesto que todas las realizaciones están relacionadas con la intra-predicción, los términos "intrapredicción" y "predicción" pueden utilizarse de forma intercambiable para referirse a los procesos de intra-predicción.

Las realizaciones de la presente invención utilizan codificación intra-imágenes o intra-codificación, para explotar las redundancias espaciales dentro de una imagen de video. Puesto que los bloques adyacentes generalmente tienen atributos similares, la eficiencia del proceso de codificación se mejora al relacionarse con la correlación espacial entre bloques adyacentes. Esta correlación puede explotarse mediante la predicción de un bloque objetivo, en base a los modos de predicción utilizados en los bloques adyacentes.

Una imagen digital puede ser dividida en bloques para un procesamiento más eficiente, o por otras razones. Como se ha ilustrado en la figura 1, un bloque objetivo "C" 12 puede estar situado... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema de descodificación de imágenes para descodificar una imagen digital, que comprende:

medios para descodificar cada uno de los bloques en los que está dividida una imagen;

medios intra-predicción para predecir un valor de píxel de un bloque objetivo a descodificar, mediante utilizar un valor de píxel de un bloque adyacente; y

medios de estimación del modo de predicción, para estimar un modo de predicción para el bloque objetivo; en el que los medios de intra-predicción incluyen un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67, 5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67, 5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal;

los modos de predicción están numerados con números crecientes, en el orden del modo de predicción vertical, el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha, el modo de predicción vertical derecha, el modo de predicción horizontal abajo, el modo de predicción vertical izquierda y el modo de predicción horizontal arriba,

el medio de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción descodifican la primera información y la segunda información;

la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido estimado en el medio de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en el medio de estimación, para mostrar el modo de predicción real.

2. Un método de descodificación de imágenes para descodificar una imagen digital mediante descodificar cada uno de los bloques en los que está dividida la imagen, comprendiendo el método:

una etapa intra-predicción, de predicción de un valor de píxel de un bloque objetivo a predecir, mediante utilizar un valor de píxel de un bloque adyacente; y

una etapa de estimación del modo de predicción, de estimación de un modo de predicción para el bloque objetivo; en el que la etapa intra-predicción utiliza por lo menos un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67, 5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67, 5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal;

los modos de predicción están numerados con números crecientes, en el orden del modo de predicción vertical, el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha, el modo de predicción vertical derecha, el modo de predicción horizontal abajo, el modo de predicción vertical izquierda y el modo de predicción horizontal arriba,

la etapa de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

la etapa de intra-predicción descodifica la primera información y la segunda información;

la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido 15 estimado en la etapa de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en la etapa de estimación, para mostrar el modo de predicción real.