Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes.

Un sistema de decodificación de imagen para decodificar una imagen digital que comprende:

medios para decodificar cada uno de los bloques en los que está dividida una imagen,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser decodificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba, y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10179562.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22, NAGAIKE-CHO, ABENO-KU OSAKA-SHI, OSAKA 545-8522 JAPON.

Inventor/es: SUN,SHIJUN, KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: 28 de Enero de 2015.

Clasificación Internacional de Patentes:

H03M7/36 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
H04N1/41 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).
H04N19/51 H04N […] › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Estimación del movimiento o de compensación del movimiento.
H04N19/593 H04N 19/00 […] › implica técnicas de predicción espacial.

PDF original: ES-2532326_T3.pdf

Fragmento de la descripción:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes Antecedentes

Las realizaciones de la presente invención se refieren a intra-predicción para una imagen.

El vídeo digital necesita una gran cantidad de datos para representar todas y cada una de las imágenes de una secuencia de vídeo digital (por ejemplo, series de imágenes) de forma descomprimida. Para la mayoría de las aplicaciones no es viable transmitir vídeo digital descomprimido a través de redes informáticas debido a las limitaciones de ancho de banda. Adicionalmente, el vídeo digital descomprimido necesita una gran cantidad de espacio de almacenamiento. Normalmente el vídeo digital es codificado de alguna forma para reducir las necesidades de almacenamiento y reducir las necesidades de ancho de banda.

Una técnica para codificar vídeo digital es la codificación entre imágenes. La codificación entre imágenes explota el hecho de que distintas imágenes de vídeo incluyen típicamente regiones de píxeles, normalmente seleccionadas como bloques de x por x, que permanecen sustancialmente iguales. Durante el proceso de codificación, un vector de movimiento interrelaciona el movimiento de un bloque de píxeles en una imagen, con un bloque de píxeles similares en otra imagen. Por consiguiente, no se necesita que el sistema codifique dos veces el bloque de píxeles, sino que codifica una vez el bloque de píxeles y proporciona un vector de movimiento para predecir el otro bloque de píxeles.

Otra técnica para codificar vídeo digital es la codificación intra-imágenes. La codificación intra-imágenes codifica una imagen o una parte de esta sin referencia a píxeles en otras imágenes. La codificación intra-imágenes codifica típicamente la imagen, o porciones de esta, sobre una base bloque por bloque. Por ejemplo, en MPEG-2, la codificación intra-imágenes hace uso de transformaciones de coseno discreto, de un bloque de píxeles y la subsiguiente codificación de los coeficientes transformados. Existen otras técnicas de codificación intra-imágenes, como son por ejemplo; la codificación de ondas pequeñas.

En general, estas técnicas utilizan tablas de datos relativamente grandes para hacer referencia a los modos de predicción. La memoria para estas tablas de datos puede ser excesivamente costosa para muchas máquinas de bajo coste. Además, también es excesivamente costoso proporcionar la suficiente memoria dentro de los dispositivos de procesamiento para almacenar la tabla de datos. Además, el sistema resultante tiene una complejidad incrementada con la tabla de datos grande.

El documento de Karczewicz, M. et al: "Analysis and Simplification of Intra Prediction", JVT (ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6), JVT-D025, expone la intra-predicción en el contexto del estándar JVT. Los modos de intra-predicción se ordenan como sigue:

Modo 0: predicción vertical

Modo 1: predicción horizontal

Modo 2: predicción DC

Modo 3: predicción diagonal abajo/izquierda

Modo 4: predicción diagonal abajo/derecha

Modo 5: predicción vertical izquierda

Modo 6: predicción horizontal abajo

Modo 7: predicción vertical derecha

Modo 8: predicción horizontal arriba

Se escoge un modo de predicción estimado para un bloque C como el mínimo de los modos usados para los bloques adyacentes A y B. Si se usa el modo de predicción estimado, el codificador envía el valor de un bit. Si no se usa el modo de predicción estimado, se envía un número de código del 0 al 7 para indicar cuál de los restantes 8 modos se debería usar.

El documento de Sun, S. et al: "Intra-Prediction-Mode Ordering and Coding", JVT(ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6), JVT-D027, expone el siguiente orden para los modos:

Modo 0: predicción horizontal

Modo 1: predicción vertical

Modo 2: predicción DC

Modo 3: predicción diagonal abajo/izquierda

Modo 4: predicción horizontal abajo

Modo 5: predicción diagonal abajo/derecha

Modo 6: predicción vertical derecha

Modo 7: predicción vertical izquierda

Modo 8: predicción horizontal arriba

La invención proporciona una mejora sobre lo expuesto en cada uno de los documentos mencionados anteriormente.

La invención proporciona un sistema de decodificación de la imagen, tal como se define en la reivindicación 1, y un método de decodificación de la imagen tal como se define en la reivindicación 2.

Breve descripción de los dibujos

Los siguientes dibujos describen solamente unas realizaciones típicas de la presente invención y por lo tanto no deben considerarse limitativos de su alcance, la invención será descrita y explicada con especificidad y detalle adicionales, mediante el uso de los dibujos anexos, en los que:

la figura 1 ilustra algunas formas de adyacencia de bloques;

la figura 2 ilustra un bloque de píxeles y los píxeles adyacentes para la predicción;

la figura 3 ilustra direcciones generales del modo de predicción;

la figura 4 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 5 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 6 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 7 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 8 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 9 es un diagrama de bloques que ilustra la estimación del modo en algunas realizaciones de la presente invención;

la figura 10 es un diagrama de bloques que ilustra la estimación del modo en realizaciones con un conjunto ordenado de modos de predicción;

la figura 11 es un diagrama de bloques que ilustra la estimación del modo con conjuntos ordenados asociados con valores numéricos;

la figura 12 es un diagrama de bloques que ilustra las opciones de estimación del modo cuando no están disponibles algunos datos de bloque adyacente;

la figura 13 es un diagrama de bloques que ilustra la modificación del orden de modos en algunas realizaciones de la presente invención,

la figura 14 es un diagrama de bloques que ilustra los métodos de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el uso del orden de modos; y

la figura 15 es un diagrama de bloques que ilustra el método de una realización de la presente invención en la que se utiliza un modo estimado para modificar el orden de modos utilizando designadores específicos.

Descripción detallada

Las realizaciones de la presente invención comprenden métodos y sistemas relacionados con la intra-predicción de imágenes. Puesto que todas las realizaciones están relacionadas con la intra-predicción, los términos "intra-predicción" y "predicción" pueden utilizarse de forma intercambiable para referirse a los procesos de intra-predicción.

Las realizaciones de la presente invención utilizan codificación intra-imágenes o intra-codificación para explotar las redundancias espaciales dentro de una imagen de vídeo. Puesto que los bloques adyacentes generalmente tienen atributos similares, la eficiencia del proceso de codificación se mejora al relacionarse con la correlación espacial entre bloques adyacentes. Esta correlación puede explotarse mediante la predicción de un bloque objetivo en base a los modos de predicción utilizados en los bloques adyacentes.

Una imagen digital puede ser dividida en bloques para un procesamiento más eficiente o por otras razones. Como se ha ilustrado en la figura 1, un bloque objetivo "C" 12 puede estar situado junto aun bloque adyacente "A" 14, que está localizado inmediatamente sobre el bloque objetivo "C" 12. Otro bloque adyacente "B" 16 está localizado inmediatamente a la izquierda del bloque objetivo "C" 12. Otros bloques que comparten límites con el bloque objetivo "C" 12, pueden considerarse también bloques adyacentes al bloque "C" 12.

Los bloques pueden comprender diversos números de píxeles en diferentes configuraciones. Por ejemplo, un bloque

puede comprender un conjunto de 4 x 4 píxeles. Un bloque puede también comprender un conjunto de 16 x 16 píxeles o un conjunto de 8 x 8. Otras configuraciones de píxeles, incluyendo conjuntos tanto cuadrados como rectangulares pueden también constituir un bloque.

Cada píxel en un bloque objetivo puede predecirse con referencia a los datos de los píxeles relacionados en los bloques adyacentes. Estos datos de píxeles... [Seguir leyendo]

Reivindicaciones:

1. Un sistema de decodificación de imagen para decodificar una imagen digital que comprende: medios para decodificar cada uno de los bloques en los que está dividida una imagen,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser decodificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba, y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.

2. Un método de decodificación de imagen para decodificar una imagen digital decodificando cada uno de los bloques en los que una imagen se divide, comprendiendo el método:

una etapa de intra-predicción de predecir un valor de píxel de un bloque objetivo a predecirse usando un valor de píxel de un bloque adyacente, y

una etapa de estimación de modo de predicción de estimar un modo de predicción para el bloque objetivo;

en el que la etapa de intra-predicción utiliza al menos un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel del segundo bloque localizado junto al lado izquierdo del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

la etapa de estimación de modos de predicción determina que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.

Patentes similares o relacionadas:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Un método de descodificación para descodificar una imagen digital dividida en bloques, comprendiendo el método: seleccionar un bloque objetivo […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 10 de Julio de 2019, de DOLBY INTERNATIONAL AB: Un sistema de extracción de tejido que comprende: un introductor alargado que tiene una luz hueca formada en el mismo; una bolsa de extracción de […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un sistema de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que codifica una señal de imagen procedente de una fotografía […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Procedimiento de codificación de vídeo, procedimiento de decodificación de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, programa de codificación de vídeo y programa de decodificación de vídeo, del 1 de Mayo de 2019, de NTT DOCOMO, INC.: Procedimiento de decodificación de imágenes codificadas, comprendiendo el procedimiento: recibir una imagen codificada (n), una temporización de decodificación […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited-Harneys Services (Cayman) Limited: Un sistema de compresión de imágenes, que comprende: un mapeador de espacio de color que mapea una imagen de entrada con una representación de espacio de color YCoCg […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited: Un procedimiento para mapear un espacio de color, que comprende: recibir una entrada RGB, comprendiendo la entrada RGB un componente […]