Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes.

Un sistema de decodificación de imagen para decodificar una imagen digital que comprende:



medios para decodificar cada uno de los bloques en los que está dividida una imagen,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser decodificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba, y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10179562.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22, NAGAIKE-CHO, ABENO-KU OSAKA-SHI, OSAKA 545-8522 JAPON.

Inventor/es: SUN,SHIJUN, KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H03M7/36 SECCION H — ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
  • H04N1/41 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).
  • H04N19/51 H04N […] › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Estimación del movimiento o de compensación del movimiento.
  • H04N19/593 H04N 19/00 […] › implica técnicas de predicción espacial.

PDF original: ES-2532326_T3.pdf

 


Fragmento de la descripción:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes Antecedentes

Las realizaciones de la presente invención se refieren a intra-predicción para una imagen.

El vídeo digital necesita una gran cantidad de datos para representar todas y cada una de las imágenes de una secuencia de vídeo digital (por ejemplo, series de imágenes) de forma descomprimida. Para la mayoría de las aplicaciones no es viable transmitir vídeo digital descomprimido a través de redes informáticas debido a las limitaciones de ancho de banda. Adicionalmente, el vídeo digital descomprimido necesita una gran cantidad de espacio de almacenamiento. Normalmente el vídeo digital es codificado de alguna forma para reducir las necesidades de almacenamiento y reducir las necesidades de ancho de banda.

Una técnica para codificar vídeo digital es la codificación entre imágenes. La codificación entre imágenes explota el hecho de que distintas imágenes de vídeo incluyen típicamente regiones de píxeles, normalmente seleccionadas como bloques de x por x, que permanecen sustancialmente iguales. Durante el proceso de codificación, un vector de movimiento interrelaciona el movimiento de un bloque de píxeles en una imagen, con un bloque de píxeles similares en otra imagen. Por consiguiente, no se necesita que el sistema codifique dos veces el bloque de píxeles, sino que codifica una vez el bloque de píxeles y proporciona un vector de movimiento para predecir el otro bloque de píxeles.

Otra técnica para codificar vídeo digital es la codificación intra-imágenes. La codificación intra-imágenes codifica una imagen o una parte de esta sin referencia a píxeles en otras imágenes. La codificación intra-imágenes codifica típicamente la imagen, o porciones de esta, sobre una base bloque por bloque. Por ejemplo, en MPEG-2, la codificación intra-imágenes hace uso de transformaciones de coseno discreto, de un bloque de píxeles y la subsiguiente codificación de los coeficientes transformados. Existen otras técnicas de codificación intra-imágenes, como son por ejemplo; la codificación de ondas pequeñas.

En general, estas técnicas utilizan tablas de datos relativamente grandes para hacer referencia a los modos de predicción. La memoria para estas tablas de datos puede ser excesivamente costosa para muchas máquinas de bajo coste. Además, también es excesivamente costoso proporcionar la suficiente memoria dentro de los dispositivos de procesamiento para almacenar la tabla de datos. Además, el sistema resultante tiene una complejidad incrementada con la tabla de datos grande.

El documento de Karczewicz, M. et al: "Analysis and Simplification of Intra Prediction", JVT (ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6), JVT-D025, expone la intra-predicción en el contexto del estándar JVT. Los modos de intra-predicción se ordenan como sigue:

Modo 0: predicción vertical

Modo 1: predicción horizontal

Modo 2: predicción DC

Modo 3: predicción diagonal abajo/izquierda

Modo 4: predicción diagonal abajo/derecha

Modo 5: predicción vertical izquierda

Modo 6: predicción horizontal abajo

Modo 7: predicción vertical derecha

Modo 8: predicción horizontal arriba

Se escoge un modo de predicción estimado para un bloque C como el mínimo de los modos usados para los bloques adyacentes A y B. Si se usa el modo de predicción estimado, el codificador envía el valor de un bit. Si no se usa el modo de predicción estimado, se envía un número de código del 0 al 7 para indicar cuál de los restantes 8 modos se debería usar.

El documento de Sun, S. et al: "Intra-Prediction-Mode Ordering and Coding", JVT(ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6), JVT-D027, expone el siguiente orden para los modos:

Modo 0: predicción horizontal

Modo 1: predicción vertical

Modo 2: predicción DC

Modo 3: predicción diagonal abajo/izquierda

Modo 4: predicción horizontal abajo

Modo 5: predicción diagonal abajo/derecha

Modo 6: predicción vertical derecha

Modo 7: predicción vertical izquierda

Modo 8: predicción horizontal arriba

La invención proporciona una mejora sobre lo expuesto en cada uno de los documentos mencionados anteriormente.

La invención proporciona un sistema de decodificación de la imagen, tal como se define en la reivindicación 1, y un método de decodificación de la imagen tal como se define en la reivindicación 2.

Breve descripción de los dibujos

Los siguientes dibujos describen solamente unas realizaciones típicas de la presente invención y por lo tanto no deben considerarse limitativos de su alcance, la invención será descrita y explicada con especificidad y detalle adicionales, mediante el uso de los dibujos anexos, en los que:

la figura 1 ilustra algunas formas de adyacencia de bloques;

la figura 2 ilustra un bloque de píxeles y los píxeles adyacentes para la predicción;

la figura 3 ilustra direcciones generales del modo de predicción;

la figura 4 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 5 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 6 ilustra las direcciones generales de los modos de predicción en una realización de la presente invención;

la figura 7 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 8 ilustra las direcciones generales de los modos de predicción en un ejemplo comparativo;

la figura 9 es un diagrama de bloques que ilustra la estimación del modo en algunas realizaciones de la presente invención;

la figura 10 es un diagrama de bloques que ilustra la estimación del modo en realizaciones con un conjunto ordenado de modos de predicción;

la figura 11 es un diagrama de bloques que ilustra la estimación del modo con conjuntos ordenados asociados con valores numéricos;

la figura 12 es un diagrama de bloques que ilustra las opciones de estimación del modo cuando no están disponibles algunos datos de bloque adyacente;

la figura 13 es un diagrama de bloques que ilustra la modificación del orden de modos en algunas realizaciones de la presente invención,

la figura 14 es un diagrama de bloques que ilustra los métodos de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el uso del orden de modos; y

la figura 15 es un diagrama de bloques que ilustra el método de una realización de la presente invención en la que se utiliza un modo estimado para modificar el orden de modos utilizando designadores específicos.

Descripción detallada

Las realizaciones de la presente invención comprenden métodos y sistemas relacionados con la intra-predicción de imágenes. Puesto que todas las realizaciones están relacionadas con la intra-predicción, los términos "intra-predicción" y "predicción" pueden utilizarse de forma intercambiable para referirse a los procesos de intra-predicción.

Las realizaciones de la presente invención utilizan codificación intra-imágenes o intra-codificación para explotar las redundancias espaciales dentro de una imagen de vídeo. Puesto que los bloques adyacentes generalmente tienen atributos similares, la eficiencia del proceso de codificación se mejora al relacionarse con la correlación espacial entre bloques adyacentes. Esta correlación puede explotarse mediante la predicción de un bloque objetivo en base a los modos de predicción utilizados en los bloques adyacentes.

Una imagen digital puede ser dividida en bloques para un procesamiento más eficiente o por otras razones. Como se ha ilustrado en la figura 1, un bloque objetivo "C" 12 puede estar situado junto aun bloque adyacente "A" 14, que está localizado inmediatamente sobre el bloque objetivo "C" 12. Otro bloque adyacente "B" 16 está localizado inmediatamente a la izquierda del bloque objetivo "C" 12. Otros bloques que comparten límites con el bloque objetivo "C" 12, pueden considerarse también bloques adyacentes al bloque "C" 12.

Los bloques pueden comprender diversos números de píxeles en diferentes configuraciones. Por ejemplo, un bloque

puede comprender un conjunto de 4 x 4 píxeles. Un bloque puede también comprender un conjunto de 16 x 16 píxeles o un conjunto de 8 x 8. Otras configuraciones de píxeles, incluyendo conjuntos tanto cuadrados como rectangulares pueden también constituir un bloque.

Cada píxel en un bloque objetivo puede predecirse con referencia a los datos de los píxeles relacionados en los bloques adyacentes. Estos datos de píxeles... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema de decodificación de imagen para decodificar una imagen digital que comprende: medios para decodificar cada uno de los bloques en los que está dividida una imagen,

medios de intra-predicción para predecir un valor de píxel de un bloque objetivo a ser decodificado mediante el uso de al menos un valor de píxel de un bloque adyacente al bloque objetivo, y

medios de estimación del modo de predicción para estimar un modo de predicción para el bloque objetivo;

en el que los medios de intra-predicción incluyen un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel de un segundo bloque situado junto a la izquierda del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción diagonal abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba, y

los medios de estimación del modo de predicción determinan que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.

2. Un método de decodificación de imagen para decodificar una imagen digital decodificando cada uno de los bloques en los que una imagen se divide, comprendiendo el método:

una etapa de intra-predicción de predecir un valor de píxel de un bloque objetivo a predecirse usando un valor de píxel de un bloque adyacente, y

una etapa de estimación de modo de predicción de estimar un modo de predicción para el bloque objetivo;

en el que la etapa de intra-predicción utiliza al menos un modo de predicción vertical utilizando un valor de predicción que es un valor de píxel de un primer bloque localizado junto y por encima del bloque objetivo; un modo de predicción horizontal utilizando un valor de predicción que es un valor de píxel del segundo bloque localizado junto al lado izquierdo del bloque objetivo; un modo de predicción DC utilizando un valor de predicción que es un promedio de los valores de píxel de los bloques primero y segundo; un modo de predicción diagonal abajo/izquierda utilizando la dirección especificada que es diagonalmente hacia abajo a la izquierda a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical abajo/derecha utilizando la dirección especificada que es diagonalmente hacia abajo a la derecha a un ángulo de 45 grados desde la horizontal; un modo de predicción vertical derecho utilizando la dirección de predicción especificada por un píxel hacia la derecha y dos píxeles hacia abajo; un modo de predicción horizontal hacia abajo utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia abajo; un modo de predicción vertical izquierdo utilizando la dirección de predicción especificada por un píxel hacia la izquierda y dos píxeles hacia abajo; un modo de predicción horizontal arriba utilizando la dirección de predicción especificada por dos píxeles hacia la derecha y un píxel hacia arriba;

los modos de predicción son numerados con números crecientes en serie, en el orden del modo de predicción vertical, el modo de predicción horizontal, el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha; el modo de predicción vertical derecho; el modo de predicción horizontal hacia abajo; el modo de predicción vertical izquierdo y el modo de predicción horizontal arriba, y

la etapa de estimación de modos de predicción determina que un modo de predicción tiene el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque como el modo de predicción estimado para el bloque objetivo.


 

Patentes similares o relacionadas:

Compresión de tabla de búsqueda de color, del 20 de Febrero de 2019, de HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P.: Un cartucho de impresión que comprende: un dispositivo de memoria que comprende una estructura de datos comprimidos para construir una tabla […]

Compresión de tablas de consulta de colores, del 23 de Enero de 2019, de HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P.: Cartucho de impresión, que comprende: un dispositivo de memoria que incluye datos para construir una tabla de colores para un dispositivo de impresión […]

Codificación, descodificación y representación de imágenes de alto rango dinámico, del 23 de Octubre de 2018, de DOLBY LABORATORIES LICENSING CORPORATION: Un procedimiento, que comprende: recibir una imagen de alto rango dinámico (HDR); generar una imagen con mapeo de tonos (TM) en base a la imagen […]

Normalización de cuantificación y transformada entera conjuntas utilizando una representación de mantisa - exponente de un parámetro de cuantificación, del 3 de Enero de 2018, de DOLBY INTERNATIONAL AB: Un método para codificar vídeo que comprende un bucle de predicción, donde el bucle de predicción comprende: a) realizar una transformación entera de un […]

Método de codificación de vídeo, método de descodificación de vídeo, aparato de codificación de vídeo, aparato de descodificación de vídeo, programa de codificación de vídeo y programa de descodificación de vídeo, del 26 de Abril de 2017, de NTT DOCOMO, INC.: Un método de descodificación de una secuencia de imágenes codificadas, comprendiendo el método etapas implementadas por ordenador realizadas mediante un procesador de un sistema […]

Normalización de cuantificación y transformada entera conjuntas utilizando una representación de mantisa ¿ exponente de un parámetro de cuantificación, del 8 de Febrero de 2017, de DOLBY INTERNATIONAL AB: Un codificador de vídeo que comprende un bucle de predicción, donde el bucle de predicción comprende: a) un módulo de transformada […]

Normalización de cuantificación y transformada entera conjuntas utilizando una representación de mantisa – exponente de un parámetro de cuantificación, del 25 de Enero de 2017, de DOLBY INTERNATIONAL AB: Un descodificador de vídeo para la reconstrucción de una muestra X' a partir de un valor cuantificado L, donde el aparato se configura para: recibir dicho valor cuantificado […]

Transformación y cuantificación de bloques mejorada para codificación de imagen y vídeo, del 16 de Noviembre de 2016, de Microsoft Technology Licensing, LLC: Un procedimiento para decodificar información de vídeo o de imagen, que comprende: recibir un conjunto de coeficientes de transformación cuantificados; […]

Otras patentes de SHARP KABUSHIKI KAISHA