Métodos y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes.

Un sistema de descodificación de imágenes para descodificar una imagen digital,

que comprende:

medios para descodificar cada uno de los bloques en los que está dividida una imagen;

medios intra-predicción para predecir un valor de píxel de un bloque objetivo a descodificar, mediante utilizar un valor de píxel de un bloque adyacente; y

medios de estimación del modo de predicción, para estimar un modo de predicción para el bloque objetivo; en el que los medios de intra-predicción incluyen un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67,5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22,5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67,5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22,5 grados respecto de la horizontal;

los modos de predicción están numerados con números crecientes, en el orden del modo de predicción vertical, el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha, el modo de predicción vertical derecha, el modo de predicción horizontal abajo, el modo de predicción vertical izquierda y el modo de predicción horizontal arriba,

el medio de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción descodifican la primera información y la segunda información; la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido estimado en el medio de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en el medio de estimación, para mostrar el modo de predicción real.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10179572.

Solicitante: SHARP KABUSHIKI KAISHA.

Nacionalidad solicitante: Japón.

Dirección: 22-22, NAGAIKE-CHO, ABENO-KU OSAKA-SHI, OSAKA 545-8522 JAPON.

Inventor/es: SUN,SHIJUN, KEROFSKY,LOUIS JOSEPH.

Fecha de Publicación: 7 de Mayo de 2014.

Clasificación Internacional de Patentes:

H03M7/36 ELECTRICIDAD. › H03 CIRCUITOS ELECTRONICOS BASICOS. › H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de una modulación diferencial de varios bits, es decir, la diferencia entre muestras sucesivas está codificada por más de un bit.
H04N1/41 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).
H04N19/51 H04N […] › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Estimación del movimiento o de compensación del movimiento.
H04N19/593 H04N 19/00 […] › implica técnicas de predicción espacial.

PDF original: ES-2467696_T3.pdf

Fragmento de la descripción:

Métodos y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes ANTECEDENTES

Las realizaciones de la presente invención se refieren a intra-predicción para una imagen.

El video digital necesita una gran cantidad de datos para representar todas y cada una de las imágenes de una secuencia de video digital (por ejemplo series de imágenes) de forma descomprimida. Para la mayoría de las aplicaciones, no es viable transmitir video digital descomprimido a través de redes informáticas, debido a las limitaciones de ancho de banda. Adicionalmente, el video digital descomprimido necesita una gran cantidad de espacio de almacenamiento. Normalmente el video digital es codificado de alguna forma, para reducir las necesidades de almacenamiento y reducir las necesidades de ancho de banda.

Una técnica para codificar video digital es la codificación entre imágenes. La codificación entre imágenes explota el hecho de que distintas imágenes de video incluyen típicamente regiones de píxeles, normalmente seleccionadas como bloques de x por x, que permanecen sustancialmente iguales. Durante el proceso de codificación, un vector de movimiento interrelaciona el movimiento de un bloque de píxeles en una imagen, con un bloque de píxeles similares en otra imagen. Por consiguiente, no se necesita que el sistema codifique dos veces el bloque de píxeles, sino que codifica una vez el bloque de píxeles y proporciona un vector de movimiento para predecir el otro bloque de píxeles.

Otra técnica para codificar video digital es la codificación intra-imágenes. La codificación intra-imágenes codifica una imagen o una parte de ésta, sin referencia a píxeles en otras imágenes. La codificación intra-imágenes codifica típicamente la imagen, o porciones de ésta, sobre una base bloque por bloque. Por ejemplo en MPEG-2, la codificación intra-imágenes hace uso de transformaciones de coseno discreto, de un bloque de píxeles, y la subsiguiente codificación de los coeficientes transformados. Existen otras técnicas de codificación intra-imágenes, como son por ejemplo la codificación de ondas pequeñas.

En general, estas técnicas utilizan tablas de datos relativamente grandes para hacer referencia a los modos de predicción. La memoria para estas tablas de datos puede ser excesivamente costosa para muchas máquinas de bajo coste. Además, también es excesivamente costoso proporcionar la suficiente memoria dentro de los dispositivos de procesamiento, para almacenar las tablas de datos. Además, el sistema resultante tiene una complejidad incrementada con las grandes tablas de datos.

El documento de Karczewicz, M. y otros: "Analysis and Simplification of Intra Prediction", JVT (ISO/IEC JCTC1/SC29/WG11 y ITU-T SG16 Q.6) , JVT-D025, da a conocer intra-predicción en el contexto del estándar JVT. Los modos de intra-predicción se ordenan como sigue:

Modo 0: predicción Vertical

Modo 1: predicción Horizontal

Modo 2: predicción DC

Modo 3: predicción Diagonal Abajo / Izquierda Modo 4: predicción Diagonal Abajo / Derecha Modo 5: predicción Vertical Izquierda Modo 6: predicción Horizontal Abajo Modo 7: predicción Vertical Derecha Modo 8: predicción Horizontal Arriba Un modo de predicción estimado para el bloque C se escoge como el mínimo de los modos utilizados para los bloques adyacentes A y B. Si se utiliza el modo de predicción estimado, el codificador envía un valor de un bit. Si no se utiliza el modo de predicción estimado, se envía un número de código desde 0 hasta 7, para indicar cuál de los 8 modos restantes debería utilizarse.

El documento de Sun, S. y otros: "Intra-Prediction-Mode Ordering end Coding", JVT (ISO/IEC JCTC1/SC29/WG11 e ITU-T SG16 Q.6) , JVT-D027, da a conocer el siguiente ordenamiento de modos:

Mode 0: predicción Horizontal

Modo 1: predicción Vertical

Modo 2: predicción DC

Modo 3: predicción Diagonal Abajo / Izquierda Modo 4: predicción Horizontal Abajo Modo 5: predicción Diagonal Abajo / Derecha Modo 6: predicción Vertical Derecha Modo 7: predicción Vertical Izquierda Modo 8: predicción Horizontal Arriba La invención da a conocer una mejora sobre lo que se da a conocer en cada uno de los documentos identificados anteriores. La invención da a conocer un sistema de descodificación de imágenes según la reivindicación 1, y un método de descodificación de imágenes según la reivindicación 2.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Los siguientes dibujos describen realizaciones de la presente invención, y por lo tanto no deben considerarse

limitativos de su alcance, y la invención será descrita y explicada con especificidad y detalle adicionales, mediante el uso de los dibujos adjuntos, en los cuales: la figura 1 ilustra algunas formas de adyacencia de bloques; la figura 2 ilustra un bloque de píxeles y los píxeles adyacentes, para la predicción; la figura 3 ilustra direcciones generales del modo de predicción; la figura 4 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 5 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 6 ilustra las direcciones generales de los modos de predicción, en una realización de la presente invención; la figura 7 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 8 ilustra las direcciones generales de los modos de predicción, de un ejemplo comparativo; la figura 9 es un diagrama de bloques que ilustra la estimación del modo, en algunas realizaciones de la presente

invención;

la figura 10 es un diagrama de bloques que ilustra la estimación del modo, en realizaciones con un conjunto ordenado de modos de predicción; la figura 11 es un diagrama de bloques que ilustra la estimación del modo, con conjuntos ordenados asociados con

valores numéricos;

la figura 12 es un diagrama de bloques que ilustra las opciones de estimación del modo, cuando no están disponibles algunos datos de bloque adyacente; la figura 13 es un diagrama de bloques que ilustra la modificación del orden de modos, en algunas realizaciones de

la presente invención,

la figura 14 es un diagrama de bloques que ilustra los métodos de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el uso del orden de modos; y

la figura 15 es un diagrama de bloques que ilustra el método de una realización de la presente invención, en la que se utiliza un modo estimado para modificar el orden de modos utilizando designadores específicos.

DESCRIPCIÓN DETALLADA

Las realizaciones de la presente invención comprenden métodos y sistemas relacionados con la intra-predicción de imágenes. Puesto que todas las realizaciones están relacionadas con la intra-predicción, los términos "intrapredicción" y "predicción" pueden utilizarse de forma intercambiable para referirse a los procesos de intra-predicción.

Las realizaciones de la presente invención utilizan codificación intra-imágenes o intra-codificación, para explotar las redundancias espaciales dentro de una imagen de video. Puesto que los bloques adyacentes generalmente tienen atributos similares, la eficiencia del proceso de codificación se mejora al relacionarse con la correlación espacial entre bloques adyacentes. Esta correlación puede explotarse mediante la predicción de un bloque objetivo, en base a los modos de predicción utilizados en los bloques adyacentes.

Una imagen digital puede ser dividida en bloques para un procesamiento más eficiente, o por otras razones. Como se ha ilustrado en la figura 1, un bloque objetivo "C" 12 puede estar situado junto o a un bloque adyacente "A" 14, que está localizado inmediatamente sobre el bloque objetivo "C" 12. Otro bloque adyacente "B" 16, está localizado inmediatamente a la izquierda del bloque objetivo "C" 12. Otros bloques que comparten límites con el bloque objetivo "C" 12, pueden considerarse bloques adyacentes al bloque "C" 12.

Los bloques pueden comprender diversos números de píxeles en diferentes configuraciones. Por ejemplo, un bloque puede comprender un conjunto de 4 x 4 píxeles. Un bloque puede también comprender un conjunto de 16 x 16 píxeles o un conjunto de 8 x 8. Otras configuraciones de píxeles, incluyendo conjuntos tanto cuadrados como rectangulares, pueden también constituir un bloque.

Cada píxel en un bloque objetivo puede predecirse con referencia a los datos de los píxeles relacionados, en los bloques adyacentes. Estos datos de píxeles adyacentes o datos de bloques adyacentes, comprenden los modos de predicción utilizados para predecir... [Seguir leyendo]

Reivindicaciones:

1. Un sistema de descodificación de imágenes para descodificar una imagen digital, que comprende:

medios para descodificar cada uno de los bloques en los que está dividida una imagen;

medios intra-predicción para predecir un valor de píxel de un bloque objetivo a descodificar, mediante utilizar un valor de píxel de un bloque adyacente; y

medios de estimación del modo de predicción, para estimar un modo de predicción para el bloque objetivo; en el que los medios de intra-predicción incluyen un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67, 5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67, 5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal;

los modos de predicción están numerados con números crecientes, en el orden del modo de predicción vertical, el modo de predicción horizontal y el modo de predicción DC, el modo de predicción diagonal abajo/izquierda, el modo de predicción diagonal abajo/derecha, el modo de predicción vertical derecha, el modo de predicción horizontal abajo, el modo de predicción vertical izquierda y el modo de predicción horizontal arriba,

el medio de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

los medios de intra-predicción descodifican la primera información y la segunda información;

la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido estimado en el medio de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en el medio de estimación, para mostrar el modo de predicción real.

2. Un método de descodificación de imágenes para descodificar una imagen digital mediante descodificar cada uno de los bloques en los que está dividida la imagen, comprendiendo el método:

una etapa intra-predicción, de predicción de un valor de píxel de un bloque objetivo a predecir, mediante utilizar un valor de píxel de un bloque adyacente; y

una etapa de estimación del modo de predicción, de estimación de un modo de predicción para el bloque objetivo; en el que la etapa intra-predicción utiliza por lo menos un modo de predicción vertical que utiliza un valor de predicción que es un valor de píxel de un primer bloque situado junto al bloque objetivo y por encima del mismo; un modo de predicción horizontal que utiliza un valor de predicción que es un valor de píxel de un segundo bloque situado junto al lado izquierdo del bloque objetivo; un modo de predicción DC que utiliza un valor de predicción que es un promedio de los valores de píxel del primer y el segundo bloques; un modo de predicción diagonal abajo/izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 45 grados respecto de la horizontal; un modo de predicción diagonal abajo/derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 45 grados respecto de la horizontal; un modo de predicción vertical derecha que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 67, 5 grados respecto de la horizontal; un modo de predicción horizontal abajo que utiliza la dirección especificada siendo descendente diagonalmente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal; un modo de predicción vertical izquierda que utiliza la dirección especificada siendo descendente diagonalmente hacia la izquierda a un ángulo de 67, 5 grados respecto de la horizontal y; un modo de predicción horizontal arriba que utiliza la dirección especificada siendo diagonalmente ascendente hacia la derecha a un ángulo de 22, 5 grados respecto de la horizontal;

la etapa de estimación del modo de predicción determina un modo de predicción que tenga el menor número de modo entre el modo de predicción del primer bloque y el modo de predicción del segundo bloque, como el modo de predicción para el bloque objetivo; y

la etapa de intra-predicción descodifica la primera información y la segunda información;

la primera información muestra si el modo de predicción real es o no igual al modo de predicción que ha sido 15 estimado en la etapa de estimación; y

la segunda información se descodifica en un caso en el que el modo de predicción real es diferente del modo de predicción que ha sido estimado en la etapa de estimación, para mostrar el modo de predicción real.

Patentes similares o relacionadas:

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Un método de descodificación para descodificar una imagen digital dividida en bloques, comprendiendo el método: seleccionar un bloque objetivo […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 10 de Julio de 2019, de DOLBY INTERNATIONAL AB: Un sistema de extracción de tejido que comprende: un introductor alargado que tiene una luz hueca formada en el mismo; una bolsa de extracción de […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un sistema de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que codifica una señal de imagen procedente de una fotografía […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 5 de Junio de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Procedimiento de codificación de vídeo, procedimiento de decodificación de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, programa de codificación de vídeo y programa de decodificación de vídeo, del 1 de Mayo de 2019, de NTT DOCOMO, INC.: Procedimiento de decodificación de imágenes codificadas, comprendiendo el procedimiento: recibir una imagen codificada (n), una temporización de decodificación […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited-Harneys Services (Cayman) Limited: Un sistema de compresión de imágenes, que comprende: un mapeador de espacio de color que mapea una imagen de entrada con una representación de espacio de color YCoCg […]

Sistema y procedimiento para transformar y codificar progresivamente datos digitales, del 10 de Abril de 2019, de Zhigu Holdings Limited: Un procedimiento para mapear un espacio de color, que comprende: recibir una entrada RGB, comprendiendo la entrada RGB un componente […]