Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas.

Procedimiento de decodificación de imágenes para decodificar cada una de una pluralidad de imágenescodificadas por bloque utilizando una matriz de cuantificación,

comprendiendo dicho procedimiento las etapassiguientes:

obtener, a partir de un flujo codificado, una matriz de cuantificación distinta de una matriz de cuantificaciónpredefinida y un ID de matriz para identificar la matriz de cuantificación, y reservar la matriz de cuantificación y elID de matriz;

extraer, a partir del flujo continuo codificado, un ID de matriz que se añade a los datos generados codificandouna imagen actual y que se utiliza para identificar una matriz de cuantificación que se ha utilizado para codificarla imagen actual;

identificar, a partir de las matrices de cuantificación reservadas en dicha etapa de reserva, una matriz decuantificación correspondiente al ID de matriz y

decodificar los datos de la imagen codificada actual utilizando la matriz de cuantificación identificada,componiéndose cada imagen de un componente luma, un primer componente croma y un segundo componentecroma, y estando el procedimiento de decodificación de imágenes caracterizado porque comprende las etapassiguientes:

una primera etapa, en la que en caso de que exista una matriz de cuantificación para el componente luma,una matriz de cuantificación para el primer componente croma y una matriz de cuantificación para el segundocomponente croma, por separado, en la matriz de cuantificación identificada por el ID de matriz extraído, lamatriz de cuantificación para el componente luma se identifica como matriz de cuantificación para uncomponente luma de la imagen actual, la matriz de cuantificación para el primer componente croma seidentifica como matriz de cuantificación para un primer componente croma de la imagen actual, y la matriz decuantificación para el segundo componente croma se identifica como matriz de cuantificación para unsegundo componente croma de la imagen actual,

una segunda etapa, en la que, en caso de que la matriz de cuantificación para el primer componente cromano esté presente y la matriz de cuantificación para el segundo componente croma esté presente en la matrizde cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para elsegundo componente croma, en lugar de la matriz de cuantificación predefinida, como matriz decuantificación para el primer componente croma de la imagen actual, y

una tercera etapa, en la que en caso de que tanto la matriz de cuantificación para el primer componentecroma y la matriz de cuantificación para el segundo componente croma no estén presentes en la matriz decuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para elcomponente luma, en lugar de la matriz de cuantificación predefinida, como la matriz de cuantificación para elprimer componente croma de la imagen actual y el segundo componente croma de la imagen actual.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/002458.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA, KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: KADONO, SHINYA, CHEN, TAO, LIM,CHONG SOON, LU,JIUHUAI, KASHIWAGI,YOSHIICHIRO.

Fecha de Publicación: 19 de Septiembre de 2012.

Clasificación Internacional de Patentes:

H04N7/26
H04N7/50

PDF original: ES-2392437_T3.pdf

Fragmento de la descripción:

Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas.

Campo técnico

La presente invención se refiere a un procedimiento de codificación de imágenes en movimiento para codificar imágenes en movimiento y generar flujos continuos, y a un procedimiento de decodificación de imágenes en movimiento para decodificar dichos flujos continuos codificados, así como los flujos continuos.

Antecedentes de la técnica

En la era de la multimedia que trata integralmente el audio, el vídeo y otros valores de píxeles, los medios informativos actuales, es decir, los periódicos, las revistas, la televisión, la radio, el teléfono y otro tipo de medios a través de los cuales se transmite información a las personas han sido englobados últimamente dentro del alcance de la multimedia. En general, el término multimedia se refiere a algo que se representa asociando no solo caracteres, sino también gráficos, audio y, en particular, imágenes y similares. No obstante, una condición previa para englobar los medios informativos disponibles mencionados anteriormente en el ámbito de la multimedia es la representación de dicha información en formato digital.

Sin embargo, cuando se calcula la cantidad de información contenida en cada uno de los medios informativos mencionados anteriormente como cantidad de información digital, mientras que la cantidad de información por carácter es de 1 a 2 bytes en el caso de los caracteres, la cantidad de información que se va a necesitar en el caso del audio (calidad telefónica) es de 64 Kbits por segundo y, en el caso de las imágenes en movimiento (calidad de recepción de televisión actual) , de 100 Mbits por segundo. Por consiguiente, no resulta razonable que los medios informativos mencionados anteriormente manejen una cantidad de información tan enorme como la disponible en formato digital. Por ejemplo, aunque actualmente ya existen videoteléfonos que utilizan la red digital de servicios integrados (RDSI) que ofrece una velocidad de transmisión comprendida entre 64 Kbits/s y 1, 5 Mbits/s, no resulta práctico transmitir vídeo de televisiones y cámaras directamente a través de la RDSI.

Desde este punto de vista, se ha planteado la necesidad de disponer de técnicas de compresión de información, y se han empleado técnicas de compresión de imágenes en movimiento que cumplen las normas H.261 y H.263 recomendadas por la UIT-T (Unión internacional de telecomunicaciones, sector de normalización de las telecomunicaciones) para videoteléfonos, por ejemplo. Además, según las técnicas de compresión de información que cumplen la norma MPEG-1, es posible almacenar información de imágenes en un CD (disco compacto) de música corriente junto con información de sonido.

El término MPEG (Grupo de expertos en imágenes en movimiento) se refiere a una norma internacional de compresión de señales de imágenes en movimiento normalizadas por ISO/IEC (Organismo internacional de normalización, Comisión electrotécnica internacional) , y el término MPEG-1 se refiere a una norma para comprimir información de señales de televisión aproximadamente hasta una centésima parte, de tal forma que las señales de imágenes en movimiento puedan transmitirse a una velocidad de 1, 5 Mbit/s. Además, puesto que la velocidad de transmisión alcanzada por la norma MPEG-1 es una velocidad de calidad media de alrededor de 1, 5 Mbit/s, la norma MPEG-2 creada con miras a cumplir requisitos de mejor calidad de imagen permite una transmisión de datos equivalente en calidad a la radiodifusión de televisión, por medio de la cual las señales de imágenes en movimiento se transmiten a una velocidad de 2 a 15 Mbit/s. Por otra parte, el grupo de trabajo (ISO/IEC JTC1/SC29/WG11) , promotor de las normas MPEG-1 y MPEG-2, creó la norma MPEG-4. La norma MPEG-4, que ofrece una tasa de compresión más alta que las normas MPEG-1 y MPEG-2 y que ofrece una codificación, una decodificación y un funcionamiento basados en el objeto, es capaz de aportar las nuevas funciones necesarias en la era de la multimedia. En la fase inicial de la normalización, la norma MPEG-4 tenía por objetivo ofrecer un procedimiento de codificación de baja velocidad binaria, pero posteriormente se ha ampliado para ser una norma que admite una codificación más general que procesa imágenes entrelazadas, así como una codificación de alta velocidad binaria. Actualmente, ISO/IEC y UIT-T han unido esfuerzos para la normalización de MPEG-4 AVC y UIT-T H.264 como procedimientos de codificación de imágenes de próxima generación que ofrecen una tasa de compresión más alta. A partir de agosto de 2002, se emite un proyecto de comité (CD) para un procedimiento de codificación de imágenes de próxima generación.

En general, en la codificación de una imagen en movimiento, la cantidad de información se comprime reduciendo las redundancias en las direcciones temporal y espacial. Por lo tanto, en la codificación de predicción interimagen que pretende reducir las redundancias temporales, se lleva a cabo la estimación del movimiento y la generación de una imagen predictiva de bloque en bloque con referencia a las imágenes progresivas o regresivas, y a continuación se aplica la codificación al valor de diferencia entre la imagen predictiva obtenida y una imagen de la imagen actual que se va a codificar. Aunque esta última hace referencia a una imagen, en el caso de una imagen progresiva "imagen" significa "trama", mientras que en el caso de una imagen entrelazada significa "trama" o "campos". En la presente memoria, una "imagen entrelazada" es una imagen de una trama que se compone de dos campos separados por el tiempo de captura. En la codificación y la decodificación de una imagen entrelazada, es posible tratar una trama

como una trama propiamente dicha, como dos campos o como una estructura de trama o una estructura de campo de bloque en bloque dentro de la trama.

La imagen que se va a codificar mediante predicción intraimagen sin referencia a ninguna imagen se denominará imagen I. La imagen que se va a codificar mediante predicción interimagen con referencia solo a una imagen se denominará imagen P. La imagen que se va a codificar mediante predicción interimagen con referencia a dos imágenes al mismo tiempo se denominará imagen B. Es posible que una imagen B se refiera a dos imágenes que pueden combinarse de forma arbitraria a partir de imágenes progresivas y regresivas por orden de presentación. Pueden determinarse imágenes de referencia para cada bloque que sirve como unidad de codificación/decodificación básica. Dichas imágenes de referencia pueden diferenciarse denominando "primera imagen de referencia" a una imagen de referencia que se describirá antes en un flujo de bits codificado, y denominando "segunda imagen de referencia" a una imagen de referencia que se describirá después en el flujo de bits. Debe tenerse en cuenta que una condición para codificar y decodificar estos tipos de imágenes es que las imágenes utilizadas como referencia deben estar ya codificadas y decodificadas.

Las imágenes P y B se codifican mediante predicción interimagen con compensación de movimiento. La codificación mediante predicción interimagen con compensación de movimiento es un procedimiento de codificación en el que se emplea compensación de movimiento en la codificación de predicción interimagen. A diferencia de un procedimiento para realizar la predicción basada simplemente en los valores de píxel de una imagen de referencia, la estimación de movimiento es una técnica capaz de aumentar la precisión de la predicción, así como reducir la cantidad de datos estimando la cantidad de movimiento (en lo sucesivo denominado "vector de movimiento") de cada parte de una imagen, y realizando además una predicción en la que se toma en consideración dicha cantidad de movimiento. Por ejemplo, es posible reducir la cantidad de datos a través de la compensación de movimiento estimando los vectores de movimiento de la imagen que se va a codificar actualmente y, a continuación, codificando los residuos de predicción entre los valores de predicción obtenidos cambiando solo la cantidad de los respectivos vectores de movimiento y la imagen que se va a codificar actualmente. En esta técnica, también se registran o transmiten vectores de movimiento en forma codificada, puesto que la información de los vectores de movimiento se necesita en el momento de la decodificación.

Se estiman los vectores del movimiento de cada macrobloque. De forma más particular, se fijará un macrobloque de la... [Seguir leyendo]

Reivindicaciones:

1. Procedimiento de decodificación de imágenes para decodificar cada una de una pluralidad de imágenes

codificadas por bloque utilizando una matriz de cuantificación, comprendiendo dicho procedimiento las etapas 5 siguientes:

obtener, a partir de un flujo codificado, una matriz de cuantificación distinta de una matriz de cuantificación predefinida y un ID de matriz para identificar la matriz de cuantificación, y reservar la matriz de cuantificación y el ID de matriz;

extraer, a partir del flujo continuo codificado, un ID de matriz que se añade a los datos generados codificando una imagen actual y que se utiliza para identificar una matriz de cuantificación que se ha utilizado para codificar la imagen actual;

identificar, a partir de las matrices de cuantificación reservadas en dicha etapa de reserva, una matriz de cuantificación correspondiente al ID de matriz y

decodificar los datos de la imagen codificada actual utilizando la matriz de cuantificación identificada,

componiéndose cada imagen de un componente luma, un primer componente croma y un segundo componente croma, y estando el procedimiento de decodificación de imágenes caracterizado porque comprende las etapas siguientes:

una primera etapa, en la que en caso de que exista una matriz de cuantificación para el componente luma,

una matriz de cuantificación para el primer componente croma y una matriz de cuantificación para el segundo componente croma, por separado, en la matriz de cuantificación identificada por el ID de matriz extraído, la matriz de cuantificación para el componente luma se identifica como matriz de cuantificación para un componente luma de la imagen actual, la matriz de cuantificación para el primer componente croma se identifica como matriz de cuantificación para un primer componente croma de la imagen actual, y la matriz de

cuantificación para el segundo componente croma se identifica como matriz de cuantificación para un segundo componente croma de la imagen actual,

una segunda etapa, en la que, en caso de que la matriz de cuantificación para el primer componente croma no esté presente y la matriz de cuantificación para el segundo componente croma esté presente en la matriz

de cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para el segundo componente croma, en lugar de la matriz de cuantificación predefinida, como matriz de cuantificación para el primer componente croma de la imagen actual, y

una tercera etapa, en la que en caso de que tanto la matriz de cuantificación para el primer componente

croma y la matriz de cuantificación para el segundo componente croma no estén presentes en la matriz de cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para el componente luma, en lugar de la matriz de cuantificación predefinida, como la matriz de cuantificación para el primer componente croma de la imagen actual y el segundo componente croma de la imagen actual.

45 2. Procedimiento de decodificación de imágenes según la reivindicación 1, en el que el ID de matriz se añade a los datos de la imagen codificada actual, por cada imagen, segmento o macrobloque.

3. Procedimiento de decodificación según la reivindicación 1, en el que la matriz de cuantificación y la información

de identificación para identificar la matriz de cuantificación están dispuestas en el flujo continuo codificado, por una 50 pluralidad de imágenes, o por una imagen individual.

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]