Aparato de decodificación de imágenes y aparato de decodificación de imágenes.
Un aparato de codificación de imágenes (400) que genera una señal de imagen codificada codificando imágenes en unidades de acceso,
incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho aparato de codificación de imágenes:
una unidad de codificación (412) configurada para codificar una imagen que ha de ser codificada para generar una imagen independiente,
en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen;
na unidad de generación de información (413) configurada para generar información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y
una unidad de escritura (411) configurada para escribir la información suplementaria generada por dicha unidad de generación de información (413) en la unidad de acceso de la señal de imagen codificada.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09179003.
Solicitante: PANASONIC CORPORATION.
Nacionalidad solicitante: Japón.
Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.
Inventor/es: TOMA,TADAMASA, OKADA,TOMOYUKI, LIU,SAM, WALKER,PHILIP M, BOERGER,PAUL.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04N7/26
- H04N7/46
- H04N7/50
PDF original: ES-2410562_T3.pdf
Fragmento de la descripción:
Aparato de codificación de imágenes y aparato de decodificación de imágenes
Campo técnico La presente invención se refiere a un aparato de codificación de imágenes que codifica una imagen en movimiento, un flujo que es generado por un procedimiento de codificación de imágenes que usa el aparato de codificación de imágenes, y un aparato de decodificación de imágenes que decodifica el flujo.
Técnica antecedente Recientemente, con la llegada de la era de los multimedia que trata integralmente audio, vídeo y valores de píxeles, los medios de información existentes, por ejemplo, periódicos, revistas, televisión, radio y teléfono, y otros medios a través de los cuales se transmite información a la gente, han caído bajo el ámbito de los multimedia. En general, multimedia se refiere a una representación en la que no sólo los caracteres sino también símbolos gráficos, audio y especialmente imágenes y similares están relacionados entre sí. Sin embargo, para incluir los medios de información existentes mencionados anteriormente en el ámbito de los multimedia, parece un requisito previo representar tal información en forma digital.
Sin embargo, al estimar la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente en forma digital, la cantidad de información por carácter requiere de 1 a 2 bytes mientras que el audio requiere más de 64 Kbits por segundo (calidad telefónica) , y una imagen en movimiento requiere más de 100 Mbits por segundo (calidad de recepción de televisión actual) . Por lo tanto, no es realista tratar la vasta cantidad de información directamente en forma digital a través de los medios de información mencionados anteriormente. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono a través de la red digital de servicios integrados (RDSI) con una velocidad de transmisión de 64 Kbits/s a 1, 5 Mbits/s, sin embargo, es imposible transmitir una imagen captada por una cámara de TV. Por lo tanto, esto requiere técnicas de compresión de información y, por ejemplo, en el caso de un videoteléfono, se emplean técnicas de compresión de vídeo conformes a los estándares H.261 y H.263 recomendados por la Unión Internacional de Telecomunicaciones-Sector de Estandarización (ITU-T) . Según las técnicas de compresión de información conformes con el estándar MPEG-1, la información de imagen así como la información de audio pueden ser almacenadas en un CD (disco compacto) de música corriente.
Aquí, el Grupo de Expertos en Imágenes en Movimiento (MPEG) es un estándar internacional para una compresión de señales de imágenes en movimiento y el MPEG-1 es un estándar que comprime señales de vídeo hasta 1, 5 Mbit/s, concretamente, para comprimir la información incluida en las señales de TV aproximadamente hasta una centésima. La calidad que es el objetivo del estándar MPEG-1 era de calidad media para producir una velocidad de transmisión principalmente de aproximadamente 1, 5 Mbits/s, por lo tanto, el MPEG-2, estandarizado con vistas a cumplir los requisitos de imagen de calidad incluso más alta, produce una calidad de emisión de TV para transmitir señales de imágenes en movimiento a una velocidad de transmisión de 2 a 15 Mbits/s.
En las circunstancias actuales, un grupo de trabajo (ISO/IEC JTC1/SC29/WG11) previamente a cargo de la estandarización del MPEG-1 y el MPEG-2 ha estandarizado además el MPEG-4 que logra una tasa de compresión superior a la lograda por el MPEG-1 y el MPEG-2, permite operaciones de codificación/decodificación según un criterio basado en objeto y produce una nueva función requerida por la era de los multimedia. Al principio, en el proceso de estandarización del MPEG-4, el objetivo era estandarizar una codificación de baja velocidad de transmisión de bits, sin embargo, el objetivo se amplia actualmente a una codificación más versátil que incluye una codificación de alta velocidad de transmisión de bits para imágenes entrelazadas y otras. Por otra parte, el ISO/IEC y el ITU-T han desarrollado conjuntamente, como procedimiento de codificación de imágenes de la próxima generación, una estandarización de Codificación Avanzada de Vídeo (AVC) de MPEG-4 con mayor tasa de compresión, y actualmente la Sociedad de Ingenieros de Imágenes en Movimiento y Televisión (SMPTE) intenta estandarizar un VC-1 (estándar SMPTE propuesto para televisión: formato y procedimiento de codificación de flujo de bits de vídeo comprimido VC-1, borrador 1 final del comité, revisión 6, 13 de julio de 2005) . Un objetivo del VC-1 es extender una herramienta de codificación y similares, basada en los procedimientos de los estándares MPEG-2 y MPEG-4. Se espera que el VC-1 se use para dispositivos periféricos de disco óptico de la siguiente generación, como un disco Blu-Ray (BD) y un DVD de alta definición (HD) .
En general, en la codificación de una imagen en movimiento, la compresión del volumen de información se realiza eliminando la redundancia en direcciones tanto espaciales como temporal. Por lo tanto, una codificación por predicción entre imágenes, cuyo propósito es reducir la redundancia temporal, estima un movimiento y genera una imagen predicha basándose en bloque por bloque con referencia a las imágenes anterior y posterior, y luego codifica un valor diferencial entre la imagen predicha obtenida y una imagen actual que ha de ser codificada. Aquí, "imagen" es un término para representar una sola pantalla y representa un marco cuando se usa para una imagen progresiva mientras que representa un marco o campos cuando se usa para una imagen entrelazada. Aquí, la imagen entrelazada es una imagen en la que un marco individual está constituido por dos campos que tienen tiempo diferente respectivamente. Para codificar y decodificar una imagen entrelazada, son posibles tres maneras: procesar un marco individual como un marco, como dos campos o como una estructura de marco/campo dependiendo de un bloque del marco.
Una imagen en la que se realiza una predicción entre imágenes sin imágenes de referencia se denomina una "imagen I". Una imagen en la que se realiza codificación por predicción entre imágenes con referencia a una imagen individual se denomina una "imagen P". Una imagen en la que se realiza codificación por predicción entre imágenes haciendo referencia simultáneamente a dos imágenes se denomina una "imagen B". La imagen B puede hacer referencia a dos imágenes, seleccionadas arbitrariamente de las imágenes cuyo momento de visualización está adelantado o atrasado respecto al de una imagen actual que ha de ser codificada, como una combinación arbitraria. Sin embargo, las imágenes de referencia ya tienen que estar codificadas o decodificadas como condición para codificar o decodificar estas imágenes I, P y B.
Las imágenes 1A y 1B son diagramas que muestran una estructura del flujo MPEG-2 convencional. Como se muestra en la FIG. 1B, el flujo según el estándar MPEG-2 tiene un sistema estratificado. El flujo está formado por una pluralidad de Grupos de Imágenes (GOP) . Es posible editar una imagen en movimiento y realizar acceso aleatorio sobre ella usando el GOP como unidad básica usada en el procesamiento de codificación. Esto significa que una imagen inicial en el GOP es un punto de acceso aleatorio. El GOP está constituido por una pluralidad de imágenes, siendo cada una una imagen I, una imagen P y una imagen B. El flujo, el GOP y la imagen incluyen respectivamente una señal síncrona (sync) que indica un límite entre unidades respectivas y una cabecera que son datos incluidos comúnmente en las unidades respectivas.
Las FIGS. 2A y 2B son ejemplos de una estructura de predicción de imágenes según el estándar MPEG-2. Las imágenes sombreadas de la FIG. 2A son imágenes de referencia a las que se hace referencia para predecir otras imágenes. Como se muestra en la FIG. 2A, en el estándar MPEG-2, la imagen P (imagen P0, P6, P9, P12 o P15) puede ser predicha a partir de una imagen, bien la imagen I o la imagen P, cuyo momento de visualización precede inmediatamente al de la imagen P. La imagen B (imagen B1, B2, B4, B5, B7, B8, B10, B11, B13, B14, B16, B17, B19 o B20) puede ser predicha a partir de una imagen cuyo momento de visualización precede inmediatamente a la imagen B
P. Las posiciones de las imágenes B están dispuestas en el flujo, inmediatamente después de la imagen I o la imagen P. Por lo tanto, en el momento de realizar el acceso aleatorio, todas las imágenes posteriores a la imagen I pueden ser decodificadas y visualizadas, cuando la decodificación comienza desde la imagen I. Con respecto a una estructura... [Seguir leyendo]
Reivindicaciones:
1. Un aparato de codificación de imágenes (400) que genera una señal de imagen codificada codificando imágenes en unidades de acceso, incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho aparato de codificación de imágenes:
una unidad de codificación (412) configurada para codificar una imagen que ha de ser codificada para generar una imagen independiente, en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen;
una unidad de generación de información (413) configurada para generar información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y
una unidad de escritura (411) configurada para escribir la información suplementaria generada por dicha unidad de generación de información (413) en la unidad de acceso de la señal de imagen codificada.
2. El aparato de codificación de imágenes (400) según la reivindicación 1,
en el que dicha unidad de escritura (411) está configurada para escribir la información suplementaria en una posición anterior a cualquier imagen incluida en la unidad de acceso de la señal de imagen codificada.
3. Un procedimiento de codificación de imágenes de generación de una señal de imagen codificada codificando imágenes de unidades de acceso, incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho procedimiento de codificación de imágenes:
generar (S400, S402, S404, S406, S408) una imagen independiente codificando una imagen que ha de ser codificada,
en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen;
generar (S410) de información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y
(ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y
escribir (S414) la información suplementaria generada en dicha generación de la información suplementaria en la unidad de acceso de la señal de imagen codificada.
4. Un aparato de decodificación de imágenes que decodifica una señal de imagen codificada generada por el aparato de codificación de imágenes según la reivindicación 1, comprendiendo dicho aparato de decodificación de imágenes:
una unidad de obtención de información (310) configurada para obtener la información suplementaria de la unidad de acceso;
una unidad de extracción (309) configurada para extraer de la unidad de acceso una imagen que ha de ser decodificada haciendo referencia a la información suplementaria obtenida por dicha unidad de obtención de información; y
una unidad de decodificación (302, 303, 304, 305, 308) configurada para decodificar la imagen extraída por dicha unidad de extracción.
5. Un procedimiento de decodificación de imágenes de decodificación de una señal de imagen codificada generada por el procedimiento de codificación de imágenes según la reivindicación 3, comprendiendo dicho procedimiento de decodificación de imágenes:
obtener (S302) la información suplementaria de la unidad de acceso;
extraer (S310) de la unidad de acceso una imagen que ha de ser decodificada haciendo referencia a la información suplementaria obtenida en dicha obtención; y decodificar la imagen extraída en dicha extracción.
6. Un medio de grabación en el que una señal de imagen codificada es grabada, generándose la señal de imagen codificada codificando imágenes en la unidad de acceso, incluyendo una o más imágenes,
en el que la señal de imagen codificada incluye:
una imagen independiente colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen; e información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada.
7. Un procedimiento de grabación de grabar una señal de imagen codificada en un medio de grabación, comprendiendo dicho procedimiento de grabación:
el procedimiento de codificación de imágenes según la reivindicación 3; y
la grabación en el medio de grabación de la señal de imagen codificada generada por el procedimiento de codificación de imágenes.
Patentes similares o relacionadas:
Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]