Dispositivo y procedimiento de codificación y de decodificación escalables de flujo de datos de imágenes, señal y programa informático correspondientes.
Procedimiento de codificación de una imagen o de una secuencia de imágenes que generan un flujo de datos enforma de grupos de bloques,
en el que al menos un grupo de bloques agrupa bloques de imagen que tienen unaresolución y un nivel de calidad de cuantificación idénticos, caracterizado porque dicho procedimiento comprende,para la codificación de dicho al menos un grupo de bloques a dicha resolución y a dicho nivel de calidad decuantificación, un número de pasadas de codificación superior o igual a dos, correspondiendo una primera pasada auna primera etapa de codificación adaptada para generar, para cada bloque del al menos un grupo de bloques,datos codificados útiles para una predicción de un nivel de calidad de cuantificación superior, siendo los datos noútiles para una predicción de un nivel de calidad de cuantificación superior para al menos un bloque de dicho almenos un grupo de bloques codificados en el curso de al menos otra pasada, de tal manera que para al menos unbloque de dicho al menos un grupo de bloques, los datos codificados en el curso de las pasadas pueden combinarsedurante la decodificación para suministrar una decodificación de dicho bloque, comprendiendo el procedimientoademás la introducción de cada pasada de codificación en una slice en el sentido de la sintaxis SVC.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2007/051615.
Solicitante: Orange.
Nacionalidad solicitante: Francia.
Dirección: 78, rue Olivier de Serres 75015 Paris FRANCIA.
Inventor/es: AMONOU, ISABELLE, CAMMAS,NATHALIE, PATEUX,STEPHANE, KERVADEC,STÉPHANE.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04N7/24 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00 tiene prioridad).
- H04N7/26
PDF original: ES-2440824_T3.pdf
Fragmento de la descripción:
Dispositivo y procedimiento de codificación y de decodificación escalables de flujo de datos de imágenes, señal y programa informático correspondientes El campo de la invención es el de la codificación y decodificación de imágenes o de secuencias vídeo de imágenes. Más en concreto, la invención se refiere a una técnica de codificación y decodificación de imágenes escalables (en inglés, "scalable") , es decir, de calidad adaptable y resolución espacio-temporal variable.
Numerosos sistemas de transmisión de datos son en la actualidad heterogéneos, en el sentido de que atienden a una pluralidad de clientes que disponen de tipos de acceso a los datos muy diversos. Así, la red mundial Internet, por ejemplo, es accesible tanto a partir de un terminal de tipo ordenador personal (PC) como de un radioteléfono. Más en general, la banda de paso para el acceso a la red, las capacidades de tratamiento de los terminales clientes y el tamaño de sus pantallas varían significativamente de un usuario a otro. Así, un primer cliente puede acceder,
por ejemplo, a la red Internet a partir de un PC potente, y disponer de una velocidad ADSL ("Asymmetric Digital Subscriber Line", o "Línea de abonado digital de estructura asimétrica") de 1.024 kbits/s mientras que un segundo cliente pretende acceder a los mismos datos en el mismo instante a partir de un terminal de tipo PDA ("Personal Digital Assistant", o "asistente digital personal") conectado a un módem de baja velocidad.
Así pues, es necesario proponer a estos diversos usuarios un flujo de datos que esté adaptado tanto en términos de velocidad como de resolución de las imágenes a sus diferentes necesidades. Esta necesidad se impone especialmente para todas las aplicaciones accesibles para clientes que disponen de capacidades de acceso y de tratamiento muy diversas, y sobre todo para las aplicaciones de:
- VOD ("Video On Demand", o "vídeo a la carta") , accesibles para terminales de radiocomunicación de tipo UMTS ("Universal Mobile Telecomunicación Service", o "servicio de telecomunicación móvil universal") , para PC o para terminales de televisión con acceso ADSL, etc.;
- movilidad de sesión (por ejemplo, recuperación en una PDA de una sesión de vídeo iniciada en un televisor, o, en un móvil UMTS de una sesión iniciada en GPRS ("General Packet Radio Service", o "servicio general de radiocomunicación por paquetes") ) ;
- continuidad de sesión (en un contexto de compartición de la banda de paso con una nueva aplicación) ;
- televisión de alta definición, en la que una codificación de vídeo única debe permitir servir tanto a clientes que disponen de una definición estándar SD como a clientes que disponen de un terminal de alta definición HD;
- videoconferencia, en la que una codificación única debe responder a las necesidades de clientes que disponen de un acceso UMTS y de un acceso a Internet;
- etc.
Para responder a estas diferentes necesidades, se han desarrollado algoritmos de codificación de imágenes escalables, o "scalable", que permiten una calidad adaptable y una resolución espacio-temporal variable. El
codificador genera un flujo comprimido que presenta una estructura jerárquica de capas, en la que cada una de las capas está anidada en una capa de nivel superior. Por ejemplo, una primera capa de datos transmite un flujo a 256 kbits/s, que podrá ser decodificado por un terminal de tipo PDA, y una segunda capa de datos complementaria transmite un flujo de resolución superior a 256 kbits/s que podrá ser decodificado, como complemento del primero, mediante un terminal más potente de tipo PC. La velocidad necesaria para el transporte de estas dos capas anidadas es, en este ejemplo, de 512 kbits/s.
Algunos de estos algoritmos de codificación vídeo escalables están en la actualidad en curso de adopción por la norma MPEG ("Moving Picture Expert Group", o "Grupo de expertos en codificación de imágenes") , en el marco del grupo de trabajo MPEG VIDEO.
La primera generación de estos algoritmos escalables (véanse los trabajos de MPEG-4, especialmente con las tecnologías de tipo FGS - Fine Grain Scalability - Escalabilidad de grano fino) no se ha impuesto, ya que se le reprochaba que era subóptima en términos de compresión.
Más recientemente, se han impuesto nuevos algoritmos para responder a este problema de eficacia. En la actualidad están en curso de adopción por la norma MPEG-4 AVC, en el contexto del grupo de trabajo JVT conjunto entre ISO e IEC: SVC será la modificación 3 de la norma AVC (ISO/IEC 14496-10 Amdt3) (Scalable Video Coding codificación de vídeo escalable) .
El modelo que ha sido conservado recientemente por SVC se basa en un codificador escalable con predicción intercapas y descomposición temporal por predicción bidireccional (imágenes B) . Esta nueva norma es capaz de suministrar flujos escalables de grano medio en las dimensiones temporal y espacial y en calidad de cuantificación.
El decodificador correspondiente a la norma se describe en el documento "Joint Draft 6", J. Reichel, M. Wien, H. Schwarz, JVT-S202, 2006, . 5 Las características principales de esta solución son las siguientes:
- solución piramidal con submuestreo de los componentes de entrada;
- descomposición temporal por imágenes B en cada nivel,
- codificación de capas sucesivas en modo CGS (Coarse Grain Scalability - Escalabilidad de grano grueso) o en modo FGS (Fine Grain Scalability - Escalabilidad de grano fino) .
El codificador se ilustra esquemáticamente en la fig. 1. Incluye dos modos:
a) el modo FGS 1, 1', 1" o codificación por cuantificación progresiva que permite alcanzar una granularidad llamada "media" (del orden del 10%) . El codificador encadena las etapas siguientes:
- Codificación en 2 de una versión de baja resolución de la secuencia de vídeo (el nivel de base de cuantificación de esta baja resolución es compatible con AVC) .
- Codificación de niveles superiores por predicción a partir del nivel precedente reconstruido y sobremuestreado y
codificación de los residuos en forma de: 25
• un nivel de base
• uno o varios niveles de mejora obtenidos por codificación multipaso de planos de bits (en lo sucesivo: FGS) . El residuo de predicción es codificado hasta una velocidad R_ri_max que corresponde a la velocidad máxima decodificable para la resolución ri.
b) el modo CGS o codificación por capas que permite alcanzar una escalabilidad llamada gruesa (del orden del 25%) . El codificador encadena las etapas siguientes:
- El nivel de base es codificado con una calidad 0 (layer 0, con QP0)
- Se calcula la diferencia entre las capas y se codifica esta diferencia (codificación entrópica) .
Un flujo SVC está constituido por un conjunto de paquetes de información. Estos diferentes paquetes de información (NAL unit) pueden agruparse jerárquicamente en:
- secuencia de vídeo: conjunto de paquetes de información que representa una secuencia de vídeo (sin correspondencia necesariamente con todo el flujo de vídeo) . En los primeros paquetes, se encuentran especialmente paquetes de información global relativa a la secuencia: paquetes de tipo SPS (Sequence Parameter
Set - conjunto de parámetros de secuencia) , pero también paquetes de información relativos a los diferentes tipos de imágenes presentes: paquetes de tipo PPS (Picture Parameter Set - conjunto de parámetros de imagen)
- Access Unit: conjunto de información correspondiente a un instante temporal. Se encuentra en paquetes de información de tipo mensaje de información (SEI - Supplemental Enhancement Information - información de mejora complementaria) , o bien de datos
- Slice: conjunto de informaciones codificadas en una NAL unit. Una slice agrupa un conjunto de macrobloques de una imagen para un nivel de representación o capa (por ejemplo, nivel de representación espacial) . En lo sucesivo, se llamará slice a un grupo de grupo de bloques.
-Macrobloque: conjunto de informaciones presente en un grupo de bloques. Un macrobloque está constituido por 4 bloques 8 x 8 de luminancia y de 2 bloques 8 x 8 de crominancia (crominancia roja, crominancia azul) para el formato de color 4:2:0. En lo sucesivo, se llamará macrobloque a un grupo de bloques.
- Bloque: conjunto de información relativo a un bloque de imagen de tamaño 8 x 8 ó 4 x 4.
Debe observarse que en lo sucesivo de este texto, salvo cuando el contexto lo indique de otro modo, el término “grupo de bloques” designa indistintamente un macrobloque o una “slice”.
El flujo SVC está organizado en Access... [Seguir leyendo]
Reivindicaciones:
1. Procedimiento de codificación de una imagen o de una secuencia de imágenes que generan un flujo de datos en forma de grupos de bloques, en el que al menos un grupo de bloques agrupa bloques de imagen que tienen una resolución y un nivel de calidad de cuantificación idénticos, caracterizado porque dicho procedimiento comprende, para la codificación de dicho al menos un grupo de bloques a dicha resolución y a dicho nivel de calidad de cuantificación, un número de pasadas de codificación superior o igual a dos, correspondiendo una primera pasada a una primera etapa de codificación adaptada para generar, para cada bloque del al menos un grupo de bloques, datos codificados útiles para una predicción de un nivel de calidad de cuantificación superior, siendo los datos no útiles para una predicción de un nivel de calidad de cuantificación superior para al menos un bloque de dicho al menos un grupo de bloques codificados en el curso de al menos otra pasada, de tal manera que para al menos un bloque de dicho al menos un grupo de bloques, los datos codificados en el curso de las pasadas pueden combinarse durante la decodificación para suministrar una decodificación de dicho bloque, comprendiendo el procedimiento además la introducción de cada pasada de codificación en una slice en el sentido de la sintaxis SVC.
2. Procedimiento de codificación según la reivindicación 1, caracterizado porque los datos codificados en el curso de las pasadas pueden combinarse de tal manera que la combinación de los datos codificados corresponde a una adición de los mismos.
3. Procedimiento de codificación según la reivindicación 1, caracterizado porque los datos codificados pueden combinarse de tal manera que la combinación de los datos codificados corresponde a una sustitución de los datos codificados por la primera codificación por los datos codificados por la segunda codificación.
4. Procedimiento de codificación según una cualquiera de las reivindicaciones precedentes, caracterizado porque,
presentando los grupos de bloques del flujo de datos una estructura jerárquica de capas de datos anidadas de niveles n sucesivos, en los que n es un número entero, correspondiendo cada una de dichas capas a una resolución y a una gama de niveles de calidad de codificación predeterminadas de dichos grupos de bloques tales que la resolución y/o el nivel de calidad de codificación son crecientes con el aumento en el orden de las capas, con al menos una capa n + 1 codificada por predicción a partir de la capa inferior n, la codificación por predicción de la capa superior sólo usa los datos codificados durante la primera etapa de codificación.
5. Procedimiento de decodificación de una imagen o de una secuencia de imágenes que provienen de un flujo de datos en forma de grupos de bloques, en el que al menos un grupo de bloques agrupa bloques de imagen que tienen una resolución y un nivel de calidad de cuantificación idénticos, incluyendo dicho flujo, para cada bloque del al 35 menos un grupo de bloques, los datos codificados por al menos dos pasadas, estando cada pasada de codificación introducida en una slice en el sentido de la sintaxis SVC; caracterizado porque habiéndose realizado una primera pasada correspondiente a una primera etapa de codificación durante la codificación de datos y habiéndose adaptado para generar datos codificados útiles para una predicción de un nivel de calidad de cuantificación superior, habiendo sido codificados datos no útiles para una predicción de un nivel de calidad de cuantificación superior para al menos un bloque de dicho al menos un grupo de bloques en el curso de al menos otra pasada, dicho procedimiento de decodificación comprende, para la decodificación de dicho al menos un grupo de bloques a dicha resolución y a dicho nivel de calidad de cuantificación, para cada pasada, para el al menos un grupo de bloques, al menos una etapa de decodificación de los datos codificados para cada bloque de dicho grupo de bloques, de tal manera que para al menos un bloque de dicho grupo de bloques, la decodificación de dicho bloque es una combinación de los 45 datos decodificados para el mismo por las etapas de decodificación relacionadas con cada pasada.
6. Dispositivo de codificación de una imagen o de una secuencia de imágenes que generan un flujo de datos en forma de grupos de bloques, en el que al menos un grupo de bloques agrupa bloques de imagen que tienen una resolución y un nivel de calidad de cuantificación idénticos, caracterizado porque dicho dispositivo incluye, para la codificación de dicho al menos un grupo de bloques a dicha resolución y a dicho nivel de calidad de cuantificación, para un número de pasadas superior o igual a dos, al menos los medios siguientes:
para el al menos un grupo de bloques, al menos medios de codificación adaptados para generar, en el curso de una primera pasada correspondiente a una primera etapa de codificación, para cada bloque del al menos un grupo de 55 bloques, datos codificados útiles para una predicción de un nivel de calidad de cuantificación superior, siendo codificados datos no útiles para una predicción de un nivel de calidad de cuantificación superior en el curso de al menos otra pasada, de tal manera que para al menos un bloque de dicho al menos un grupo de bloques, los datos codificados en el curso de las pasadas pueden combinarse durante la decodificación para suministrar una decodificación de dicho bloque,
medios de introducción de cada pasada de codificación en una slice en el sentido de la sintaxis SVC.
7. Dispositivo de decodificación de una imagen o de una secuencia de imágenes que provienen de un flujo de datos en forma de grupos de bloques, en el que al menos un grupo de bloques agrupa bloques de imagen que tienen una 65 resolución y un nivel de calidad de cuantificación idénticos, incluyendo dicho flujo, para cada bloque del al menos un grupo de bloques, datos codificados por al menos dos pasadas, introduciéndose cada pasada de codificación en una slice en el sentido de la sintaxis SVC; caracterizado porque, habiéndose realizado una primera pasada correspondiente a una primera etapa de codificación durante la codificación de datos y habiéndose adaptado para generar datos codificados útiles para una predicción de un nivel de calidad de cuantificación superior, habiéndose codificado datos no útiles para una predicción de un nivel de calidad de cuantificación superior para al menos un 5 bloque de dicho al menos un grupo de bloques en el curso de al menos otra pasada, dicho dispositivo incluye, para la decodificación de dicho al menos un grupo de bloques a dicha resolución y a dicho nivel de calidad de cuantificación, para cada bloque de dicho al menos un grupo de bloques, para cada pasada, medios de decodificación de los datos codificados en la pasada, de tal manera que para al menos un bloque de dicho al menos un grupo de bloques, la decodificación de dicho bloque es una combinación de los datos decodificados para el
mismo por los medios de decodificación relacionados con cada pasada.
8. Señal de transmisión de un flujo de datos codificado por el procedimiento según una de las reivindicaciones 1 a 4, caracterizado porque un encabezamiento de grupo de bloques incluye además una información que indica el tipo de combinación que se realizará entre los datos codificados por las diferentes etapas de codificación.
9. Producto de programa informático descargable desde una red de comunicación y/o registrado en un soporte legible por ordenador y/o ejecutable por un procesador, caracterizado porque comprende instrucciones de código de programa para la implementación del procedimiento de codificación según una al menos de las reivindicaciones 1 a 4.
Patentes similares o relacionadas:
Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]