Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida.

Procedimiento para codificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques,

para establecer una señal de error de predicción

(105),

decisión entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial para la codificación,

en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias, de tal manera que la codificación se lleva a cabo según la CABAC o la CAVLC, y mediante el cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10153812.

Solicitante: Narroschke, Matthias.

Nacionalidad solicitante: Alemania.

Dirección: Am Länderweg 6 64850 Schaafheim ALEMANIA.

Inventor/es: MUSMANN,HANS-GEORG, NARROSCHKE,MATTHIAS.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/129 (Escaneado de unidades de codificación, p. ej. exploración en zig-zag de coeficientes de transformación, o ordenación flexible de macrobloque [FMO])
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/13 (Codificación de entropía adaptativa, p. ej. codificación adaptativa de longitud variable [AVLC] o codificación adaptativa de contexto de aritmética binaria [CABAC])
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/46 (Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70  tienen prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/11 (codificación predictiva entre una pluralidad de modos espaciales)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/147 (según el tipo de criterio de distorsión (tasa de distorsión como un criterio para la estimación del movimiento H04N 19/567))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/12 (Selección de entre una pluralidad de transformadas o estándares, p. ej. selección entre transformada discreta del coseno [DCT] y transformación de sub-banda o selección entre H.263 y H.264)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/124 (Cuantificación)

PDF original: ES-2544978_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida La invención se refiere a un procedimiento de codificación y descodificación, un codificador y un descodificador, y señales de datos que usan la codificación adaptativa del error de predicción.

Los actuales procedimientos de codificación de vídeo se basan en una codificación híbrida. La codificación híbrida proporciona una etapa de codificación en el dominio temporal y una etapa de codificación en el dominio espacial. En 10 primer lugar, la redundancia temporal de las señales de vídeo se reduce mediante el uso de una predicción con compensación de movimiento basada en bloques entre el bloque de imágenes que se va a codificar y un bloque de referencia de una imagen que ya ha sido transmitida determinada por un vector de movimiento. Las muestras de error de predicción restantes se disponen en bloques y se transforman en el dominio de frecuencias, dando lugar a un bloque de coeficientes. Estos coeficientes se cuantifican y exploran de acuerdo con un patrón de exploración en zigzag bastante 15 conocido, que comienza con el coeficiente que representa el valor de la CC. De acuerdo con una representación típica, este coeficiente se encuentra entre los coeficientes de baja frecuencia en la esquina superior izquierda de un bloque. La exploración en zigzag produce un conjunto unidimensional de coeficientes, que se someten a una codificación de entropía posteriormente por un codificador. El codificador está optimizado para un conjunto de coeficientes con una energía decreciente. Debido a que el orden de los coeficientes dentro de un bloque está predeterminado y fijado, la 20 exploración en zigzag produce un conjunto de coeficientes de energía decreciente, si las muestras de predicción de error están correlacionadas. La siguiente etapa de codificación se puede optimizar entonces para dicha situación. Con este fin, el estándar más reciente H.264/AVC propone una codificación aritmética binaria adaptativa basada en el contexto (CABAC) o una codificación de longitud variable adaptable al contexto (CAVLC) . Sin embargo, la eficiencia de la transformación solo es alta si las muestras de error de predicción están correlacionadas. Para las muestras que estén correlacionadas solo ligeramente en el dominio espacial, la transformación resulta menos eficiente.

La memoria de la conferencia de NARROSCHKE: "Extending the prediction error coder of H.246/AVC by a vector quantizer" PROCEEDINGS OF SPIE VISUAL COMMUNICATIONS AND IMAGE PROCESSING, [Online] vol. 5960, 12 de julio de 2005 (12-07-2005) , páginas M1 a M12, XP002431468 tiene por objeto un codificador de predicción de error de H.246/AVC mediante un cuantificador vectorial.

La presente invención tiene por objeto proporcionar un procedimiento de codificación y descodificación, los respectivos codificadores y descodificadores, señales de datos así como los correspondientes sistemas y semántica para codificar y descodificar señales de vídeo que sean más eficientes que en la técnica anterior. La invención se expresa en las reivindicaciones adjuntas.

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento para codificar una señal de vídeo basado en una codificación híbrida. El procedimiento comprende las etapas de reducción de la redundancia temporal mediante la predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y la etapa de decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial.

De acuerdo con un aspecto correspondiente de la presente invención, se proporciona un codificador que está adaptado para aplicar la codificación híbrida de una señal de vídeo. El codificador incluye unos medios para reducir la redundancia 45 temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y unos medios para decidir entre transformar la señal de error de predicción en el dominio de frecuencia o mantener la señal de error de predicción en el dominio espacial. De acuerdo con este aspecto de la invención, se proporciona un concepto y los correspondientes aparatos, señales y semántica para decidir de forma adaptativa entre procesar la señal de error de predicción en el dominio de frecuencias o en el espacial. Si las muestras 50 de error de predicción solo tienen una pequeña correlación, las siguientes etapas de codificación de las muestras pueden ser más eficientes y provocarían una reducción en la tasa de datos, comparada con la codificación de los coeficientes en el dominio de frecuencias. De este modo, por la presente invención se aplica una etapa de decisión adaptativa y unos medios de control adaptativos para tomar la decisión. Por consiguiente, en función de la señal de error de predicción, se decide si se usa una transformación en el dominio de frecuencias o se mantiene la señal de error de predicción en el 55 dominio espacial. Los siguientes mecanismos de codificación pueden ser los mismos que para el dominio de frecuencias, o se pueden adaptar especialmente a las necesidades de las muestras en el dominio espacial.

De acuerdo con otro aspecto de la invención, el procedimiento para codificar una señal de vídeo, y en particular la etapa de decisión, está basado en una función de costes. Generalmente, la decisión de usar los coeficientes en el dominio de

frecuencias o las muestras en el dominio espacial puede basarse en diversos tipos de mecanismos de decisión. La decisión se puede tomar para todas las muestras contenidas en una parte específica de una señal de vídeo de una sola vez o, por ejemplo, incluso para un número específico de bloques, macrobloques, o rebanadas (slices) . La decisión puede basarse en una función de costes, como por ejemplo una función de Lagrange. Los costes se calculan para ambas codificaciones: en el dominio de frecuencias y en el dominio espacial. En la decisión, se opta por la codificación con los costes más bajos.

De acuerdo con otro aspecto de la presente invención, la función de costes incluye los costes de tasa-distorsión para la codificación en el dominio espacial y en el de frecuencias. De acuerdo con otro aspecto más de la invención, los costes de tasa-distorsión se pueden calcular mediante la tasa requerida y la distorsión resultante ponderada por un parámetro de Lagrange. Además, la medida de la distorsión puede ser el error cuadrático medio de la cuantificación o el error absoluto medio de la cuantificación.

De acuerdo con un aspecto de la presente invención, las muestras en el dominio espacial se pueden codificar básicamente por los mismos procedimientos que se usan para los coeficientes en el dominio de frecuencias. Estos procedimientos pueden incluir los procedimientos de codificación CABAC o CAVLC. Por lo tanto, solo sería necesaria, si acaso, una pequeña adaptación de los mecanismos de codificación si los medios de control adaptivos decidieran cambiar entre el dominio de frecuencias y el espacial. No obstante, también se podría proporcionar para usar diferentes sistemas de codificación para los coeficientes en los dos dominios.

De acuerdo con otro aspecto de la invención, se proporciona un procedimiento para codificar una señal de vídeo, basado en la codificación híbrida. De acuerdo con este aspecto de la invención, la redundancia temporal se reduce mediante una predicción con compensación de movimiento basada en bloques, y las muestras de la señal del error de predicción se proporcionan en el bloque del error de predicción en el dominio espacial. Las muestras se exploran a partir del bloque... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento para codificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción (105) , decisión entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial para la codificación, en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias, de tal manera que la codificación se lleva a cabo según la CABAC o la CAVLC, y mediante el cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

2. El procedimiento según la reivindicación 1, en el que la etapa de decisión está basada en una función de costes.

3. El procedimiento según la reivindicación 1 o 2, en el que la función de costes incluye los costes de tasa

distorsión para la codificación en el dominio espacial y la codificación en el dominio de frecuencias. 20

4. El procedimiento según la reivindicación 3, en el que los costes de tasa-distorsión se calculan mediante la tasa requerida (R) y la distorsión resultante (D) ponderadas por un parámetro de Lagrange.

5. El procedimiento según la reivindicación 4, en el que la medida de la distorsión es el error cuadrático 25 medio de cuantificación (107) o el error absoluto medio de la cuantificación (107) .

6. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para la CABAC que posee probabilidades separadas para el dominio espacial.

7. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para la CAVLC para el dominio espacial.

8. El procedimiento según una de las reivindicaciones anteriores, que comprende una cuantificación adicional de las muestras de error de predicción mediante un cuantificador escalar (107) que posee una optimización del error de cuantificación ponderado subjetivamente (107) u optimización del error cuadrático medio de cuantificación (107) en el dominio espacial.

9. Señal de datos (116) que representa una señal de vídeo codificada (101) , que comprende información codificada de una señal de predicción de error (105) que está codificada parcialmente en el dominio espacial y codificada parcialmente en el dominio de frecuencias, y en cada caso se codifican por medio del mismo tipo de procedimiento de codificación, y el procedimiento de codificación se selecciona entre una CABAC y una CAVLC, y mediante la cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

10. La señal de datos (116) según la reivindicación 9, que comprende información relativa al dominio en el 45 cual está codificada una rebanada, un macrobloque o un bloque, en particular información acerca de si una rebanada, macrobloque o bloque se codifica en el dominio espacial o en el de frecuencias.

11. La señal de datos (116) de la reivindicación 10, que comprende una información de indicador_codificación_DF_DE_rebanada, indicador_codificación_DF_DE_MB y/o indicador_DF_DE relativa a la 50 codificación usada para una rebanada, un macrobloque o un bloque, respectivamente.

12. Procedimiento para descodificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

descodificación eficaz de datos de vídeo codificados en el dominio de frecuencias o en el espacial, en función del mecanismo de codificación usado para codificar los datos de la señal de vídeo (101) , mediante la cual se ha codificado el vídeo codificado con un procedimiento según cualquiera de las reivindicaciones 1 a 8.

13. El procedimiento de descodificación según la reivindicación 12, en el que las posiciones de las muestras de la señal de error de predicción (105) recibidas en un conjunto unidimensional se asignan a ubicaciones en una disposición bidimensional y se determinan basándose en una señal de error de predicción o imagen de predicción recibida con anterioridad.

14. Codificador para codificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

unos medios para reducir la redundancia temporal mediante una predicción con compensación de movimiento basada en 10 bloques, para establecer una señal de error de predicción (105) , unos medios de control adaptativos para decidir entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial, unos medios de cuantificación escalar (107) para cuantificar la señal de error de predicción (105) transformada en el dominio de frecuencias y unos medios de cuantificación escalar (107) para cuantificar la señal de error de predicción (105) transformada en el dominio espacial, y unos medios de codificación de entropía adaptados para codificar una señal de error de predicción (105) , transformada 20 en el dominio de frecuencias o mantenida en el dominio espacial, por medio de una CABAC o CAVLC.

15. Descodificador para descodificar una señal de vídeo (101) que se ha codificado usando una codificación híbrida mediante una CABAC o CAVLC que comprende información codificada de una señal de error de predicción (105) que se codifica parcialmente en el dominio espacial y se codifica parcialmente en el dominio de frecuencias, y en cada caso cuantificada por medio de una cuantificación escalar (107) y codificada por medio del mismo tipo de procedimiento de codificación, y el procedimiento de codificación se selecciona entre una CABAC y una CAVLC, que comprende unos medios de control adaptativo (201) para decidir de forma adaptativa si un flujo de entrada de una señal de vídeo codificada (101) representa la señal de error de predicción (105) de la señal de vídeo codificada (101) en el dominio espacial o en el dominio de frecuencias.

16. El descodificador de la reivindicación 15, que comprende además unos medios de control de exploración para proporcionar un orden de exploración basado en una señal de predicción o una señal de error de predicción (105) o en una combinación lineal de ambos.

17. Descodificador para descodificar una señal de vídeo (101) , adaptado para usar un procedimiento según la reivindicación 12 o 13.