Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida.

Procedimiento para codificar una señal de vídeo (101) usando una codificación híbrida,

que comprende:

reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques,

para establecer una señal de error de predicción (105),

decisión entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial para la codificación,

en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias, de tal manera que la codificación se lleva a cabo según la CABAC o la CAVLC, y mediante el cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10153812.

Solicitante: Narroschke, Matthias.

Nacionalidad solicitante: Alemania.

Dirección: Am Länderweg 6 64850 Schaafheim ALEMANIA.

Inventor/es: MUSMANN,HANS-GEORG, NARROSCHKE,MATTHIAS.

Fecha de Publicación: 17 de Junio de 2015.

Clasificación Internacional de Patentes:

H04N19/11 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › codificación predictiva entre una pluralidad de modos espaciales.
H04N19/12 H04N 19/00 […] › Selección de entre una pluralidad de transformadas o estándares, p. ej. selección entre transformada discreta del coseno [DCT] y transformación de sub-banda o selección entre H.263 y H.264.
H04N19/124 H04N 19/00 […] › Cuantificación.
H04N19/129 H04N 19/00 […] › Escaneado de unidades de codificación, p. ej. exploración en zig-zag de coeficientes de transformación, o ordenación flexible de macrobloque [FMO].
H04N19/13 H04N 19/00 […] › Codificación de entropía adaptativa, p. ej. codificación adaptativa de longitud variable [AVLC] o codificación adaptativa de contexto de aritmética binaria [CABAC].
H04N19/147 H04N 19/00 […] › según el tipo de criterio de distorsión (tasa de distorsión como un criterio para la estimación del movimiento H04N 19/567).
H04N19/46 H04N 19/00 […] › Incorporación de información adicional en la señal de vídeo durante el proceso de compresión (H04N 19/517, H04N 19/68, H04N 19/70 tienen prioridad).
H04N19/61 H04N 19/00 […] › en combinación con codificación predictiva.

PDF original: ES-2544978_T3.pdf

Fragmento de la descripción:

Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida La invención se refiere a un procedimiento de codificación y descodificación, un codificador y un descodificador, y señales de datos que usan la codificación adaptativa del error de predicción.

Los actuales procedimientos de codificación de vídeo se basan en una codificación híbrida. La codificación híbrida proporciona una etapa de codificación en el dominio temporal y una etapa de codificación en el dominio espacial. En 10 primer lugar, la redundancia temporal de las señales de vídeo se reduce mediante el uso de una predicción con compensación de movimiento basada en bloques entre el bloque de imágenes que se va a codificar y un bloque de referencia de una imagen que ya ha sido transmitida determinada por un vector de movimiento. Las muestras de error de predicción restantes se disponen en bloques y se transforman en el dominio de frecuencias, dando lugar a un bloque de coeficientes. Estos coeficientes se cuantifican y exploran de acuerdo con un patrón de exploración en zigzag bastante 15 conocido, que comienza con el coeficiente que representa el valor de la CC. De acuerdo con una representación típica, este coeficiente se encuentra entre los coeficientes de baja frecuencia en la esquina superior izquierda de un bloque. La exploración en zigzag produce un conjunto unidimensional de coeficientes, que se someten a una codificación de entropía posteriormente por un codificador. El codificador está optimizado para un conjunto de coeficientes con una energía decreciente. Debido a que el orden de los coeficientes dentro de un bloque está predeterminado y fijado, la 20 exploración en zigzag produce un conjunto de coeficientes de energía decreciente, si las muestras de predicción de error están correlacionadas. La siguiente etapa de codificación se puede optimizar entonces para dicha situación. Con este fin, el estándar más reciente H.264/AVC propone una codificación aritmética binaria adaptativa basada en el contexto (CABAC) o una codificación de longitud variable adaptable al contexto (CAVLC) . Sin embargo, la eficiencia de la transformación solo es alta si las muestras de error de predicción están correlacionadas. Para las muestras que estén correlacionadas solo ligeramente en el dominio espacial, la transformación resulta menos eficiente.

La memoria de la conferencia de NARROSCHKE: "Extending the prediction error coder of H.246/AVC by a vector quantizer" PROCEEDINGS OF SPIE VISUAL COMMUNICATIONS AND IMAGE PROCESSING, [Online] vol. 5960, 12 de julio de 2005 (12-07-2005) , páginas M1 a M12, XP002431468 tiene por objeto un codificador de predicción de error de H.246/AVC mediante un cuantificador vectorial.

La presente invención tiene por objeto proporcionar un procedimiento de codificación y descodificación, los respectivos codificadores y descodificadores, señales de datos así como los correspondientes sistemas y semántica para codificar y descodificar señales de vídeo que sean más eficientes que en la técnica anterior. La invención se expresa en las reivindicaciones adjuntas.

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento para codificar una señal de vídeo basado en una codificación híbrida. El procedimiento comprende las etapas de reducción de la redundancia temporal mediante la predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y la etapa de decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial.

De acuerdo con un aspecto correspondiente de la presente invención, se proporciona un codificador que está adaptado para aplicar la codificación híbrida de una señal de vídeo. El codificador incluye unos medios para reducir la redundancia 45 temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y unos medios para decidir entre transformar la señal de error de predicción en el dominio de frecuencia o mantener la señal de error de predicción en el dominio espacial. De acuerdo con este aspecto de la invención, se proporciona un concepto y los correspondientes aparatos, señales y semántica para decidir de forma adaptativa entre procesar la señal de error de predicción en el dominio de frecuencias o en el espacial. Si las muestras 50 de error de predicción solo tienen una pequeña correlación, las siguientes etapas de codificación de las muestras pueden ser más eficientes y provocarían una reducción en la tasa de datos, comparada con la codificación de los coeficientes en el dominio de frecuencias. De este modo, por la presente invención se aplica una etapa de decisión adaptativa y unos medios de control adaptativos para tomar la decisión. Por consiguiente, en función de la señal de error de predicción, se decide si se usa una transformación en el dominio de frecuencias o se mantiene la señal de error de predicción en el 55 dominio espacial. Los siguientes mecanismos de codificación pueden ser los mismos que para el dominio de frecuencias, o se pueden adaptar especialmente a las necesidades de las muestras en el dominio espacial.

De acuerdo con otro aspecto de la invención, el procedimiento para codificar una señal de vídeo, y en particular la etapa de decisión, está basado en una función de costes. Generalmente, la decisión de usar los coeficientes en el dominio de

frecuencias o las muestras en el dominio espacial puede basarse en diversos tipos de mecanismos de decisión. La decisión se puede tomar para todas las muestras contenidas en una parte específica de una señal de vídeo de una sola vez o, por ejemplo, incluso para un número específico de bloques, macrobloques, o rebanadas (slices) . La decisión puede basarse en una función de costes, como por ejemplo una función de Lagrange. Los costes se calculan para ambas codificaciones: en el dominio de frecuencias y en el dominio espacial. En la decisión, se opta por la codificación con los costes más bajos.

De acuerdo con otro aspecto de la presente invención, la función de costes incluye los costes de tasa-distorsión para la codificación en el dominio espacial y en el de frecuencias. De acuerdo con otro aspecto más de la invención, los costes de tasa-distorsión se pueden calcular mediante la tasa requerida y la distorsión resultante ponderada por un parámetro de Lagrange. Además, la medida de la distorsión puede ser el error cuadrático medio de la cuantificación o el error absoluto medio de la cuantificación.

De acuerdo con un aspecto de la presente invención, las muestras en el dominio espacial se pueden codificar básicamente por los mismos procedimientos que se usan para los coeficientes en el dominio de frecuencias. Estos procedimientos pueden incluir los procedimientos de codificación CABAC o CAVLC. Por lo tanto, solo sería necesaria, si acaso, una pequeña adaptación de los mecanismos de codificación si los medios de control adaptivos decidieran cambiar entre el dominio de frecuencias y el espacial. No obstante, también se podría proporcionar para usar diferentes sistemas de codificación para los coeficientes en los dos dominios.

De acuerdo con otro aspecto de la invención, se proporciona un procedimiento para codificar una señal de vídeo, basado en la codificación híbrida. De acuerdo con este aspecto de la invención, la redundancia temporal se reduce mediante una predicción con compensación de movimiento basada en bloques, y las muestras de la señal del error de predicción se proporcionan en el bloque del error de predicción en el dominio espacial. Las muestras se exploran a partir del bloque de error de predicción para proporcionar un conjunto de muestras en un orden específico. De acuerdo con este aspecto de la invención, se proporciona un sistema de exploración obtenido a partir de una imagen de error de predicción o una imagen de predicción. El sistema de exploración de acuerdo con este aspecto de la invención tiene en cuenta el hecho de que la exploración en zigzag de acuerdo con la técnica anterior para el dominio de frecuencias puede no ser el orden de exploración más eficiente para el dominio espacial. Por lo tanto, se proporciona un sistema de exploración adaptativa, que tiene en cuenta la distribución de las muestras y la magnitud de las muestras en el dominio espacial. El sistema de exploración puede estar basado preferentemente en una imagen de error de predicción o una imagen de predicción. Este aspecto de la invención tiene en cuenta las posiciones más probables de las muestras con la magnitud más alta y las muestras con mayor probabilidad... [Seguir leyendo]

Reivindicaciones:

1. Procedimiento para codificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción (105) , decisión entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial para la codificación, en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias, de tal manera que la codificación se lleva a cabo según la CABAC o la CAVLC, y mediante el cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

2. El procedimiento según la reivindicación 1, en el que la etapa de decisión está basada en una función de costes.

3. El procedimiento según la reivindicación 1 o 2, en el que la función de costes incluye los costes de tasa

distorsión para la codificación en el dominio espacial y la codificación en el dominio de frecuencias. 20

4. El procedimiento según la reivindicación 3, en el que los costes de tasa-distorsión se calculan mediante la tasa requerida (R) y la distorsión resultante (D) ponderadas por un parámetro de Lagrange.

5. El procedimiento según la reivindicación 4, en el que la medida de la distorsión es el error cuadrático 25 medio de cuantificación (107) o el error absoluto medio de la cuantificación (107) .

6. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para la CABAC que posee probabilidades separadas para el dominio espacial.

7. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para la CAVLC para el dominio espacial.

8. El procedimiento según una de las reivindicaciones anteriores, que comprende una cuantificación adicional de las muestras de error de predicción mediante un cuantificador escalar (107) que posee una optimización del error de cuantificación ponderado subjetivamente (107) u optimización del error cuadrático medio de cuantificación (107) en el dominio espacial.

9. Señal de datos (116) que representa una señal de vídeo codificada (101) , que comprende información codificada de una señal de predicción de error (105) que está codificada parcialmente en el dominio espacial y codificada parcialmente en el dominio de frecuencias, y en cada caso se codifican por medio del mismo tipo de procedimiento de codificación, y el procedimiento de codificación se selecciona entre una CABAC y una CAVLC, y mediante la cual se usa un cuantificador escalar (107) en el dominio espacial, así como en el dominio de frecuencias.

10. La señal de datos (116) según la reivindicación 9, que comprende información relativa al dominio en el 45 cual está codificada una rebanada, un macrobloque o un bloque, en particular información acerca de si una rebanada, macrobloque o bloque se codifica en el dominio espacial o en el de frecuencias.

11. La señal de datos (116) de la reivindicación 10, que comprende una información de indicador_codificación_DF_DE_rebanada, indicador_codificación_DF_DE_MB y/o indicador_DF_DE relativa a la 50 codificación usada para una rebanada, un macrobloque o un bloque, respectivamente.

12. Procedimiento para descodificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

descodificación eficaz de datos de vídeo codificados en el dominio de frecuencias o en el espacial, en función del mecanismo de codificación usado para codificar los datos de la señal de vídeo (101) , mediante la cual se ha codificado el vídeo codificado con un procedimiento según cualquiera de las reivindicaciones 1 a 8.

13. El procedimiento de descodificación según la reivindicación 12, en el que las posiciones de las muestras de la señal de error de predicción (105) recibidas en un conjunto unidimensional se asignan a ubicaciones en una disposición bidimensional y se determinan basándose en una señal de error de predicción o imagen de predicción recibida con anterioridad.

14. Codificador para codificar una señal de vídeo (101) usando una codificación híbrida, que comprende:

unos medios para reducir la redundancia temporal mediante una predicción con compensación de movimiento basada en 10 bloques, para establecer una señal de error de predicción (105) , unos medios de control adaptativos para decidir entre transformar la señal de error de predicción (105) en el dominio de frecuencias o mantener la señal de error de predicción (105) en el dominio espacial, unos medios de cuantificación escalar (107) para cuantificar la señal de error de predicción (105) transformada en el dominio de frecuencias y unos medios de cuantificación escalar (107) para cuantificar la señal de error de predicción (105) transformada en el dominio espacial, y unos medios de codificación de entropía adaptados para codificar una señal de error de predicción (105) , transformada 20 en el dominio de frecuencias o mantenida en el dominio espacial, por medio de una CABAC o CAVLC.

15. Descodificador para descodificar una señal de vídeo (101) que se ha codificado usando una codificación híbrida mediante una CABAC o CAVLC que comprende información codificada de una señal de error de predicción (105) que se codifica parcialmente en el dominio espacial y se codifica parcialmente en el dominio de frecuencias, y en cada caso cuantificada por medio de una cuantificación escalar (107) y codificada por medio del mismo tipo de procedimiento de codificación, y el procedimiento de codificación se selecciona entre una CABAC y una CAVLC, que comprende unos medios de control adaptativo (201) para decidir de forma adaptativa si un flujo de entrada de una señal de vídeo codificada (101) representa la señal de error de predicción (105) de la señal de vídeo codificada (101) en el dominio espacial o en el dominio de frecuencias.

16. El descodificador de la reivindicación 15, que comprende además unos medios de control de exploración para proporcionar un orden de exploración basado en una señal de predicción o una señal de error de predicción (105) o en una combinación lineal de ambos.

17. Descodificador para descodificar una señal de vídeo (101) , adaptado para usar un procedimiento según la reivindicación 12 o 13.

Patentes similares o relacionadas:

Método de correlación de modo de intra predicción, del 29 de Julio de 2020, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de descodificación de imágenes, comprendiendo el método: descodificar (S300) información de bandera que indica si uno de los modos […]

Método para segmentación de imágenes usando columnas, del 22 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un método para codificar una imagen de video que comprende una pluralidad de bloques (1… 24) de árbol codificados dispuestos en al menos […]

Método y aparato para procesar una señal de vídeo, del 15 de Julio de 2020, de LG ELECTRONICS INC.: Método para descodificar un flujo continuo de bits correspondiente a una señal de vídeo que comprende por lo menos un bloque de codificación, con un aparato de descodificación, […]

Filtrado multimétrico, del 8 de Julio de 2020, de QUALCOMM INCORPORATED: Un procedimiento de codificación de datos de vídeo en un esquema de filtro en bucle adaptativo basado en árbol cuaternario, QALF, con múltiples filtros, comprendiendo […]

Procedimiento de descodificación predictiva de vídeo en movimiento, dispositivo de descodificación predictiva de vídeo en movimiento, del 17 de Junio de 2020, de NTT DOCOMO, INC.: Procedimiento de descodificación predictiva de vídeo ejecutado por un dispositivo de descodificación predictiva de vídeo, que comprende: […]

Codificación luma-croma con tres predictores espaciales distintos, del 17 de Junio de 2020, de DOLBY INTERNATIONAL AB: Un codificador de video para codificar datos de señal de video para un bloque de imagen, comprendiendo el codificador de video un codificador para codificar […]

Aparato de decodificación de imágenes, del 3 de Junio de 2020, de INNOTIVE LTD: Aparato de decodificación de imágenes, que comprende: una unidad de análisis para decodificar información de intra-predicción de un flujo […]