Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.

Un procedimiento de codificación de datos de vídeo que comprende:

seleccionar

(1006) un contexto de uno o más contextos basados en una profundidad de transformación de una unidad de transformación asociada con un bloque de datos de vídeo a codificar, en el que la profundidad de transformación especifica el nivel de subdivisión actual de una unidad de codificación en bloques para el objeto de codificación de transformación;

codificar (1002) un indicador de bloque codificado croma Cb para el bloque de datos de vídeo usando la codificación aritmética binaria adaptativa al contexto, CABAC y el contexto seleccionado, en el que la codificación del indicador de bloque codificado croma Cb comprende el uso de un conjunto de contexto que incluye uno o más contextos; y

codificar (1004) un indicador de bloque codificado croma Cr usando CABAC, en el que la codificación del indicador de bloque codificado croma Cr comprende utilizar el mismo conjunto de contexto como el indicador de bloque codificado croma Cb.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2012/059100.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5775 MOREHOUSE DRIVE SAN DIEGO, CA 92121-1714 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KARCZEWICZ, MARTA, CHIEN,WEI-JUNG, SOLE ROJALS,JOEL.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/176 (siendo la región de un bloque, p. ej. un macrobloque)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/50 (utilizando codificación predictiva (H04N 19/61  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/91 (Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética)

PDF original: ES-2550803_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.
Ilustración 2 de Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.
Ilustración 3 de Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.
Ilustración 4 de Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.
Ver la galería de la patente con 10 ilustraciones.
Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto.

Fragmento de la descripción:

Reducción del número de contextos para codificación aritmética binaria adaptativa al contexto

Campo técnico

La presente divulgación se refiere a codificación de vídeo, y en particular a codificación aritmética binaria (CABAC) adaptativa según el contexto utilizado en la codificación de vídeo.

Antecedentes Las capacidades de vídeo digital se pueden incorporar en una amplia gama de dispositivos, incluyendo televisores digitales, sistemas de radiodifusión directa digitales, sistemas de transmisión inalámbricos, asistentes digitales personales (PDA) , ordenadores portátiles o de escritorio, ordenadores de tableta, lectores de libros electrónicos, cámaras digitales, dispositivos de grabación digitales, reproductores multimedia digitales, dispositivos de videojuegos, consolas de videojuegos, teléfonos celulares o satelitales de radio, los llamados "teléfonos inteligentes", dispositivos de teleconferencia de video, dispositivos de video de transmisión en vivo, y similares. Los dispositivos de vídeo digitales implementan técnicas de compresión de vídeo, tales como las descritas en los estándares definidos por MPEG-2, MPEG-4, UIT-T H.263, UIT-T H.264/MPEG-4, Parte 10, codificación de vídeo avanzada (AVC) , estándar de codificación de vídeo de alta eficiencia (HEVC) actualmente en fase de desarrollo, y extensiones de esas normas. Los dispositivos de vídeo pueden transmitir, recibir, codificar, decodificar, y/o almacenar información de vídeo digital de manera más eficiente mediante la implementación de este tipo de técnicas de compresión de vídeo.

Las técnicas de compresión de vídeo realizan predicción espacial (dentro de las imágenes) y/o una predicción temporal (entre imágenes) para reducir o eliminar la redundancia inherente a las secuencias de vídeo. Para la codificación de vídeo basado en bloques, una porción de vídeo (es decir, una imagen de video o una porción de una imagen de vídeo) puede dividirse en bloques de vídeo, que también pueden denominarse como bloques de árbol, unidades de codificación (CUS) y/o nodos de codificación. Los bloques de vídeos en una porción intra-codificada (I) de una imagen se codifican utilizando predicción espacial con respecto a las muestras de referencia en bloques vecinos de la misma imagen. Los bloques de vídeos en una porción inter-codificada (P o B) de una imagen pueden usar predicción espacial con respecto a las muestras de referencia en bloques vecinos de la misma imagen o predicción temporal con respecto a las muestras de referencia en otras imágenes de referencia. Las imágenes pueden indicarse como marcos, imágenes de referencia y pueden indicarse como marcos de referencia.

La predicción espacial o temporal resulta en un bloque de predicción para un bloque a codificar. Los datos residuales representan diferencias de píxeles entre el bloque original a codificar y el bloque de predicción. Un bloque inter-codificado se codifica de acuerdo con un vector de movimiento que apunta a un bloque de muestras de referencia que forman el bloque de predicción, y los datos residuales que indican la diferencia entre el bloque codificado y el bloque predictivo. Un bloque intra-codificado se codifica de acuerdo con un modo de intra-codificación y los datos residuales. Para mayor compresión, los datos residuales pueden ser transformados desde el dominio de píxeles a un dominio de transformación, dando como resultado coeficientes de transformación residuales, que luego pueden ser cuantificados. Los coeficientes de transformación cuantificados, inicialmente dispuestos en una matriz de dos dimensiones, pueden ser escaneados para producir un vector unidimensional de coeficientes de transformación, y la codificación de entropía se puede aplicar para lograr aún más compresión. Los siguientes artículos se refieren a reducción de sitio de contexto para CABAC.

“BoG report on context reduction for CABAC”, 6 JCT-VC Meeting; 97. MPEG Meeting, 14-22 de julio de 2011, Turín; "Modified binarization and coding of MVD for PIPE/CABAC" de Nguyen et al, en 6. JCT-VC Meeting; 97. MPEG Meeting; 14-22 de Julio de 2011, Turín; y "CE11: Context size reduction for the significance map" de Hisao Sasai et al, en 96. MPEG Meeting; 21-25 de marzo de 2011, Ginebra.

Sumario La invención se define en las reivindicaciones a las que se hace ahora referencia. En general, esta divulgación describe técnicas para la codificación aritmética binaria (CABAC) adaptativa según contexto en un proceso de codificación de vídeo. En particular, esta divulgación propone una reducción en el número de contextos CABAC usados para uno o más elementos de sintaxis, ejemplos no limitativos de los cuales incluyen pred_type, merge_idx, inter_pred_flag, ref_idx_lx, cbf_cb, cbf_cr, coeff_abs_level_greater1_flag, y coeff_abs_level_greater2_flag. Las modificaciones pueden reducir hasta 56 contextos con insignificantes cambios de eficiencia de codificación. Las reducciones de contexto propuestas para los elementos de sintaxis pueden ser utilizadas en solitario o en cualquier fusión.

La codificación de vídeo puede incluir la determinación de un primer tipo de predicción para un bloque de datos de vídeo en una porción P, que representa el primer tipo de predicción como un elemento de sintaxis de tipo de predicción de porción P, la determinación de un segundo tipo de predicción para un bloque de datos de vídeo en una

porción B, la representación del segundo tipo de predicción como un elemento de sintaxis de tipo de predicción de porción B, la determinación de una binarización de porción P para el elemento de sintaxis de tipo de predicción de porción P, la determinación una binarización de porción B para el elemento de sintaxis de tipo de predicción de porción B, en el que el elemento de sintaxis de tipo de predicción de porción P y el elemento de sintaxis de tipo de predicción de porción B se determinan usando la misma lógica de binarización, y la codificación de los datos de vídeo basados en los binarizaciones del elemento de sintaxis del tipo de predicción de porción P y el elemento de sintaxis de tipo de predicción de porción B.

La decodificación de vídeo puede incluir la asignación de un elemento de sintaxis de tipo de predicción de porción P binarizada a un tipo de predicción usando una asignación de binarización para un bloque de datos de vídeo en una porción P, la asignación de un elemento de sintaxis tipo de predicción de porción B binarizada a un tipo de predicción utilizando la misma asignación de binarización para un bloque de datos de vídeo en una porción B, y la decodificación de los datos de vídeo en base a los tipos de predicción asignados.

La codificación de datos de vídeo puede comprender la determinación de un tipo de partición para un modo de predicción para un bloque de datos de vídeo, que codifica una partición de tipo bin de un elemento de sintaxis de tipo de predicción para un bloque de datos de vídeo utilizando CABAC con un solo contexto, en el que el contexto individual es el mismo para cualquier tipo de partición, y que codifica una partición de tamaño bin del elemento de sintaxis de tipo de predicción para el bloque de datos de vídeo utilizando CABAC en el modo de derivación.

La decodificación de datos de vídeo puede comprender la recepción de un elemento de sintaxis de tipo de predicción para un bloque de datos de vídeo que ha sido codificado usando CABAC, incluyendo el elemento de sintaxis de tipo de predicción un tipo de partición bin que representa un tipo de partición y un tamaño de partición bin que representa un tamaño de partición, decodificando el tipo de partición bin del elemento de sintaxis del tipo de predicción usando el contexto de codificación... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación de datos de vídeo que comprende:

seleccionar (1006) un contexto de uno o más contextos basados en una profundidad de transformación de una unidad de transformación asociada con un bloque de datos de vídeo a codificar, en el que la profundidad de transformación especifica el nivel de subdivisión actual de una unidad de codificación en bloques para el objeto de codificación de transformación; codificar (1002) un indicador de bloque codificado croma Cb para el bloque de datos de vídeo usando la codificación aritmética binaria adaptativa al contexto, CABAC y el contexto seleccionado, en el que la codificación del indicador de bloque codificado croma Cb comprende el uso de un conjunto de contexto que incluye uno o más contextos; y codificar (1004) un indicador de bloque codificado croma Cr usando CABAC, en el que la codificación del indicador de bloque codificado croma Cr comprende utilizar el mismo conjunto de contexto como el indicador de bloque codificado croma Cb.

2. Un procedimiento de decodificación de datos de vídeo que comprende:

seleccionar (1006) un contexto de uno o más contextos basados en una profundidad de transformación de una unidad de transformación asociada con un bloque de datos de vídeo a codificar, en el que la profundidad de transformación especifica el nivel de subdivisión actual de una unidad de codificación en bloques para el objeto de codificación de transformación; decodificar (1002) un indicador de bloque codificado croma Cb para el bloque de datos de vídeo usando la codificación aritmética binaria adaptativa al contexto, CABAC y el contexto seleccionado, en el que la decodificación del indicador de bloque codificado croma Cb comprende el uso de un conjunto de contexto que incluye el uno o más contextos; y decodificar (1004) un indicador de bloque codificado croma Cr usando CABAC, en el que la decodificación del indicador de bloque codificado croma Cr comprende utilizar el mismo conjunto de contexto que el indicador de bloque codificado croma Cb.

3. El procedimiento de la reivindicación 1 ó 2, en el que el conjunto de contexto incluye 5 contextos.

4. El procedimiento de la reivindicación 1, que comprende además:

señalizar el indicador de bloque codificado croma Cb en un flujo de bits de vídeo codificado; y señalizar el indicador de bloque codificado croma Cr en el flujo de bits de vídeo codificado.

5. El procedimiento de la reivindicación 2, que comprende además:

recibir el indicador de bloque codificado croma Cb en un flujo de bits de vídeo codificado; y recibir el indicador de bloque codificado croma Cr en el flujo de bits de vídeo codificado.

6. Un aparato (20) configurado para codificar datos de vídeo que comprende:

medios (56) para seleccionar un contexto de uno o más contextos basados en una profundidad de transformación de una unidad de transformación asociada con un bloque de datos de vídeo a codificar, en el que la profundidad de transformación especifica el nivel de subdivisión actual de una unidad de codificación en bloques para el objeto de codificación de transformación; medios (56) para la codificación de un indicador de bloque codificado croma Cb para el bloque de datos de vídeo usando la codificación aritmética binaria adaptativa al contexto, CABAC, y el contexto seleccionado, en el que la codificación del indicador de bloque codificado croma Cb comprende el uso de un conjunto contexto que incluye uno o más contextos; y medios (56) para la codificación de un indicador de bloque codificado croma Cr usando CABAC, en el que la codificación del indicador de bloque codificado croma Cr comprende utilizar el mismo conjunto de contexto que el indicador de bloque codificado croma Cb.

7. Un aparato (30) configurado para decodificar datos de vídeo que comprende:

medios (80) para seleccionar un contexto de uno o más contextos basados en una profundidad de transformación de una unidad de transformación asociada con un bloque de datos de vídeo a codificar, en el que la profundidad de transformación especifica el nivel de subdivisión actual de una unidad de codificación en bloques para el objeto de codificación de transformación; medios (80) para decodificar un indicador de bloque codificado croma Cb para el bloque de datos de vídeo usando la codificación aritmética binaria adaptativa al contexto, CABAC, y el contexto seleccionado, en el que la decodificación del indicador de bloque codificado croma Cb comprende el uso de un conjunto de contexto que incluye uno o más contextos; y medios (80) para decodificar un indicador de bloque codificado croma Cr usando CABAC, en el que la decodificación del indicador de bloque codificado croma Cr comprende utilizar el mismo conjunto de contexto

que el indicador de bloque codificado croma Cb.

8. El aparato de la reivindicación 6 ó 7, en el que el conjunto de contexto incluye 5 contextos.

9. El aparato de la reivindicación 6, que comprende además:

medios para la señalización del indicador de bloque codificado croma Cb en un flujo de bits de vídeo codificado; 5y medios para la señalización del indicador de bloque codificado croma Cr en el flujo de bits de vídeo codificado.

10. El aparato de la reivindicación 7, que comprende además:

medios para recibir el indicador de bloque codificado croma Cb en un flujo de bits de vídeo codificado; y medios para recibir el indicador de bloque codificado croma Cr en el flujo de bits de vídeo codificado.

11. Un medio de almacenamiento legible por ordenador que almacena instrucciones que, al ejecutarse, originan que uno o más procesadores configurados para codificar o decodificar datos de vídeo efectúen el procedimiento de cualquiera de las reivindicaciones 1 a 5.