CODIFICACION INTERTRAMAS CON DECISION RAPIDA DE MODO.

Método para seleccionar el modo de un macrobloque actual de una trama inter-codificada según una codificación de vídeo H.

264/MPEG AVC, en el que los modos de macrobloque son los siguientes:

Trama - P: MODO e {INTRA4X4, INTRA16X16, SALTO, 16X16, 16, 8, 8X16, 8X8, 8X4, 4X8, 4X4}

Trama - B: MODO e {INTRA4X4, INTRA16X16, BI-DIRECTO, DIRECTO, FWD16X16, FWD16X8, FWD8X16, FWD8X8, FWD8X4, FWD4X8, FWD4X4, BAK16X16, BAK16X8, BAK8X16, BAK8X8, BAK8X4, BAK4X8, BAK4X4}

y el modo INTRA4x4 contiene los modos:

MODO e {vertical, horizontal, DC, diagonal-abajo-izquierda, diagonal-abajo-derecha, vertical-izquierda, horizontal-abajo, vertical-derecha, horizontal-arriba}

e INTRA16x16 contiene los modos: MODO e {vertical, horizontal, DC, plano}

comprendiendo dicho método:

- comprobación (420, 422), con un parámetro de cuantificación dado QP, para los modos SALTO y 16x16, si un valor J de dicho modo SALTO es menor que el valor J de dicho modo 16x16 y si dicho modo 16x16 carece de resto de predicción, donde J es un valor de suma correspondiente a la suma de las diferencias de cuadrados entre la señal original y la señal reconstruida, y del producto del multiplicador de Lagrange ?MODO, por el número R de bits requeridos asociados al modo actual, comprendiendo los bits del encabezado del macrobloque, los coeficientes de movimiento y todos los coeficientes DCT;

- de no ser cierta la premisa anterior, continuar la comprobación (426) del modo 8x8, y de ser cierta, se comprueba (424) si dicho modo SALTO tiene la misma información de movimiento que dicho modo 16x16,

si no fuese cierto, se continúa con dicha comprobación (426) del modo 8x8,

si fuese cierto, se continúa con la comprobación (438) de los modos intra;

- comprobación (426) de dicho modo 8x8 y determinación (428) de si dicho modo 8x8 tiene la misma información de movimiento que dicho modo 16x16;

- si fuese cierto, se continúa con la comprobación (432) del modo 4x4, y si no lo fuese, se comprueba (430) el modo 16x8 y el modo 8x16, y si dichos modos tuviesen la misma información de movimiento que dicho modo 16x16, se continúa comprobando (432) el modo 4x4;

- comprobación (432) de dicho modo 4x4 y determinación (434) de si dicho modo 4x4 tiene la misma información de movimiento que dicho modo 8x8;

- si fuese cierto, se continúa con la comprobación (438) de los modos intra, y si no lo fuese, se comprueban (436) los modos 8x4 y 4x8, y si estos modos tuviesen la misma información de movimiento que dicho modo 8x8, se continúa con la comprobación (438) de los modos intra,

- en el que para cada modo de macrobloque específico se dispone de un umbral ajustable de coste de codificación y se selecciona el modo actualmente comprobado (440) para dicho macrobloque actual si se alcanza el correspondiente umbral del coste de codificación de dicho modo, deteniéndose la comprobación de los modos no comprobados restantes

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2004/019527.

Solicitante: THOMSON LICENSING.

Nacionalidad solicitante: Francia.

Dirección: 1, RUE JEANNE D'ARC,92443 ISSY-LES-MOULINEAUX CEDE.

Inventor/es: BOYCE,JILL,MACDONALD, YIN,PENG, TOURAPIS,ALEXANDROS,MICHAEL.

Fecha de Publicación: .

Fecha Concesión Europea: 14 de Abril de 2010.

Clasificación Internacional de Patentes:

  • H04N7/26A4B
  • H04N7/26A4P
  • H04N7/26A4Z
  • H04N7/26A6C2
  • H04N7/26A6S2
  • H04N7/26A8B
  • H04N7/26A8P
  • H04N7/34B
  • H04N7/36C
  • H04N7/46E
  • H04N7/50

Clasificación PCT:

  • H04N7/26
  • H04N7/50

Clasificación antigua:

  • H04N7/26
  • H04N7/50
CODIFICACION INTERTRAMAS CON DECISION RAPIDA DE MODO.

Fragmento de la descripción:

Codificación intertramas con decisión rápida de modo.

La presente invención se refiere a codificadores y descodificadores de vídeo, y más concretamente, a codificadores para toma de decisiones de modo de intertrama.

Antecedentes de la invención

En la norma de compresión de vídeo JVT, se puede utilizar inter- e intra-codificación para intertramas. El codificador necesita adoptar una decisión relativa al modo para cada macrobloque, en función de diversas consideraciones relativas a la eficiencia de codificación y a la calidad subjetiva. Una decisión de modo inter se asocia con la estimación de movimiento, diferentes tamaños de bloque y selección de múltiples imágenes de referencia. Una decisión de modo intra se asocia a diferentes tipos de bloque y múltiples selecciones de predicción espacial. De esta manera, las decisiones de modo para intertramas plantean una pesada carga para el codificador. Por ello, lo que se precisa es un nuevo método que reduzca la complejidad a la hora de adoptar decisiones relativas a la codificación, manteniendo al mismo tiempo la eficiencia de dicha codificación.

En "Fast Intra-prediction modo selection for 4x4 blocks in H.264", 2003 IEEE Internacional Conferencie on Acoustics, Speech and Signal Processing Proceedings (ICASSP), Nueva York, NY, Vol. 3, 6 de abril de 2003, pp. III389-III391, revela una selección de modo de predicción intra para macrobloques en la codificación de vídeo.

El documento US-A-2003/0099292 describe una codificación de trama de campo H.264 adaptable.

Resumen de la invención

Este y otos inconvenientes y desventajas de la técnica anterior son abordados por un dispositivo y un método para la codificación de intertramas basada en tomas de decisión de modo rápidas.

Se proporciona un codificador de vídeo y los métodos correspondientes para seleccionar el modo de un macrobloque actual de una trama inter-codificada, comprendiendo uno o más primeros modos de comprobación para un subconjunto de modos de macrobloque, comprobando selectivamente otros modos en respuesta a la información sobre el vector de movimiento de los primeros bloques verificados, y la selección del modo correspondiente al macrobloque actual en respuesta a los modos comprobados; comprobación del modo de macrobloque de al menos un macrobloque próximo, y selección del modo del macrobloque actual en respuesta al modo del macrobloque de al menos un macrobloque próximo comprobado; comprobación del coste de un subconjunto de modos de macrobloque, comprobando adicionalmente tan sólo los modos con codificación intra si el coste comprobado satisface un criterio preestablecido, y selección del modo correspondiente al macrobloque actual en respuesta a los modos comprobados, y selección del modo del actual macrobloque en respuesta a los modos de macrobloque comprobados si se cumple el umbral de detención temprana ajustado.

Estos y otros aspectos, características y ventajas de la presente invención serán evidentes mediante la siguiente descripción de los ejemplos de realización, que deberán verse en relación con las figuras adjuntas. La invención se recoge en las reivindicaciones adjuntas.

Breve descripción de las figuras

La presente invención se comprenderá mejor haciendo referencia a las siguientes figuras de ejemplo, en las cuales:

La figura 1 muestra un organigrama de un codificador de vídeo para decisión de modo de codificación rápida, de acuerdo con una realización de la presente invención;

La figura 2 muestra un diagrama de bloques de un codificador de vídeo.

La figura 3 muestra un organigrama de un ejemplo de proceso de decisión de codificación de vector de movimiento de acuerdo con una realización de la presente invención; y

La figura 4 muestra un organigrama de un ejemplo de proceso mixto de decisión de codificación intra e inter, de acuerdo con una realización de la presente invención.

Descripción detallada de las realizaciones preferidas

Los métodos de codificación inter e intra se utilizan para codificación intertramas de acuerdo con las normas de compresión de vídeo. Por lo general, un codificador toma una decisión de codificación inter o intra para cada macrobloque, en función de la eficiencia de codificación y de consideraciones subjetivas de calidad. En la norma de compresión de vídeo JVT, la codificación inter permite diversas particiones de bloque en un macrobloque de 16x16 (concretamente, 16x16, 16x8, 8x16, 8x8 en el caso de un macrobloque, y 8x8,8x4, 4x8,4x4 en el caso de un submacrobloque de 8x8), así como múltiples imágenes de referencia. Además, JVT también soporta los modos SALTO (SKIP) e intra. Los modos intra incluyen dos tipos: INTRA4x4 e INTRA16x16, en los que INTRA4x4 soporta 9 modos e INTRA16x16 soporta 4 modos. Todas estas opciones implican decisiones de modo muy complicadas. Las realizaciones de la presente invención simplifican las decisiones de modo reduciendo el número de posibles modos candidatos a examinar.

Las codificaciones inter e intra se utilizan para las intertramas (tramas P y B) en JVT (que también se conocen como H. 264 y MPEG AVC). Cada macrobloque individual se codifica como intra, utilizando solamente la correlación espacial, o se codifica como inter, utilizando la correlación temporal a partir de tramas anteriormente codificados. Por lo general, un codificador toma una decisión de codificación inter/intra para cada macrobloque, en función de la eficiencia de codificación y de consideraciones de calidad subjetivas. La intercodificación suele utilizarse para macrobloques que se han predicho bien a partir de las imágenes anteriores, y la intracodificación suele utilizarse para los macrobloques que no están bien predichos a partir de las imágenes anteriores, o para macrobloques con baja actividad espacial.

La norma JVT utiliza particiones de macrobloque jerárquicas con estructura arbórea. Los macrobloques intercodificados de 16x16 píxeles pueden descomponerse en particiones de macrobloque con unos tamaños de 16x8, 8x16, u 8x8 píxeles. Las particiones de macrobloques de 8x8 píxeles también se conocen como sub-macrobloques. Los submacrobloques pueden seguir descomponiéndose en particiones de submacrobloques con unos tamaños de 8x4,4x8, y 4x4 píxeles. Un codificador puede seleccionar cómo dividir el macrobloque en particiones y en particiones de submacrobloques, en función de las características de un macrobloque específico, a fin de maximizar la eficiencia de compresión y la calidad subjetiva.

Pueden utilizarse múltiples imágenes de referencia para la interpredicción, tal como un índice de imágenes de referencia codificado para indicar cuál de las múltiples imágenes de referencia se ha utilizado. En las imágenes P (o segmentos P) tan sólo se utiliza la predicción monodireccional, y las imágenes de referencia válidas se gestionan en la lista 0. En las imágenes B (o segmentos B) se gestionan dos listas de imágenes de referencia, la lista 0 y la lista 1, pudiendo efectuarse una doble predicción utilizando la lista 0 y la lista 1. Cuando se utiliza la doble predicción, los predictores de la lista 0 y la lista 1 se promedian para constituir un predictor final.

Cada partición de macrobloque puede tener un índice de imágenes de referencia independiente, un tipo de predicción (lista 0, lista 1, predicción doble) y un vector de movimiento independiente. Cada partición del submacrobloque puede tener vectores de movimiento independientes, pero todas las particiones del submacrobloque correspondientes al mismo submacrobloque utilizan el mismo índice de imágenes de referencia y tipo de predicción.

En el caso de macrobloques con codificación inter, las tramas P también soportan el modo SALTO (SKIP), mientras que las tramas B soportan tanto los modos SALTO (SKIP) y DIRECTO (DIRECT). En el modo SALTO (SKIP), no se codifica ningún movimiento ni información residual. La información de movimiento correspondiente a un macrobloque SALTO (SKIP) es la misma que un predictor de vector de movimiento especificado por el tipo de imagen/ segmento (P o B) y otras informaciones, como los parámetros relativos al nivel de secuencia y segmento. La información de movimiento está también relacionada con otros macrobloques contiguos, temporal o espacialmente, y su propia posición de macrobloque dentro del segmento. En el modo DIRECTO (DIRECT), por otra parte,...

 


Reivindicaciones:

1. Método para seleccionar el modo de un macrobloque actual de una trama inter-codificada según una codificación de vídeo H.264/MPEG AVC, en el que los modos de macrobloque son los siguientes:

Trama - P: MODO e {INTRA4X4, INTRA16X16, SALTO, 16X16, 16, 8, 8X16, 8X8, 8X4, 4X8, 4X4}

Trama - B: MODO e {INTRA4X4, INTRA16X16, BI-DIRECTO, DIRECTO, FWD16X16, FWD16X8, FWD8X16, FWD8X8, FWD8X4, FWD4X8, FWD4X4, BAK16X16, BAK16X8, BAK8X16, BAK8X8, BAK8X4, BAK4X8, BAK4X4}

y el modo INTRA4x4 contiene los modos:

MODO e {vertical, horizontal, DC, diagonal-abajo-izquierda, diagonal-abajo-derecha, vertical-izquierda, horizontal-abajo, vertical-derecha, horizontal-arriba}

e INTRA16x16 contiene los modos: MODO e {vertical, horizontal, DC, plano}

comprendiendo dicho método:

- comprobación (420, 422), con un parámetro de cuantificación dado QP, para los modos SALTO y 16x16, si un valor J de dicho modo SALTO es menor que el valor J de dicho modo 16x16 y si dicho modo 16x16 carece de resto de predicción, donde J es un valor de suma correspondiente a la suma de las diferencias de cuadrados entre la señal original y la señal reconstruida, y del producto del multiplicador de Lagrange ?MODO, por el número R de bits requeridos asociados al modo actual, comprendiendo los bits del encabezado del macrobloque, los coeficientes de movimiento y todos los coeficientes DCT;

- de no ser cierta la premisa anterior, continuar la comprobación (426) del modo 8x8, y de ser cierta, se comprueba (424) si dicho modo SALTO tiene la misma información de movimiento que dicho modo 16x16,

si no fuese cierto, se continúa con dicha comprobación (426) del modo 8x8,

si fuese cierto, se continúa con la comprobación (438) de los modos intra;

- comprobación (426) de dicho modo 8x8 y determinación (428) de si dicho modo 8x8 tiene la misma información de movimiento que dicho modo 16x16;

- si fuese cierto, se continúa con la comprobación (432) del modo 4x4, y si no lo fuese, se comprueba (430) el modo 16x8 y el modo 8x16, y si dichos modos tuviesen la misma información de movimiento que dicho modo 16x16, se continúa comprobando (432) el modo 4x4;

- comprobación (432) de dicho modo 4x4 y determinación (434) de si dicho modo 4x4 tiene la misma información de movimiento que dicho modo 8x8;

- si fuese cierto, se continúa con la comprobación (438) de los modos intra, y si no lo fuese, se comprueban (436) los modos 8x4 y 4x8, y si estos modos tuviesen la misma información de movimiento que dicho modo 8x8, se continúa con la comprobación (438) de los modos intra,

- en el que para cada modo de macrobloque específico se dispone de un umbral ajustable de coste de codificación y se selecciona el modo actualmente comprobado (440) para dicho macrobloque actual si se alcanza el correspondiente umbral del coste de codificación de dicho modo, deteniéndose la comprobación de los modos no comprobados restantes.

2. Método de acuerdo con la reivindicación 1, en el que los umbrales de coste de codificación T(modo) se calculan de la forma siguiente:

T(modo) = a(modo)x Tn + ß(modo)

Tn = MAX(COSTtext{límiteinferior}, MIN(COSTtext{límitesuperior}, COST1, COST2, COSTN,))

Donde a(modo) y ß(modo) son escalares de un modo, y COSTi denota el coste de codificación del i-ésimo bloque adyacente.

3. Método de acuerdo con la reivindicación 1, en el que la información de los bloques adyacentes espacial y/o temporalmente y de las particiones de bloques, se utiliza a fin de decidir los modos a comprobar.

4. Método de acuerdo con la reivindicación 1, en el que el procesamiento de la selección de modo finaliza cuando los macrobloques adyacentes temporal y/o espacialmente tienen una relación específica con la información de movimiento del macrobloque actual, tras el examen de un modo específico.


 

Patentes similares o relacionadas:

Imagen de 'Filtro de desbloqueo condicionado por el brillo de los píxeles'Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .