Método de control de velocidad binaria de codificación, dispositivo, programa, y medio de grabación que contiene el programa.

Un método de control de velocidad binaria de codificación usado en usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama

, comprendiendo el método las etapas de:

- medir una cantidad de código generado para información cuantificada para una imagen que ha sido codificada;

- medir una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

- calcular una proporción de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

- determinar una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

estimando una cantidad de código generado cuando la imagen objetivo de codificación es codificada usando un tamaño supuesto predeterminado de la etapa de cuantificación, basándose en el índice complejo calculado y la proporción calculada de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, y

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de código generado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2008/053959.

Solicitante: NIPPON TELEGRAPH AND TELEPHONE CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 3-1, OTEMACHI 2-CHOME CHIYODA-KU TOKYO 100-8116 JAPON.

Inventor/es: TANIDA,Ryuichi, SHIMIZU,Atsushi.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/51 (Estimación del movimiento o de compensación del movimiento)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/593 (implica técnicas de predicción espacial)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/176 (siendo la región de un bloque, p. ej. un macrobloque)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/61 (en combinación con codificación predictiva)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/50 (utilizando codificación predictiva (H04N 19/61  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/91 (Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/196 (está especialmente adaptado para el cálculo de los parámetros de codificación, p. ej., promediando los parámetros de codificación previamente calculados (procesamiento de los vectores de movimiento H04N 19/513))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/423 (caracterizado por las disposiciones de la memoria (H04N 19/433  tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/503 (que implica predicción temporal (codificación adaptativa con la selección adaptativa entre codificación predictiva espacial y temporal H04N 19/107; codificación adaptativa con la selección adaptativa entre una pluralidad de modos codificación predictiva temporales H04N 19/109))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/147 (según el tipo de criterio de distorsión (tasa de distorsión como un criterio para la estimación del movimiento H04N 19/567))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/14 (Complejidad de la unidad de codificación, p. ej. cantidad de actividad o estimación de presencia de bordes (H04N 19/146 tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/126 (Detalles de las funciones de normalización o de ponderación, p. ej matrices de normalización o cuantificadores uniformes de variables)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/136 (Características o propiedades de la señal de vídeo de entranda)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/15 (monitorizando el tamaño de datos comprimidos actual en la memoria antes de decidir el almacenamiento en la memoria intermedia (buffer) de transmisión)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Métodos o disposiciones para la codificación, decodificación,... > H04N19/60 (utilizando codificación por transformada)

PDF original: ES-2532375_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método de control de velocidad binaria de codificación, dispositivo, programa, y medio de grabación que contiene el programa. 5

Campo técnico La presente invención se refiere a un método de control de velocidad binaria de codificación usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, un aparato correspondiente, un programa de control de velocidad binaria de codificación para implementar el control de velocidad binaria de codificación, y un medio de almacenamiento legible por ordenador que almacena el programa.

Se reivindica la prioridad sobre la solicitud de patente japonesa Nº 2007-064271, presentada el 14 de marzo de 2007, cuyo contenido se incorpora en este documento por referencia.

Técnica antecedente En muchos métodos de codificación de vídeo, la cantidad de código generado varía dependiendo del carácter de una imagen de entrada. Por lo tanto, se requiere una técnica de control de velocidad binaria de codificación para controlar la cantidad de código generado y mantener una velocidad binaria de codificación constante.

La cantidad de código generado está relacionada estrechamente con el tamaño de la etapa de cuantificación, y la cantidad de código generado se controla variando el tamaño de la etapa de cuantificación.

En el modelo de prueba 5 (abreviado como “TM5”) de MPEG-2, el control de cantidad de código se realiza usando una relación entre el tamaño de la etapa de cuantificación y la cantidad de código generado (véase, por ejemplo, el documento 1 no relacionado con patentes) .

Más adelante se explicará el control de cantidad de código en el TM5 de MPEG-2.

En el TM5 de MPEG-2, el control de la cantidad de código se realiza usando una unidad denominada GOP (grupo de imágenes) , que puede incluir imágenes I, P y B que tienen diferentes tipos de imagen tales como tipos de imagen I, P y B.

La fig. 7 muestra un diagrama de flujo del control de cantidad de código en el TM5 de MPEG-2.

Tal como se muestra en el diagrama de flujo, en el control de cantidad de código del TM5 en MPEG-2, en la primera etapa S301, se calcula un índice complejo Xx para cada tipo de imagen (x=i, p, b (que corresponden respectivamente a imágenes I, P y B) ) mediante la siguiente fórmula:

X = S ⋅< Q >

x x x

En la fórmula anterior, x indica el tipo de imagen, Sx indica la cantidad de código generado por una imagen que tiene el mismo tipo de imagen que la presente imagen y fue codificada más recientemente, y <Qx> indica un promedio del

tamaño de la etapa de cuantificación en la codificación relevante.

Generalmente, la cantidad de código Sx está en proporción inversa al tamaño de la etapa de cuantificación Qx. Por lo tanto, el cálculo del índice complejo Xx da una relación entre la cantidad de código generado y el tamaño de la etapa de cuantificación.

En la siguiente etapa S302, se calcula una cantidad objetivo Tx de código (x=i, p, b) para cada tipo de imagen mediante las siguientes fórmulas:

[Fórmula 1]

R

Ti = NX

p pNX

++ bb

XK XK

ip ib

R

T =

p NKX

bp p

N + p XK

pb

R

T =

b NKX

pb p

Nb + XK

bp

Aquí, R indica la cantidad de código asignada al GOP relevante, Np indica el número de imágenes P en el GOP, Nb indica el número de imágenes B en el GOP, y Kp y Kb son constantes.

Las fórmulas anteriores muestran que, con el fin de establecer la cantidad de código objetivo Ti, las imágenes P son convertidas en imágenes I de acuerdo con Xp/Xi, las imágenes B son convertidas en imágenes I de acuerdo con Xb/Xi, y la cantidad de código objetivo Ti se calcula basándose en los valores convertidos, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

Con el fin de establecer la cantidad de código objetivo Tp, las imágenes B son convertidas en imágenes P de acuerdo con Xb/Xp, y la cantidad de código objetivo Tp se calcula basándose en el valor convertido, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

Con el fin de establecer la cantidad de código objetivo Tb, las imágenes P son convertidas en imágenes B de acuerdo con Xp/Xb, y la cantidad de código objetivo Tb se calcula basándose en los valores convertidos, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

En la siguiente etapa S303, basándose en la cantidad de código objetivo Tx establecida anteriormente para las imágenes, se determina el tamaño de la etapa de cuantificación para un bloque pequeño tal como un objetivo de codificación.

En la siguiente etapa S304, cada bloque pequeño es sometido a cuantificación y codificación usando el tamaño determinado de la etapa de cuantificación.

En la siguiente etapa S305, después de que se completa la codificación de una imagen, se calcula un promedio <Qx> del tamaño de la etapa de cuantificación.

En la etapa S306, (después de que se completa la codificación de una imagen) , se mide la cantidad real Sx de código generado.

Basándose en la cantidad medida Sx de código generado y el tamaño promedio calculado de la etapa de cuantificación <Qx>, de nuevo en la etapa S301, se actualiza el índice complejo Xx para cada tipo de imagen.

De acuerdo con el método anterior, en el TM5 de MPEG-2, se asigna una cantidad de código objetivo a cada imagen cuando se codifica la imagen, controlando así la cantidad de código generado.

En el método convencional, la cantidad de código objetivo se determina basándose en la cantidad de código asignada al GOP relevante y el índice complejo para cada tipo de imagen. Este método está basado en una relación previa de manera que el tamaño de la etapa de cuantificación es inversamente proporcional a la cantidad de código generado.

Sin embargo, si la cantidad de código generado para un elemento (por ejemplo, el vector de movimiento para predicción de movimiento compensado, el modo de codificación, etc.) que no tiene relación con el tamaño de la etapa de cuantificación es dominante, entonces la relación previa puede resultar ineficaz. Si la relación previa es ineficaz, la cantidad de código generado se estima erróneamente, y de este modo la cantidad de código objetivo no se determina con exactitud.

Con el fin de resolver el problema anterior, el documento de patente 1 desvela un método de realización de control de cuantificación sin considerar la cantidad de código de longitud fija.

En este método, la cantidad de código requerida para cada elemento (por ejemplo, componentes de DC o vectores de movimiento en el modo de codificación intratrama de MPEG-2) que no depende de la velocidad binaria se define como la cantidad de código independiente del tamaño de la etapa de cuantificación.

Documento 1 no relacionado con patentes: MPEG-2, Test Model5 (TM5) , Doc. ISO/IECJTC1/SC29WG11/NO400, Test Model Editing Committee, págs. 59-63, abril de 1993.

Documento de patente 1: Solicitud de patente japonesa sin examinar, primera publicación Nº H10-290461.

El documento D1 [RATE-DISTORTION OPTIMIZATION FOR VIDEO COMPRESSION” IEEE SIGNAL PROCESSING MAGAZINE, IEEE SERVICE CENTER, PISCATAWAY, NJ, US LNKD-DOI:10.1109/79.733497, vol. 15, nº 6, 1 de noviembre de 1998 (1998-11-01) , páginas 74-90, XP001064929 ISSN: 1053-5888] desvela un método de optimización de un codificador de vídeo basado en el principal del multiplicador de Lagrange D+λR.

El documento D2 [“MPEG-4... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de control de velocidad binaria de codificación usado en usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, comprendiendo el método las etapas 5 de:

-medir una cantidad de código generado para información cuantificada para una imagen que ha sido codificada;

-medir una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

- calcular una proporción de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

-determinar una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

estimando una cantidad de código generado cuando la imagen objetivo de codificación es codificada usando un tamaño supuesto predeterminado de la etapa de cuantificación, basándose en el índice complejo calculado y la proporción calculada de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, y

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de 25 código generado.

2. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1, en el que la etapa de determinar una cantidad de código objetivo incluye:

calcular el tamaño supuesto de la etapa de cuantificación para una imagen codificada mediante predicción intertrama usando un tamaño de la etapa de cuantificación que se usó al codificar una imagen mediante predicción intratrama y un valor de proporción predeterminado.

3. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1, en el que la etapa de 35 determinar una cantidad de código objetivo incluye:

variar la proporción calculada de la cantidad de código generado para la información no cuantificada de acuerdo con el tamaño supuesto de la etapa de cuantificación; y

determinar la cantidad de código objetivo de la imagen objetivo de codificación usando la proporción variada de la cantidad de código generado.

4. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 3, en el que la etapa de determinar una cantidad de código objetivo incluye:

variar la proporción calculada de la cantidad de código generado para la información no cuantificada de acuerdo con el tamaño supuesto de la etapa de cuantificación, usando una función que define una relación entre el tamaño de la etapa de cuantificación y la proporción de la cantidad de código generado para la información no cuantificada.

5. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 4, en el que:

la función está formada por líneas rectas que tienen diferentes gradientes que corresponden a diferentes intervalos de valores del tamaño de la etapa de cuantificación.

6. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 4, en el que:

la función se determina basándose en la proporción calculada de la cantidad de código generado para la información no cuantificada y un tamaño de la etapa de cuantificación usado en la codificación de la imagen que ha sido codificada.

7. Un aparato de control de velocidad binaria de codificación usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, comprendiendo el aparato:

-un dispositivo que mide una cantidad de código generado para información cuantificada para una imagen que ha 65 sido codificada;

-un dispositivo que mide una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

-un dispositivo que calcula una proporción de la cantidad de código generado para la información no cuantificada a 5 la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

-un dispositivo que determina una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido 10 codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

estimando una cantidad de código generado cuando la imagen objetivo de codificación es codificada usando un tamaño supuesto predeterminado de la etapa de cuantificación, basándose en el índice complejo calculado y la proporción calculada de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, y

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de código generado.

8. Un programa de control de velocidad binaria de codificación mediante el cual un ordenador ejecuta una operación para implementar el método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1.

9. Un medio de almacenamiento legible por ordenador que almacena un programa de control de velocidad binaria de codificación mediante el cual un ordenador ejecuta una operación para implementar el método de control de 25 velocidad binaria de codificación de acuerdo con la reivindicación 1.