Método de control de velocidad binaria de codificación, dispositivo, programa, y medio de grabación que contiene el programa.

Un método de control de velocidad binaria de codificación usado en usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama,

comprendiendo el método las etapas de:

- medir una cantidad de código generado para información cuantificada para una imagen que ha sido codificada;

- medir una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

- calcular una proporción de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

- determinar una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

estimando una cantidad de código generado cuando la imagen objetivo de codificación es codificada usando un tamaño supuesto predeterminado de la etapa de cuantificación, basándose en el índice complejo calculado y la proporción calculada de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, y

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de código generado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2008/053959.

Solicitante: NIPPON TELEGRAPH AND TELEPHONE CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 3-1, OTEMACHI 2-CHOME CHIYODA-KU TOKYO 100-8116 JAPON.

Inventor/es: TANIDA,Ryuichi, SHIMIZU,Atsushi.

Fecha de Publicación: 10 de Diciembre de 2014.

Clasificación Internacional de Patentes:

H04N19/126 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 19/00 Métodos o disposiciones para la codificación, decodificación, compresión o descompresión de señales de vídeo digital. › Detalles de las funciones de normalización o de ponderación, p. ej matrices de normalización o cuantificadores uniformes de variables.
H04N19/136 H04N 19/00 […] › Características o propiedades de la señal de vídeo de entranda.
H04N19/14 H04N 19/00 […] › Complejidad de la unidad de codificación, p. ej. cantidad de actividad o estimación de presencia de bordes (H04N 19/146 tiene prioridad).
H04N19/147 H04N 19/00 […] › según el tipo de criterio de distorsión (tasa de distorsión como un criterio para la estimación del movimiento H04N 19/567).
H04N19/15 H04N 19/00 […] › monitorizando el tamaño de datos comprimidos actual en la memoria antes de decidir el almacenamiento en la memoria intermedia (buffer) de transmisión.
H04N19/176 H04N 19/00 […] › siendo la región de un bloque, p. ej. un macrobloque.
H04N19/196 H04N 19/00 […] › está especialmente adaptado para el cálculo de los parámetros de codificación, p. ej. promediando los parámetros de codificación previamente calculados (procesamiento de los vectores de movimiento H04N 19/513).
H04N19/423 H04N 19/00 […] › caracterizado por las disposiciones de la memoria (H04N 19/433 tiene prioridad).
H04N19/50 H04N 19/00 […] › utilizando codificación predictiva (H04N 19/61 tiene prioridad).
H04N19/503 H04N 19/00 […] › que implica predicción temporal (codificación adaptativa con la selección adaptativa entre codificación predictiva espacial y temporal H04N 19/107; codificación adaptativa con la selección adaptativa entre una pluralidad de modos codificación predictiva temporales H04N 19/109).
H04N19/51 H04N 19/00 […] › Estimación del movimiento o de compensación del movimiento.
H04N19/593 H04N 19/00 […] › implica técnicas de predicción espacial.
H04N19/60 H04N 19/00 […] › utilizando codificación por transformada.
H04N19/61 H04N 19/00 […] › en combinación con codificación predictiva.
H04N19/91 H04N 19/00 […] › Codificación de entropía, p. ej. codificación de longitud variable [VLC] o la codificación aritmética.

PDF original: ES-2532375_T3.pdf

Fragmento de la descripción:

Método de control de velocidad binaria de codificación, dispositivo, programa, y medio de grabación que contiene el programa. 5

Campo técnico La presente invención se refiere a un método de control de velocidad binaria de codificación usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, un aparato correspondiente, un programa de control de velocidad binaria de codificación para implementar el control de velocidad binaria de codificación, y un medio de almacenamiento legible por ordenador que almacena el programa.

Se reivindica la prioridad sobre la solicitud de patente japonesa Nº 2007-064271, presentada el 14 de marzo de 2007, cuyo contenido se incorpora en este documento por referencia.

Técnica antecedente En muchos métodos de codificación de vídeo, la cantidad de código generado varía dependiendo del carácter de una imagen de entrada. Por lo tanto, se requiere una técnica de control de velocidad binaria de codificación para controlar la cantidad de código generado y mantener una velocidad binaria de codificación constante.

La cantidad de código generado está relacionada estrechamente con el tamaño de la etapa de cuantificación, y la cantidad de código generado se controla variando el tamaño de la etapa de cuantificación.

En el modelo de prueba 5 (abreviado como “TM5”) de MPEG-2, el control de cantidad de código se realiza usando una relación entre el tamaño de la etapa de cuantificación y la cantidad de código generado (véase, por ejemplo, el documento 1 no relacionado con patentes) .

Más adelante se explicará el control de cantidad de código en el TM5 de MPEG-2.

En el TM5 de MPEG-2, el control de la cantidad de código se realiza usando una unidad denominada GOP (grupo de imágenes) , que puede incluir imágenes I, P y B que tienen diferentes tipos de imagen tales como tipos de imagen I, P y B.

La fig. 7 muestra un diagrama de flujo del control de cantidad de código en el TM5 de MPEG-2.

Tal como se muestra en el diagrama de flujo, en el control de cantidad de código del TM5 en MPEG-2, en la primera etapa S301, se calcula un índice complejo Xx para cada tipo de imagen (x=i, p, b (que corresponden respectivamente a imágenes I, P y B) ) mediante la siguiente fórmula:

X = S ⋅< Q >

x x x

En la fórmula anterior, x indica el tipo de imagen, Sx indica la cantidad de código generado por una imagen que tiene el mismo tipo de imagen que la presente imagen y fue codificada más recientemente, y <Qx> indica un promedio del

tamaño de la etapa de cuantificación en la codificación relevante.

Generalmente, la cantidad de código Sx está en proporción inversa al tamaño de la etapa de cuantificación Qx. Por lo tanto, el cálculo del índice complejo Xx da una relación entre la cantidad de código generado y el tamaño de la etapa de cuantificación.

En la siguiente etapa S302, se calcula una cantidad objetivo Tx de código (x=i, p, b) para cada tipo de imagen mediante las siguientes fórmulas:

[Fórmula 1]

Ti = NX

p pNX

++ bb

XK XK

ip ib

T =

p NKX

bp p

N + p XK

T =

b NKX

pb p

Nb + XK

Aquí, R indica la cantidad de código asignada al GOP relevante, Np indica el número de imágenes P en el GOP, Nb indica el número de imágenes B en el GOP, y Kp y Kb son constantes.

Las fórmulas anteriores muestran que, con el fin de establecer la cantidad de código objetivo Ti, las imágenes P son convertidas en imágenes I de acuerdo con Xp/Xi, las imágenes B son convertidas en imágenes I de acuerdo con Xb/Xi, y la cantidad de código objetivo Ti se calcula basándose en los valores convertidos, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

Con el fin de establecer la cantidad de código objetivo Tp, las imágenes B son convertidas en imágenes P de acuerdo con Xb/Xp, y la cantidad de código objetivo Tp se calcula basándose en el valor convertido, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

Con el fin de establecer la cantidad de código objetivo Tb, las imágenes P son convertidas en imágenes B de acuerdo con Xp/Xb, y la cantidad de código objetivo Tb se calcula basándose en los valores convertidos, los números Np y Nb de imágenes, y la cantidad R de código asignada al GOP.

En la siguiente etapa S303, basándose en la cantidad de código objetivo Tx establecida anteriormente para las imágenes, se determina el tamaño de la etapa de cuantificación para un bloque pequeño tal como un objetivo de codificación.

En la siguiente etapa S304, cada bloque pequeño es sometido a cuantificación y codificación usando el tamaño determinado de la etapa de cuantificación.

En la siguiente etapa S305, después de que se completa la codificación de una imagen, se calcula un promedio <Qx> del tamaño de la etapa de cuantificación.

En la etapa S306, (después de que se completa la codificación de una imagen) , se mide la cantidad real Sx de código generado.

Basándose en la cantidad medida Sx de código generado y el tamaño promedio calculado de la etapa de cuantificación <Qx>, de nuevo en la etapa S301, se actualiza el índice complejo Xx para cada tipo de imagen.

De acuerdo con el método anterior, en el TM5 de MPEG-2, se asigna una cantidad de código objetivo a cada imagen cuando se codifica la imagen, controlando así la cantidad de código generado.

En el método convencional, la cantidad de código objetivo se determina basándose en la cantidad de código asignada al GOP relevante y el índice complejo para cada tipo de imagen. Este método está basado en una relación previa de manera que el tamaño de la etapa de cuantificación es inversamente proporcional a la cantidad de código generado.

Sin embargo, si la cantidad de código generado para un elemento (por ejemplo, el vector de movimiento para predicción de movimiento compensado, el modo de codificación, etc.) que no tiene relación con el tamaño de la etapa de cuantificación es dominante, entonces la relación previa puede resultar ineficaz. Si la relación previa es ineficaz, la cantidad de código generado se estima erróneamente, y de este modo la cantidad de código objetivo no se determina con exactitud.

Con el fin de resolver el problema anterior, el documento de patente 1 desvela un método de realización de control de cuantificación sin considerar la cantidad de código de longitud fija.

En este método, la cantidad de código requerida para cada elemento (por ejemplo, componentes de DC o vectores de movimiento en el modo de codificación intratrama de MPEG-2) que no depende de la velocidad binaria se define como la cantidad de código independiente del tamaño de la etapa de cuantificación.

Documento 1 no relacionado con patentes: MPEG-2, Test Model5 (TM5) , Doc. ISO/IECJTC1/SC29WG11/NO400, Test Model Editing Committee, págs. 59-63, abril de 1993.

Documento de patente 1: Solicitud de patente japonesa sin examinar, primera publicación Nº H10-290461.

El documento D1 [RATE-DISTORTION OPTIMIZATION FOR VIDEO COMPRESSION” IEEE SIGNAL PROCESSING MAGAZINE, IEEE SERVICE CENTER, PISCATAWAY, NJ, US LNKD-DOI:10.1109/79.733497, vol. 15, nº 6, 1 de noviembre de 1998 (1998-11-01) , páginas 74-90, XP001064929 ISSN: 1053-5888] desvela un método de optimización de un codificador de vídeo basado en el principal del multiplicador de Lagrange D+λR.

El documento D2 [“MPEG-4 Rate Control for Multiple Video Objects” IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 9, nº 1, 1 de febrero de 1999 (1999-02-01) , XP011014547 ISSN: 1051-8215] desvela un algoritmo que puede lograr una velocidad binaria constante cuando codifica múltiples objetos de vídeo. La implementación es una extensión no trivial del algoritmo de control de velocidad de MPEG-4 para objetos de vídeo individuales que emplea un modelo de cuantificador de velocidad cuadrático. El algoritmo está organizado en dos fases: una fase de precodificación y una de postcodificación. En la fase de precodificación, se efectúa una estimación de objetivo inicial para cada objeto. Basándose en lo llena que está la memoria intermedia, se ajusta el objetivo total y luego se distribuye proporcionalmente al tamaño relativo, el movimiento y la varianza de cada objeto. Basándose en los nuevos objetivos individuales y la relación de... [Seguir leyendo]

Reivindicaciones:

1. Un método de control de velocidad binaria de codificación usado en usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, comprendiendo el método las etapas 5 de:

-medir una cantidad de código generado para información cuantificada para una imagen que ha sido codificada;

-medir una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

- calcular una proporción de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

-determinar una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

estimando una cantidad de código generado cuando la imagen objetivo de codificación es codificada usando un tamaño supuesto predeterminado de la etapa de cuantificación, basándose en el índice complejo calculado y la proporción calculada de la cantidad de código generado para la información no cuantificada a la cantidad total de código generado, y

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de 25 código generado.

2. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1, en el que la etapa de determinar una cantidad de código objetivo incluye:

calcular el tamaño supuesto de la etapa de cuantificación para una imagen codificada mediante predicción intertrama usando un tamaño de la etapa de cuantificación que se usó al codificar una imagen mediante predicción intratrama y un valor de proporción predeterminado.

3. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1, en el que la etapa de 35 determinar una cantidad de código objetivo incluye:

variar la proporción calculada de la cantidad de código generado para la información no cuantificada de acuerdo con el tamaño supuesto de la etapa de cuantificación; y

determinar la cantidad de código objetivo de la imagen objetivo de codificación usando la proporción variada de la cantidad de código generado.

4. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 3, en el que la etapa de determinar una cantidad de código objetivo incluye:

variar la proporción calculada de la cantidad de código generado para la información no cuantificada de acuerdo con el tamaño supuesto de la etapa de cuantificación, usando una función que define una relación entre el tamaño de la etapa de cuantificación y la proporción de la cantidad de código generado para la información no cuantificada.

5. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 4, en el que:

la función está formada por líneas rectas que tienen diferentes gradientes que corresponden a diferentes intervalos de valores del tamaño de la etapa de cuantificación.

6. El método de control de velocidad binaria de codificación de acuerdo con la reivindicación 4, en el que:

la función se determina basándose en la proporción calculada de la cantidad de código generado para la información no cuantificada y un tamaño de la etapa de cuantificación usado en la codificación de la imagen que ha sido codificada.

7. Un aparato de control de velocidad binaria de codificación usado en codificación de vídeo en el cual se usan de manera intercambiable predicción intratrama y predicción intertrama, comprendiendo el aparato:

-un dispositivo que mide una cantidad de código generado para información cuantificada para una imagen que ha 65 sido codificada;

-un dispositivo que mide una cantidad de código generado para información no cuantificada para la imagen que ha sido codificada;

-un dispositivo que calcula una proporción de la cantidad de código generado para la información no cuantificada a 5 la cantidad total de código generado, basándose en las cantidades de código medidas anteriormente; y

-un dispositivo que determina una cantidad de código objetivo de una imagen objetivo de codificación:

calculando un índice complejo multiplicando una cantidad de código generado para la imagen que ha sido 10 codificada, por un promedio de un tamaño de la etapa de cuantificación en la codificación relevante;

determinando la cantidad de código objetivo de la imagen objetivo de codificación usando la cantidad estimada de código generado.

8. Un programa de control de velocidad binaria de codificación mediante el cual un ordenador ejecuta una operación para implementar el método de control de velocidad binaria de codificación de acuerdo con la reivindicación 1.

9. Un medio de almacenamiento legible por ordenador que almacena un programa de control de velocidad binaria de codificación mediante el cual un ordenador ejecuta una operación para implementar el método de control de 25 velocidad binaria de codificación de acuerdo con la reivindicación 1.

Patentes similares o relacionadas:

Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, aparato de codificación de imágenes, aparato de descodificación de imágenes y aparato de codificación / descodificación de imágenes, del 27 de Mayo de 2020, de Sun Patent Trust: Un procedimiento de codificación de imágenes que comprende: dividir (S201) una imagen en mosaicos; codificar (S202) los mosaicos para […]

Codificación y decodificación de vídeo a partir de un epítome, del 22 de Abril de 2020, de Orange: Procedimiento de codificación de una secuencia de imágenes, que implementa las siguientes etapas, para al menos una imagen actual de dicha secuencia: - construcción […]

Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Un método de descodificación para descodificar una imagen digital dividida en bloques, comprendiendo el método: seleccionar un bloque objetivo […]

Codificación de mapas de significado y bloques de coeficiente de transformada, del 8 de Enero de 2020, de GE Video Compression, LLC: Decodificador para decodificar un flujo de datos para reconstruir una versión reconstruida de una matriz de muestras , configurada para extraer […]

Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, y dispositivo de decodificación de imágenes, del 1 de Enero de 2020, de Sun Patent Trust: Un procedimiento de codificación para codificar bloques de imágenes por medio de inter predicción en base a imágenes de referencia codificadas […]

Método de codificación de imagen, método de decodificación de imagen, aparato de codificación de imagen y aparato de decodificación de imagen, del 1 de Enero de 2020, de Sun Patent Trust: Un método de codificación de imagen para codificar bloques de imágenes por medio de inter predicción basada en imágenes de referencia codificadas […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]