MÉTODO Y DISPOSITIVO DE ESTIMACIÓN DE LA CANTIDAD DE CÓDIGO, SU PROGRAMA Y MEDIO DE ALMACENAMIENTO.

Método de estimación de la cantidad de código, usado en la codificación de vídeo,

para estimar una cantidad de código generada en un primer método de codificación de fuente de información en el que puede seleccionarse una pluralidad de tamaños de transformación ortogonal y se realiza una codificación reordenando coeficientes de transformación ortogonal bidimensionales cuantificados para tener una forma unidimensional, en el que la cantidad de código se estima usando un segundo método de codificación de fuente de información que tiene un coste computacional inferior al primer método de codificación de fuente de información y realiza la codificación usando una tabla de codificación de longitud variable, y el método de estimación de la cantidad de código comprende las etapas de: realizar una reordenación, cuando se codifica, según dicho primer método de codificación de fuente de información, de valores cuantificados de coeficientes de una transformación ortogonal de mayor tamaño que un tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información, reordenando los valores cuantificados para tener una forma unidimensional en el orden definido en el primer método de codificación de fuente de información, en el que en la forma unidimensional, se obtienen conjuntos de Ejecución-Nivel del número Ejecución de coeficientes &8220;0&8221; sucesivos y un coeficiente significativo Nivel que los sigue, y se almacenan los conjuntos Ejecución-Nivel obtenidos; con el fin de dividir los conjuntos Ejecución-Nivel en una pluralidad de grupos de conjuntos Ejecución-Nivel, calcular el número de grupos basándose en una proporción entre un área de transformación ortogonal correspondiente al tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información y un área de transformación ortogonal seleccionada mediante dicho primer método de codificación de fuente de información; clasificar los conjuntos Ejecución-Nivel en grupos cuyo número es dicho número de grupos; dividir la Ejecución de cada conjunto Ejecución-Nivel entre el número de grupos, y fijar el cociente obtenido como Ejecución del conjunto Ejecución-Nivel; determinar una longitud de código de cada conjunto Ejecución-Nivel en cada grupo haciendo referencia a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información; y calcular la suma total de las longitudes de código determinadas, en el que se estima que la cantidad de código generada en el primer método de codificación de fuente de información es la suma total de las longitudes de código de todos los grupos.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2008/054158.

Solicitante: NIPPON TELEGRAPH AND TELEPHONE CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 3-1, OTEMACHI 2-CHOME CHIYODA-KU TOKYO 100-8116 JAPON.

Inventor/es: TANIDA,Ryuichi, SHIMIZU,Atsushi.

Fecha de Publicación: .

Fecha Solicitud PCT: 7 de Marzo de 2008.

Clasificación PCT:

  • H03M7/40 ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Conversión en, o a partir de códigos la longitud variable, p. ej. código Shanno-Fano, código Huffman, código Morse.
  • H04N1/41 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 1/00 Exploración, transmisión o reproducción de documentos o similares, p. ej. transmisión facsímil; Sus detalles. › Reducción del ancho de banda o de la redundancia (para la exploración H04N 1/17).
  • H04N7/26
  • H04N7/30

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.

PDF original: ES-2369214_T3.pdf

 


Fragmento de la descripción:

Método y dispositivo de estimación de la cantidad de código, su programa y medio de almacenamiento

Campo de la invención

La presente invención se refiere a un método de estimación de la cantidad de código y a un dispositivo, programa, y medio de almacenamiento correspondientes en la codificación de vídeo en el que se somete una imagen de vídeo a una transformación ortogonal y codificación usando código de longitud variable.

Se reivindica prioridad de la solicitud de patente japonesa n.º 2007-064283, presentada el 14 de marzo de 2007, cuyo contenido se incorpora al presente documento como referencia.

Técnica anterior

En la mayoría de los métodos de codificación de vídeo recientes, cada trama se divide en pequeñas áreas, y se somete una imagen diferencial basada en una imagen predicha a una transformación ortogonal, cuantificación, y después codificación de entropía, comprimiendo así los datos de vídeo.

En la norma de codificación de vídeo H.264 (véase el documento no de patente 1) como formato de codificación de vídeo dominante actual, puede seleccionarse no sólo un método de codificación de longitud variable adaptativa según el contexto (“CAVLC”) para realizar una codificación de entropía haciendo referencia a una tabla, sino también un método de codificación aritmética binaria adaptativa según el contexto (“CABAC”) que puede mejorar adicionalmente la eficacia de codificación.

La CABAC anterior es un método de codificación que puede comprimir una señal estacionaria hasta un límite lógico, y por tanto es una técnica esencial para la codificación altamente eficaz. Sin embargo, en comparación con la CAVLC, el coste computacional de CABAC es muy alto (véase el documento no de patente 2) .

Cuando se codifica una imagen de vídeo y se genera un flujo que puede distribuirse en una red que tiene una banda de transmisión limitada, es necesario producir una cantidad constante de código generado por unidad de tiempo para no superar la banda limitada. Generalmente, se ejecuta un control de tasa de transmisión para controlar la cantidad de código generado variando el tamaño de la etapa de cuantificación (“Qetapa”) .

Por ejemplo, se codifica cada bloque objetivo de codificación; se calcula la cantidad de código generado correspondiente; y se ajusta la Qetapa del siguiente bloque basándose en el resultado calculado, manteniendo así una cantidad constante de código generado.

Cuando se usa CABAC, se requiere una cantidad considerable de tiempo para obtener la cantidad de código generado, lo que aumenta un retraso en la codificación. En un método propuesto conocido para reducir el retraso, se aproxima la relación entre Qetapa y la cantidad de código generado usando una función, de modo que se estima la cantidad de código generado (véase el documento de patente 1) .

Sin embargo, usar una función aproximada produce una variación en la precisión de medición dependiendo de cada imagen de vídeo. Con el fin de realizar la estimación con una precisión mejorada, puede usarse CAVLC que tiene un coste computacional menor que CABAC para estimar la cantidad de código (es decir, estimación de la cantidad de código) . En tal caso, se usa un resultado obtenido realizando la codificación de longitud variable, y por tanto puede ejecutarse una estimación de la cantidad de código superior.

Las figuras 7A y 7B muestran un diagrama de flujo de una operación de codificación mediante el cual puede usarse CAVLC para la estimación de la cantidad de código de CABAC. En este caso, la figura 7A muestra una rutina principal, y la figura B muestra un proceso de CABAC.

En primer lugar, se explicará la rutina principal (etapas de S101 a S111) en la figura 7A.

En primer lugar se determina el modo de inter-predicción y el modo de intra-predicción (véanse las etapas S101 y S102) .

A continuación, se determina el modo de predicción realizando una intra/inter-determinación (véase la etapa S103) , y se calcula una predicción residual para el modo determinado (véase la etapa S104) y se somete a DCT (véase la etapa S105) .

Se aplica la cuantificación a coeficientes de transformada de DCT usando una Qetapa suministrada (véase la etapa S106) .

Se ordenan los coeficientes de transformada cuantificados en una forma unidimensional, y se suministra información de coeficientes a una unidad de cálculo de CABAC. Simultáneamente, se realiza la estimación de la cantidad de código basándose en la información de coeficientes (proceso de precodificación) (véase la etapa S107) .

Los coeficientes cuantificados también se someten a una cuantificación inversa (véase la etapa S108) e IDCT (véase la etapa S109) , y entonces se añaden a una imagen predicha, generando así una imagen decodificada (véase la etapa S 110) .

Finalmente, se somete la imagen decodificada a un proceso de filtrado (véase la etapa S111) .

A continuación, se explicará el proceso de CABAC (véanse las etapas de S121 a S125) en la figura 7B.

En primer lugar, se espera (véanse las etapas de S121 a S122) , la recepción de información de coeficientes generada en el proceso (S107) de precodificación. Cuando se reciben los datos relevantes, se realiza una etapa de CABAC (véase la etapa S123) , y se transmite un flujo generado (véase la etapa S124) . Finalmente, se envía la cantidad de código generado a un controlador de cantidad de código (véase la etapa S125) .

La figura 8 muestra un ejemplo de la estructura para implementar la operación anterior.

El dispositivo mostrado tiene una unidad 101 de determinación de modo de inter-predicción, una unidad 102 de determinación de modo de intra-predicción, un selector 103 de modo de predicción, un conmutador 104, un substractor 105, una unidad 106 DCT, un cuantificador 107, un controlador 108 de cantidad de código, un procesador 109 de precodificación, un codificador 110 de entropía, un cuantificador inverso 111, una unidad 112 IDCT, un sumador 113, una memoria intermedia 114 de almacenamiento de imagen decodificada, un filtro 115, y una memoria intermedia 116 de almacenamiento de imagen de referencia.

La unidad 101 de determinación de modo de inter-predicción realiza la predicción compensada de movimiento usando una imagen de referencia en la memoria intermedia 116 de almacenamiento de imagen de referencia, determina el modo de inter-predicción, envía información del modo de predicción al selector 103 de modo de predicción, y también envía una imagen predicha al conmutador 104.

La unidad 102 de determinación de modo de intra-predicción determina el modo de intra-predicción usando una imagen decodificada en la memoria intermedia 114 de almacenamiento de imagen decodificada, envía información de modo de predicción al selector 103 de modo de predicción, y también envía una imagen predicha al conmutador 104.

El selector 103 de modo de predicción determina el modo de predicción, y selecciona uno del modo de intrapredicción y el modo de inter-predicción enviando una señal de control al conmutador 104.

Basándose en la señal de control del selector 103 de modo de predicción, el conmutador 104 selecciona una de una imagen inter-predicha enviada desde la unidad 101 de determinación de modo de inter-predicción y una imagen intra-predicha enviada desde la unidad 102 de determinación de modo de intra-predicción.

El substractor 105 genera una imagen residual predicha calculando la diferencia entre una imagen original y una imagen predicha, y envía la imagen generada a la unidad 106 DCT.

La unidad 106 DCT aplica una transformada DCT a la imagen residual predicha enviada, y envía la imagen al cuantificador 107.

El cuantificador 107 realiza la cuantificación de los coeficientes de transformada de DCT usando el tamaño de etapa de cuantificación Qetapa enviado desde el controlador 108 de cantidad de código, y envía el resultado cuantificado al procesador 109 de precodificación y al cuantificador inverso 111.

Basándose en una cantidad de código estimada (cantidad de código estimada) enviada desde el procesador 109 de precodificación, el controlador 108 de cantidad de código calcula Qetapa del siguiente macrobloque, y envía la Qetapa calculada al cuantificador 107 y al cuantificador inverso 111. El... [Seguir leyendo]

 


Reivindicaciones:

1. Método de estimación de la cantidad de código, usado en la codificación de vídeo, para estimar una cantidad de código generada en un primer método de codificación de fuente de información en el que puede seleccionarse una pluralidad de tamaños de transformación ortogonal y se realiza una codificación reordenando coeficientes de transformación ortogonal bidimensionales cuantificados para tener una forma unidimensional, en el que la cantidad de código se estima usando un segundo método de codificación de fuente de información que tiene un coste computacional inferior al primer método de codificación de fuente de información y realiza la codificación usando una tabla de codificación de longitud variable, y el método de estimación de la cantidad de código comprende las etapas de:

realizar una reordenación, cuando se codifica, según dicho primer método de codificación de fuente de información, de valores cuantificados de coeficientes de una transformación ortogonal de mayor tamaño que un tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información, reordenando los valores cuantificados para tener una forma unidimensional en el orden definido en el primer método de codificación de fuente de información, en el que en la forma unidimensional, se obtienen conjuntos de Ejecución-Nivel del número Ejecución de coeficientes “0” sucesivos y un coeficiente significativo Nivel que los sigue, y se almacenan los conjuntos Ejecución-Nivel obtenidos;

con el fin de dividir los conjuntos Ejecución-Nivel en una pluralidad de grupos de conjuntos Ejecución-Nivel, calcular el número de grupos basándose en una proporción entre un área de transformación ortogonal correspondiente al tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información y un área de transformación ortogonal seleccionada mediante dicho primer método de codificación de fuente de información;

clasificar los conjuntos Ejecución-Nivel en grupos cuyo número es dicho número de grupos;

dividir la Ejecución de cada conjunto Ejecución-Nivel entre el número de grupos, y fijar el cociente obtenido como Ejecución del conjunto Ejecución-Nivel;

determinar una longitud de código de cada conjunto Ejecución-Nivel en cada grupo haciendo referencia a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información; y calcular la suma total de las longitudes de código determinadas, en el que se estima que la cantidad de código generada en el primer método de codificación de fuente de información es la suma total de las longitudes de código de todos los grupos.

2. Método de estimación de la cantidad de código según la reivindicación 1, en el que la etapa de clasificar los conjuntos Ejecución-Nivel en los grupos incluye asignar un número de índice a cada conjunto Ejecución-Nivel en el orden de detección de los conjuntos Ejecución-Nivel, dividir cada número de índice entre el número de grupos, y clasificar los conjuntos Ejecución-Nivel que tienen el mismo resto para la división en el mismo grupo.

3. Método de estimación de la cantidad de código según la reivindicación 1, en el que la etapa de clasificar los conjuntos Ejecución-Nivel en los grupos incluye acumular un valor obtenido añadiendo 1 a cada Ejecución en el orden de detección de los conjuntos Ejecución-Nivel, dividir cada valor acumulado entre el número de grupos, y clasificar los conjuntos Ejecución-Nivel que tienen el mismo resto para la división en el mismo grupo.

4. Dispositivo de estimación de la cantidad de código, usado en la codificación de vídeo, para estimar una cantidad de código generada en un primer método de codificación de fuente de información en el que puede seleccionarse una pluralidad de tamaños de transformación ortogonal y se realiza la codificación reordenando coeficientes de transformación ortogonal bidimensionales cuantificados para tener una forma unidimensional, en el que se estima la cantidad de código usando un segundo método de codificación de fuente de información que tiene un coste computacional inferior al del primer método de codificación de fuente de información y realiza la codificación usando una tabla de codificación de longitud variable, y el dispositivo de estimación de la cantidad de código comprende:

un dispositivo que realiza la reordenación, cuando se codifica, según dicho primer método de codificación de fuente de información, de valores cuantificados de coeficientes de una transformación ortogonal de mayor tamaño que un tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información, reordenando los valores cuantificados para tener una forma unidimensional en el orden definido en el primer método de codificación de fuente de información, en el que para la forma unidimensional, el dispositivo obtiene conjuntos Ejecución-Nivel del número Ejecución de coeficientes “0” sucesivos y un coeficiente significativo Nivel que los sigue, y almacena los conjuntos Ejecución-Nivel obtenidos;

un dispositivo que calcula, con el fin de dividir los conjuntos Ejecución-Nivel en una pluralidad de grupos de conjuntos Ejecución-Nivel, el número de grupos basándose en una proporción entre un área de transformación ortogonal correspondiente al tamaño de transformación ortogonal asignado a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información y un área de transformación ortogonal seleccionada mediante dicho primer método de codificación de fuente de información;

un dispositivo que clasifica los conjuntos Ejecución-Nivel en grupos cuyo número es dicho número de grupos;

un dispositivo que divide la Ejecución de cada conjunto Ejecución-Nivel entre el número de grupos, y fija el cociente obtenido como Ejecución del conjunto Ejecución-Nivel;

un dispositivo que determina una longitud de código de cada conjunto Ejecución-Nivel en cada grupo haciendo referencia a dicha tabla de codificación de longitud variable según dicho segundo método de codificación de fuente de información; y un dispositivo que calcula la suma total de las longitudes de código determinadas, en el que se estima que la cantidad de código generada en el primer método de codificación de fuente de información es la suma total de las longitudes de código de todos los grupos.

5. Programa informático que comprende código de software adaptado para realizar el método según la reivindicación 1 cuando se ejecuta en un ordenador.

6. Medio de almacenamiento legible por ordenador que almacena un programa informático que comprende código de software adaptado para realizar el método según la reivindicación 1 cuando se ejecuta en un ordenador.

 

Patentes similares o relacionadas:

Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]

Imagen de 'Filtro de desbloqueo condicionado por el brillo de los píxeles'Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .