PROCEDIMIENTO Y DISPOSITIVO PARA LA CODIFICACIÓN DE IMÁGEN EN MOVIMIENTO.
Un procedimiento de codificación de vídeo para realizar codificación predictiva por compensación de movimiento en una imagen de vídeo de entrada que tiene luminancia (Y) y dos diferencias de color (Cr,
Cb) que comprende: la selección de una combinación a partir de una pluralidad de combinaciones indexadas de una imagen de referencia, un factor de ponderación preparado para cada luminancia y dos diferencias de color y un desplazamiento preparado para cada luminancia y dos diferencias de color para un bloque que se codificará de la imagen de vídeo de entrada; la obtención de información de índice (215) que indica la combinación indexada seleccionada; la generación de una imagen de predicción de compensación de movimiento (212) para el bloque que se codificará añadiendo el desplazamiento a la imagen de referencia multiplicado por el factor de ponderación, según un vector de movimiento (214) para el bloque que se codificará; la generación de una señal de error de predicción para el bloque que se codificará calculando un error entre la imagen de vídeo de entrada y la imagen de predicción de compensación de movimiento; la generación cuantificada de un coeficiente de transformación ortogonal (210) para el bloque que se codificará sometiendo la señal de error de predicción a transformación ortogonal y cuantificación; y la codificación del coeficiente de transformación ortogonal cuantificado, la información del vector de movimiento y la información de índice
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2003/004992.
Solicitante: KABUSHIKI KAISHA TOSHIBA.
Nacionalidad solicitante: Japón.
Dirección: 1-1, SHIBAURA 1-CHOME, MINATO-KU TOKYO 105-8001 JAPON.
Inventor/es: KIKUCHI,YOSHIHIRO, KOTO,SHINICHIRO, CHUJOH,TAKESHI.
Fecha de Publicación: .
Fecha Solicitud PCT: 18 de Abril de 2003.
Fecha Concesión Europea: 25 de Agosto de 2010.
Clasificación PCT:
- H04N7/32
Clasificación antigua:
- H04N7/32
Países PCT: Austria, Bélgica, Suiza, Alemania, España, Francia, Reino Unido, Italia, Liechtensein, Países Bajos, Suecia, Finlandia, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.
Fragmento de la descripción:
Campo técnico
La presente invención se refiere a un procedimiento y aparato de codificación/decodificación de vídeo que codifica/decodifica un vídeo de fundido y vídeo de disolución, en particular, a alta eficacia.
Técnica anterior
La codificación intertrama predictiva de compensación de movimiento se usa como uno de los modos de codificación en un esquema estándar de codificación de vídeo como ITUTH.261, H.263, ISO/IEC MPEG-2 o MPEG-4. Como modelo predictivo en codificación intertrama predictiva de compensación de movimiento, se usa un modelo que muestra la más alta eficacia predictiva cuando no se usa cambio de brillo en la dirección de tiempo. En el caso de un vídeo de fundido que cambia en el brillo de imágenes, no existe ningún procedimiento conocido hasta ahora que realice una predicción apropiada frente a un cambio en el brillo de imágenes cuando, por ejemplo, una imagen normal aparece a partir de una imagen en negro. Con el fin de mantener también la calidad de imagen en un vídeo de fundido se requiere, por tanto, un gran número de bits.
Con el fin de resolver este problema, por ejemplo, en la patente japonesa nº 3.166.716, "Codificador de vídeo de contramedida de fundido y procedimiento de codificación", se detecta una parte de vídeo de fundido para cambiar la asignación del número de bits. Más específica-mente, en el caso de un vídeo de fundido de cierre, se asigna un gran número de bits a la parte de inicio de fundido de cierre que cambia en luminancia. En general, la última parte de fundido de cierre se convierte en una imagen monocroma, y con ello puede codificarse fácilmente. Por este motivo, el número de bits asignados a esta parte se reduce. Esto hace posible mejorar la calidad global de imagen sin aumentar excesivamente el número total de bits.
En la patente japonesa nº 2.938.412, "Procedimiento de compensación de cambio de luminancia de vídeo, aparato de codificación de vídeo, aparato de decodificación de vídeo, medio de grabación en el que se registra el programa de codificación o decodificación de vídeo y medio de grabación en el que se registran datos codificados de vídeo", se propone un esquema de codificación consistente en copiar apropiadamente un vídeo de fundido compensando una imagen de referencia de acuerdo con dos parámetros, que son, una cantidad de cambio de luminancia y una cantidad de cambio de contraste.
En Thomas Wiegand y Berand Girod, "Multi-frame motion-compensated prediction for video transmission", Kluwer Academic Publishers 2001, se propone un esquema de codificación basado en una pluralidad de memorias intermedias de tramas. En este esquema, se ha realizado un intento para mejorar la eficacia predictiva generando selectivamente una imagen de predicción a partir de una pluralidad de tramas de referencia contenidas en las memorias intermedias
de tramas.
Según las técnicas convencionales, con el fin de codificar un vídeo de fundido o un vídeo de disolución mientras se mantiene una alta calidad de imagen, se requiere un gran número de bits. Por tanto, no puede esperarse una mejora en la eficacia de codificación.
Descripción de la invención
Un objeto de la presente invención es proporcionar un procedimiento y aparato de codificación de vídeo que pueda codificar un vídeo que cambie de luminancia con el tiempo, por ejemplo, un vídeo de fundido o vídeo de disolución, en particular, a alta eficacia. La invención se define mediante las reivindicaciones 1 y 2.
Breve descripción de los dibujos Mejor modo de realizar la invención
La FIG. 1 es un diagrama de bloques que muestra la configuración de un aparato de codificación de vídeo según la primera forma de realización de la presente invención; la FIG. 2 es un diagrama de bloques que muestra la configuración detallada de un generador de imágenes de predicción/memoria de tramas en la FIG. 1; la FIG. 3 es una vista que muestra un ejemplo de una tabla de combinaciones de números de tramas de referencia y parámetros predictivos, que se usa en la primera forma de realización; la FIG. 4 es un organigrama que muestra un ejemplo de una secuencia para seleccionar un esquema predictivo (una combinación de un número de trama de referencia y un parámetro predictivo) para cada macrobloque y para determinar un modo de codificación en la primera forma de realización; la FIG. 5 es un diagrama de bloques que muestra la configuración de un aparato de decodificación de vídeo según la primera forma de realización; la FIG. 6 es un diagrama de bloques que muestra la configuración detallada del generador de imágenes de predicción/memoria de tramas de la FIG. 5; la FIG. 7 es una vista que muestra un ejemplo de una tabla de combinaciones de parámetros predictivos en un caso en el que el número de tramas de referencia es uno y se envía un número de trama de referencia como información de modo según la segunda forma de realización de la presente invención; la FIG. 8 es una vista que muestra un ejemplo de una tabla de combinaciones de parámetros predictivos en un caso en el que el número de tramas de referencia es dos y se envía un número de trama de referencia como información de modo según la segunda forma de realización; la FIG. 9 es una vista que muestra un ejemplo de una tabla de combinaciones de números de imágenes de referencia y parámetros predictivos en un caso en el que el número de trama de referencia es uno según la tercera forma de realización de la presente invención; la FIG. 10 es una vista que muestra un ejemplo de una tabla para sólo señales de luminancia según la tercera forma de realización; la FIG. 11 es una vista que muestra un ejemplo de una sintaxis para cada bloque cuando se va a codificar información de índice; la FIG. 12 es una vista que muestra un ejemplo específico de un flujo de bits codificados cuando se va a generar una imagen de predicción es usando una imagen de referencia; la FIG. 13 es una vista que muestra un ejemplo específico de un flujo de bits codificados cuando se va a generar una imagen de predicción usando dos imágenes de referencia; la FIG. 14 es una vista que muestra un ejemplo de una tabla de números de tramas de referencia, número de campo de referencias y parámetros predictivos cuando la información que se va a codificar es un campo superior según la cuarta forma de realización de la presente invención; y la FIG. 15 es una vista que muestra un ejemplo de una tabla de números de tramas de referencia, número de campo de referencias y parámetros predictivos cuando la información que se va a codificar es un campo inferior según la cuarta forma de realización de la presente invención.A continuación se describirán las formas de realización de la presente invención con referencia a las diversas vistas de los dibujos adjuntos.
[Primera forma de realización] (Sobre el lado de codificación)
La FIG. 1 muestra la configuración de un aparato de codificación de vídeo según la primera forma de realización de la presente invención. Se introduce una señal de vídeo 100 en el aparato de codificación de vídeo, por ejemplo, sobre una base de trama. La señal de vídeo 100 se introduce en un sustractor 101. El sustractor 101 calcula la diferencia entre la señal de vídeo 100 y una señal de imagen de predicción 212 para generar una señal de error predictivo. Un conmutador de selección de modo 102 selecciona la señal de error predictivo o la señal de vídeo
100. Un transformador ortogonal 103 somete la señal seleccionada a una transformación ortogonal, por ejemplo, una transformada de coseno discreta (DCT). El transformador ortogonal 103 genera información de coeficiente de transformación ortogonal, por ejemplo, información de coeficiente de DCT. La información de coeficiente de transformación ortogonal es cuantificada por un cuantificador 104 y se ramifica en dos trayectorias. Una información de cuantificación de coeficiente de transformación ortogonal 210 ramificada en dos trayectorias es guiada hacia un codi
ficador de longitud variable 111.
La otra información de cuantificación de coeficiente de transformación ortogonal 210 ramificada en las dos trayectorias se somete en secuencia a procesamiento inverso al del cuantificador 104 y el transformador ortogonal 103 mediante un descuantificador o cuantificador inverso 105 y transformador ortogonal inverso 106 para reconstruirse en una señal de error predictivo. Posteriormente, un sumador 107 suma la señal de error predictivo reconstruida...
Reivindicaciones:
1. Un procedimiento de codificación de vídeo para realizar codificación predictiva por compensación de movimiento en una imagen de vídeo de entrada que tiene luminancia (Y) y dos diferencias de color (Cr, Cb) que comprende:
la selección de una combinación a partir de una pluralidad de combinaciones indexadas de una imagen de referencia, un factor de ponderación preparado para cada luminancia y dos diferencias de color y un desplazamiento preparado para cada luminancia y dos diferencias de color para un bloque que se codificará de la imagen de vídeo de entrada;
la obtención de información de índice (215) que indica la combinación indexada seleccionada;
la generación de una imagen de predicción de compensación de movimiento (212) para el bloque que se codificará añadiendo el desplazamiento a la imagen de referencia multiplicado por el factor de ponderación, según un vector de movimiento (214) para el bloque que se codificará;
la generación de una señal de error de predicción para el bloque que se codificará
calculando un error entre la imagen de vídeo de entrada y la imagen de predicción de
compensación de movimiento;
la generación cuantificada de un coeficiente de transformación ortogonal (210) para
el bloque que se codificará sometiendo la señal de error de predicción a transformación
ortogonal y cuantificación; y
la codificación del coeficiente de transformación ortogonal cuantificado, la información del vector de movimiento y la información de índice.
2. Un aparato de codificación de vídeo para realizar codificación predictiva de compensación de movimiento en una imagen de vídeo de entrada que tiene una luminancia (Y) y dos diferencias de color (Cr, Cb) que comprende:
medios para seleccionar una combinación a partir de una pluralidad de combinaciones indexadas de una imagen de referencia, un factor de ponderación preparado para cada luminancia y dos diferencias de color y un desplazamiento preparado para cada luminancia y dos diferencias de color para un bloque que se codificará de la imagen de vídeo de entrada;
medios (203) para obtener información de índice (215) que indica la combinación in
dexada seleccionada; medios (204) para generar una imagen de predicción de compensación de movimiento para el bloque que se codificará añadiendo el desplazamiento a la imagen de referencia multiplicado por el factor de ponderación, según un vector de movimiento (214) para el bloque que se codificará;
medios (101) para generar una señal de error de predicción para el bloque que se 5 codificará calculando un error entre la imagen de vídeo de entrada y la imagen de predicción de compensación de movimiento;
medios (103, 104) para generar cuantificado un coeficiente de transformación ortogonal para el bloque que se codificará sometiendo la señal de error de predicción a transformación ortogonal y cuantificación; y
10 medios (111) para codificar el coeficiente de transformación ortogonal cuantificado, la información del vector de movimiento y la información de índice.
Patentes similares o relacionadas:
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Ponderación adaptativa de imágenes de referencia en codificación de vídeo, del 27 de Marzo de 2019, de InterDigital VC Holdings, Inc: Un aparato de codificación para producir datos de vídeo para una imagen que tiene una pluralidad de bloques de imagen, incluyendo los datos de […]
Un método y un aparato para descodificar/codificar una señal de video, del 17 de Mayo de 2017, de LG ELECTRONICS INC.: Un método para descodificar datos de video multi-visualización en una corriente de video multi-visualización, que comprende: recibir la corriente […]
Procedimiento y dispositivo de decodificación que utiliza codificación subbanda de una unidad de conversión de frecuencia, del 26 de Abril de 2017, de SK TELECOM CO., LTD.: Aparato de decodificación de video que comprende un decodificador para recibir datos codificados para reconstruir un bloque de conversión de frecuencia transformado […]
Método de codificación escalable de vídeo y métodos de decodificación que utilizan predicción ponderada, dispositivos para ello, programas para ello, y medio de grabación donde se graba el programa, del 19 de Abril de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación escalable de video, que comprende: - para cada una de las regiones de imagen de referencia: calcular un coeficiente de […]
Método y dispositivo de control de codificación de predicción intra, su programa, y medio de almacenamiento que contiene programa, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de control de codificación de predicción intra usado en codificación de predicción intra que tiene una pluralidad de modos de la predicción […]
Método de codificación de imágenes y aparato de codificación de imágenes, del 15 de Febrero de 2017, de Sun Patent Trust: Un método de codificación de imágenes para generar una corriente de bits codificada mediante la codificación de una imagen utilizando una descripción de memoria […]