CODIFICACIÓN Y DECODIFICACIÓN SENSIBLES AL CONTEXTO DE UN FLUJO DE DATOS DE VÍDEO.
Procedimiento para comprimir un flujo de datos de vídeo en el que los datos de vídeo de una imagen se representan mediante símbolos de imagen,
con la etapa de procedimiento: - elección de los símbolos de imagen a partir de una memoria de símbolos (17), caracterizado por las siguientes etapas de procedimiento: - clasificación de los símbolos de imagen con ayuda de un conmutador de contexto (18) entre distintos ramales de codificación (19) para formar grupos de símbolos de imagen, que están asignados en cada caso a distintos contextos, llevándose el conmutador de contexto (18) en un instante predeterminado a una posición predeterminada y accionándose a continuación en función del correspondiente contexto del símbolo de imagen a transmitir, - codificación de entropía de los grupos de símbolos de imagen y composición de los datos emitidos por los ramales de codificación (19) para formar un flujo de datos de vídeo comprimido, en el que los símbolos de imagen existentes en los distintos ramales de codificación (19) se transforman mediante un codificador de longitud de recorrido (23) asociado al correspondiente ramal de codificación (19) en símbolos de longitud de recorrido y en el que los símbolos de longitud de recorrido se transforman, con ayuda de un código de entropía adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto mediante un codificador de entropía (24) en símbolos de código del código de entropía
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/DE2003/000306.
Solicitante: SIEMENS AKTIENGESELLSCHAFT.
Nacionalidad solicitante: Alemania.
Dirección: WITTELSBACHERPLATZ 2 80333 MUNCHEN ALEMANIA.
Inventor/es: PANDEL, JURGEN, KUTKA, ROBERT, BASE,GERO, ILLGNER-FEHNS,KLAUS.
Fecha de Publicación: .
Fecha Solicitud PCT: 4 de Febrero de 2003.
Fecha Concesión Europea: 1 de Septiembre de 2010.
Clasificación Internacional de Patentes:
- H04N7/26A4K
- H04N7/26A4Q
- H04N7/26A4V
- H04N7/26A6Q
- H04N7/26A8T
- H04N7/50
Clasificación PCT:
- H04N7/34
- H04N7/50
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.
Fragmento de la descripción:
Codificación y decodificación sensibles al contexto de un flujo de datos de vídeo.
La invención se refiere a procedimientos para comprimir y descomprimir un flujo de datos de vídeo. La invención se refiere además a dispositivos para realizar los procedimientos.
Tales procedimientos de compresión son necesarios en particular para transportar datos de vídeo a través de redes de datos orientadas a paquetes, ya que la anchura de banda de redes de datos orientadas a paquetes está estrictamente limitada. Se han desarrollado por lo tanto procedimientos estandarizados, como por ejemplo MPEG-1, MPEG-2 y H.26X con los que pueden comprimirse datos de vídeo. Los procedimientos estandarizados funcionan con la codificación híbrida compensadora de movimiento, una combinación de reducción de redundancia sin pérdidas y de reducción de la irrelevancia con pérdidas.
La mayoría de las veces contribuye a la compresión la llamada predicción compensadora de movimientos. La predicción compensadora de movimientos aprovecha la similitud de imágenes consecutivas, prediciendo la imagen a codificar en ese momento a partir de imágenes ya transmitidas. Puesto que la mayoría de las veces solo determinadas partes de las imágenes consecutivas se mueven, fracciona un codificador la imagen a codificar en ese momento en macrobloques rectangulares, que la mayoría de las veces tienen un tamaño de 8 x 8 ó 16 x 16 puntos de imagen. Para cada uno de estos macrobloques busca el codificador de entre las imágenes ya transmitidas macrobloques que encajan y calcula su desplazamiento respecto a los macrobloques de la imagen a codificar en ese momento. Los desplazamientos de los macrobloques se describen mediante vectores de movimiento, que codifica el codificador en base a tablas de codificación.
Puesto que la imagen a codificar en ese momento no puede construirse en todos los casos mediante el desplazamiento de macrobloques de imágenes ya transmitidas, por ejemplo cuando entran en la imagen nuevos objetos, debe transmitirse también el error de predicción desde el codificador al decodificador. Este error de predicción resulta de la diferencia entre la imagen real a codificar en ese momento y la imagen de predicción construida mediante desplazamiento de los macrobloques de imágenes precedentes.
El documento US-5764374 describe un sistema de compresión de imágenes sin pérdidas con determinación del contexto, predicción y codificación de Golomb, determinándose los parámetros del código de Golomb en función del contexto y de la evolución en el tiempo.
Puesto que los errores de predicción de puntos de imagen contiguos tienen correlación en zonas no predecibles o malamente predecibles, se realiza para reducir la redundancia a continuación una transformación del error de predicción. En función del procedimiento de compresión se utilizan al respecto diversos procedimientos de transformación. Son usuales por ejemplo la transformación discreta del Wavelet (DWT) o la transformación cosenoidal discreta (DCT). Mediante la transformación cosenoidal discreta se transforma cada macrobloque de 8 x 8 puntos de imagen en una matriz de 8 x 8 coeficientes espectrales. Entonces representa el primer coeficiente la luminosidad media del bloque, con lo que el mismo se denomina también "componente de continua" o "coeficiente de CC". Los demás coeficientes reflejan, al crecer el número del índice, componentes de más alta frecuencia de la distribución de la luminosidad y se denominan por lo tanto "componentes de alterna" o "coeficientes de CA".
Para reducir aún más la velocidad de datos necesaria, se cuantifican los coeficientes espectrales antes de continuar con la codificación. Cuando la señal de error de predicción varía sólo lentamente de un punto de la imagen a otro, entonces tras la cuantificación la mayoría de los coeficientes espectrales de alta frecuencia son iguales a cero y por lo tanto no han de transmitirse.
Puesto que tras la transformación la mayoría de los coeficientes espectrales son cero, se reúnen los coeficientes espectrales en la continuación del procedimiento mediante codificación por longitud de recorrido y a continuación se codifican con ayuda de una tabla de códigos con palabras de código de longitud variable.
Partiendo de este estado de la técnica, la invención tiene como tarea básica indicar procedimientos de compresión y descompresión de datos de vídeo que presenten un mayor grado de compresión que los procedimientos conocidos.
Esta tarea se resuelve según la invención mediante un procedimiento para comprimir datos de vídeo en el que los datos de vídeo de una imagen se representan mediante símbolos de imagen, con las siguientes etapas de procedimiento:
- elección de los símbolos de imagen a partir de una memoria de símbolos;
- clasificación de los símbolos de imagen con ayuda de un conmutador de contexto entre distintos ramales de codificación para formar grupos de símbolos de imagen que están asignados en cada caso a distintos contextos, llevándose el conmutador de contexto en un instante predeterminado a una posición predeterminada y accionándose a continuación en función del correspondiente contexto del símbolo de imagen a transmitir;
- codificación de entropía de los grupos de símbolos de imagen y composición de los datos emitidos por los ramales de codificación para formar un flujo de datos de vídeo comprimido.
Esta tarea se resuelve además según la invención mediante un procedimiento para descomprimir un flujo de datos de vídeo comprimido, en el que los datos de vídeo de los símbolos de imagen que forman una imagen se extraen del flujo de datos de vídeo, con las siguientes etapas de procedimiento:
- reparto del flujo de datos de vídeo en segmentos de flujo de bits, asociados en cada caso a un contexto;
- codificación de entropía de los segmentos de flujo de bits para formar grupos de símbolos de imagen; y
- transmisión de los símbolos de imagen en grupos de símbolos de imagen distribuidos entre distintos ramales de decodificación mediante un conmutador de contexto a una memoria de imagen, encontrándose el conmutador de contexto en un instante predeterminado en una posición predeterminada y accionándose a continuación en función del contexto de los símbolos de imagen.
El procedimiento para la compresión y descompresión según la invención se basa en el conocimiento de que la probabilidad de que se presente un símbolo de imagen puede depender fuertemente del correspondiente contexto. El procedimiento según la invención aprovecha esta circunstancia clasificando los símbolos de imagen en función del correspondiente contexto en los ramales de codificación. Los símbolos de imagen distribuidos entre los ramales de codificación pueden entonces codificarse de manera efectiva con un código adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto con longitud de palabra variable. Un tal código se denomina a continuación también código de entropía. Es especialmente ventajoso que pueda utilizarse entonces un código adaptado a la distribución efectiva de frecuencias de los símbolos de imagen en el correspondiente contexto.
En una forma de ejecución preferente de la invención, se distribuyen símbolos binarios entre los ramales de codificación y a continuación se someten a una codificación por longitud de recorrido, en la que se computa la cantidad de símbolos iguales consecutivos y se codifica mediante un número asociado al símbolo.
Esta forma de ejecución del procedimiento correspondiente a la invención aprovecha la circunstancia de que en un determinado contexto se presenta una gran cantidad de símbolos iguales, que puede comprimirse de manera efectiva mediante una codificación por longitud de recorrido. Dado que los símbolos de imagen se clasifican en función del correspondiente contexto en los ramales de codificación, con lo que en los ramales de codificación existen grupos de símbolos de imagen que presentan en cada caso una gran cantidad de símbolos de imagen iguales, se logra la premisa para una codificación por longitud de recorrido efectiva.
En otra forma de ejecución preferente, se utiliza en el correspondiente ramal de codificación o ramal de decodificación para el código con longitud de palabra variable un código de entropía que puede calcularse analíticamente, que durante el proceso de compresión o descompresión se adapta a la distribución de frecuencias de los símbolos de imagen en el...
Reivindicaciones:
1. Procedimiento para comprimir un flujo de datos de vídeo en el que los datos de vídeo de una imagen se representan mediante símbolos de imagen, con la etapa de procedimiento:
- elección de los símbolos de imagen a partir de una memoria de símbolos (17),
caracterizado por las siguientes etapas de procedimiento:
- clasificación de los símbolos de imagen con ayuda de un conmutador de contexto (18) entre distintos ramales de codificación (19) para formar grupos de símbolos de imagen, que están asignados en cada caso a distintos contextos, llevándose el conmutador de contexto (18) en un instante predeterminado a una posición predeterminada y accionándose a continuación en función del correspondiente contexto del símbolo de imagen a transmitir,
- codificación de entropía de los grupos de símbolos de imagen y composición de los datos emitidos por los ramales de codificación (19) para formar un flujo de datos de vídeo comprimido,
en el que los símbolos de imagen existentes en los distintos ramales de codificación (19) se transforman mediante un codificador de longitud de recorrido (23) asociado al correspondiente ramal de codificación (19) en símbolos de longitud de recorrido y en el que los símbolos de longitud de recorrido se transforman, con ayuda de un código de entropía adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto mediante un codificador de entropía (24) en símbolos de código del código de entropía.
2. Procedimiento según la reivindicación 1,
en el que los segmentos generados mediante la codificación de entropía se reúnen mediante un multiplexador (26) para formar flujo de datos de vídeo comprimido.
3. Procedimiento según la reivindicación 2,
en el que el multiplexador (26) inserta en el flujo de datos de vídeo comprimido elementos de información sobre la longitud de los segmentos de flujo de bits.
4. Procedimiento según una de las reivindicaciones 1 a 3,
en el que los ramales de codificación (19) se asignan durante el proceso de compresión, con ayuda de un sistema lógico de contexto (20, 21), adaptivamente a los contextos que se presentan de los símbolos de imagen.
5. Procedimiento según una de las reivindicaciones 1 a 4,
en el que para la conversión de los símbolos de imagen en símbolos de código se utiliza un código de entropía, que puede calcularse analíticamente, adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto.
6. Procedimiento según una de las reivindicaciones 1 a 5,
en el que para el código de entropía se utiliza el código Golomb.
7. Procedimiento según una de las reivindicaciones 1 a 6,
en el que para los datos de vídeo a comprimir se utilizan datos de textura.
8. Dispositivo para realizar un procedimiento según una de las reivindicaciones 1 a 6,
en el que una memoria de imágenes (17) lleva conectado a continuación un conmutador de contexto (18) controlado por una lógica de contexto (20, 22), mediante el que los símbolos de imagen elegidos de la memoria de imágenes (17) pueden clasificarse en distintos grupos de símbolos de imagen asociados a los correspondientes contextos y pueden llevarse a un codificador de entropía (24), y en el que el conmutador de contexto (18) distribuye los símbolos de imagen en función del contexto entre distintos ramales de codificación (19), que presentan en cada caso un codificador de entropía (24) para un código de entropía adaptado a la distribución de frecuencias de los símbolos de imágenes en el correspondiente contexto y un codificador de longitud de recorrido (23) y que por su lado de salida están conectados a un multiplexador (26).
9. Procedimiento para descomprimir un flujo de datos de vídeo comprimido,
en el que los símbolos de imagen se extraen a partir del flujo de datos de vídeo, con la etapa de procedimiento:
- reparto del flujo de datos de vídeo en segmentos de flujo de bits asociados en cada caso a un contexto, y
caracterizado por las siguientes etapas de procedimiento:
- codificación de entropía de los segmentos de flujo de bits para formar grupos de símbolos de imagen; y
- transmisión de los símbolos de imagen en grupos de símbolos de imagen distribuidos entre distintos ramales decodificadores (39) mediante un conmutador de contexto (44) a una memoria de imagen (45), encontrándose el conmutador de contexto (44) en un instante predeterminado en una posición predeterminada y accionándose a continuación en función del contexto de los símbolos de imagen,
en el que los símbolos de códigos contenidos en los segmentos del flujo de bits se transforman con ayuda de un código de entropía adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto mediante un codificador de entropía (41) en símbolos de longitud de recorrido, que a continuación se decodifican mediante un decodificador de longitud de recorrido (42) en símbolos de imagen que representan datos de vídeo de una imagen.
10. Procedimiento según la reivindicación 9,
en el que los símbolos de código están codificados en un código de entropía que puede calcularse analíticamente.
11. Procedimiento según la reivindicación 10,
en el que los símbolos de código están codificados en código Golomb.
12. Procedimiento según una de las reivindicaciones 9 a 11,
en el que los ramales decodificadores (39) están asignados adaptivamente a los contextos de los símbolos de imagen durante el proceso de descompresión con ayuda de un sistema lógico de contexto (47, 48).
13. Procedimiento según una de las reivindicaciones 9 a 12,
en el que los segmentos del flujo de bits correspondientes al flujo de datos de vídeo se distribuyen mediante un demultiplexador (38) entre ramales decodificadores (39), asociados en cada caso a un contexto.
14. Procedimiento según una de las reivindicaciones 9 a 13,
en el que el demultiplexador (38) es controlado por elementos de información insertados en el flujo de bits y que se refieren a la longitud de los segmentos del flujo de bits.
15. Procedimiento según una de las reivindicaciones 9 a 14,
en el que para los datos de vídeo se utilizan datos de textura.
16. Dispositivo para descomprimir datos de vídeo según una de las reivindicaciones 9 a 15,
en el que los segmentos de flujo de bits pueden distribuirse mediante un demultiplexador (38) entre distintos ramales decodificadores (39) asociados a los distintos contextos de los símbolos de imagen, que en cada caso presentan un decodificador de entropía (41) para un código de entropía adaptado a la distribución de frecuencias de los símbolos de imagen en el correspondiente contexto, y a los que está conectado a continuación un conmutador de contexto (44) y una memoria de imagen (45) y en el que los ramales de decodificación (39) presentan respectivos decodificadores de longitud de recorrido (42).
Patentes similares o relacionadas:
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]
Procedimiento de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un procedimiento de codificación de imágenes para codificar un bloque actual incluido en una imagen actual, comprendiendo el procedimiento […]