MÉTODO DE CODIFICACIÓN Y COMPRESIÓN INTERFRAME DE VIDEO CON JPEG 2000.
Método de codificación y compresión de video con JPEG 2000, estando dicho vídeo formado por una secuencia de fotogramas,
que comprende los siguientes pasos:
i) establecer un tamaño de partición y dividir cada fotograma en particiones;
ii) comprimir (100) cada fotograma siguiendo el formato JPEG 2000 según dicho tamaño establecido de partición;
iii) comparar partición a partición (110) cada fotograma sin comprimir (20) con un fotograma de referencia (21), y marca aquellas particiones que han cambiado entre cada fotograma y el fotograma de referencia por encima de un umbral preestablecido;
iv) actualizar (120) dicho fotograma de referencia sobrescribiendo cada partición marcada en el paso anterior con la partición que ha cambiado del fotograma sin comprimir;
v) generar un flujo de información de salida (130) formado por aquellas particiones comprimidas en JPEG 2000 que han cambiado para cada fotograma; y
reiterar los pasos iii)-v) para cada fotograma de la secuencia.
Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P200900262.
Solicitante: UNIVERSIDAD CARLOS III DE MADRID.
Nacionalidad solicitante: España.
Inventor/es: PATRICIO GUISADO,MIGUEL ÁNGEL, LUIS BUSTAMANTE,ÁLVARO, BERLANGA DE JESÚS,ANTONIO, GARCIA HERRERO,JESUS, MOLINA LOPEZ,JOSE MANUEL.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04N7/26
Fragmento de la descripción:
Método de codificación y compresión interframe de vídeo con JPEG 2000.
Campo de la invención
La presente invención se refiere a la codificación y compresión de vídeo; y más en particularmente, en el caso de utilizar imágenes comprimidas con el formato JPEG 2000.
Antecedentes de la invención
Actualmente los sistemas de transmisión de vídeo se basan en la utilización de técnicas de compresión para comprimir la señal procedente de una fuente de vídeo (vídeo-cámara, fichero, ...), ya que sin emplear ningún tipo de compresión sobre la imagen, se generaría una gran cantidad de información que tiene que ser enviada a través de la red, y que limita la cantidad de fotogramas por segundo que pueden ser transmitidos por ta red.
Para hacernos una idea una imagen capturada directamente desde una digitalizadora a una resolución de 768x576 píxeles con tres componentes rojo, verde, azul, sin emplear ningún tipo de compresión ocupa 1296 KB. Si se considera que una secuencia de vídeo normal está en torno a los 25 fotogramas por segundo, implicaría un total de 32400 KB/s, o lo que es lo mismo, cerca de 2 GB de datos para la transmisión de vídeo de un minuto de duración, casi la mitad de lo que puede almacenar un DVD actual.
Estas cifras desbancan por completo las capacidades de las redes digitales de transmisión actuales, salvo configuraciones específicas que pueden ser muy costosas y poco accesibles.
La compresión del vídeo es por tanto una de las partes más importante de la transmisión de vídeo en tiempo real Es indispensable el uso de códecs de compresión para reducir la cantidad de datos a transmitir. Para solventar este problema actualmente existen diversas técnicas de compresión de vídeo e imágenes, que reducen el nivel de bits necesarios para representar la imagen y así reducir la cantidad de información enviada y/o almacenada.
Dentro de las técnicas de compresión de vídeo actuales, se encuentras dos métodos claramente diferenciados, las técnicas "intraframe" y las "interframe".
Una técnica intraframe se aplica sobre un fotograma individual de la secuencia de vídeo haciendo uso de las similitudes entre los píxeles próximos en la imagen y de las limitaciones del sistema de visión humana. La compresión en el vídeo vendrá dada en este caso por la compresión individual de cada uno de sus fotogramas. Uno de los códecs que emplean esta técnica es MJPEG.
La técnica interframe sin embargo, se basa en la similitud de las imágenes consecutivas de una secuencia de vídeo, aprovechando que una secuencia de fotogramas consecutivos suelen ser muy parecidos. Con esta técnica por regla general se suelen obtener mayores ratios de compresión que con las técnicas intraframe, teniendo como contrapartida la consiguiente pérdida de calidad (entiéndase calidad como degradación respecto a la fuente original). Un ejemplo de un códec que emplea esta técnica es MPEG (MPEG2, MPEG4).
Para evaluar la efectividad de una técnica de compresión de vídeo, se analizan fundamentalmente dos factores:
El primero consiste en evaluar el ratio de compresión alcanzado por el códec, el cual se basa en comparar el archivo original (sin comprimir) frente al archivo obtenido como resultado del proceso de compresión. Cuanto menor sea el archivo final frente al archivo original, mejor será el sistema.
El segundo factor, y también muy importante, consiste en analizar la calidad que tiene el archivo de vídeo una vez comprimido frente al archivo original, para evaluar la similitud que tienen ambos. Para comprobar esta calidad existen diferentes técnicas de referencia que pretenden evaluar tanto calidades objetivas como subjetivas.
La compresión intraframe ha demostrado ser muy adecuada para uso en la transmisión de vídeo en tiempo real.
Dentro de las técnicas de compresión de vídeo intraframe actuales predomina la utilización del códec MJPEG, en el que cada fotograma de una secuencia de vídeo es comprimido independientemente utilizando JPEG.
Otra técnica existente, pero menos extendida, es MJPEG 2000, que se basa en el mismo fundamento que MJPEG, pero en este caso el códec utilizado para la compresión de cada fotograma es JPEG 2000, que es la evolución de JPEG por el grupo Joint Pothographic Expert Group.
JPEG 2000 descompone la imagen en varias resoluciones durante el proceso de compresión; por eso se le llama códec escalable, ya que permite obtener múltiples versiones de un único archivo comprimi- do.
MJPEG 2000 es actualmente el formato de compresión de vídeo intraframe más avanzado. Este formato está definido como estándar en el documento ISO/IEC 15444-3, donde se detallan todas sus especificaciones como sistema de almacenamiento de vídeo comprimido utilizando como base el códec JPEG 2000.
Dentro del ámbito de la transmisión de vídeo en tiempo real con JPEG 2000 existe un estándar recientemente aprobado (octubre de 2008), que está especificado en el RFC 5371.
Con JPEG 2000 una imagen se divide en regiones más pequeñas llamadas tiles. Estas regiones están codificadas independientemente, lo que significa que cada una de éstas puede ser accedida y decodificada independientemente de las demás.
La organización física de una imagen comprimida con JPEG 2000, dividida en celdas (TILE #0, TILE #1, TILE #2), es en un flujo de código 10 como se muestra en la figura 1. En esta figura se puede observar cómo en este formato, al comienzo del flujo de código 11 (Start of Codestream: SOC) existe una cabecera principal (12), que es la que almacena información sobre toda la imagen, como es el ancho, alto, número de componentes, etc. Seguida de esta cabecera principal aparecen ya las partes de la imagen (T0, T1, T2) como tal, también cada una precedida por su correspondiente cabecera (TH0, TH1, TH2), comienzo de celda (13, 13', 13'') y comienzo de datos (14, 14', 14''), una a una hasta completar toda la imagen, acabando el flujo de código 10 con un fin de flujo de código 15.
Hasta ahora, para formar un vídeo a partir de imágenes comprimidas con JPEG 2000 se realiza la compresión de cada uno de los fotogramas independientemente y se almacenan o retransmiten consecutivamente.
De este modo, surge la necesidad de implementar un sistema de vídeo transmisión de imágenes en tiempo real que reduzca los anchos de banda necesarios, mejore la calidad de la imagen, y aumente la cantidad de imágenes por segundo que pueden ser transmitidas, y que su utilización introduzca el mínimo retardo posible entre su captura y recepción, ya que por ejemplo en entornos como los de vídeo vigilancia se necesita observar lo que está pasando en tiempo real.
En ninguno de estos dos estándares (tanto almacenamiento como transmisión) ni en trabajos relacionados con JPEG 2000 se hace referencia a la utilización de técnicas de análisis intraframe para reducir la cantidad de datos generados.
Descripción de la invención
La invención se refiere a un método de codificación y compresión de vídeo con JPEG 2000 de acuerdo con la reivindicación 1. Realizaciones preferidas del método se describen en las reivindicaciones dependientes.
La presente invención proporciona un método de análisis intraframe de imágenes JPEG 2000 (MIJ2K) con el que se obtiene una mejora sustancial tanto en requisitos de ancho de banda en transmisión de vídeo, como de almacenamiento para vídeos comprimidos con el códec JPEG 2000.
La presente invención aprovecha el hecho de que JPEG 2000 permite dividir la imagen en particiones o zonas más pequeñas, que son los llamados tiles. Y transmite únicamente aquellos tiles de la imagen que han sido modificados entre fotogramas consecutivos, realizando sencillas y pequeñas comprobaciones entre los tiles de dos fotogramas consecutivos de la secuencia de vídeo, con el objeto de no recargar las necesidades de cómputo en la codificación del vídeo.
Esto permite reducir el ancho de banda necesario para la transmisión del vídeo, así como reducir el costo de procesamiento y decodificación en el lado del cliente, el cual es uno de los mayores problemas en este tipo de sistemas, sobre todo cuando se emplean sistemas con pocos recursos como teléfonos móviles o PDAs.
Es decir, la presente invención aprovecha las ventajas de los dos tipos de compresión: la intraframe, que aporta baja latencia y...
Reivindicaciones:
1. Método de codificación y compresión de vídeo con JPEG 2000, estando dicho vídeo formado por una secuencia de fotogramas, que comprende los siguientes pasos:
i) establecer un tamaño de partición y dividir cada fotograma en particiones;
ii) comprimir (100) cada fotograma siguiendo el formato JPEG 2000 según dicho tamaño establecido de partición;
iii) comparar partición a partición (110) cada fotograma sin comprimir (20) con un fotograma de referencia (21), y marcar aquellas particiones que han cambiado entre cada fotograma y el fotograma de referencia por encima de un umbral preestablecido;
iv) actualizar (120) dicho fotograma de referencia sobrescribiendo cada partición marcada en el paso anterior con la partición que ha cambiado del fotograma sin comprimir;
v) generar un flujo de información de salida (130) formado por aquellas particiones comprimidas en JPEG 2000 que han cambiado para cada fotograma; y
reiterar los pasos iii)-v) para cada fotograma de la secuencia.
2. Método según la reivindicación 1, en el que se establece un número máximo de iteraciones que una partición puede permanecer sin actualizar, y si una partición pasa dicho número máximo se actualiza en el fotograma de referencia y se selecciona para, comprimida, formar parte del flujo de información de salida.
3. Método según cualquiera de tas reivindicaciones 1-2, en el que se establece un parámetro que indica cada cuántos fotogramas se actualiza el fotograma de referencia por completo con dicho fotograma y dicho fotograma completo comprimido se selecciona para formar el flujo de información de salida.
4. Método según cualquiera de las reivindicaciones anteriores, en el que dicho fotograma de referencia se inicializa con un fotograma negro.
5. Método según cualquiera de las reivindicaciones 1-4, en el que la etapa de comparar cada fotograma con el fotograma de referencia se realiza haciendo una resta en valor absoluto entre dichos fotogra- mas.
6. Método según la reivindicación 5, en el que previamente a esa resta se hace una conversión de dichos fotogramas a escala de grises.
7. Método según cualquiera de las reivindicaciones 1-6, en el que dicho umbral predeterminado se determina realizando una media del valor de los píxeles de una misma partición, sobre el fotograma de diferencia en valor absoluto.
8. Método según cualquiera de las reivindicaciones 1-7, en el que dicho umbral predeterminado se determina como el píxel con el mayor índice de variación dentro de una misma partición, o píxel con mayor valor de color.
9. Método según cualquiera de las reivindicaciones 1-8, en el que la etapa de comparar cada fotograma con el fotograma de referencia da como resultado un valor cuantitativo del cambio habido.
10. Método según cualquiera de las reivindicaciones 1-4, en el que la etapa de comparar dicho fotograma con el fotograma de referencia se realiza haciendo una operación XOR entre dichos primer y segundo fotogramas.
11. Método según cualquiera de las reivindicaciones 1-10, en el que dicho tamaño de ta partición se establece según el fotograma a codificar y comprimir pertenezca a un tipo de escena dentro de grupos de escenas preestablecidos.
12. Método de transmisión de vídeo con JPEG 2000, caracterizado porque:
- se codifica y comprime una secuencia de fotogramas de dicho vídeo de acuerdo con el método de codificación y compresión definido en cualquiera de las reivindicaciones 1-11,
- se transmite dicho flujo de información generado para cada fotograma de la secuencia.
13. Método de transmisión según la reivindicación 12, en el que se transmite dichos fotogramas mediante protocolo RTP sobre UDP.
14. Método de transmisión según la reivindicación 13, en el que en dicho protocolo RTP se utiliza una cabecera adicional identificando el tipo de contenido que se está transmitiendo.
15. Método de almacenamiento de vídeo con JPEG2000, caracterizado porque:
- se codifica y comprime una secuencia de fotogramas de dicho vídeo de acuerdo con el método definido en cualquiera de las reivindicaciones 1-11,
- se almacena dicho flujo de información generado para cada fotograma de la secuencia en medios de almacenamiento.
16. Dispositivo codificador y decodificador de vídeo que incluye medios para llevar a cabo el método de codificación y compresión definido en cualquiera de las reivindicaciones 1-11.
17. Programa informático que comprende medios de código de programa informático adaptados para llevar a cabo el método de codificación y comprensión definido en cualquiera de las reivindicaciones 1-11, cuando dicho programa es ejecutado.
Patentes similares o relacionadas:
Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]