CODIFICACION DE VIDEO.

Procedimiento de codificación de una señal de vídeo que representa una secuencia de imágenes para formar una señal de vídeo codificada,

siendo algunas de las imágenes de dicha secuencia imágenes, imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, caracterizándose el procedimiento porque comprende, además, la etapa que consiste en indicar un orden de codificación para las imágenes de referencia con un valor de indicador de secuencia, asignando a imágenes de referencia consecutivas en el orden de codificación valores de indicador de secuencia que difieren el uno respecto del otro en una cantidad predeterminada independiente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, lo cual permite que un aparato de descodificación de vídeo detecte la corrupción y/o pérdida de imágenes de referencia

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP01/05431.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4,02150 ESPOO.

Inventor/es: HANNUKSELA, MISKA.

Fecha de Publicación: 25 de Mayo de 2010.

Fecha Concesión Europea: 17 de Febrero de 2010.

Clasificación Internacional de Patentes:

H04N7/64

Clasificación PCT:

H04N7/64

Clasificación antigua:

H04N7/64

Fragmento de la descripción:

Codificación de vídeo.

La invención se refiere a la codificación de vídeo.

Una secuencia de vídeo consiste en una serie de imágenes o tramas inmóviles. Los procedimientos de compresión de vídeo se basan en reducir las partes redundantes y perceptualmente irrelevantes de secuencias de vídeo. La redundancia en las secuencias de vídeo se pueden categorizar en redundancia espectral, espacial y temporal. La redundancia espectral se refiere a la similitud entre los diferentes componentes de color de la misma imagen. La redundancia espacial se deriva de la similitud entre los píxeles vecinos en una imagen. La redundancia temporal existe debido a que los objetos que aparecen en una imagen previa han de aparecen también probablemente en la actual imagen. La compresión se puede conseguir aprovechando esta redundancia temporal y prediciendo la imagen actual a partir de otra imagen, calificado de imagen ancla o imagen de referencia. La posterior compresión se consigue generando datos de compensación de movimiento que describen el movimiento entre la imagen actual y la imagen anterior.

Sin embargo, no se puede conseguir suficiente compresión con solo reducir la redundancia inherente de la secuencia. De este modo, los codificadores de vídeo intentan también reducir la calidad de las partes de la secuencia de vídeo que son subjetivamente menos importantes. Además, la redundancia del flujo de bits codificado se reduce mediante codificación eficiente sin pérdida de coeficientes y parámetros de compresión. La técnica principal va dirigida al uso de códigos de longitud variable.

Los procedimientos de compresión de vídeo diferencian típicamente entre imágenes que utilizan reducción de redundancia temporal y los que no. Las imágenes comprimidas que no utilizan procedimientos de reducción de redundancia temporal se denominan normalmente tramas INTRA o tramas I o imágenes I. Las imágenes temporalmente predichas se predicen normalmente por adelantado a partir de una imagen que ha lugar antes de la imagen actual y se denominan tramas INTER o tramas P. En el caso de las tramas INTER, las imágenes predichas con compensación de movimiento tiene raramente suficiente precisión y por lo tanto una trama comprimida de error de predicción se asocia a cada trama INTER. Las imágenes INTER pueden contener áreas codificadas INTRA.

Muchos esquemas predichos de compresión de vídeo también usan tramas predichas temporal y bidireccionalmente, las cuales se denominan comúnmente imágenes B o trama B. Las imágenes B se insertan entre pares de imágenes ancla de tramas I y/o P y se predicen a partir de bien una o dos de estas imágenes ancla. Las imágenes B producen normalmente mayor compresión en comparación con las imágenes predichas adelantas. Las imágenes B no se usan como imágenes ancla, es decir, no se predicen otras imágenes a partir de éstas. Por lo tanto, se pueden desechar (intencional o no intencionalmente) sin tener ningún impacto sobre la calidad de imagen de futuras imágenes. Aunque las imágenes B pueden mejorar el rendimiento de compresión en comparación con las imágenes P, su generación requiere mayor complejidad computacional y uso de memoria, e introducen retardos adicionales. Esto no puede ser un problema para aplicaciones en tiempo no real, tales como la emisión de vídeo en tiempo real, pero pueden causar problemas en aplicaciones de tiempo real tales como la videoconferencia.

Una secuencia de vídeo comprimida consiste típicamente en una secuencia de imágenes, que se puede categorizar bastamente en imágenes INTRA temporalmente independientes e imágenes INTER temporal y diferencialmente codificadas. Puesto que la eficiencia de compresión en las imágenes INTRA es normalmente inferior a la de compresión en las imágenes INTER, las imágenes INTRA se usan con moderación, especialmente en aplicación de baja tasa de transferencia de bits.

Una secuencia de vídeo puede consistir en una serie de escenas o tomas. El contenido de las imágenes puede ser especialmente diferente de una escena a otra, y por lo tanto, la primera imagen de una escena típicamente con codificación INTRA. Hay frecuente cambios de escena en el material de televisión o cinematográfico, con lo cual los cortes de escena son relativamente raros en la videoconferencia. Además, las imágenes INTRA se insertan típicamente para detener la propagación temporal de errores de transmisión en una señal de vídeo reconstruida y proporcionar puntos de acceso aleatorios a un flujo de bits de vídeo.

El vídeo comprimido se corrompe fácilmente por errores de transmisión, principalmente por dos razones. En primer lugar, debido a la utilización de la codificación diferencial predictiva temporal (tramas INTER), se propaga un error tanto espacial como temporalmente. En la práctica, se entiende que una vez que se produce un error, este es fácilmente visible para el ojo humano durante un tiempo relativamente largo. Especialmente susceptibles son las transmisiones a baja tasa de transferencia de bits donde solamente hay pocas tramas con codificación INTRA, por lo tanto la propagación temporal de error no se detiene durante algún tiempo. En segundo lugar, el uso de códigos de longitud variable aumenta la susceptibilidad de errores. Cuando un error de bit altera la contraseña, el descodificador perderá la sincronización de contraseña y descodifica también posteriores contraseñas libres de error (que comprenden diversos bits) de forma incorrecta hasta código de la siguiente (o primera) sincronización. Un código de sincronización es un patrón de bits que no se puede generar a partir de ninguna combinación legal de otras contraseñas y tales códigos se añaden al flujo de bits a intervalos para permitir la resincronización. Además, los errores se producen cuando se pierden datos durante la transmisión. Por ejemplo, en las aplicaciones de vídeo que usan el protocolo de transporte UDP no fiable en redes IP, los elementos de red pueden desechar partes del flujo de bits de vídeo codificado.

Hay muchas maneras para el receptor de solucionar la corrupción introducida en la vía de transmisión. En general, al recibir una seña, los errores de transmisión en primer lugar se detectan y a continua se corrigen u ocultan por el receptor. La corrección de error se refiere al proceso de recuperar perfectamente los datos erróneos como si no se hubiesen introducido errores en primer lugar. La ocultación de error se refiere al proceso de ocultar los efectos de errores de transmisión de manera que son difícilmente visibles en la secuencia de vídeo reconstruida. Típicamente, se añade alguna cantidad de redundancia por la codificación de fuente o transporte para mantener la detección de error, la corrección de error y la ocultación de error. Las técnicas de ocultación de error se pueden clasificar bastamente en tres categorías: ocultación adelantada de error, ocultación de error por postprocesado y ocultación interactiva de error. El término "ocultación adelantada de error" se refiere a las técnicas en las cuales la parte transmisora añade redundancia a los datos transmitidos para mejorar la resiliencia de error de los datos codificados. La ocultación de error por postprocesado se refiere a operaciones en el descodificador en respuesta a características de las señales recibidas. Estos procedimientos evalúan la representación correcta de datos erróneamente recibidos. En la ocultación interactiva de error, el transmisor y el receptor cooperan para minimizar el efecto de los errores de transmisión. Estos procedimientos utilizan en gran medida información de realimentación proporcionada por el receptor. La ocultación de error por postprocesado se puede denominar también ocultación pasiva de error mientras las dos otras categorías representan formas de ocultación activa de error.

Hay numerosos algoritmos conocidos de ocultación, una análisis de las cuales es proporcionada por Y. Wang y Q.-F. Zhu en "Error control and Concealment for Video Communicación: A review" Proceedings of the IEEE, Vol. 86 No. 5, Mayo 1998, pp. 974-997 y un artículo de P. Salama, N. B. Shroff, y E. J. Delp, "Error Concealment in Encoded Video" presentado en IEEE Journal en Selected Areas in Communicatiins.

El documento EP 0 849 952 describe un procedimiento de codificación de señal de vídeo según la primera parte de la reivindicación 1.

Las normas actuales de codificación de vídeo definen una sintaxis para un flujo de bits de vídeo autosuficiente. Las normas más populares en el momento de la redacción son la recomendación H.263 de ITU.T, "Vídeo coding for low bit rate communication February",...

Reivindicaciones:

1. Procedimiento de codificación de una señal de vídeo que representa una secuencia de imágenes para formar una señal de vídeo codificada, siendo algunas de las imágenes de dicha secuencia imágenes, imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, caracterizándose el procedimiento porque comprende, además, la etapa que consiste en indicar un orden de codificación para las imágenes de referencia con un valor de indicador de secuencia, asignando a imágenes de referencia consecutivas en el orden de codificación valores de indicador de secuencia que difieren el uno respecto del otro en una cantidad predeterminada independiente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, lo cual permite que un aparato de descodificación de vídeo detecte la corrupción y/o pérdida de imágenes de referencia.

2. Procedimiento según la reivindicación 1, que comprende la etapa que consiste en incrementar el valor de indicador de secuencia en uno cada vez que una imagen de referencia se codifica.

3. Procedimiento según la reivindicación 1 o 2, que comprende la etapa que consiste en incluir el valor de indicador de secuencia en una cabecera de imagen.

4. Procedimiento según la reivindicación 1, que comprende las etapas que consisten en codificar la señal de vídeo según la norma de codificación de vídeo H.263 y en incluir el valor de indicador de secuencia en la información de mejoramiento adicional del flujo de bits H.263.

5. Procedimiento según la reivindicación 1, que comprende la etapa que consiste en asociar el valor de indicador de secuencia a la totalidad de una imagen.

6. Procedimiento según la reivindicación 1, que comprende la etapa que consiste en asociar el valor de indicador de secuencia a una parte de una imagen.

7. Procedimiento según la reivindicación 6, que comprende la etapa que consiste en incluir el valor de indicador de secuencia en una cabecera de segmento de imagen o una cabecera de macrobloque de una imagen codificada.

8. Procedimiento según la reivindicación 1, que comprende las etapas que consisten en codificar la señal de vídeo de manera evolutiva y en asociar valores de indicador de secuencia a capas de la señal de vídeo codificada de manera evolutiva.

9. Procedimiento de descodificación de una señal de vídeo codificada que representa una secuencia de imágenes para formar una señal de vídeo descodificada, siendo algunas de las imágenes de dicha secuencia imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia, imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, comprendiendo la señal de vídeo codificada valores de indicador de secuencia indicativos de un orden de codificación para las imágenes de referencia, siendo las imágenes de referencia consecutivas en el orden de codificación asignadas valores de indicador de secuencia que difieren el uno respecto del otro en una cantidad predeterminada independientemente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, comprendiendo el procedimiento:

- identificar los valores de indicador de secuencia asignados a dos imágenes de referencia descodificadas consecutivamente;
- comparar los valores de indicador de secuencia asignados a dos imágenes de referencia descodificadas consecutivamente; y
- detectar la corrupción y/o pérdida de una imagen de referencia si los valores de indicador de secuencia asignados a las dos imágenes de referencia descodificadas consecutivamente no difieren de dicha cantidad predeterminada.

10. Procedimiento según la reivindicación 9, que comprende la etapa que consiste en enviar una solicitud a un transmisor para codificar une imagen de una manera no predicha temporalmente cuando el valor de indicador de secuencia asignado a una imagen de referencia descodificada particular no sigue consecutivamente el valor de indicador de secuencia asignado a una imagen de referencia descodificada inmediatamente precedente.

11. Procedimiento según la reivindicación 9, que comprende la etapa que consiste en detectar la corrupción y/o pérdida de una imagen de referencia si los valores de indicador de secuencia asignados a dos imágenes de referencia descodificadas consecutivamente difieren en más de uno.

12. Procedimiento según la reivindicación 9, que comprende la obtención de un valor de indicador de secuencia a partir de una cabecera de imagen.

13. Procedimiento según la reivindicación 9, en el cual la señal de vídeo se codifica según la norma de codificación de vídeo H.263 y el procedimientos comprende la etapa que consiste en obtener un valor de indicador de secuencia a partir de la información de mejoramiento adicional del flujo de bits H.263.

14. Procedimiento según la reivindicación 9, que comprende la etapa que consiste en asociar un valor de indicador de secuencia identificado a la totalidad de una imagen.

15. Procedimiento según la reivindicación 9, que comprende la etapa que consiste en asociar un valor de indicador de secuencia identificado a una parte de una imagen.

16. Procedimiento según la reivindicación 15, que comprende la etapa que consiste en obtener un valor de indicador de secuencia a partir de una cabecera de segmento de imagen o de una cabecera de macrobloque de una imagen codificada.

17. Procedimiento según la reivindicación 9, en el cual la señal de vídeo se codifica de manera evolutiva y el procedimiento comprende la etapa que consiste en asociar valores de indicador de secuencia identificados a capas de la señal de vídeo codificada de manera evolutiva.

18. Señal de vídeo codificada que representa una secuencia de imágenes, siendo algunas de las imágenes de dicha secuencia imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, caracterizándose la señal de vídeo codificada porque comprende, además, valores de indicador de secuencia indicativos de un orden de codificación de las imágenes de referencia, siendo asignados a imágenes de referencia consecutivas en el orden de codificación valores de indicador de secuencia que difieren el uno del otro en una cantidad predeterminada independientemente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, lo cual permite que un aparato de descodificación de vídeo detecte la corrupción y/o pérdida de imágenes de referencia.

19. Señal de vídeo codificada según la reivindicación 18, en la cual dicha cantidad predeterminada es 1.

20. Señal de vídeo codificada según la reivindicación 18, en la cual el valor de indicador de secuencia se incluye en una cabecera de imagen.

21. Señal de vídeo codificada según la reivindicación 18, codificada según la norma de codificación de vídeo H.263 y en la cual el valor de indicador de secuencia se incluye en la información de mejoramiento adicional del flujo de bits H.263.

22. Señal de vídeo codificada según la reivindicación 18, en la cual el valor de indicador de secuencia se asocia a la totalidad de una imagen.

23. Señal de vídeo codificada según la reivindicación 18, en la cual el valor de indicador de secuencia se asocia a una parte de una imagen.

24. Señal de vídeo codificada según la reivindicación 23, en la cual el valor de indicador de secuencia se incluye en una cabecera de segmento de imagen o una cabecera de macrobloque de una imagen codificada.

25. Señal de vídeo codificada según la reivindicación 18, en la cual la señal de vídeo codificada se codifica de manera evolutiva y valores de indicador de secuencia se asocian a capas de la señal de vídeo codificada de manera evolutiva.

26. Aparato para codificar una señal de vídeo que representa una secuencia de imágenes para formar una señal de vídeo codificada, siendo algunas de las imágenes de dicha secuencia imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, caracterizándose el aparato porque está dispuesto para indicar un orden de codificación para las imágenes de referencia con un valor de indicador de secuencia, asignando a imágenes de referencia consecutivas en el orden de codificación valores de indicador de secuencia que difieren el uno respecto del otro en una cantidad predeterminada independientemente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, lo cual permite a un aparato de descodificación de vídeo detectar la corrupción y/o pérdida de imágenes de referencia.

27. Aparato según la reivindicación 26, dispuesto para incrementar el valor de indicador de secuencia en 1 cada vez que una imagen de referencia se codifica.

28. Aparato según la reivindicación 26, dispuesto para incluir el valor de indicador de secuencia en una cabecera de imagen.

29. Aparato según la reivindicación 26, dispuesto para codificar la señal de vídeo según la norma de codificación de vídeo H.263 e incluir el valor de indicador de secuencia en la información de mejoramiento adicional del flujo de bits H.263.

30. Aparato según la reivindicación 26, dispuesto para asociar el valor de indicador de secuencia a la totalidad de una imagen.

31. Aparato según la reivindicación 26, dispuesto para asociar el valor de indicador de secuencia a una parte de una imagen.

32. Aparato según la reivindicación 31, dispuesto para incluir el valor de indicador de secuencia en una cabecera de segmento de imagen o una cabecera de macrobloque de una imagen codificada.

33. Aparato según la reivindicación 26, dispuesto para codificar la señal de vídeo de manera evolutiva y para asociar valores de indicador de secuencia a capas de la señal de vídeo codificada de manera evolutiva.

34. Aparato para descodificar una señal de vídeo codificada que representa una secuencia de imágenes para formar una señal de vídeo descodificada, siendo algunas de las imágenes de dicha secuencia imágenes de referencia que se utilizan para la predicción temporal de otras imágenes en la secuencia y siendo otras imágenes de dicha secuencia imágenes de no-referencia que no se utilizan para la predicción temporal de otras imágenes, comprendiendo la señal de vídeo codificada valores de indicador de secuencia indicativos de un orden de codificación para las imágenes de referencia, siendo asignadas a imágenes de referencia consecutivas en el orden de codificación valores de indicador de secuencia que difieren el uno respecto del otro en una cantidad predeterminada independientemente del número de imágenes de no-referencia codificadas entre imágenes de referencia consecutivas, estando el aparato dispuesto para:

- identificar los valores de indicador de secuencia asignados a dos imágenes de referencia descodificadas consecutivamente;
- comparar los valores de indicador de secuencia asignados a las dos imágenes de referencia descodificadas consecutivamente; y
- detectar la corrupción y/o pérdida de una imagen de referencia si los valores de indicador de secuencia asignados a las dos imágenes de referencia descodificadas consecutivamente no difieren de dicha cantidad predeterminada.

35. Aparato según la reivindicación 34, dispuesto para enviar una solicitud a un transmisor para codificar una imagen de una manera no predicha temporalmente cuando el valor de indicador de secuencia asignado a una imagen de referencia descodificada particular no sigue consecutivamente el valor de indicador de secuencia asociado a una imagen de referencia descodificada inmediatamente precedente.

36. Aparato según la reivindicación 34, dispuesto para detectar la corrupción y/o pérdida de una imagen de referencia si los valores de indicador de secuencia asignados a dos imágenes de referencia descodificadas consecutivamente difieren en más de 1.

37. Aparato según la reivindicación 34, dispuesto para obtener un valor de indicador de secuencia a partir de una cabecera de imagen.

38. Aparato según la reivindicación 34, en el cual la señal de vídeo se codifica según la norma de codificación de vídeo H.263 y el aparato está dispuesto para obtener une valor de indicador de secuencia a partir de información de mejoramiento adicional del flujo de bits H.263.

39. Aparato según la reivindicación 34, dispuesto para asociar un valor de indicador de secuencia identificado con la totalidad de una imagen.

40. Aparato según la reivindicación 34, dispuesto para asociar un valor de indicador de secuencia identificado con una parte de una imagen.

41. Aparato según la reivindicación 40, dispuesto para obtener un valor de indicador de secuencia a partir de una cabecera de segmento de imagen o de una cabecera de macrobloque de una imagen codificada.

42. Aparato según la reivindicación 34, en el cual la señal de vídeo se codifica de manera evolutiva y el aparato está dispuesto para asociar valores de indicador de secuencia identificados con capas de la señal de vídeo codificada de manera evolutiva.

43. Dispositivo de radiocomunicación portátil que incluye al menos uno de entre un aparato para codificar una señal de vídeo según cualquiera de las reivindicaciones 26 a 33 y un aparato para descodificar una señal de vídeo codificada según cualquiera de las reivindicaciones 34 a 42.

44. Dispositivo terminal multimedia que incluye al menos uno de entre un aparato para codificar una señal de vídeo según cualquiera de las reivindicaciones 26 a 33 y un aparato para descodificar una señal de vídeo codificada según cualquiera de las reivindicaciones 34 a 42.

Patentes similares o relacionadas:

Método y aparato para la ocultación de error de vídeo en vídeo codificado de multivistas utilizando sintaxis de nivel alto, del 15 de Agosto de 2012, de THOMSON LICENSING: Un aparato que comprende: un descodificador para descodificar imágenes para al menos una vista correspondiente al contenido de videode multivistas de un flujo […]

Procedimiento de almacenamiento de un objeto multimedia, estructura de datos y terminal asociado, del 29 de Mayo de 2012, de APPLE INC.: Procedimiento de almacenamiento de un objeto multimedia constituido por al menos un flujo elemental de datos, por un terminal de recepción […]

MÉTODO DE RESINCRONIZACIÓN PARA LA DECODIFICACIÓN DE VIDEO, del 15 de Marzo de 2012, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Método de resincronización de una señal de datos de vídeo comprimida según la norma MPEG-4, Parte 2 recibida por un decodificador, que comprende […]

CODIFICACIÓN Y TRANSMISIÓN DE VÍDEO, del 22 de Marzo de 2011, de BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY: Procedimiento de transmisión de datos de vídeo, que comprende las etapas siguientes: codificar una primera secuencia de tramas de vídeo; codificar […]

USO DE ALMACENAMIENTO EN CACHE DE TRAMA PARA MEJORAR LA RECUPERACION DE PERDIDAS DE PAQUETES, del 13 de Diciembre de 2010, de MICROSOFT CORPORATION: Un método para transmitir una señal sobre una red, que comprende las etapas de: Un codificador que codifica y una secuencia de cuadros de la señal en una secuencia […]

CODIFICACION DE VIDEO., del 16 de Marzo de 2007, de NOKIA MOBILE PHONES LTD.: Método para decodificar vídeo que consiste en: recibir datos de vídeo codificados por un decodificador de vídeo, decodificar dichos datos de vídeo para […]

SISTEMAS PARA LA DETECCION DE ERRORES EN SEÑALES DE VIDEO., del 1 de Mayo de 2006, de LUCENT TECHNOLOGIES INC.: Un aparato para la detección de errores en señales de video, para uso en un receptor que tiene un descodificador para recibir señales de video […]

PROCEDIMIENTO PARA REDUCIR EL RUIDO DE CUANTIFICACION, del 13 de Agosto de 2009, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento para reducir el ruido de cuantificación en tándem en un sistema que comprende una pluralidad de dispositivos de cuantificación […]