PROCEDIMIENTO Y APARATO PARA DETERMINAR UN PROCEDIMIENTO DE CODIFICACION EN BASE A UN VALOR DE DISTORSION RELACIONADO CON EL OCULTAMIENTO DE ERRORES.

Procedimiento de codificación de datos multimedia que comprende:

la estimación de un valor de distorsión para una primera parte de datos multimedia en base, en parte, a por lo menos uno o más procedimientos de ocultamiento relacionados con el ocultamiento de la primera parte si la primera parte fuese recibida erróneamente (402); y

la determinación de un procedimiento de codificación para la primera parte en base, en parte, a por lo menos una comparación del valor de distorsión estimado y un umbral;

caracterizado porque:

el umbral varía en función de uno o más factores seleccionados de una lista de factores (404), la lista de factores incluyendo:

una ubicación de la primera parte en una trama que contiene la primera parte,

una textura de un área de la trama que contiene la primera parte,

una posición de la trama que contiene la primera parte dentro de un grupo de imágenes que contienen la trama,

una distribución de valores de distorsión en la trama que contiene la primera parte, y

una actividad de movimiento del área de la trama que contiene la primera parte

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/060786.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: ATTN: INTERNATIONAL IP ADMINISTRATION 5775 MOREHOUSE DRIVE,SAN DIEGO, CALIFORNIA 92121.

Inventor/es: WALKER, GORDON KENT, RAVEENDRAN,VIJAYALAKSHMI,R, SUBRAMANIA,SITARAMAN GANAPATHY C/O QUALCOMM INCORPORATED.

Fecha de Publicación: 7 de Abril de 2010.

Fecha Concesión Europea: 25 de Noviembre de 2009.

Clasificación Internacional de Patentes:

H04N7/26A4C2
H04N7/26A6
H04N7/26A6C4
H04N7/26A6E4
H04N7/26A6Q
H04N7/26A6W2
H04N7/26A8B
H04N7/50
H04N7/68

Clasificación PCT:

H04N7/26
H04N7/68

PROCEDIMIENTO Y APARATO PARA DETERMINAR UN PROCEDIMIENTO DE CODIFICACION EN BASE A UN VALOR DE DISTORSION RELACIONADO CON EL OCULTAMIENTO DE ERRORES.

Fragmento de la descripción:

Procedimiento y aparato para determinar un procedimiento de codificación en base a un valor de distorsión relacionado con el ocultamiento de errores.

Antecedentes

Campo de la solicitud

Esta solicitud se refiere al procesamiento de señal multimedia y, más concretamente, a la codificación de vídeo.

Descripción de los antecedentes de la técnica

Los sistemas de procesamiento multimedia, como los codificadores de vídeo, pueden codificar datos multimedia utilizando procedimientos de codificación basados en estándares internacionales como los estándares Grupo de Expertos en Imágenes en Movimiento (MPEG)-1, -2 y -4, el estándar Unión Internacional de Telecomunicaciones (ITU)-T H.263, e ITU-T H.264 y su homólogo ISO/IEC MPEG-4, Parte 10, es decir, Codificación de vídeo Avanzada (AVC). Tales procedimientos de codificación por lo general se refieren a la compresión de datos multimedia para la transmisión y/o almacenamiento. La compresión es en términos generales el proceso de eliminación de la redundancia de los datos.

Una señal de vídeo puede describirse en términos de una secuencia de imágenes, que incluyen tramas (una imagen completa) o campos (p. ej., un flujo de vídeo entrelazado comprende campos de líneas pares e impares alternantes de una imagen). Tal y como se utiliza en la presente memoria, la expresión trama se refiere a una imagen, una trama o un campo. Los procedimientos de codificación de vídeo comprimen señales de vídeo utilizando algoritmos de compresión sin pérdida o con pérdida para comprimir cada trama. La codificación intra-frame (denominada intra-codificación en la presente memoria) se refiere a la codificación de una trama utilizando únicamente dicha trama. La codificación inter-frame (denominada inter-codificación en la presente memoria) se refiere a la codificación de una trama en base a otras, tramas de referencia. Por ejemplo, las señales de vídeo muchas veces presentan una redundancia temporal en la que las tramas que son cercanas entre sí en la secuencia temporal de tramas tienen por lo menos partes que coinciden o por lo menos coinciden parcialmente entre sí.

Los procesadores multimedia, como los codificadores de vídeo, pueden codificar una trama partiéndola en bloques o macrobloques de, por ejemplo, 16x16 píxeles. El codificador puede partir adicionalmente cada macrobloque en subbloques. Cada subbloque puede comprender adicionalmente subbloques adicionales. Por ejemplo, los subbloques o un macrobloque pueden incluir subbloques de 16x8 y 8x16. Los subbloques de los subbloques de 8x16 pueden incluir subbloques de 8x8, y así sucesivamente. Tal y como se utiliza en la presente memoria, el término bloque se refiere a un macrobloque o a un subbloque.

Los codificadores toman ventaja de esta redundancia temporal utilizando algoritmos basados en la compensación de movimiento por inter-codificación. Los algoritmos de compensación de movimiento identifican partes de una trama de referencia que coinciden por lo menos parcialmente con un bloque. El bloque puede desplazarse en la trama con respecto a la parte coincidente de la trama de referencia. Este desplazamiento se caracteriza por un vector de movimiento. Cualquier diferencia entre el bloque y la parte parcialmente coincidente de la trama de referencia puede caracterizarse en términos de un residual. El codificador puede codificar una trama como datos que comprenden uno o más vectores de movimiento y residuales para una partición particular de una trama. Una partición particular de un bloque para la codificación de una trama puede seleccionarse minimizando aproximadamente una función de coste que, por ejemplo, equilibra el tamaño de la codificación con la distorsión del contenido resultante de la codificación.

La inter-codificación permite una compresión más eficaz que la intra-codificación. Sin embargo, la inter-codificación puede crear problemas cuando los datos de referencia (p. ej., las tramas de referencia o los campos de referencia) se pierden debido a errores en el canal, etc. En estos casos, puede no resultar posible la decodificación de los datos inter-codificados o puede resultar en errores no deseados y en la propagación de errores. Los decodificadores pueden emplear esquemas de ocultamiento que tratan de ocultar o tapar datos erróneos con datos derivados de los bloques vecinos o de datos en otras tramas. La mejoría de los algoritmos de ocultamiento puede proporcionar alguna mejoría en la calidad de las partes ocultas de los datos de vídeo erróneos. Sin embargo, hay un límite en la calidad que mostrará la imagen oculta debido a la fuerte dependencia de los algoritmos de ocultamiento de la información espacio-temporal. Los datos ocultos no pueden ser de alta calidad y la experiencia de visualización puede verse degradada. Además, la decodificación de la señal puede volverse imposible y puede requerirse la resincronización. La propagación de errores puede ser limitada, y puede permitirse la resincronización (o la adquisición inicial), mediante procedimientos de codificación que refrescan la señal de vídeo. Una señal de vídeo refrescada puede decodificarse sin referencia a o conocimiento de otras tramas.

Una trama intra-codificada independientemente decodificable es la forma más común de trama que permite el refresco de la señal de vídeo. Los estándares MPEG-x y H.26x utilizan lo que se conoce como grupo de imágenes (GOP) que comprende una trama intra-codificada (también denominada trama I) y tramas P temporalmente predichas o tramas B bidirecccionalmente predichas que hacen referencia a la trama I y/o a otras tramas P y/o B dentro del GOP. Son deseables GOP-s más largos para una mayor compresión, pero GOP-s más cortos permiten una adquisición y una resincronización más rápidas. Aumentar el número de tramas I refrescará la señal de vídeo con mayor frecuencia, limitando así adicionalmente la propagación de errores y proporcionando una adquisición y una resincronización más rápidas, pero a costa de una menor compresión. Lo que se necesita es una forma de codificar datos de vídeo que limite la propagación de errores del flujo de vídeo en el decodificador al tiempo que se preserva la eficacia de la compresión.

COTE G ET AL: Optimal Mode Selection and Synchronization for Robust Video Communications over Error-Prone Networks de la revista de la IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, IEEE SERVICE CENTER, PISCATAWAY, EEUU, vol. 18, nº 6, junio de 2000 (2000-06), XP011055134 ISSN: 0733-8716, se refiere a una selección y sincronización de modo óptimo.

RUI ZHANG ET AL: Video Coding with Optimal Inter/Intra-Mode Switching for Packet Loss Resilience de la revista IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, IEEE SERVICE CENTER, PISCATAWAY, EEUU, vol. 18, nº 6, junio 2000 (2000-06), páginas 966-976, XP011055155 ISSN: 0733-8716 se refiere a una codificación de vídeo con conmutación inter/intra-modo óptima.

US 6,574,277 se refiere a un aparato y a un procedimiento de codificación de imágenes en movimiento. Se calcula la distancia desde un pequeño bloque a un patrón de sincronización insertado en los datos codificados para cada bloque pequeño en una trama de imágenes. En base al conteo, una unidad de estimación de probabilidad de pérdida de datos estima la probabilidad de que los datos codificados de un bloque pequeño diana se pierdan durante la transmisión. En lo que respecta a un bloque pequeño en el que se ha realizado una codificación predictiva inter-frame, una unidad de estimación de la degradación de la calidad de la imagen estima al grado de degradación de la calidad de la imagen que se producirá en este bloque pequeño en la imagen decodificada. La prioridad de refresco forzada de cada bloque pequeño se calcula comparando la probabilidad de pérdida de datos estimada y el grado de degradación de la calidad de la imagen estimada con valores umbrales, y los valores de prioridad son almacenados en forma de un mapa de refresco forzado.

Por último, COTE G ET AL: Optimal intra coding of blocks for robust video communication over the Internet SIGNAL PROCESSING. IMAGE COMMUNICATION, ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, PAISES BAJOS, vol. 15, nº 1-2, septiembre 1999 (1999-09), páginas 25-34, XP004180636 ISSN: 0923-5965 se refiere a la intra-codificación óptima de bloques.

Resumen

La invención se define en las reivindicaciones independientes 1 y 9.

El sistema, procedimiento y dispositivos de la solicitud presentan cada...

Reivindicaciones:

1. Procedimiento de codificación de datos multimedia que comprende:

quadla estimación de un valor de distorsión para una primera parte de datos multimedia en base, en parte, a por lo menos uno o más procedimientos de ocultamiento relacionados con el ocultamiento de la primera parte si la primera parte fuese recibida erróneamente (402); y quadla determinación de un procedimiento de codificación para la primera parte en base, en parte, a por lo menos una comparación del valor de distorsión estimado y un umbral; quadcaracterizado porque: quadel umbral varía en función de uno o más factores seleccionados de una lista de factores (404), la lista de factores incluyendo: quaduna ubicación de la primera parte en una trama que contiene la primera parte, quaduna textura de un área de la trama que contiene la primera parte, quaduna posición de la trama que contiene la primera parte dentro de un grupo de imágenes que contienen la trama, quaduna distribución de valores de distorsión en la trama que contiene la primera parte, y quaduna actividad de movimiento del área de la trama que contiene la primera parte.

2. Procedimiento según la Reivindicación 1, que comprende adicionalmente la codificación de la primera parte utilizando el procedimiento de codificación (406) determinado.

3. Procedimiento según la Reivindicación 1, en el que la determinación del procedimiento de codificación comprende adicionalmente la determinación del procedimiento de codificación para refrescar la primera parte.

4. Procedimiento según la Reivindicación 3, en el que el umbral varía en función de uno o más factores seleccionados de una lista de factores, incluyendo adicionalmente la lista de factores:

quadun modo de codificación de la trama que contiene la primera parte.

5. Procedimiento según la Reivindicación 1, que comprende adicionalmente la intra-codificación de la primera parte para refrescar la primera parte en base a una comparación del valor de distorsión estimado y un umbral.

6. Procedimiento según la Reivindicación 1, que comprende adicionalmente la estimación del valor de distorsión de la primera parte en base, en parte, a por lo menos una probabilidad de error de los datos de predicción utilizados por el uno o más procedimientos de ocultamiento.

7. Procedimiento según la Reivindicación 1, que comprende adicionalmente la estimación del valor de distorsión para la primera parte en base, en parte, a por lo menos una diferencia en valores de píxeles entre una versión de la primera parte construida por el uno o más procedimientos de ocultamiento y una versión libre de errores de la primera parte.

8. Procedimiento según la Reivindicación 1, en el que la estimación del valor de distorsión de la primera parte comprende adicionalmente la estimación de los componentes de distorsión del valor de distorsión para cada uno de los uno o más procedimientos de ocultamiento.

9. Aparato de codificación de datos multimedia que comprende:

quadmedios para estimar un valor de distorsión (802) para una primera parte de los datos multimedia en base, en parte, a por lo menos uno o más procedimientos de ocultamiento relacionados con el ocultamiento de la primera parte si la primera parte fuese recibida erróneamente; y quadmedios para determinar un procedimiento de codificación (804) para la primera parte en base, en parte, a por lo menos una comparación del valor de distorsión estimado y un umbral, caracterizado porque quadel umbral varía en función de uno o más factores seleccionados de una lista de factores, incluyendo la lista de factores: quaduna ubicación de la primera parte en una trama que contiene la primera parte, quaduna textura de un área de la trama que contiene la primera parte, quaduna posición de la trama que contiene la primera parte dentro de un grupo de imágenes que contienen la trama, quaduna distribución de valores de distorsión en la trama que contiene la primera parte, y quaduna actividad de movimiento del área de la trama que contiene la primera parte.

10. Aparato según la Reivindicación 9, que comprende adicionalmente medios para codificar la primera parte utilizando el procedimiento de codificación determinado.

11. Aparato según la Reivindicación 9, en el que los medios de determinación determinan el procedimiento de codificación para refrescar la primera parte.

12. Aparato según la Reivindicación 11, en el que el umbral varía en función de uno o más factores seleccionados de la lista de factores, incluyendo adicionalmente la lista de factores:

quadun modo de codificación de la trama que contiene la primera parte.

13. Aparato según la Reivindicación 9, que comprende adicionalmente medios para la intra-codificación de la primera parte para refrescar la primera parte en base a una comparación del valor de distorsión estimado y un umbral.

14. Aparato según la Reivindicación 9, en el que el aparato es un procesador de datos multimedia.

15. Medio legible por máquina que comprende unas instrucciones que al ejecutarlas hacen que una máquina lleve a cabo un procedimiento según cualquiera de las reivindicaciones 1 a 8.

Patentes similares o relacionadas:

Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]

Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]

Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]

Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]

Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]

Procedimiento de codificación de longitud variable y procedimiento de decodificación de longitud variable, del 14 de Agosto de 2019, de Godo Kaisha IP Bridge 1: Un método de codificación para codificar un coeficiente de un componente de frecuencia incluido en un bloque objetivo a codificar, comprendiendo el método de codificación: […]

Método de cálculo de vectores de movimiento, del 12 de Junio de 2019, de Panasonic Intellectual Property Corporation of America: Un sistema de codificación y descodificación de imágenes que incluye un aparato de codificación de imágenes que codifica un bloque actual incluido en una imagen actual […]