CODIFICACION DE VIDEO EN PRIMER PLANO Y DE FONDO; EN EL QUE LA IMAGEN SE DIVIDE EN PORCIONES.

Procedimiento para la codificación de vídeo que comprende: dividir una imagen (100) en un conjunto de bloques de codificación de forma regular que tienen una alineación predeterminada en relación con el área de la imagen (100),

correspondiendo cada bloque de codificación (102) con un grupo de elementos de codificación elementales; asociar una orden de escaneado dada con los bloques de codificación (102) a través de la imagen (100) para la formación de porciones de codificación de vídeo; determinar una forma (101) dentro de la imagen (100); seleccionar un subconjunto de bloques de codificación (102) para la forma determinada, en la que el subconjunto de los bloques de codificación define un área que cubre la forma determinada (101); determinar como objeto de codificación separado el subconjunto seleccionado de los bloques de codificación; determinar como objeto de fondo unitario el subconjunto de los bloques de codificación (103) que corresponde a la parte de la imagen (100) que excluye el objeto de codificación separado; codificar el objeto de codificación separado; y codificar como un objeto de codificación el objeto de fondo unitario, comprendiendo la codificación del objeto de fondo unitario: determinar lo largo de dicha orden de escaneado dada una pluralidad de porciones de codificación de bloques de codificación del subconjunto de bloques de codificación (103) que corresponden a la parte de la imagen (100) que excluye el objeto de codificación separado; de manera que una o más de las porciones de codificación está formada por bloques de codificación no contiguos respecto a dicha orden de escaneado dada

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2002/004932.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4, 02150 ESPOO.

Inventor/es: HANNUKSELA, MISKA, WANG,YE-KUI.

Fecha de Publicación: 2 de Noviembre de 2010.

Fecha Concesión Europea: 14 de Julio de 2010.

Clasificación Internacional de Patentes:

H04N7/26A8L
H04N7/26A8R
H04N7/26J14
H04N7/26J6B

Clasificación PCT:

H04N7/26

Clasificación antigua:

H04N7/26

CODIFICACION DE VIDEO EN PRIMER PLANO Y DE FONDO; EN EL QUE LA IMAGEN SE DIVIDE EN PORCIONES.

Fragmento de la descripción:

Esta invención se refiere a codificación de vídeo. Se refiere, en particular, aunque no exclusivamente, a codificación de vídeo y transmisión en conexiones de datos propensas a errores.

La transmisión de video requiere la codificación del video en una forma que permita su transmisión. Típicamente, implica una compresión efectiva, debido a la gran cantidad de información contenida en un flujo de imágenes que constituyen un video a transmitir.

ITU-TH.263 es una recomendación de codificación de vídeo de la Unión Internacional de Telecomunicaciones (ITU) que especifica la sintaxis del flujo de bits y la decodificación de un flujo de bits. En esta norma, las imágenes se codifican utilizando luminancia y dos componentes de diferencias de color (crominancia) (Y, CB y CR). Los componentes de crominancia se muestrean cada uno a la mitad de resolución lo largo de ambos ejes de coordenadas en comparación con el componente de luminancia.

Cada imagen codificada, así como el correspondiente flujo de bits codificados, se organiza en una estructura jerárquica con cuatro capas, que son, de arriba a abajo, una capa de imagen, una capa de segmento de imagen, una capa de macrobloque (MB) y una capa de bloque. La capa de segmento de imagen puede ser un grupo de capas de bloques o una capa de porciones.

Los datos de la capa de imagen contienen parámetros que afectan a la totalidad del área de la imagen y la decodificación de los datos de la imagen. Por defecto, cada imagen se divide en grupos de bloques. Un grupo de bloques (GOB) generalmente comprende una fila de macrobloques (16 líneas de píxeles subsecuenciales) o un múltiplo del mismo. Los datos de cada GOB consisten en una cabecera GOB opcional, seguida de datos de MB. Como alternativa a los GOB se pueden utilizar las llamadas porciones, donde cada imagen se divide en porciones en lugar de GOB. Los datos de cada porción consisten en una cabecera de porción seguida de los datos de MB.

Las porciones definen regiones dentro de una imagen codificada. Cada región es un número de MB en un orden de exploración normal. No hay dependencias de predicción a través de los límites de las porciones dentro de la misma imagen codificada. Sin embargo, la predicción temporal generalmente puede atravesar los límites de la porción a menos que se utilice el UIT-T H.263 Anexo I (Decodificación de Segmento Independiente). Las porciones pueden ser decodificadas independientemente del resto de los datos de la imagen (excepto para el encabezado de la imagen). En consecuencia, las porciones mejoran la resistencia al error en las redes con pérdida de paquetes.

Cada GOB o porción se divide en MB. Un MB se refiere a 16 x 16 píxeles de datos de luminancia y los 8 x 8 píxeles de datos de crominancia espacialmente correspondientes. En otras palabras, un MB se compone de cuatro bloques de luminancia 8 x 8 y dos bloques de crominancia 8 x 8 espacialmente correspondientes.

En lugar de utilizar las regiones formadas por un número de MBs en el orden de exploración normal, se propusieron regiones rectangulares que consisten en macrobloques NxM (N, M mayor o igual a uno) y que sustituyen a las estructuras de porción y GOB en la ITUT H.263 por parte de Cheung Sen-ching, "Proposal on using Region Layer in H.263+", ITU-T SG15 WP1 documento LBC-96-213, Julio 1996. Sin embargo, la propuesta no fue adoptada para la H.263.

En el modo de Decodificación de Segmento Independiente de ITU-T H.263 (UITT H.263 Anexo I), los límites de segmento (tal como se define por los límites de las porciones o los límites superiores de los GOB para los que se envían cabeceras de GOB, o los límites de la imagen, siempre que limiten una región de la forma más pequeña) son tratados de forma similar a los límites de fotografía, lo que elimina todos los errores de propagación de las porciones vecinas. Por ejemplo, los errores no se pueden propagar por compensación de movimiento o filtrado de bucle de desbloqueo de las porciones vecinas. Los límites de los segmentos sólo pueden cambiarse en imágenes INTRA, es decir, cuando no se requiere intercodificación.

El proyecto de norma ISO/IEC 14496-2:1999 (E), conocido como visual MPEG-4

o vídeo MPEG-4, es un proyecto de norma que tiene un diseño centrado en torno a una unidad básica de contenido llamada objeto audio-visual (AVO). Ejemplos de AVO son un músico (en movimiento) en una orquesta, el sonido generado por este músico, la silla donde está sentado, el fondo (posiblemente en movimiento) detrás de la orquesta, y texto explicativo para el paso de flujo. En el video MPEG-4, cada AVO está representado por separado y se convierte en la base de un flujo independiente.

La codificación de vídeo en movimiento natural en dos dimensiones es una parte del vídeo MPEG-4. El vídeo MPEG-4 es capaz de codificar objetos rectangulares convencionales de vídeo y objetos de vídeo en dos dimensiones de forma arbitraria. El video de base AVO se llama objeto de vídeo (VO). El VO puede ser escalable, es decir, se puede fraccionar, codificar, y enviar en dos o más capas de objeto de vídeo (VOL). Uno de estos VOL se llama capa de base, que debe recibir todos los terminales con el fin de mostrar cualquier tipo de vídeo. Los VOL restantes se llaman capas de mejora, que se pueden utilizar en caso de errores de transmisión o de capacidad de transmisión restringida. En caso de codificación de

vídeo no escalable, se codifica un VOL por VO.

Una instantánea en el tiempo de una capa de objeto de vídeo se llama un plano de objeto de vídeo (VOP). Para un vídeo rectangular, corresponde a una imagen o a un fotograma. Sin embargo, en general, los VOP pueden tener una forma arbitraria. Cada VOP se puede dividir en paquetes de vídeo. Cada VOP y paquete de video se divide en macrobloques de manera similar a la UIT-T H.263. La información del color (YUV) del macrobloque se codifica de manera similar a la UIT-T H.263, es decir, el macrobloque se divide en bloques de 8 x 8. Además, si el VOP tiene una forma arbitraria, la forma del macrobloque se codifica tal como se explica en el párrafo siguiente.

Los VO de video MPEG-4 pueden ser de cualquier forma, y, además, la forma, el tamaño y la posición del objeto pueden variar de un fotograma a otro. En cuanto a su representación general, un objeto de vídeo se compone de tres componentes de color (YUV) y un componente alfa. El componente alfa define la forma del objeto en base de imagen a imagen. Los objetos binarios forman la clase más sencilla de objetos. Están representados por una secuencia de mapas alfa binarios, es decir, imágenes bidimensionales, donde cada píxel es negro o blanco. El vídeo MPEG-4 ofrece un modo sólo de forma binaria para la compresión de estos objetos. El proceso de compresión se define exclusivamente por un codificador de forma binaria para la codificación de la secuencia de mapas alfa. Además de los objetos binarios, se pueden utilizar un mapa alfa de escala de grises para definir la opacidad del objeto. El límite del objeto se codifica usando un mapa alfa binario, mientras que la información alfa de escala de grises se codifica de manera similar a la codificación de textura utilizando la transformada DCT. Además de la secuencia de la forma del objeto y de las definiciones de opacidad, la representación comprende los colores de todos los píxeles en el interior de la forma del objeto. El vídeo MPEG-4 codifica estos objetos utilizando un codificador de forma binaria y a continuación un algoritmo basado en la transformada discreta del coseno de movimiento compensado (DCT) para la codificación de la textura interior.

También es conocido que es ventajoso segmentar un flujo de bits de vídeo en porciones de diferentes prioridades, por ejemplo, mediante la codificación de video escalable, la partición de datos, o la codificación basada en regiones descrita anteriormente.

El documento WO 99/49412 presenta, de acuerdo con su resumen, un procedimiento y un aparato para la codificación de datos digitales de imágenes, en el que una región de interés se puede especificar antes de que se haya iniciado el proceso de codificación

o durante el proceso de codificación, de modo que la prioridad de las salidas del codificador se modifican con el fin de poner más énfasis en la región de interés, aumentando así la velocidad y/o aumentando la fidelidad de la región reconstruida de interés. El sistema, por lo tanto, permite una reconstrucción más efectiva de las imágenes digitales en líneas de comunicación.

El...

Reivindicaciones:

1. Procedimiento para la codificación de vídeo que comprende:

dividir una imagen (100) en un conjunto de bloques de codificación de forma regular que tienen una alineación predeterminada en relación con el área de la imagen (100), correspondiendo cada bloque de codificación (102) con un grupo de elementos de codificación elementales;

asociar una orden de escaneado dada con los bloques de codificación (102) a través de la imagen (100) para la formación de porciones de codificación de vídeo;

determinar una forma (101) dentro de la imagen (100);

seleccionar un subconjunto de bloques de codificación (102) para la forma determinada, en la que el subconjunto de los bloques de codificación define un área que cubre la forma determinada (101);

determinar como objeto de codificación separado el subconjunto seleccionado de los bloques de codificación;

determinar como objeto de fondo unitario el subconjunto de los bloques de codificación (103) que corresponde a la parte de la imagen (100) que excluye el objeto de codificación separado;

codificar el objeto de codificación separado; y

codificar como un objeto de codificación el objeto de fondo unitario, comprendiendo la codificación del objeto de fondo unitario:

determinar lo largo de dicha orden de escaneado dada una pluralidad de porciones de codificación de bloques de codificación del subconjunto de bloques de codificación (103) que corresponden a la parte de la imagen (100) que excluye el objeto de codificación separado;

de manera que una o más de las porciones de codificación está formada por bloques de codificación no contiguos respecto a dicha orden de escaneado dada.

2. Procedimiento según la reivindicación 1, en el que la codificación de vídeo del objeto de codificación separado también comprende la sub-etapa de definir en el objeto de codificación separado porciones de codificación respecto a dicha orden de escaneado dada.

3. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que el área que cubre la forma determinada (101) es un área rectangular, con lo cual un cuadrado es un subconjunto de rectángulos.

4. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que la codificación de vídeo del objeto de codificación separado asociado con la forma

determinada es independiente de la codificación de vídeo del objeto de fondo para inhibir la propagación de errores en el al menos un objeto de codificación separado.

5. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que el procedimiento también comprende proteger errores del objeto de codificación separado contra la corrupción de los datos.

6. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que el procedimiento también comprende proteger errores de desigualdad incluyendo paquetes de datos prioritarios que contienen información relacionada con el objeto de codificación separado.

7. Codificador de vídeo que comprende:

medios para dividir una imagen (100) en un conjunto de bloques de codificación de forma regular que tienen una alineación predeterminada en relación con el área de la imagen (100), correspondiendo cada bloque de codificación a un grupo de elementos de codificación elementales, en el que una orden de escaneado dada está asociada con los bloques de codificación (102) a través de la imagen (100) para la formación de porciones de codificación de vídeo;

medios para determinar una forma (101) en una imagen (100);

medios para seleccionar un subconjunto de bloques de codificación (102) para la forma determinada, definiendo el subconjunto de bloques de codificación define un área que cubre la forma determinada (101);

medios para determinar como objeto de codificación separado el al menos un subconjunto seleccionado de los bloques de codificación;

medios para determinar como objeto de fondo unitario el subconjunto de los bloques de codificación (103) que corresponde a la parte de la imagen (100) que excluye el objeto de codificación separado;

medios para codificar el objeto de codificación separado; y

medios para codificar como objeto de codificación el objeto de fondo unitario, comprendiendo los medios para codificar la imagen de fondo:

medios para determinar a lo largo de dicha orden de escaneado dada una pluralidad de porciones de codificación de bloques de codificación del subconjunto de los bloques de codificación (103) que corresponde a la parte de la imagen (100) que excluye el objeto de codificación separado, de manera que

una o más de las porciones de codificación está formada por bloques de codificación no contiguos respecto a dicha orden de escaneado dada.

8. Codificador de vídeo según la reivindicación 7, en el que los medios para codificar el objeto de codificación separado están configurados para definir, en el objeto de codificación separado porciones de codificación respecto a dicha orden de escaneado dada.

9. Codificador de vídeo según la reivindicación 7 u 8, en el que el área que cubre

la al menos una forma determinada (101) es un área rectangular, en la que un cuadrado es un 5 subconjunto de rectángulos.

10. Codificador de vídeo según una cualquiera de las reivindicaciones 7 a 9, en el que la codificación de vídeo del objeto de codificación separado asociado con cada una de la al menos una forma determinada es independiente de la codificación de vídeo del objeto de fondo para la inhibición de la propagación de errores en el objeto de codificación separado.

11. Codificador de vídeo según una cualquiera de las reivindicaciones 7 a 10, comprendiendo el codificador de vídeo también medios para la protección de errores del objeto de codificación separado contra la corrupción de datos.

12. Codificador de vídeo según una cualquiera de las reivindicaciones 7 a 11, comprendiendo el codificador de vídeo también medios para realizar la protección de errores de desigualdad que incluye paquetes de datos prioritarios que contienen información relacionada con el objeto de codificación separado.

13. Producto de programa de ordenador que comprende medios de programa ejecutables en un ordenador para hacer que un aparato codifique en vídeo una imagen (100), comprendiendo el producto de programa un código de programa ejecutable en ordenador para hacer que el aparato realice un procedimiento según una cualquiera de las reivindicaciones 1 a

Patentes similares o relacionadas:

BARRIDO DE COLOR Y POSICIONAMIENTO DE SUBTÍTULOS, del 24 de Marzo de 2011, de SONY CORPORATION: BORRADO DE COLOR Y POSICIONAMIENTO DINAMICO DE SUBTITULOS PARA UNA IMAGEN DE VIDEO QUE SE CONSIGUE CODIFICANDO Y DESCODIFICANDO LOS SUBTITULOS SEPARADAMENTE DE […]

PROCEDIMIENTO DE CODIFICACION DE VIDEO, PROCEDIMIENTO DE DESCODIFICACION DE VIDEO, PROGRAMA DE CODIFICACION DE VIDEO, PROGRAMA DE DESCODIFICACION DE VIDEO, APARATO DE CODIFICACION DE VIDEO, APARATO DE DESCODIFICACION DE VIDEO, del 27 de Octubre de 2010, de NTT DOCOMO, INC.: Un procedimiento de codificación de vídeo para que un aparato de codificación de vídeo codifique una película dividida en una pluralidad de regiones, comprendiendo […]

TRANSCODIFICADOR DIGITAL CON INSERCION DE LOGO, del 24 de Febrero de 2010, de GENERAL INSTRUMENT CORPORATION: Método de inserción de un logo transparente en el flujo de bits de un transcodificador de MPEG que tiene secciones de codificación y de descodificación […]

MÉTODO DE DECODIFICACIÓN Y APARATO QUE PERMITE UN CAMBIO RÁPIDO DE VÍDEO COMPRIMIDO, del 27 de Diciembre de 2011, de THOMSON LICENSING: Decodificador de vídeo para recibir datos de tren comprimido y proporcionar una salida de vídeo descomprimida, comprendiendo dicho decodificador: un receptor para recibir […]

MÉTODO DE CODIFICACIÓN Y APARATO QUE PERMITE UN RÁPIDO CAMBIO DE CANAL DE VÍDEO COMPRIMIDO, del 27 de Diciembre de 2011, de THOMSON LICENSING: Codificador de vídeo para recibir imágenes de entrada y para proporcionar datos de tren comprimido, comprendiendo dicho decodificador: una porción de decodificación normal […]

SINCRONIZACIÓN DE DATOS DE AUDIO Y VÍDEO EN UN SISTEMA DE COMUNICACIÓN INALÁMBRICO, del 9 de Marzo de 2011, de QUALCOMM INCORPORATED: Un sincronizador de flujo de datos, que comprende: medios para descodificar datos de vídeo codificados y para proporcionar datos de vídeo descodificados, […]

PROCEDIMIENTO DE CODIFICACION Y DESCODIFICACION DE IMAGENES, del 31 de Marzo de 2010, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: Un procedimiento para codificar una imagen, comprendiendo dicho procedimiento: codificar una imagen de entrada (Img) para obtener datos codificados […]

DESCODIFICADOR DE IMAGENES EN MOVIMIENTO, del 9 de Julio de 2010, de SHARP KABUSHIKI KAISHA: Un dispositivo de descodificación de imágenes de vídeo que tiene un primer modo de descodificación para descodificar una imagen en el interior […]