TÉCNICA DE ADICIÓN DE RUIDO DE CONFORT VIDEO.
Método para reducir artefactos en un tren de vídeo, que comprende las etapas de decodificación del tren de vídeo y de adición de ruido aleatorio,
al menos, a un píxel de una imagen del tren de vídeo tras la decodificación, en una cantidad correlacionada con información sobre luminancia de, al menos, una porción de una imagen actual, caracterizado por la puesta en correlación del ruido utilizando un factor dependiente de la correlación temporal de la imagen actual con una de una imagen previamente visualizada o decodificada
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2004/030745.
Solicitante: THOMSON LICENSING.
Nacionalidad solicitante: Francia.
Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.
Inventor/es: LLACH,JOAN, BOYCE,JILL,MACDONALD, TOURAPIS,ALEXANDROS,MICHAEL.
Fecha de Publicación: .
Fecha Solicitud PCT: 21 de Septiembre de 2004.
Clasificación Internacional de Patentes:
- H04N7/26P4
Clasificación PCT:
- H04N7/26
Clasificación antigua:
- H04N7/26
Países PCT: Alemania, España, Francia, Reino Unido, Italia.
PDF original: ES-2363772_T3.pdf
Fragmento de la descripción:
REFERENCIA A OTRAS SOLICITUDES RELACIONADAS
La presente solicitud reivindica su prioridad, de acuerdo con 35 U.S.C. 119(e) a la Solicitud de Patente Provisional Estadounidense con el Número de Serie 60/505.354, presentada el 23 de septiembre de 2003.
CAMPO TÉCNICO
La presente invención se refiere a una técnica para la reducción de artefactos en relación con la decodificación de un flujo de vídeo codificado.
TÉCNICA ANTERIOR
La decodificación de trenes de vídeo comprimidos a una baja tasa binaria suele generar artefactos visibles, que son percibidos por el espectador. Los efectos de pixelado y el ruido de mosaico son artefactos muy frecuentes que surgen cuando se utilizan técnicas de compresión basadas en bloques. El sistema visual humano tiene una mayor sensibilidad ante ciertos tipos de artefactos, y de este modo, dichos artefactos se perciben con mayor claridad y resultan más molestos que otros. La adición de ruido aleatorio al flujo decodificado puede reducir la perceptibilidad de dichos artefactos relacionados con la compresión, pero las grandes diferencias entre fotogramas creadas por la propia adición de ruido pueden generar artefactos perceptibles y molestos. La adición de una señal de oscilación puede reducir la sensibilidad humana ante los artefactos de las imágenes, por ejemplo, ocultando las deformidades de los contornos y el pixelado. Una de las técnicas anteriores ha propuesto la inclusión en una imagen de una vibración de ruido aleatorio basado en el grano de las películas, para disimular el efecto de pixelado. La justificación de la inclusión de dicho ruido aleatorio es que el error aleatorio es más fácil de asimilar que el error estructurado o correlacionado. Otras técnicas anteriores han propuesto la inclusión de una señal de vibración en un tren de vídeo para ocultar los artefactos relacionados con la compresión. Una técnica anterior ha propuesto la inclusión de una vibración de ruido aleatorio en el proceso de codificación y decodificación de vídeo del filtro de desbloqueo de bucles de la norma de codificación de vídeo ITU/ISU H.264, conocida habitualmente como norma de codificación JVT. La cantidad de vibración a añadir depende de la posición de un píxel con respecto al borde de un bloque. Otra técnica anterior ha propuesto la inclusión del ruido aleatorio con posterioridad a la decodificación de vídeo (es decir, añadir el ruido como un “procesamiento posterior”), para su utilización como una señal de ruido aceptable. La cantidad de ruido añadida depende del parámetro de cuantificación y de la cantidad de ruido añadida a unos píxeles espacialmente adyacentes. El término “señal de ruido aceptable” procede de la utilización del ruido en la compresión de audio, y se refiere al patrón de ruido generado en el lado del receptor para evitar el silencio total, que resulta incómodo para el oyente. Puede obtenerse información sobre las técnicas anteriores en las que se añade ruido aleatorio con posterioridad a la decodificación de vídeo en los dos artículos siguientes: Christina Gomila, Alexander Kobilansky: "SEI message for film grain encoding" JVT of ISO IEC MPEG and ITU-T VCEG JVT-H022, 23 de mayo de 2003 (2003-05-23), páginas 1 -14, XP002308742 Ginebra, Suiza. Christina Gomila: "SEI message for film grain encoding: syntax and results" JVT of IS0 IEC MPEG and ITU-T VCEG JVT-I013 Revisión 2,2 septiembre 2003 (2003-09-02), Páginas 1-11, XP002308743 San Diego, CA, EE.UU. Las anteriores técnicas de reducción de artefactos mediante la adición de ruido suelen reducir los artefactos espaciales, pero se corre el riesgo de generar anormalidades temporales, es decir, unas grandes diferencias entre fotogramas. De este modo, es necesaria una técnica para reducción de artefactos durante la decodificación de un tren de vídeo codificado que supere las desventajas que se acaban de mencionar.
BREVE RESUMEN DE LA INVENCIÓN
Sucintamente, de acuerdo con una realización preferida de los presentes principios, se facilita un método para conseguir una reducción de los artefactos en un tren de vídeo durante la decodificación, comienza con la decodificación del tren de vídeo. Tras la decodificación, se añade ruido al tren de vídeo añadiendo ruido a cada píxel, en una cantidad correlacionada con la luminancia de al menos una parte de una imagen previamente decodificada. De este modo, de acuerdo con estos principios, la correlación con la luminancia ayuda a determinar el ruido que es necesario añadir para reducir las grandes diferencias entre fotogramas que constituían una de las desventajas de las anteriores técnicas de adición de ruido. El ruido se añade utilizando un factor dependiente de la correlación temporal de la imagen actual con la de una imagen anteriormente visualizada o codificada.
BREVE DESCRIPCIÓN DE LAS FIGURAS:
La figura 1 muestra un diagrama de bloques de una primera realización de un decodificador de vídeo de acuerdo con estos principios, para reducción de artefactos relacionados con la decodificación de un tren de vídeo codificado mediante la adición de ruido correlacionado con la luminancia de al menos una parte de la imagen actual;
La figura 2 muestra un diagrama de bloques de una segunda realización de un decodificador de vídeo de acuerdo con estos principios, para la reducción de los artefactos relacionados con la decodificación de un tren de vídeo codificado mediante la adición de ruido correlacionado con la luminancia de, al menos, una parte de la imagen actual; y La figura 3 muestra un diagrama de bloques de una tercera realización de un decodificador de vídeo de acuerdo con estos principios, para reducción de artefactos relacionados con la decodificación de un tren de vídeo codificado mediante la adición de ruido correlacionado con la luminancia de, al menos, una parte de la imagen actual;
DESCRIPCIÓN DETALLADA
De acuerdo con estos principios, la adición de un ruido aleatorio, que contenga una señal de vibración, a la señal ya codificada, en una cantidad correlacionada con la luminancia de, al menos, una porción de una imagen actual mejora la calidad subjetiva del vídeo. Hasta el momento actual, se había demostrado que la adición de ruido a una señal codificada mejora la calidad de la señal de vídeo. El impacto visual que representa añadir una señal de ruido a la secuencia de vídeo, en lugar de hacerlo a una sola imagen, ha pasado a ser un factor a tener en cuenta a la hora de determinar la magnitud de la señal de ruido. Se ha prestado atención al impacto visual que supone añadir una señal de ruido a la secuencia de vídeo, en lugar de hacerlo en una sola imagen, a la hora de determinar la magnitud de la señal de ruido. La magnitud de la señal de ruido correspondiente a un píxel de una película puede ponerse en correlación con el valor de la señal de ruido que se añade a los píxeles de la imagen previamente visualizada, por ejemplo, las señales de ruido están correlacionadas en el tiempo. Alternativamente, la correlación temporal puede estar basada en la imagen anteriormente decodificada, en lugar de basarse en la imagen anteriormente visualizada. En función de cuanto antecede, la señal de ruido añadida, utilizando una correlación temporal con un factor de correlación α,0 ≤α≤ 1, puede calcularse como sigue:
N(k, x, y) = (1 – α) * N(k-1, x, y) + α * R(k, x, y) (1)
El número aleatorio R(k, x, y) puede generarse utilizando cualquier tipo de distribución de números aleatorios, por ejemplo, una distribución Normalizada, Gaussiana o Laplaciana. R(k, x, y) puede también recortarse dentro de un determinado rango, en caso necesario. El generador de números aleatorios puede implementarse mediante una tabla de búsquedas. R(k, x, y) puede también incluir una correlación espacial, como la utilizada, por ejemplo, para generar ruido de tipo “grano de película”. De acuerdo con estos principios, la adición de ruido parece depender en gran medida del brillo (es decir, de la luminancia) de un bloque o macrobloque, pero también del brillo de sus bloques adyacentes. Cuanto más oscuro sea el bloque/macrobloque, más fácil será percibir el ruido con una varianza relativamente elevada. Basándose en esto, la cantidad de ruido a añadir, N(k, x, y) puede deducirse de la relación:
N(k, x, y) = 1 – γ((k, x, y))) * N(k-1, x, y) + γ(k, x, y) * (1 -φ(k, x, y)) * R(k, x, y) (2)
Representando la función γ(k, x, y) un factor... [Seguir leyendo]
Reivindicaciones:
1. Método para reducir artefactos en un tren de vídeo, que comprende las etapas de decodificación del tren de vídeo y de adición de ruido aleatorio, al menos, a un píxel de una imagen del tren de vídeo tras la decodificación, en una cantidad correlacionada con información sobre luminancia de, al menos, una porción de una imagen actual, caracterizado por la puesta en correlación del ruido utilizando un factor dependiente de la correlación temporal de la imagen actual con una de una imagen previamente visualizada o decodificada.
2. Método de acuerdo con la reivindicación 1, en el que el factor de correlación se establece de acuerdo, bien con un componente de luma o bien un componente de color.
3. Método de acuerdo con la reivindicación 1, que incluye adicionalmente la etapa de añadir ruido a un componente de color de la imagen de acuerdo con un componente de luma.
4. Método de acuerdo con la reivindicación 1, en el que el factor de correlación se establece por primera vez sobre un bloque de imagen de N x N píxeles, donde N es un numero entero, con anterioridad a la interpolación del ruido aditivo.
5. Método de acuerdo con la reivindicación 1, que comprende adicionalmente la etapa de ajuste del ruido en función de la intensidad de un bloque de N x N, donde N es un número entero de píxeles adyacentes.
6. Método de acuerdo con la reivindicación 1, en el que la cantidad de ruido está correlacionada utilizando una aproximación de un filtro de respuesta finita a impulsos (FIR).
7. Disposición de decodificador para decodificar un tren de vídeo codificado para conseguir una reducción de artefactos, que comprende: un decodificador de vídeo (12) para decodificar un tren de vídeo codificado entrante, para obtener imágenes decodificadas; un dispositivo de almacenamiento de imágenes de referencia (14) para almacenar, al menos, una imagen previamente decodificada para su utilización por parte del decodificador a fin de decodificar imágenes futuras, un generador de ruido (16) para generar ruido aleatorio para añadirlo, al menos, a un píxel de una imagen codificada, en una cantidad correlacionada con información de luminancia de, al menos, una parte de la imagen actual, caracterizado por la puesta en correlación del ruido utilizando un factor dependiente de la correlación temporal de la imagen actual con la de una imagen previamente visualizada o decodificada; un dispositivo de almacenamiento de imágenes de ruido (17) para almacenar la información de ruido para su posterior utilización por parte del generador de ruido; un bloque sumador para sumar el ruido generado por el generador de ruido a una imagen decodificada procedente del decodificador; y un recortador (20) para recortar el ruido sumado y la imagen decodificada.
8. Disposición de decodificador de acuerdo con la reivindicación 7, en la que el generador de ruido implementa una ejemplificación de un filtro de respuesta finita a impulsos.
9. Disposición de decodificador de acuerdo con la reivindicación 7, en la que el generador de ruido implementa una aproximación de un filtro de respuesta infinita a impulsos.
10. Disposición de decodificador de acuerdo con la reivindicación 7, en la que el generador de ruido genera ruido de acuerdo con imágenes decodificadas y con información de tren binario proporcionada por el decodificador.
11. Disposición de decodificador de acuerdo con la reivindicación 7, en la que la información de tren binario comprende un parámetro de cuantificación.
12. Disposición de decodificador de acuerdo con la reivindicación 7, que incluye adicionalmente un segundo dispositivo de almacenamiento de imágenes para almacenar imágenes de bloque de N x N píxeles promediadas, donde N es un número entero, para ser utilizado por el generador de ruido.
13. Disposición de decodificador para decodificar un tren de vídeo codificado para conseguir una reducción de artefactos, que comprende: un decodificador de vídeo (12) para decodificar un tren de vídeo codificado entrante para obtener imágenes decodificadas; un dispositivo de almacenamiento de imágenes de referencia (14) para almacenar, al menos, una imagen previamente decodificada para su utilización por parte del decodificador para decodificar imágenes futuras; un generador de ruido (16) para generar ruido de acuerdo con imágenes codificadas e información de tren binario procedente del decodificador para añadirlo, al menos, a un píxel de la imagen decodificada en una cantidad correlacionada con el ruido aditivo de, al menos, un píxel de una imagen anterior, caracterizado por la puesta en
correlación del ruido utilizando un factor dependiente de la correlación temporal de la imagen actual con una imagen previamente visualizada o una imagen previamente decodificada; un dispositivo de almacenamiento de imágenes (22) para almacenar una imagen consistente en un bloque de N x N píxeles promediados, donde N es un número entero, para su utilización por parte del generador de ruido, y un bloque sumador (18) para sumar el ruido generado por el generador de ruido a una imagen decodificada procedente del decodificador.
14. Disposición de decodificador de acuerdo con la reivindicación 13, en la que el generador de ruido implementa una ejemplificación de un filtro de respuesta finita a impulsos.
Patentes similares o relacionadas:
UN PROCEDIMIENTO Y DISPOSITIVO ASOCIADO PARA FILTRAR IMÁGENES DIGITALES DE VIDEO, del 21 de Noviembre de 2011, de NOKIA CORPORATION: Un procedimiento para reducir distorsiones visuales en una trama de una señal de vídeo digital, que se codifica en bloques y luego se descodifica, estando […]
COMPRESIÓN Y DESCOMPRESIÓN DE IMÁGENES, del 4 de Abril de 2011, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Aparato de descompresión que comprende: - una entrada o entradas para recibir información de imagen y una pluralidad de conjuntos de parámetros de control para […]
Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]