Detección de cortes de escena en un flujo de bitios de vídeo MPEG.
Un método para detectar cortes de escena en un flujo de bitios en un vídeo de tipo MPEG,
que comprende los pasos de:
(a) determinar en una pluralidad de tramas cada trama que tiene unos campos primero y segundo, un número de macrobloques codificados para cada campo en cada trama primera y segunda;
(b) fijar un número de macrobloques predichos igual a un número de macrobloques predichos hacia adelante después de la determinación de un campo correspondiente que ha de ser el primer campo en una trama; y
(c) fijar el número de macrobloques predichos igual a un número de macrobloques predichos hacia atrás después de la determinación del campo correspondiente que ha de ser el segundo campo en la trama;
(d) determinar una relación entre el número de macrobloques predichos con el número de macrobloques codificados de cada uno;
(e) seleccionar un campo que tenga una relación más baja entre los campos primero y segundo;
(f) comparar la relación más baja con un valor umbral; y
(g) detectar un corte de escena después de determinar que la relación más baja es menor que el valor umbral, en donde el corte de escena corresponde al campo seleccionado.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2002/029883.
Solicitante: THOMSON LICENSING.
Nacionalidad solicitante: Francia.
Dirección: 1-5, RUE JEANNE D'ARC 92130 ISSY-LES-MOULINEAUX FRANCIA.
Inventor/es: PETERSON,Richard Mateer, CHALOM,Edmond.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04B1/66 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04B TRANSMISION. › H04B 1/00 Detalles de los sistemas de transmision, no cubiertos por uno de los grupos H04B 3/00 - H04B 13/00; Detalles de los sistemas de transmisión no caracterizados por el medio utilizado para la transmisión. › para reducir el ancho de banda de las señales; para mejorar la eficacia de la transmisión (H04B 1/68 tiene prioridad).
- H04N5/14 H04 […] › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 5/00 Detalles de los sistemas de televisión (Detalles de los dispositivos de análisis o sus combinaciones con la producción de la tensión de alimentación H04N 3/00). › Circuitos de señal de imagen para la región de frecuencias de video (H04N 5/222 tiene prioridad).
- H04N5/92 H04N 5/00 […] › Transformación de la señal de televisión para el registro, p. ej. modulación, cambio de frecuencia; Transformación inversa para la sincronización sonora.
- H04N7/26
PDF original: ES-2385324_T3.pdf
Fragmento de la descripción:
Detección de cortes de escena en un flujo de bitios de vídeo MPEG.
Referencias cruzadas con aplicaciones relacionadas Esta solicitud reivindica los beneficios de la Solicitud de Patente Provisional de EEUU Nº 60/324.890, presentada el 26 de septiembre de 2001.
Campo del invento El presente invento se refiere a un vídeo de tipo MPEG, y más particularmente a la detección de un corte de escena en el flujo de bitios de vídeo.
Antecedentes del invento
Las secuencias de vídeo basadas en MPEG pueden estar divididas en escenas que pueden variar en longitud desde menos de un segundo hasta varios minutos o más. La detección de estas divisiones o cortes de escena hace posible una amplia variedad de características de valor añadido. Por ejemplo, una trama puede ser seleccionada de cada escena para crear un guión que resume los contenidos de una grabación de vídeo. Además, se puede utilizar un editor de vídeo para manipular la grabación de vídeo en modo de escena a escena, por ejemplo reordenando escenas o mediante la aplicación de técnicas de procesamiento de imágenes a cada trama en una escena.
Las secuencias de vídeo MPEG incluyen tres tipos de tramas, Intra-Tramas (I) , Inter-Tramas (P) , y Tramas Bidireccionales (B) . Las tramas I codifican una imagen fija utilizando un método similar a la codificación JPEG. Las tramas P son predichas a partir de una trama I o P previa. Las tramas B son predichas a partir de una trama I o P y de una trama I o P próxima. Estos tres tipos de tramas se codifican usando una Transformación Cosenoidal Discreta (DCT) , la cual organiza la redundancia en direcciones espaciales entre tramas. No obstante, para las tramas I la información DCT se obtiene directamente a partir de una muestra de imagen, en tanto que para las tramas P y B la información DCT se obtiene a partir de un error residual después de la predicción.
Cada trama se divide en una pluralidad de macrobloques. Cada uno de ellos incluye información relacionada con una pluralidad de bloques de luminancia, por ejemplo Y1, Y2, Y3 e Y4, y una pluralidad de bloques de crominancia, por ejemplo uno U y otro V en un sistema YUV. Cada uno de estos bloques incluye una pluralidad de pels, o elementos de elementos de imagen, por ejemplo un bloque 8x8.
Cuando el vídeo ha sido codificado en un flujo de bitios de tipo MPEG la detección del corte de escena puede realizarse sin la decodificación completa del flujo de bitios, lo cual aumenta la velocidad de procesamiento del vídeo. También se puede extraer información adicional tal como tipos de codificación de macrobloques, vectores de movimiento y coeficientes DCT a partir del flujo de bitios sin decodificar totalmente el flujo de bitios.
Un método para la detección de cortes de escena se realiza de la siguiente manera:
1. para las tramas I se determinan las diferencias cuadráticas medias entre los coeficientes DCT;
2. para las tramas P el método propuesto determina el número de macrobloques predichos hacia adelante;
3. para las tramas B se cuenta el menor de los números de macrobloques codificados en adelante y del número de macrobloques codificados hacia atrás; y
4. a continuación se determina un mínimo en una representación de estos números con respecto al número de tramas.
En otro método propuesto para la detección de cortes de escena: para las tramas I se utiliza una diferencia entre los histogramas de color formados a partir de los coeficientes DC usados, y se combina con la información sobre la relación entre el número de macrobloques sin compensación de movimiento con el número de ellos con compensación de movimiento. El método propuesto busca un pico en una representación con respecto al número de tramas. Para las tramas B se determina la relación de las predicciones hacia adelante con las predicciones hacia atrás. En todos los casos se aplica una técnica de umbral adaptativa a fin de identificar los picos.
Otro método adicional hace uso de histogramas para todas las tramas (I, P y B) formadas a partir de los coeficientes Cosenoidales Discretos (DC) con compensación de movimiento.
No obstante, no existe actualmente un sistema o método conocido de detección de corte de escena basado en el examen global de todas las predicciones dentro de un subgrupo de imágenes (GOP) .
Resumen del invento
El invento se refiere a un método de acuerdo con la reivindicación 1. Las realizaciones preferidas se detallan en las reivindicaciones dependientes.
Breve descripción de los dibujos A continuación se describen con detalle las realizaciones preferidas del presente invento haciendo referencia a los dibujos que se acompañan, en los que:
la Figura 1 ilustra unos cortes de escena en un subgrupo GOP de acuerdo con los principios del presente invento;
la Figura 2 es un diagrama de flujos que ilustra un primer método para la detección de un corte de escena de acuerdo con los principios del presente invento; y la Figura 3 es un diagrama de flujos que ilustra un segundo método para la detección de un corte de escena de acuerdo con los principios del presente invento.
Descripción detallada De acuerdo con los principios del presente invento la detección del corte de escena se realiza recogiendo datos sobre el número de macrobloques predichos hacia adelante y hacia atrás en cada Inter Trama (P) o Trama Bidireccional (B) , analizándolos a un nivel de sub GOP (cada trama de anclaje junto con las tramas B precedentes) sin considerar cada trama de forma independiente. Se sobreentiende que el presente invento puede ser puesto en práctica en diversas formas de soporte físico, soporte lógico, microprogramas, procesadores con fines específicos, o una combinación de ellos. En una realización a modo de ejemplo el presente invento se ha puesto en práctica en un soporte lógico como un programa de aplicación incorporado de forma tangible en un dispositivo de almacenamiento de programas. El programa de la aplicación puede ser cargado en, y ejecutado por, una máquina que comprende cualquier disposición de elementos apropiada. Preferiblemente, la máquina está instalada en una plataforma de ordenador que tiene un soporte físico tal como una o más unidades centrales de procesamiento (CPU) , una memoria de acceso aleatorio (RAM) , y una interfaz o interfaces de entrada/salida (I/O) . La plataforma de ordenador incluye también un sistema operativo y un código de microinstrucción. Los diversos procesos y funciones descritos aquí pueden formar parte bien del código de microinstrucción o del programa de aplicación (o de una combinación de ellos) que se ejecuta a través del sistema operativo. Además, se pueden conectar otros diversos dispositivos periféricos a la plataforma de ordenador tal como un dispositivo o dispositivos de almacenamiento de datos y un dispositivo o dispositivos de impresión.
Se ha de entender además que, debido a que algunos de los componentes del sistema y de los pasos del método descritos en las figuras que se acompañan pueden ser puestas en práctica en soporte lógico, las conexiones, interconexiones o relaciones funcionales efectivas entre los componentes del sistema (o los pasos del proceso) pueden diferir dependiendo de la forma en la que se haya programado el presente invento. Las enseñanzas del presente invento aquí proporcionadas así como éstas y otras aplicaciones o configuraciones similares del presente invento podrán ser comprendidas por cualquier persona con una formación normal en la técnica relacionada.
Para cada trama P o B se registra el número de macrobloques que utilizan la predicción hacia adelante y el número de macrobloques que utilizan la predicción hacia atrás (encontrada solamente en las tramas B) . Se examinan los datos de cada trama de anclaje, intra-trama (I) o P, y todas las tramas B inmediatamente anteriores.
Si un macrobloque ha sido predicho de forma inapropiada la compensación de movimiento posterior residual puede ser amplia, y se necesitan unos coeficientes DCT amplios con el fin de realizar una compensación por la predicción. Para estas predicciones existe una alta probabilidad (aproximadamente mayor del 50%) de que la predicción sea falsa. Esto es, que un macrobloque de trama de anclaje en el que se base la predicción pueda no tener una asociación real con el macrobloque en la trama predicha, aunque la trama de anclaje pueda ser lo suficientemente similar a para que a partir de ella se pueda realizar una predicción. Debido a esto se ignora tal macrobloque en la recogida de... [Seguir leyendo]
Reivindicaciones:
1. Un método para detectar cortes de escena en un flujo de bitios en un vídeo de tipo MPEG, que comprende los pasos de:
(a) determinar en una pluralidad de tramas cada trama que tiene unos campos primero y segundo, un número de macrobloques codificados para cada campo en cada trama primera y segunda;
(b) fijar un número de macrobloques predichos igual a un número de macrobloques predichos hacia adelante después de la determinación de un campo correspondiente que ha de ser el primer campo en una trama; y
(c) fijar el número de macrobloques predichos igual a un número de macrobloques predichos hacia atrás después de la determinación del campo correspondiente que ha de ser el segundo campo en la trama;
(d) determinar una relación entre el número de macrobloques predichos con el número de macrobloques codificados de cada uno;
(e) seleccionar un campo que tenga una relación más baja entre los campos primero y segundo;
(f) comparar la relación más baja con un valor umbral; y
(g) detectar un corte de escena después de determinar que la relación más baja es menor que el valor umbral, en donde el corte de escena corresponde al campo seleccionado.
2. El método de la reivindicación 1, en el que la pluralidad de tramas es un grupo de tramas, en el que cada una de ellas incluye dos campos, en donde el grupo de tramas comprende un subgrupo de imágenes y el flujo de bitios de vídeo incluye una pluralidad de subgrupos de imágenes.
3. El método de la reivindicación 2, en el que antes del paso (a) están comprendidos los pasos de: determinar si una primera imagen de un subgrupo de imágenes es una imagen I; determinar si una imagen anterior era una imagen I o P; y avanzar el procesamiento hasta un subgrupo de imágenes siguiente, en respuesta a una determinación de
que la primera imagen que ha de ser una imagen I y que la imagen previa ha de ser una imagen I o P.
4. El método de la reivindicación 1, que además comprende los pasos de: iniciar el número de macrobloques predichos en cero para cada campo; e iniciar el número de macrobloques codificados en cero para cada campo.
5. El método de la reivindicación 1, en el que al menos uno de la pluralidad de potenciales cortes de escena existe entre campos en entrelazados de una trama.
Patentes similares o relacionadas:
Sistema y método para codificación y decodificación aritmética, del 29 de Abril de 2020, de NTT DOCOMO, INC.: Método de decodificación aritmética para convertir una secuencia de información compuesta por una secuencia de bits en una secuencia de eventos binarios compuesta […]
Filtro de desbloqueo condicionado por el brillo de los píxeles, del 25 de Marzo de 2020, de DOLBY INTERNATIONAL AB: Método para desbloquear datos de píxeles procesados con compresión de vídeo digital basado en bloque, incluyendo los pasos: - recibir […]
Método para codificar y descodificar imágenes B en modo directo, del 19 de Febrero de 2020, de Godo Kaisha IP Bridge 1: Un método para generar y descodificar una secuencia de bits de una imagen B objetivo, en donde generar la secuencia de bits de la imagen B objetivo incluye las siguientes […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para compresión de imágenes de video usando predicción en modo directo, que incluye: proporcionar una secuencia de cuadros predichos […]
Interpolación mejorada de cuadros de compresión de vídeo, del 4 de Diciembre de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método de compresión de imágenes de video que comprende: proporcionar una secuencia de cuadros referenciables (I, P) y predichos bidireccionales […]
Capa de sectores en códec de vídeo, del 27 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un procedimiento de decodificación de vídeo e imágenes, que comprende: decodificar una imagen de un flujo de bits codificado que tiene una jerarquía […]
Transformación solapada condicional, del 20 de Noviembre de 2019, de Microsoft Technology Licensing, LLC: Un método para codificar un flujo de bits de vídeo utilizando una transformación solapada condicional, en donde el método comprende: la señalización de un modo de filtro […]
Técnica para una simulación del grano de película exacta de bits, del 4 de Septiembre de 2019, de InterDigital VC Holdings, Inc: Un procedimiento para simular un grano de película en un bloque de imagen que comprende: calcular el promedio de los valores de luminancia de píxeles dentro del bloque de […]