Procesamiento de un flujo de datos digitales.

Procedimiento de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e inter-secuencias, procedimiento que consta de una etapa

(E1) de corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y de cálculo de signaturas para estos segmentos, y una etapa (E2) de detección de inter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo:

- una primera detección de inter-secuencias mediante detección de separación, separando dicha separación dos inter-secuencias o una inter-secuencia y una secuencia,

- una alimentación de una base de referencia (BR) con al menos las signaturas de los segmentos de las intersecuencias detectadas por la primera detección,

- una segunda detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa (E1) de corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia (BR).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2010/050304.

Solicitante: Orange.

Inventor/es: NATUREL,XAVIER, BERRANI,SID AHMED.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES... > G06K9/00 (Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00))
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES... > Métodos o disposiciones para la lectura o el reconocimiento... > G06K9/62 (Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > DIFUSION (BROADCAST) (comunicación multiplex H04J;... > Disposiciones para las aplicaciones de difusión... > H04H60/37 (para identificar segmentos de información de difusión, p. ej. escenas o programas de extracción ID)
google+ twitter facebookPin it
Procesamiento de un flujo de datos digitales.
Procesamiento de un flujo de datos digitales.

Texto extraído del PDF original:

DESCRIPCIÓN

Procesamiento de un flujo de datos digitales La presente invención se refiere al procesamiento de un flujo de datos digitales. Más exactamente, la invención se refiere a la extracción y la anotación de secuencias y de inter-secuencias a partir de un flujo de datos digitales. Puede tratarse, por ejemplo, de un flujo televisual. Una secuencia es entonces un programa televisado tal como, por ejemplo, una película, un capítulo de una serie, un juego, un informativo, un parte meteorológico, etc. Una inter- secuencia es entonces un inter-programa tal como, por ejemplo, un anuncio, un tráiler, un patrocinador que precede al comienzo o que sigue al final de un programa, etc. El volumen de datos radiofónicos y audiovisuales no deja de crecer dando origen a nuevas necesidades y servicios que implican puesta a disposición del público de contenidos. Se trata, por ejemplo, de servicios de televisión a la carta, de servicios de control de la difusión de contenidos, etc. Estos servicios requieren un procesamiento de los flujos de datos correspondientes para extraer de ellos secuencias e inter-secuencias. La técnica de la invención puede aplicarse concreta, aunque no exclusivamente, a la implementación de dichos servicios.

Existen diferentes técnicas de extracción de secuencias y de inter-secuencias a partir de un flujo de datos digitales. El enfoque más sencillo y más directo se basa en la utilización de informaciones de programación vehiculadas en el propio flujo mediante EIT (por Event Information Tables en inglés (tabla de información de eventos)) o puestas a disposición de forma independiente por el emisor del flujo como, por ejemplo, una guía de programas. Este enfoque presenta el inconveniente de ser impreciso e incompleto. En efecto, las informaciones en las que se basa son a menudo, ellas mismas, imprecisas (por ejemplo, los horarios se dan a título indicativo) e incompletas (muchos programas, concretamente los programas pequeños no son mencionados en ella).

Otro inconveniente es que cualquier cambio de programación no tenido en cuenta en las EIT o la guía de programas genera un error durante la extracción. Otro enfoque se basa en el análisis del contenido del flujo de datos digitales.

En su tesis titulada “Structuration automatique de flux vidéo de télévision” (estructuración automática de flujo de video de televisión), Universidad de Rennes 1, 2007, Xavier Naturel combina varias técnicas. Previamente, un conjunto de referencia que consta de los descriptores que caracterizan programas e inter- programas se constituye manualmente. A continuación, el análisis del contenido del flujo se realiza en varias etapas. El flujo se corta y los trozos obtenidos son caracterizados mediante descriptores. Cada descriptor se compara con los almacenados en el conjunto de referencia. Cuando se establece una correspondencia, el trozo es indexado. Los trozos que no se han podido indexar se clasifican en programas o inter-programas en función de su duración. A continuación, periódicamente los trozos son anotados mediante un análisis global del flujo que se parece al de la EIT.

El enfoque puede completarse, independientemente de las operaciones descritas anteriormente, mediante la aplicación de una técnica de detección de separación entre dos inter-programas. En un flujo televisual, una separación se caracteriza por imágenes monocromas y silencios. Esta detección permite identificar inter-programas cuyos descriptores no habrían sido almacenados en el conjunto de referencia.

El enfoque de Xavier Naturel se basa principalmente en la constitución de un conjunto de referencia. Las prestaciones de este enfoque están limitadas por el contenido de este conjunto de referencia creado manualmente. Estas prestaciones se degradan en cuanto nuevos programas o inter-programas son insertados en el flujo. Finalmente, al basarse este enfoque en un análisis global del flujo para la anotación, no puede proporcionar resultados de anotación sobre la marcha, es decir a medida que se produce la recepción de un flujo difundido o a medida que se produce la lectura de un flujo registrado. Otros enfoques de extracción de secuencias o de inter-secuencias a partir de un flujo de datos digitales se basan en el carácter repetitivo de inter-secuencias en el flujo.

En el documento titulado “A non-supervised approach for repeated sequence detection in tv broadcast streams”. Signal Processing: Image Communication, número especial en “Semantic Analysis for Interactive Multimedia Services”, 2008, G. Manson et al., basan su enfoque en la detección de inter-programas que se repiten en el flujo.

Se calculan descriptores simples para todas las imágenes del flujo y se calculan descriptores más complejos para ciertas imágenes del flujo, también llamadas imágenes clave. Los dos tipos de descriptores se almacenan en una base de datos. Periódicamente, los descriptores de las imágenes clave almacenados en la base de datos se comparan entre sí. Los descriptores idénticos o similares se agrupan. Estos agrupamientos permiten detectar inter-programas que se repiten. Estos inter-programas se reconstituyen a continuación a partir de las imágenes clave a las que se asocian las imágenes vecinas mediante análisis de los descriptores simples correspondientes. Los programas se determinan a continuación a partir de los inter-programas.

El inconveniente de este enfoque es que la detección de los inter-programas se realiza periódicamente, debiendo ser el periodo suficientemente largo para detectar numerosas repeticiones. De este modo, este enfoque no permite un procesamiento sobre la marcha del flujo.

Uno de los objetivos de la invención es remediar los inconvenientes de la técnica anterior mencionada anteriormente. De este modo, la presente invención se refiere, de acuerdo con un primer aspecto, a un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias, procedimiento que consta de una etapa de corte sobre la marcha del flujo en segmentos y de cálculo de signaturas para estos segmentos y una etapa de detección de inter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo: - una primera detección de inter-secuencias mediante detección de separación, - una alimentación de una base de referencia con al menos las signaturas de los segmentos de las inter- secuencias detectadas mediante la primera detección, - una segunda detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa de corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia.

Al realizarse el procesamiento del flujo de datos digitales (detección de inter-secuencias y alimentación de una base de referencia) sobre la marcha, es más rápido, más económico y puede realizarse para cualquier flujo sin conocimiento previo de éste.

Al realizarse la alimentación de la base de referencia automáticamente durante el procesamiento del flujo sobre la marcha, esta alimentación no es manual y no necesita procesamiento previo. En consecuencia, es menos costosa. Al implementar la detección de inter-secuencias dos métodos complementarios vinculados entre sí por su interacción con la base de referencia, esta detección es a la vez más rápida y más eficaz.

De acuerdo con una característica preferida, la comparación de las signaturas de un segmento del flujo, llamado segmento de solicitud, con las signaturas de un segmento de una inter-secuencia contenidas en la base de referencia, denominándose este segmento, segmento candidato, consta de un cálculo de distancia entre el segmento de solicitud y el segmento candidato.

El cálculo de distancia entre un segmento de solicitud y un segmento candidato permite definir si estos dos segmentos son idénticos o casi idénticos. De acuerdo con una característica preferida, la base de referencia consta, además, de estructuras de datos relativas a los segmentos de las inter-secuencias detectadas mediante la primera detección. De este modo, los datos contenidos en la base de referencia permiten tener un buen conocimiento de los segmentos de las inter-secuencias detectadas.

De acuerdo con una característica preferida, cuando la distancia entre un segmento de solicitud y un segmento candidato es inferior a un valor umbral dado de distancia, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a este segmento candidato. De este modo, en cualquier momento se puede decir si un segmento contenido en la base de referencia ha servido para la detección de una inter-secuencia mediante el método de reconocimiento. De acuerdo con la naturaleza del indicador de reconocimiento, se puede conocer el número de veces en las que se ha producido esta incidencia.

De acuerdo con una característica preferida, el procedimiento de procesamiento de un flujo de datos digitales de acuerdo con la invención consta de una etapa de limpieza de la base de referencia que comprende la supresión de estructuras de datos de segmentos en función del resultado de una comparación del valor del indicador de reconocimiento, comprendido en las estructuras de datos de los segmentos contenidos en la base de referencia, con un valor umbral dado de reconocimiento. La supresión periódica de los segmentos que no han servido para la detección de una inter-secuencia mediante el método de reconocimiento permite aligerar la base de referencia haciendo de este modo al procedimiento más rápido en su desarrollo y menos costoso, concretamente para la preservación de esta base. De acuerdo con una característica preferida, el procedimiento de acuerdo con la invención consta de una etapa de consolidación de inter-secuencias que permiten identificar si existe solapamiento entre dos inter-secuencias detectadas sucesivamente.

La identificación de solapamiento entre dos inter-secuencias permite definir más rigurosamente estas inter- secuencias y obtener un procedimiento más preciso. De acuerdo con una característica preferida, el procedimiento de acuerdo con la invención consta de una etapa de anotación de programa sobre la marcha mediante aplicación de criterios temporales. De este modo la anotación realizada sobre la marcha es más rápida y permite obtener programas anotados a medida que se produce su difusión o su lectura.

La invención también se refiere a un sistema de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias, sistema que efectúa un corte sobre la marcha del flujo en segmentos y un cálculo de signaturas para estos segmentos y consta de: - un primer módulo de detección de inter-secuencias mediante detección de separación, - una base de referencia alimentada con al menos las signaturas de los segmentos de las inter-secuencias detectadas por el primer módulo de detección, - un segundo módulo de detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante el corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia, procesando el primer módulo y el segundo módulo de detección de inter-secuencias el flujo sobre la marcha. El sistema de acuerdo con la invención presenta las mismas ventajas que el procedimiento descrito anteriormente.

La invención también se refiere a un producto de programa informático que comprende instrucciones de código de programa grabadas en o transmitidas por un soporte legible por un ordenador, para implementar las etapas del procedimiento descrito anteriormente cuando dicho programa es ejecutado en un ordenador. Otras características y ventajas de la presente invención aparecerán en la descripción a continuación de realizaciones preferidas descritas en referencia a las figuras, en las que: - la figura 1 representa una realización de un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias, - la figura 2 representa una realización de un sistema capaz de implementar el procedimiento de la figura 1.

La invención se refiere al procesamiento de un flujo de datos digitales que comprende secuencias e inter- secuencias. Estas secuencias e inter-secuencias se diferencian unas de otras esencialmente por su duración, siendo una inter-secuencia mucho más corta que una secuencia.

Este procesamiento pretende extraer secuencias o inter-secuencias a partir del flujo de datos digitales y anotarlas. Este procesamiento se realiza sobre la marcha es decir a medida que se produce la recepción para un flujo difundido mediante una red o a medida que se produce la lectura para un flujo grabado.

Un flujo de datos digitales puede cortarse en segmentos. Las secuencias e inter-secuencias comprendidas en este flujo son cortadas, a su vez, en segmentos. Un segmento es un trozo continuo del flujo y comprende un comienzo y un final. Un segmento está compuesto por un conjunto de segmentos elementales. Puede calcularse una signatura para un segmento elemental permitiendo de este modo caracterizarlo.

La invención se expone a continuación para una realización preferida en la que el flujo de datos digitales considerado es un flujo televisual. Esta realización es ilustrativa de la invención y no puede considerarse limitante de la misma. Un flujo televisual corresponde a un contenido de audio y video difundido de forma continua por un canal de televisión. Este contenido comprende secuencias llamadas programas (o programas televisados) e inter-secuencias llamadas inter-programas.

Un programa es, por ejemplo, una película, un capítulo de una serie, un juego, un informativo, un parte meteorológico, etc. Un inter-programa es, por ejemplo, un anuncio, un tráiler, un patrocinador que precede al comienzo o que sigue al final de un programa, etc. Dos programas están separados por uno o más inter-programas. Un programa puede estar constituido por varias partes separadas por inter-programas como, por ejemplo, cuando una película es interrumpida por anuncios. Entre dos inter-programas puede encontrarse una separación que comprende un conjunto de imágenes monocromas contiguas, acompañadas por silencio.

Puede existir o no existir separación entre un inter-programa y un programa. Los segmentos que componen los programas e inter-programas son planos. Los segmentos elementales son imágenes. En el caso de un flujo televisual, un plano es un conjunto de imágenes filmadas sin interrupción.

La figura 1 representa una realización de un procedimiento de procesamiento de un flujo de datos digitales que comprende programas (o secuencias) e inter-programas (o inter-secuencias). Durante una etapa E1, el flujo se corta en planos (o segmentos) y se calcula una signatura para las imágenes (o segmentos elementales) constitutivas de estos planos.

Una signatura caracteriza el contenido de una imagen. Para calcular la signatura S de una imagen, ésta se divide en 4 bloques en cada uno de los cuales se realiza un sub- muestreo hacia un bloque 8x8 y a continuación un cálculo de DCT (por Discrete Cosine Transform en inglés (transformada discreta del coseno)). De cada DCT se extraen 16 coeficientes: 1 coeficiente DC (valor medio) y 15 coeficientes AC (componente frecuencial). Cada uno de estos coeficientes se cuantifica en una longitud de 1 bit, que conduce a una signatura de 64 bits de longitud por concatenación de los 4 bloques.

El coeficiente DC asociado al bloque i, con i variando de 0 a 3, y denominado DCi se calcula de la siguiente forma:

i

Los 15 coeficientes AC asociados al bloque i, con i variando de 0 a 3, y denominados AC con j variando de 0 a

j

14, se calculan de la siguiente forma: La signatura S de una imagen se escribe entonces de la forma: La etapa siguiente E2 es una etapa de detección de inter-programas (o inter-secuencias).

La detección de inter-programas se realiza mediante dos métodos diferentes vinculados entre sí por su interacción con una base de referencia. El primer método de detección de inter-programas se basa en la detección de la separación que existe entre dos inter-programas. El método aplicado es un método clásico tal como se describe por R Lienhart et al., en el documento titulado On the detection and recognition of television commercials”, en Proceedings of the IEEE International Conference on Multimedia Computing and Systems, Ottawa, Canadá, 1997.

La detección de separación consta de una detección de silencio y una detección de imágenes monocromas. Para detectar un silencio, se mide la energía de la señal de audio vehiculada en el flujo en un instante dado. Si el valor de esta energía es inferior a un valor umbral dado de energía, entonces se considera que este instante corresponde a un silencio. A continuación, se calcula un indicado de mono cromaticidad para las imágenes situadas alrededor del instante de silencio detectado. Para ello se calcula un histograma de luminancia de la imagen considerada en escala de grises y a continuación la entropía de este histograma. Si el valor de esta entropía es inferior a un valor umbral dado de entropía, entonces se considera que la imagen correspondiente es una imagen monocroma. Considerando las imágenes alrededor de un instante de silencio detectado, se obtienen los límites de comienzo y de final (la imagen de comienzo y la imagen de final) de la separación.

De ello se deduce el límite de final del inter-programa que precede a la separación y el límite de comienzo del inter- programa que sigue a la separación. De la misma forma, cuando existe una separación entre un inter-programa y un programa, de ella se deduce el límite de final del inter-programa o del programa que precede a la separación y el límite de comienzo respectivamente del programa o del inter-programa que sigue a la separación.

Si la distancia (por ejemplo en tiempo o en número de imágenes) entre dos separaciones es pequeña, entonces se deduce de ello que el trozo de flujo comprendido entre estas dos separaciones es un inter-programa. Se pueden determinar los límites de este inter-programa. Al contrario, si la distancia entre dos separaciones es grande, entonces se deduce de ello que el trozo de flujo comprendido entre estas dos separaciones es un programa o una parte de programa. También se pueden determinar los límites de este programa o de esta parte de programa. A medida que se produce la detección de inter-programas mediante el método de detección de separación descrito anteriormente, una base de referencia BR es alimentada.

En la inicialización, es decir antes del comienzo del procesamiento del flujo sobre la marcha, la base de referencia BR está vacía. Cuando se detecta un inter-programa, se forman pares (signatura, identificador) y se almacenan en una tabla de troceado (“tabla hash”). Los identificadores designan los planos constitutivos del inter-programa detectado. Estos planos pertenecen al conjunto de los planos obtenidos durante la etapa E1 anterior.

Las signaturas son las de las imágenes constitutivas de un plano tales como las que se han calculado durante la etapa E1 anterior. Hay tantos pares (signatura, identificador) como imágenes.

A un plano le corresponde un único identificador y viceversa. El identificador de un plano apunta a una estructura de datos que agrupa informaciones relativas a este plano como, por ejemplo, las signaturas de las imágenes constitutivas de este plano, un indicador de reconocimiento, etc. La base de referencia BR consta de la tabla de troceado y las estructuras de datos relativas a los planos.

El segundo método de detección de inter-programas se basa en el reconocimiento de inter-programas. Para un plano obtenido durante la etapa E1 de corte del flujo en planos, se revisa si éste está presente en la base de referencia BR, comparando las signaturas relativas a este plano con las contenidas en la base de referencia BR.

Para ello, se analiza si la signatura de la primera imagen del plano considerado, llamado plano de solicitud, se encuentra en la tabla de troceado. Si esta signatura se encuentra en la tabla de troceado, entonces el identificador al que está asociada la signatura permite recuperar un plano, llamado plano candidato.

A continuación se calcula una distancia entre el plano de solicitud y el plano candidato. Esta distancia es una media de las distancias, calculadas mediante la distancia de Hamming, entre las signaturas de las imágenes respectivamente del plano de solicitud y del plano candidato. Si el valor de la distancia calculado es inferior a un valor umbral dado de distancia, entonces el plano de solicitud se considera como reconocido, es decir idéntico o casi idéntico al plano candidato. Se considera que un plano reconocido pertenece a un inter-programa, por definición de la base de referencia BR. Cuando un plano es reconocido, un indicador de reconocimiento (por ejemplo, un valor numérico, una indicación temporal como la hora actual para un flujo difundido, etc.) se añade o se actualiza en la estructura de datos asociada a este plano en la base de referencia BR. Las tres operaciones realizadas durante esta etapa E2, a saber la detección de inter-programas mediante el primer y el segundo método, así como la alimentación de la base de referencia BR, se realizan en paralelo.

Los dos métodos de detección de inter-programas se completan y permiten detectar de una manera los inter- programas del flujo. Por ejemplo, el segundo método de detección (por reconocimiento) permite detectar inter- programas unidos a programas y para los cuales no existe separación entre los dos.

Los dos métodos de detección de inter-programas están vinculados entre sí por su interacción con la base de referencia BR. El primer método permite alimentar la base de referencia BR. El segundo método explota los datos de la base de referencia BR. La etapa siguiente E3 es una etapa de extracción y de anotación de programa.

Esta etapa consta de tres sub-etapas E31, E32 y E33 realizadas sobre la marcha. La sub-etapa E31 es una etapa de consolidación de inter-programas.

Esta etapa permite consolidar los resultados obtenidos mediante los dos métodos de detección de inter-programas descritos anteriormente Ésta permite concretamente determinar en ciertos casos, de forma más precisa, los límites (imagen de comienzo e imagen de final) de un inter-programa detectado.

Para ello, se consideran dos inter-programas IPk e IPk+1 detectados sucesivamente. Estos dos inter-programas son detectados de forma indiferente mediante uno u otro de los dos métodos expuestos anteriormente. IPk se define mediante el intervalo [dk, fk] en el que dk es el instante de la imagen de comienzo y fk es el instante de la imagen de final de este inter-programa. IPk+1 se define mediante el intervalo [dk+1, fk+1] en el que dk+1 es el instante de la imagen de comienzo y fk+1 es el instante de la imagen de final de este inter-programa.

Se considera también Lmax, la longitud máxima en tiempo de un inter-programa. Si la distancia temporal que separa la imagen de final del inter-programa IPk de la imagen de comienzo del inter- programa siguiente IPk+1 es inferior a la longitud máxima de un inter-programa, es decir: dk + 1 - fk ≤ Lmax, entonces de ello se deduce que existe solapamiento entre los dos inter-programas IPk e IPk+1 o que estos dos inter- programas están separados por un espacio más corto que la longitud máxima en tiempo de un inter-programa (Lmax).

Se redefinen entonces los límites del inter-programa IPk mediante reunión de los dos inter-programas IPk e IPk+1, incluyendo, llegado el caso, el espacio comprendido entre estos dos inter-programas. Se obtiene entonces: IPk = [dk, fk + 1].

La sub-etapa E32 es una etapa de formación de programas.

En cuanto dos inter-programas sucesivos IPl e IPl+1 están definidos correctamente por sus intervalos respectivos [dl, fl] y [dl+1, fl+1] es posible determinar si una parte de programa o un programa se encuentra entre estos dos inter- programas.

Para ello, se contempla la distancia temporal dl+1 - fl que separa la imagen de final del inter-programa IPl de la imagen de comienzo del inter-programa siguiente IPl+1. Si esta distancia es superior a la longitud máxima de un inter-programa, es decir dl+1 - fl > Lmax, entonces se deduce de ello que el trozo de flujo situado entre estos dos inter-programas es una parte de programa o un programa.

Esta parte de programa o este programa se define mediante el intervalo [fl+1, dl+1-1] en el que fl + 1 es el instante de la imagen de comienzo y dl+1-1 es el instante de la imagen de final de este programa o de esta parte de programa. La sub-etapa siguiente E33 es una etapa de anotación de programas.

La anotación se realiza sobre la marcha a partir de la detección de una parte de programa o de un programa para cada programa o parte de programa formado en la sub-etapa E32 anterior. Esta anotación se basa en la utilización de una guía de programas como por ejemplo una EIT (por Event Information

Table en inglés). Una guía de programas consta de informaciones relativas a los programas tales como el nombre (o etiqueta), la hora aproximada de comienzo, la hora aproximada de final, la duración aproximada, etc. La anotación se efectúa utilizando criterios de proximidad temporal.

Para ello, se compara el instante de la imagen de comienzo y el instante de la imagen de final de una parte de programa o de un programa formado durante la sub-etapa anterior E32 con, respectivamente, las horas de comienzo y las horas de final de programas contenidos en la guía de programas. La etiqueta de la guía de programas seleccionada y que sirve para anotar el programa o la parte de programa considerado es la que corresponde al solapamiento temporal máximo con el programa o la parte de programa considerado. Cuando dos partes de programa son anotadas mediante la misma etiqueta, estas dos partes de programa se fusionan. Esto corresponde, por ejemplo, a una película interrumpida por la publicidad.

La etapa siguiente E4 es una etapa de limpieza de la base de referencia BR. La limpieza se realiza periódicamente, estando el periodo de limpieza previamente definido.

Se recuerda que, durante la etapa E2, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a un plano y contenida en la base de referencia BR cuando este plano permite detectar un inter- programa mediante el segundo método de detección, es decir mediante el método de reconocimiento de inter- programas.

La limpieza de la base de referencia consta de la supresión de la estructura de datos asociada a un plano en función del resultado de una comparación del indicador de reconocimiento de este plano con un valor umbral dado de reconocimiento. De este modo, un plano que no ha o ha servido poco para la detección de inter-programas se suprime de la base de referencia BR. La figura 2 representa una realización de un sistema capaz de implementar un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias tal como se ha descrito anteriormente.

El sistema consta de un módulo M1 de corte en segmentos sobre la marcha de un flujo de datos digitales recibido o leído. El módulo M1 comprende también medios de cálculo de una signatura para los segmentos elementales constitutivos de los segmentos obtenidos posteriormente al corte del flujo.

El módulo M1 implementa la etapa E1 tal como se ha descrito anteriormente. El sistema comprende también un primer y un segundo módulo, respectivamente M2 y M3, de detección de inter- secuencias.

El primer módulo M2 de detección de inter-secuencias detecta inter-secuencias mediante aplicación de un método de detección de separación que existe entre dos inter-secuencias, tal como se ha descrito en la etapa E2 anteriormente.

El segundo módulo M3 de detección de inter-secuencias detecta inter-secuencias mediante aplicación de un método de reconocimiento de inter-secuencias, tal como se ha descrito en la etapa E2 anteriormente. El premier y el segundo módulo, respectivamente M2 y M3, de detección de inter-secuencias procesan el flujo sobre la marcha.

El sistema comprende también una base de referencia BR alimentada por el primer módulo M2 de detección de inter-secuencias. El contenido de la base de referencia BR es explotado por el segundo módulo M3 de detección de inter-secuencias para el reconocimiento de inter-secuencias. La alimentación, la explotación y el contenido de la base de referencia BR se han descrito anteriormente en la etapa E2. Los procesamientos efectuados sobre la marcha en el flujo mediante el primer y el segundo módulo, respectivamente M2 y M3, de detección así como la alimentación de la base de referencia BR se realizan en paralelo.

En referencia a la sub-etapa E31, el sistema comprende un módulo M4 de consolidación de inter-programas. En referencia a la sub-etapa E32, el sistema comprende también un módulo M5 de formación de programas.

El sistema comprende también un módulo M6 de anotación de programas. En referencia a la etapa E33 descrita anteriormente, el módulo M6 de anotación de programas asigna una etiqueta a los programas formados por el módulo M5 de formación de programas.

El sistema comprende también un módulo M7 de limpieza de la base de referencia, tal como se ha descrito anteriormente en la etapa E4. El sistema comprende además una unidad de control central, no representada, conectada a cada uno de los módulos M1 a M7 y adaptada para controlar su funcionamiento.

Los módulos M1 a M7 pueden ser módulos de software que forman un programa informático. La invención se refiere, también, a un programa informático para un sistema de extracción de secuencias y/o de inter-secuencias a partir de un flujo de datos digitales que comprende instrucciones de código de programa para hacer ejecutar el procedimiento descrito anteriormente por el sistema.

Los diferentes módulos de software pueden ser almacenados en o transmitidos por un soporte de datos. Éste puede ser un soporte físico de almacenamiento, por ejemplo un CD-ROM, un disco magnético o un disco duro, o bien un soporte transmisible tal como una señal eléctrica, óptica o radio.

REIVINDICACIONES

1. Procedimiento de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e inter-secuencias, procedimiento que consta de una etapa (E1) de corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y de cálculo de signaturas para estos segmentos, y una etapa (E2) de detección de inter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo: - una primera detección de inter-secuencias mediante detección de separación, separando dicha separación dos inter-secuencias o una inter-secuencia y una secuencia, - una alimentación de una base de referencia (BR) con al menos las signaturas de los segmentos de las inter- secuencias detectadas por la primera detección, - una segunda detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa (E1) de corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia (BR).

2. Procedimiento de acuerdo con la reivindicación 1, caracterizado por que la comparación de las signaturas de un segmento del flujo, denominado segmento de solicitud, con las signaturas de un segmento de una inter-secuencia contenidas en la base de referencia (BR), denominándose este segmento, segmento candidato, consta de un cálculo de distancia entre el segmento de solicitud y el segmento candidato.

3. Procedimiento de acuerdo con la reivindicación 1 o 2, caracterizado por que la base de referencia (BR) consta, además, de estructuras de datos relativas a los segmentos de las inter-secuencias detectadas mediante la primera detección.

4. Procedimiento de acuerdo con las reivindicaciones 2 y 3, caracterizado por que, cuando la distancia entre un segmento de solicitud y un segmento candidato es inferior a un valor umbral dado de distancia, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a este segmento candidato. 5. Procedimiento de acuerdo con las reivindicaciones 3 y 4, caracterizado por que consta de una etapa (E4) de limpieza de la base de referencia (BR) que comprende la supresión de estructuras de datos de segmentos en función del resultado de una comparación del valor del indicador de reconocimiento, comprendido en las estructuras de datos de los segmentos contenidas en la base de referencia (BR), con un valor umbral dado de reconocimiento. 6. Procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 5, caracterizado por que consta de una etapa (E31) de consolidación de inter-secuencias que permite identificar si hay solapamiento entre dos inter- secuencias detectadas sucesivamente. 7. Procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 6, caracterizado por que consta de una etapa (E33) de anotación de programa sobre la marcha mediante aplicación de criterios temporales.

8. Sistema de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e inter- secuencias, efectuando dicho sistema un corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y un cálculo de signaturas para estos segmentos, que consta de: - un primer módulo (M2) de detección de inter-secuencias mediante detección de separación, separando dicha separación dos inter-secuencias o una inter-secuencia y una secuencia, - una base de referencia (BR) alimentada con al menos las signaturas de los segmentos de las inter-secuencias detectadas por el primer módulo de detección, - un segundo módulo (M3) de detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante el corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia (BR), procesando el primer módulo (M2) y el segundo módulo (M3) de detección de inter-secuencias el flujo sobre la marcha.

9. Producto de programa informático que comprende instrucciones de código de programa grabadas en o transmitidas por un soporte legible por un ordenador, para implementar las etapas del procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 7 cuando dicho programa es ejecutado en un ordenador.