Procedimiento de detección y reconocimiento de logotipos en un flujo de datos de vídeo.
Procedimiento de detección y reconocimiento de logotipos en un flujo de datos de vídeo que comprende la etapade:
-muestrear (1) unos fotogramas del flujo de datos de vídeo con una frecuencia de muestreo;caracterizado porque comprende las etapas de:
- en cada fotograma muestreado, segmentar aquellas áreas dentro del fotograma que tienen una formageométrica regular;
- para cada área segmentada, generar (4) un vector de parámetros característicos cuyos elementos sonunos valores numéricos de unos parámetros característicos extraídos de una imagen comprendida en dichaárea segmentada en dicho fotograma muestreado;
- determinar (5) si dicha imagen comprendida en dicha área segmentada corresponde a un logotipo enfunción de la distancia entre dicho vector de parámetros característicos de dicha imagen y un conjunto devectores cuyos elementos son unos valores numéricos de dichos parámetros característicos extraídos paracada logotipo de un conjunto de logotipos de referencia, estando dicho conjunto de vectores almacenadosen una base de datos (8),
en el que la etapa de muestrear (1) incluye una etapa de gestión de tiempos que modifica dinámicamente lafrecuencia de muestreo en función de un tiempo transcurrido entre la etapa de muestrear unos fotogramas y laetapa de determinar si las imágenes comprendidas en las áreas segmentadas corresponden a un logotipo.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09382086.
Solicitante: FUNDACION CENTRO DE TECNOLOGIAS DE INTERACCION VISUAL Y COMUNICACIONES VICOMTECH.
Nacionalidad solicitante: España.
Inventor/es: GARCIA OLAIZOLA,IGOR, AGINAKO BENGOA,NAIARA, LABAYEN ESNAOLA,MIKEL.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06K9/32 FISICA. › G06 CALCULO; CONTEO. › G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › G06K 9/00 Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00). › Alimentación o centrado del captador de imagen o de la zona de imagen.
PDF original: ES-2395448_T3.pdf
Fragmento de la descripción:
Procedimiento de detección y reconocimiento de logotipos en un flujo de datos de vídeo Campo de la invención La presente invención se aplica al campo de la televisión y la publicidad. Más concretamente, la presente invención 5 se refiere a un procedimiento para la detección y el reconocimiento de logotipos en emisiones de vídeo.
Antecedentes de la invención La publicidad y la televisión han estado siempre fuertemente unidas, siendo la publicidad una de las principales fuentes de ingresos en las retransmisiones televisivas. Sin embargo, este modelo de negocio está sufriendo enormes cambios que están llegando a desestabilizar las cuentas de las cadenas de televisión.
Existen diferentes factores que están provocando este cambio sustancial en el negocio publicitario en televisión. Por una parte, la entrada de la televisión digital permite que se puedan desarrollar sistemas capaces de identificar los cortes publicitarios, de manera que estos pueden ser eliminados directamente de las grabaciones. Por ejemplo, el documento US 6.100.941 A revela un procedimiento para la detección de segmentos de vídeo correspondientes a cortes publicitarios, utilizando, entre otros parámetros, la detección de fotogramas fundidos a negro.
Por otra parte, la proliferación de canales de televisión está siendo enorme. A la oferta de televisión analógica, canales vía satélite o por cable, se le deben sumar los nuevos canales de la TDT (Televisión Digital Terrestre) , nuevas opciones como Imagenio, canales de Internet, servicios de Video bajo Demanda, etc. Esta enorme fragmentación hace disminuir el valor de los anuncios, desviando el valor de la publicidad hacia los propios contenidos televisivos en lugar de a las pausas publicitarias propias de cada emisión de dichos contenidos. Esto se debe a que la linealidad de las emisiones se rompe en muchos casos, mientras que el mismo contenido puede ser ofrecido por varios canales o en varias ocasiones.
Frente a estos cambios, se deben plantear nuevas soluciones y nuevos modelos de negocio que consigan seguir dando beneficios a los difusores y productores. Los canales de pago son una manera clásica de subsistir económicamente evitando una fuerte dependencia de los cortes publicitarios. De esta forma se ofrece un mejor
servicio. Sin embargo, se ha visto que la masa de usuarios no es suficiente para soportar un gran número de empresas de este tipo, ya que los televidentes no tienden a suscribirse a más de un proveedor.
Por ello, y ante la falta de eficiencia de los cortes publicitarios en este nuevo entorno, cada vez se tiende más a insertar la publicidad directamente en los contenidos. Esto se conoce como Product Placement. De esta forma, se asegura asociar el producto a los contenidos, lo cual altera el modelo de negocio. Ya no se valoran tanto las franjas horarias, sino que la valoración del propio contenido es la que pone precio a los anuncios que se inserten dentro del mismo. Sin embargo, este medio de publicitar productos introduce ciertas dificultades técnicas a la hora de evaluar la duración de las marcas publicitarias en las emisiones. Al estar integrado en el resto de la imagen de la emisión, y no formar parte de una planificación temporal precalculada, no es tan fácil determinar cuándo aparece insertado un logotipo de una marca.
Actualmente existen innumerables líneas de investigación en el ámbito de la Visión Artificial que tratan de estos temas. Fruto de ello, existen diferentes soluciones para el procesamiento, análisis, segmentación y seguimiento de patrones en imágenes, que es el objetivo principal a la hora de encontrar un logotipo concreto en una escena. Sin embargo, como ocurre en la mayoría de las líneas relacionadas con la inteligencia artificial, hoy en día, no se pueden desarrollar sistemas inteligentes de propósito general. Sólo los sistemas expertos consiguen resultados satisfactorios, aquellos en los que el conocimiento del problema a tratar es reducido y puede ser transmitido al sistema. Esto hace que para cada caso haya que desarrollar, o en el mejor de los casos adaptar sistemas ya que no es posible implementar una solución de propósito general. El documento WO 0045291 describe, por ejemplo, un sistema basado en la búsqueda de imágenes que contienen unos patrones de texto almacenados en una base de datos, información que puede utilizarse para clasificar los fotogramas y detectar anuncios.
Otros ejemplos de documentos de la técnica anterior incluyen:
L. Ballan, M. Bertini, A. Del Bimbo, y A. Jain, “Automatic Trademark Detection and Recognition in Sport Videos”, en Proc. del IEEE Conferencia Internacional sobre Multimedia y Expo (ICME) , Hannover, Alemania, 2008
Bohumil Kovar y Alan Hanjalic, “Logo detection and classification in a sport video: video indexing for sponsorship revenue control”, Proc. SPIE, Almacenamiento y Recuperación de Bases de Datos Multimedia 2002.
Sin embargo, para una detección de logotipos integrados en una escena, es necesario un sistema robusto que sea capaz de detectar automáticamente múltiples logotipos en un entorno no controlado en el que se desconoce la posición, luminosidad o perspectiva de dichos logotipo. También es necesario que el procedimiento suponga una carga computacional controlada, para evitar colapsos y permitir su funcionamiento en tiempo real.
Resumen de la invención La presente invención resuelve el problema anteriormente mencionado mediante un procedimiento de detección de logotipos en un flujo de datos de vídeo que agiliza la localización de dichos logotipos partiendo de la base de que la mayoría de los logotipos tienen una forma geométrica regular, en cuyo interior se inscribe el diseño propio de cada marca. Al buscar logotipos exclusivamente dentro de dichas formas geométricas, se reduce la carga computacional de dicha búsqueda respecto a otros sistemas de localización anteriores de carácter más general, permitiendo a la presente invención funcionar en tiempo real.
Para ello, en primer lugar, el procedimiento muestrea unos fotogramas del flujo de datos de vídeo con una cierta frecuencia de muestreo. Para cada fotograma muestreado por el procedimiento, se localizan primeramente aquellas 10 áreas dentro del fotograma que tienen una forma geométrica regular. Posteriormente, cada imagen contenida en una de esas áreas es caracterizada mediante un conjunto de parámetros que se almacenan en un vector de parámetros característicos. Estos parámetros se comparan con una base de datos que contiene unos vectores con unos valores de referencia de dichos parámetros, calculados previamente para cada uno de los logotipos que se desean localizar. Esta comparación, que supone el cálculo de una distancia entre vectores, permite determinar si la imagen contenida dentro de dicha forma geométrica regular corresponde con alguno de los logotipos cuyos parámetros se incluyen la base de datos.
Preferentemente, para facilitar la labor de los algoritmos de localización de figuras geométricas, y optimizar su resultado, se realiza un preprocesado de los fotogramas muestreados mediante filtros de realce de bordes y reducción de ruido. También preferentemente, con el fin de proporcionar un informe final al usuario, cada vez que se detecta un logotipo en un fotograma, se almacena en un archivo información referente a cuál es el logotipo detectado, así como sobre su instante de aparición dentro del flujo de datos de vídeo.
Preferentemente, para permitir al procedimiento operar en tiempo real, adaptándose al tiempo de procesado del sistema y sin provocar una saturación de datos, el procedimiento de la invención contempla una modificación dinámica de la frecuencia de muestreo de fotogramas en función del tiempo requerido por el operador para ejecutar
las distintas etapas del procedimiento. Preferentemente, independientemente de dicha frecuencia de muestreo, el procedimiento muestrea al menos un fotograma de cada escena del flujo de datos de vídeo cuya duración supera un umbral predeterminado, con el fin de no perder información relativa a ninguna escena cuando la frecuencia de muestreo es muy baja, evitando al mismo tiempo extraer información de escenas cuya duración es tan breve que la información que contienen resulta imperceptible al usuario.
Preferentemente, las formas geométricas que el procedimiento debe localizar son círculos, elipses, y rectángulos, preferentemente en ese mismo orden para optimizar la carga computacional generada por dichas búsquedas al eliminar mediante las primeras búsquedas, candidatos de las siguientes búsquedas, más costosas en cuanto a carga computacional.
En cuanto a los parámetros que se utilizan para caracterizar las imágenes y... [Seguir leyendo]
Reivindicaciones:
1. Procedimiento de detección y reconocimiento de logotipos en un flujo de datos de vídeo que comprende la etapa de:
-muestrear (1) unos fotogramas del flujo de datos de vídeo con una frecuencia de muestreo;
caracterizado porque comprende las etapas de:
-en cada fotograma muestreado, segmentar aquellas áreas dentro del fotograma que tienen una forma geométrica regular;
-para cada área segmentada, generar (4) un vector de parámetros característicos cuyos elementos son unos valores numéricos de unos parámetros característicos extraídos de una imagen comprendida en dicha
área segmentada en dicho fotograma muestreado;
-determinar (5) si dicha imagen comprendida en dicha área segmentada corresponde a un logotipo en función de la distancia entre dicho vector de parámetros característicos de dicha imagen y un conjunto de vectores cuyos elementos son unos valores numéricos de dichos parámetros característicos extraídos para cada logotipo de un conjunto de logotipos de referencia, estando dicho conjunto de vectores almacenados
en una base de datos (8) ,
en el que la etapa de muestrear (1) incluye una etapa de gestión de tiempos que modifica dinámicamente la frecuencia de muestreo en función de un tiempo transcurrido entre la etapa de muestrear unos fotogramas y la etapa de determinar si las imágenes comprendidas en las áreas segmentadas corresponden a un logotipo.
2. Procedimiento según la reivindicación 1, caracterizado porque comprende, además, una etapa de preprocesado (2) de los fotogramas muestreados mediante filtros de realce de bordes y reducción de ruido, anterior a la etapa de segmentar las áreas con formas geométricas regulares.
3. Procedimiento según cualquiera de las reivindicaciones 1 a 2, caracterizado porque comprende, además, una etapa consistente en almacenar (6) en unos medios de almacenamiento (9) , para cada fotograma en el que se determina que una imagen comprendida en un área segmentada de dicho fotograma corresponde con un logotipo, un nombre de dicho logotipo y un código de tiempos que indica un tiempo en el que dicho fotograma aparece en el flujo de datos de video.
4. Procedimiento según la reivindicación 3, caracterizado porque incluye, además una etapa de gestión de tiempos (7) que modifica dinámicamente la frecuencia de muestreo en función de un tiempo transcurrido entre la etapa de muestrear (1) unos fotogramas y la etapa de almacenar (6) en unos medios de almacenamiento (9) el
nombre del logotipo y el código de tiempos
5. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de muestrear (1) unos fotogramas se muestrea al menos un fotograma de cada escena del flujo de datos de vídeo cuya duración es mayor que un umbral de duración.
6. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de
segmentar (3) unas áreas con formas geométricas regulares, dichas áreas con formas geométricas regulares son, al menos, áreas con forma de círculo, elipse y rectángulo.
7. Procedimiento según la reivindicación 6, caracterizado porque en la etapa de segmentar (3) unas áreas con formas geométricas regulares, se segmentan en primer lugar las áreas con forma de círculo, en segundo lugar las áreas con forma de elipse, y en tercer lugar las áreas con forma de rectángulo.
8. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de generar
(4) un vector de parámetros característicos, dichos parámetros característicos de las imágenes comprendidas en las áreas segmentadas comprenden un indicador de la forma geométrica del área segmentada.
9. Procedimiento según la reivindicación 8, caracterizado porque para calcular la similitud entre los parámetros característicos de las imágenes comprendidas en las áreas segmentadas, y unos valores de referencia de dichos 45 parámetros característicos para unas marcas comerciales comprendidos en una base de datos (8) , se asigna un peso a dicho indicador de la forma geométrica del área segmentada mayor que unos pesos asignados al resto de parámetros característicos de dicha imagen.
10. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de generar
(4) un vector de parámetros característicos, dichos parámetros característicos de las imágenes comprendidas en 50 las áreas segmentadas comprenden unos valores de media y varianza de unos parámetros que definen un color de unos píxeles comprendidos en dichas áreas segmentadas.
11. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de generar
(4) un vector de parámetros característicos, los parámetros característicos extraídos de las imágenes comprendidas en las áreas segmentadas comprenden una medida de la entropía de dicha imagen.
12. Procedimiento según cualquiera de las reivindicaciones anteriores caracterizado porque, en la etapa de generar
(4) un vector de parámetros característicos, dichos parámetros característicos de las imágenes comprendidas en las áreas segmentadas comprenden unos vectores que contienen unos descriptores de unos puntos característicos de dichas imágenes obtenidos mediante un algoritmo SIFT, reduciéndose la dimensión de dichos vectores que contienen unos descriptores mediante un análisis de componente principal.
13. Procedimiento según cualquiera de las reivindicaciones anteriores, caracterizado porque en la etapa de generar
(4) un vector de parámetros característicos, dichos parámetros característicos extraídos de las imágenes comprendidas en las áreas segmentadas comprenden un parámetro que relaciona la superficie y el perímetro del área segmentada.
Patentes similares o relacionadas:
Sistema de generación de marcador y método, del 29 de Julio de 2020, de NEC CORPORATION: Un sistema de generación de marcador que comprende: medios de entrada de imagen de vídeo para proporcionar como entrada una imagen de vídeo; […]
Un sistema implementado por ordenador y procedimiento para extraer y reconocer caracteres alfanuméricos de señales de tráfico, del 15 de Abril de 2020, de Tata Consultancy Services Limited: Un sistema implementado por ordenador que tiene: (i) un repositorio configurado para almacenar una plantilla predeterminada que tiene secciones, caracteres alfanuméricos […]
Sistema y método de orientación automatizada para una máquina de movimientos coordinados, del 8 de Enero de 2020, de Recognition Robotics, Inc: Un método de orientación automatizada, que comprende: tomar una imagen inicial de una pluralidad de piezas de trabajo (Wa, Wb, Wc) de forma similar con una cámara […]
Aparato de procesamiento de imágenes, procedimiento de procesamiento de imágenes y programa, del 6 de Noviembre de 2019, de CANON KABUSHIKI KAISHA: Aparato de procesamiento de imágenes, que comprende: una unidad de adquisición de imágenes objetivo configurada para adquirir una imagen […]
Método y aparato para comprobar neumáticos de rueda de vehículo, del 25 de Septiembre de 2019, de NEXION S.p.A: Un método para comprobar los neumáticos en las ruedas de un vehículo que comprende las etapas siguientes: - cuando el vehículo está […]
Procedimiento para determinar datos de posición de un objeto objetivo en un sistema de referencia, del 11 de Septiembre de 2019, de MBDA Deutschland GmbH: Procedimiento para determinar los datos de posición de un objeto objetivo (Z) en un sistema de referencia desde una posición de observación separada […]
Dispositivo y procedimiento para determinar una diferencia de frecuencia de muestreo, del 10 de Julio de 2019, de Opticom, Dipl.-Ing. Michael Keyhl GmbH (100.0%): Dispositivo para la determinación de una diferencia de la frecuencia de muestreo entre una primera señal (IS1) de información y una segunda señal (IS2) de información, […]
Procedimiento para el control de un dispositivo de faros para un vehículo y dispositivo de faros, del 22 de Mayo de 2019, de VOLKSWAGEN AKTIENGESELLSCHAFT: Procedimiento para el control de un dispositivo de faros para un vehículo , presentando el dispositivo de faros dos faros separados , […]