Método de procesamiento de vídeo, medio legible por ordenador que contiene instrucciones que implementan dicho método y sistema de procesamiento de vídeo.

Método de procesamiento de vídeo que comprende:

detectar si hay o no una o más actividades en una secuencia de vídeo;

si se detectan una o más actividades

, generar una o más primitivas;

si se generan una o más primitivas, inferir si hay o no uno o más eventos de interés en la secuencia de vídeo basándose en las primitivas generadas;

si no se generan primitivas, codificar la secuencia de vídeo para obtener vídeo codificado a una primera tasa de transmisión de bits, a una primera frecuencia de fotogramas y a una primera resolución;

si se generan una o más primitivas y no se infieren eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una segunda tasa de transmisión de bits, a una segunda frecuencia de fotogramas y a una segunda resolución, siendo al menos una de la segunda tasa de transmisión de bits, la segunda frecuencia de fotogramas y la segunda resolución superior a la primera tasa de transmisión de bits, la primera frecuencia de fotogramas y la primera resolución, respectivamente;

si se infieren uno o más eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una tercera tasa de transmisión de bits, a una tercera frecuencia de fotogramas y a una tercera resolución, siendo al menos una de la tercera tasa de transmisión de bits, la tercera frecuencia de fotogramas y la tercera resolución superior a la segunda tasa de transmisión de bits, la segunda frecuencia de fotogramas y la segunda resolución, respectivamente; y

transmitir dicho vídeo codificado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/012556.

Solicitante: Avigilon Fortress Corporation.

Nacionalidad solicitante: Canadá.

Dirección: 2900 - 550 Burrard Street Vancouver, British Columbia V6C 0A3 CANADA.

Inventor/es: ZHANG,Zhong, VENETIANER,Peter,L, CHOSAK,Andrew,J, FRAZIER,Matthew,F, HAERING,Niels, LIPTON,Alan,J, MYERS,GARY, YIN,WEIHONG.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES... > G06K9/00 (Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Sistemas de televisión (detalles H04N 3/00, H04N... > H04N7/24 (Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00  tiene prioridad))
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Detalles de los sistemas de televisión (detalles... > H04N5/272 (Medios para introducir una imagen de primer plano en una imagen de fondo, es decir, incrustación, efecto inverso)
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO O GENERACION DE DATOS DE IMAGEN, EN GENERAL... > Análisis de imagen, p. ej. desde un mapeado binario... > G06T7/20 (Análisis del movimiento)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Sistemas de televisión (detalles H04N 3/00, H04N... > H04N7/18 (Sistemas de televisión en circuito cerrado, es decir, sistemas en los cuales la señal no es difundida)
  • SECCION G — FISICA > SEÑALIZACION > SISTEMAS DE SEÑALIZACION O DE LLAMADA; TRANSMISORES... > Alarmas contra ladrones, los atracadores o cualquier... > G08B13/196 (utilizando cámaras de televisión)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Sistemas de televisión (detalles H04N 3/00, H04N... > H04N7/12 (Sistemas en los cuales la señal de televisión es transmitida vía uno o varios canales paralelos, siendo el ancho de banda de cada canal inferior al ancho de banda de la señal de televisión (H04N 7/24 tiene prioridad; sistemas de televisión de alta definición H04N 7/015))

PDF original: ES-2534250_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método de procesamiento de vídeo, medio legible por ordenador que contiene instrucciones que implementan dicho método y sistema de procesamiento de vídeo

Antecedentes de la invención

Campo de la invención

La invención se refiere a un sistema para videovigilancia automática que emplea primitivas de vídeo.

Referencias

Para mayor comodidad del lector, a continuación se enumeran las referencias citadas en el presente documento. En la memoria descriptiva, los números entre paréntesis se refieren a las respectivas referencias. Las referencias enumeradas se incorporan como referencia al presente documento.

Las siguientes referencias describen detección de objetivos en movimiento:

{1} A. Lipton, H. Fujiyoshi y R. S. Patil, "Moving Target Detection and Classification from Real-Time Video", Proceedings of IEEE WACV '98, Princeton, NJ, 1998, págs. 8-14.

{2} W.E.L. Grimson, et al., "Using Adaptive Tracking to Classify and Monitor Activities in a Site", CVPR, págs. 22-29, junio de 1998.

{3} A. J. Lipton, H. Fujiyoshi, R.S. Patil, "Moving Target Classification and Tracking from Real-time Video", IUW, págs. 129-136, 1998.

{4} T.J. Olson y F.Z. Brill, "Moving Object Detection and Event Recognition Algorithm for Smart Cameras", IUW, págs. 159-175, mayo de 1997.

Las siguientes referencias describen detección y seguimiento de humanos:

{5} A. J. Lipton, "Local Application of Optical Flow to Analyse Rigid Versus Non-Rigid Motion", International Conference on Computer Vision, Corfú, Grecia, septiembre de 1999.

{6} F. Bartolini, V. Cappellini y A. Mecocci, "Counting people getting in y out of a bus by real-time image-sequence Processing", IVC, 12(1 ):36-41, enero de 1994.

{7} M. Rossiy A. Bozzoli, "Tracking and counting moving people", ICIP94, págs. 212-216, 1994.

{8} C.R. Wren, A. Azarbayejani, T. Darrell y A. Pentland, "Pfinder: Real-time tracking of the human body", Vismod, 1995.

{9} L. Khoudour, L. Duvieubourg, J.P. Deparis, "Real-Time Pedestrian Counting by Active Linear Cameras", JEI, 5(4):452-459, octubre de 1996.

{1} S. loffe, D.A. Forsyth, "Probabilistic Methods for Finding People", IJCV. 43(1 ):45-68, junio de 21.

{11} M. Isard y J. MacCormick, "BraMBLe: A Bayesian Multiple-Blob Tracker", ICCV, 21.

Las siguientes referencias describen análisis de blobs:

{12} D.M. Gavrila, "The Visual Analysis of Pluman Movement: A Survey", CVIU, 73(1):82-98, enero de 1999.

{13} Niels Flaering y Niels da Vitoria Lobo, "Visual Event Detection", Video Computing Series, Editor Mubarak Shah, 21.

Las siguientes referencias describen análisis de blobs para camiones, coches y personas:

{14} Collins, Lipton, Kanade, Fujiyoshi, Duggins, Tsin, Tolliver, Enomoto y Plasegawa, "A System for Video Surveillance and Monitoring: VSAM Final Report", Technical Report CMU-RI-TR--12, Robotics Institute, Carnegie Mellon University, mayo de 2.

{15} Lipton, Fujiyoshi y Patil, "Moving Target Classification and Tracking from Real-time Video", 98 Daroa IUW. 2-23 nov. 1998.

La siguiente referencia describe el análisis de un blob de una única persona y sus contornos:

{16} C.R. Wren, A. Azarbayejani, T. Darrell, y A.P. Pentland. "Pfinder: Real-Time Tracking of the Human Body", PAMI, vol. 19, págs. 78-784, 1997.

La siguiente referencia describe movimiento interno de blobs, incluyendo cualquier segmentación basada en movimiento:

{17} M. Allmen y C. Dyer, "Long-Range Spatiotemporal Motion Understanding Using Spatiotemporal Flow Curves", Proc. IEEE CVPR. Lahaina, Maui, Hawaii, págs. 33-39, 1991.

{18} L. Wixson, "Detecting Salient Motion by Accumulating Directionally Consistent Flow", IEEE Trans. Pattern Anal. Mach. Intell., vol. 22, págs. 774-781, agosto de 2.

El documento US23/4316 A1 da a conocer un método y un dispositivo para gestionar información de imagen en un sistema de monitorización. El sistema de monitorización comprende al menos un módulo de monitorización para monitorizar una ubicación monitorizada y una unidad receptora remota. El método comprende las etapas de grabar una imagen de la ubicación monitorizada con el módulo de monitorización, segmentar una región diferenciada comparando la imagen grabada con una imagen de referencia en el módulo de monitorización, crear una forma de contorno exterior en el módulo de monitorización que representa el borde de la región diferenciada, clasificar la forma de contorno exterior y determinar si es interesante para su transmisión y, en su caso, transmitir datos que representan la forma de contorno exterior a la unidad receptora, recrear la forma de contorno exterior en la unidad receptora por medio de dichos datos transmitidos y presentar la forma de contorno exterior visualmente en la unidad receptora. La unidad receptora puede estar ubicada en una estación de monitorización asistida por una persona humana en la que un operario puede tomar una decisión en cuanto a si hay o no situación de alarma.

El documento WO 24 6184 da a conocer un método para la detección de eventos en el que no se transmite información si no se detecta movimiento por debajo de un umbral. El método da a conocer transmitir en dos modos: transmitiendo un primer modo un flujo de características y transmitiendo el segunda modo las características y una parte de flujo de imágenes, usando ambos modos una resolución y una frecuencia de fotogramas diferentes.

El documento US 23/85992 A1 da a conocer un método y un aparato para proporcionar vigilancia por inmersión, en el que un guardia de seguridad remoto puede monitorizar una escena usando una variedad de fuentes de imagen que se representan sobre un modelo para proporcionar una vista conceptual tridimensional de la escena. Usando un selector de vista, el guardia de seguridad puede seleccionar dinámicamente una vista de cámara para su presentación visual en su modelo conceptual, realizar un recorrido de la escena, identificar objetos en movimiento y seleccionar la mejor vista de esos objetos en movimiento.

Antecedentes de la invención

La videovigilancia de espacios públicos se ha generalizado enormemente y aceptado por el público general. Por desgracia, los sistemas de videovigilancia convencionales producen volúmenes de datos tan ingentes que se obtiene como resultado un problema inextricable en el análisis de datos de videovigilancia.

Existe la necesidad de reducir la cantidad de datos de videovigilancia de modo que pueda llevarse a cabo el análisis de los datos de videovigilancia.

Existe la necesidad de filtrar los datos de videovigilancia para identificar partes deseadas de los datos de videovigilancia.

Sumario de la invención

Un objetivo de la invención es reducir la cantidad de datos de videovigilancia de modo que pueda llevarse a cabo el análisis de los datos de videovigilancia.

Un objetivo de la invención es filtrar los datos de videovigilancia para identificar partes deseadas de los datos de videovigilancia.

Un objetivo de la invención es producir una alarma en tiempo real basándose en una detección automática de un evento a partir de los datos de videovigilancia.

Un objetivo de la invención es integrar los datos procedentes de sensores de vigilancia que no sean de vídeo para obtener capacidades de búsqueda mejoradas.

Un objetivo de la invención es integrar datos procedentes de sensores de vigilancia que no sean de vídeo para

obtener capacidades de detección de eventos mejoradas.

La invención incluye dos métodos según las reivindicaciones 1 y 2.

La invención incluye un medio legible por ordenador según la reivindicación 3 y un sistema de procesamiento de vídeo según la reivindicación 4.

... [Seguir leyendo]

 


Reivindicaciones:

Método de procesamiento de vídeo que comprende:

detectar si hay o no una o más actividades en una secuencia de vídeo;

si se detectan una o más actividades, generar una o más primitivas;

si se generan una o más primitivas, inferir si hay o no uno o más eventos de interés en la secuencia de vídeo basándose en las primitivas generadas;

si no se generan primitivas, codificar la secuencia de vídeo para obtener vídeo codificado a una primera tasa de transmisión de bits, a una primera frecuencia de fotogramas y a una primera resolución;

si se generan una o más primitivas y no se infieren eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una segunda tasa de transmisión de bits, a una segunda frecuencia de fotogramas y a una segunda resolución, siendo al menos una de la segunda tasa de transmisión de bits, la segunda frecuencia de fotogramas y la segunda resolución superior a la primera tasa de transmisión de bits, la primera frecuencia de fotogramas y la primera resolución, respectivamente;

si se infieren uno o más eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una tercera tasa de transmisión de bits, a una tercera frecuencia de fotogramas y a una tercera resolución, siendo al menos una de la tercera tasa de transmisión de bits, la tercera frecuencia de fotogramas y la tercera resolución superior a la segunda tasa de transmisión de bits, la segunda frecuencia de fotogramas y la segunda resolución, respectivamente; y

transmitir dicho vídeo codificado.

Método de procesamiento de vídeo que comprende:

detectar si hay o no una o más actividades en una secuencia de vídeo;

si se detectan una o más actividades, generar una o más primitivas;

si se generan una o más primitivas, inferir si hay o no uno o más eventos de interés en la secuencia de vídeo basándose en las primitivas generadas;

si se generan una o más primitivas y no se infieren eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una primera tasa de transmisión de bits, a una primera frecuencia de fotogramas y a una primera resolución;

si se infieren uno o más eventos de interés, codificar la secuencia de vídeo para obtener vídeo codificado a una segunda tasa de transmisión de bits, a una segunda frecuencia de fotogramas y a una segunda resolución, siendo al menos una de la segunda tasa de transmisión de bits, la segunda frecuencia de fotogramas y la segunda resolución superior a la primera tasa de transmisión de bits, la primera frecuencia de fotogramas y la primera resolución, respectivamente;

si no se generan primitivas, no se transmite la secuencia de vídeo;

si se generan una o más primitivas, transmitir dicho vídeo codificado.

Medio legible por ordenador que contiene instrucciones que, cuando se ejecutan por un sistema informático, hacen que dicho sistema informático implemente el método según la reivindicación 1 ó 2.

Sistema de procesamiento de vídeo que comprende:

el medio legible por ordenador según la reivindicación 3; y

un ordenador acoplado a dicho medio legible por ordenador para ejecutar las instrucciones contenidas en dicho medio legible por ordenador.