Detector de anomalías de movimiento de vídeo.

Método para procesar imágenes de vídeo para detectar un evento de interés,

que comprende las etapasde:

- recibir una señal de vídeo (10) que representa las imágenes de vídeo que van a procesarse;

- extraer (1) al menos una característica de punto de la señal de vídeo;

- seguir (2) la posición y movimiento de la al menos una característica de punto dentro de las imágenesde vídeo para generar una correspondiente al menos una pista, representando cada una, unacorrespondiente característica de punto;

- usar (3) un proceso de aprendizaje iterativo para derivar un patrón normal de comportamiento para cadapista, en el que el proceso de aprendizaje (3) acumula datos que representan el comportamiento de la(s)pista(s) a lo largo de un periodo de tiempo en un histograma de cuatro dimensiones, representandodichas cuatro dimensiones posición x, posición y, velocidad x y velocidad y, de la(s) pista(s) dentro de laimagen de vídeo;

- comparar (4) el comportamiento presente de la al menos una pista con el respectivo patrón normal decomportamiento, en el que el proceso de comparación (4) clasifica una pista como normal según unacomparación de la frecuencia de ocupación de la correspondiente celda de histograma con un umbral deocupación; y

- en respuesta a que el comportamiento presente caiga fuera del patrón normal de comportamiento,generar (5) una señal de alarma (20).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/GB2003/002963.

Solicitante: ROKE MANOR RESEARCH LIMITED.

Nacionalidad solicitante: Reino Unido.

Dirección: ROKE MANOR, OLD SALISBURY LANE ROMSEY, HAMPSHIRE SO51 0ZN REINO UNIDO.

Inventor/es: EVANS, RICHARD JOHN.

Fecha de Publicación: 21 de Agosto de 2013.

Clasificación Internacional de Patentes:

G01S3/786 FISICA. › G01 METROLOGIA; ENSAYOS. › G01S LOCALIZACION DE LA DIRECCION POR RADIO; RADIONAVEGACION; DETERMINACION DE LA DISTANCIA O DE LA VELOCIDAD MEDIANTE EL USO DE ONDAS DE RADIO; LOCALIZACION O DETECCION DE PRESENCIA MEDIANTE EL USO DE LA REFLEXION O RERRADIACION DE ONDAS DE RADIO; DISPOSICIONES ANALOGAS QUE UTILIZAN OTRAS ONDAS. › G01S 3/00 Localizadores de dirección para la determinación de la dirección desde la que se reciben ondas infrasonoras, sonoras, ultrasonoras o electromagnéticas o emisiones de partículas, que no tienen contenido direccional significativo (establecimiento de la posición mediante la coordinación de una pluralidad de determinaciones de dirección o de líneas de posición G01S 5/00). › manteniéndose el estado deseado automáticamente.
G06T7/20 G […] › G06 CALCULO; CONTEO. › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › G06T 7/00 Análisis de imagen. › Análisis del movimiento (estimación del movimiento para codificación, decodificación, compresión o descompresión de señales de vídeo digitales H04N 19/43, H04N 19/51).
G08B13/194 G […] › G08 SEÑALIZACION. › G08B SISTEMAS DE SEÑALIZACION O DE LLAMADA; TRANSMISORES TELEGRAFICOS DE ORDENES; SISTEMAS DE ALARMA. › G08B 13/00 Alarmas contra ladrones, los atracadores o cualquier intruso. › utilizando sistemas de barrido y de comparación de imagen.
G08B21/02 G08B […] › G08B 21/00 Alarmas que reaccionan a una sola condición especificada, indeseable o anormal, y no previstas en otro lugar. › Alarmas para garantizar la seguridad de las personas.
G08B21/04 G08B 21/00 […] › que reaccionan ante la falta de actividad, p. ej. personas mayores (G08B 21/06 tiene prioridad).
H04N7/18 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04N TRANSMISION DE IMAGENES, p. ej. TELEVISION. › H04N 7/00 Sistemas de televisión (detalles H04N 3/00, H04N 5/00; métodos y arreglos, para la codificación, decodificación, compresión o descompresión de señales de vídeo digital H04N 19/00; distribución selectiva de contenido H04N 21/00). › Sistemas de televisión en circuito cerrado, es decir, sistemas en los cuales la señal no es difundida.

PDF original: ES-2439726_T3.pdf

Fragmento de la descripción:

Detector de anomalías de movimiento de vídeo La presente invención se refiere a dispositivos y a métodos para procesar imágenes de vídeo para disparar una señal de alarma cuando se detecta un evento de interés.

La televisión de circuito cerrado (CCTV) se usa ampliamente para fines de seguridad, transporte y otros fines. Aplicaciones de ejemplo incluyen la observación de delitos o vandalismo en espacios o edificios abiertos al público (tales como hospitales y escuelas) , intrusión en áreas prohibidas, monitorización del flujo libre de tráfico rodado, detección de incidentes de tráfico y retenciones, detección de vehículos que se desplazan en sentido contrario en carreteras de un solo sentido.

Sin embargo, la monitorización de pantallas de CCTV (por operadores humanos) es una tarea muy laboriosa y hay riesgo considerable de que eventos de interés puedan pasar desapercibidos. Esto es especialmente cierto cuando se exige a los operadores que monitoricen varias salidas de cámara de CCTV simultáneamente. Como resultado, en muchas instalaciones de CCTV se graban datos de vídeo y sólo se inspeccionan en detalle si se sabe que se ha producido un evento. Incluso en estos casos, el volumen de datos grabados puede ser grande y la inspección manual de los datos puede ser laboriosa. Por consiguiente, existe la necesidad de que dispositivos automáticos procesen imágenes de vídeo y disparen una señal de alarma cuando hay un evento de interés. La señal de alarma puede usarse para o bien atraer la atención inmediata de un operador hacia el evento, colocar una marca de índice en el vídeo grabado o bien activar una grabación selectiva de datos de CCTV.

Se han desarrollado algunos detectores de eventos automáticos para sistemas de CCTV, aunque pocos de ellos son muy satisfactorios. Los dispositivos más comunes se denominan detectores de movimiento de vídeo (VMD) o detectores de actividad, aunque se basan generalmente en algoritmos sencillos en relación a la detección de cambios en el brillo de la imagen de vídeo, no el movimiento real de objetos visualizados. Con vistas a detectar cambios en el brillo, la imagen de vídeo se divide generalmente en una rejilla de normalmente 16 bloques horizontal y verticalmente (es decir 256 bloques en total) . Hay varias desventajas en estos algoritmos. Por ejemplo, son propensos a falsas alarmas, por ejemplo cuando hay cambios en los niveles globales de iluminación. Además, no pueden detectar el movimiento de objetos pequeños, debido al procesamiento basado en bloques. Además, no pueden aplicarse si la escena contiene normalmente objetos móviles que no son de interés. Estas desventajas pueden reducirse, en pequeña medida, mediante una lógica de procesamiento adicional, pero la eficacia de VMD convencionales está limitada de manera inherente por el uso de la detección de cambio como fase de procesamiento de imágenes inicial.

Hay otro tipo de dispositivo de detección, que se caracteriza por el uso de algoritmos complejos que implican segmentación de imágenes, reconocimiento y seguimiento de objetos y reglas de decisión de alarma. Aunque estos dispositivos pueden ser muy eficaces, son generalmente sistemas caros diseñados para su uso en aplicaciones específicas y no tienen un buen rendimiento sin un ajuste y configuración cuidadosos, y pueden no funcionar en absoluto fuera de una variedad limitada de aplicaciones para las que se desarrollaron originalmente.

La patente estadounidense n.º 6.081.606 de los inventores Wade & Jeffrey describe un aparato y un método para detectar movimiento dentro de una secuencia de imágenes. Ese documento da a conocer que el movimiento dentro de una imagen puede calcularse correlacionando áreas de una imagen con áreas de la siguiente imagen en el vídeo para generar un campo de flujo. El campo de flujo se analiza entonces y se dispara una alarma dependiendo de la magnitud y dirección observadas del flujo.

La patente europea n.º 0 986 912 describe un método para monitorizar una zona de vigilancia predeterminada. Una imagen de vídeo se divide en varios segmentos. Se determina una distribución estadística para el nivel de gris medio para cada segmento. Puede usarse un cambio en el nivel de gris medio para un segmento, fuera de la variación estadística habitual, para activar una alarma.

El documento EPO 933726 da a conocer un método para procesar imágenes para detectar un evento.

El detector de anomalías de movimiento de vídeo aborda el problema de detectar automáticamente eventos de interés para operadores de sistemas de CCTV usados en aplicaciones de seguridad, transporte y otras aplicaciones, procesando imágenes de CCTV. El detector puede usarse de varias maneras, por ejemplo para disparar una alarma, emplazando a un operador humano a que visualice datos de vídeo, o para activar una grabación selectiva de datos de vídeo o para insertar una marca de índice en grabaciones de datos de vídeo.

Por consiguiente, la presente invención proporciona un método y un aparato para procesar imágenes de vídeo para detectar un evento de interés, según las reivindicaciones.

La señal de alarma puede provocar al menos uno de los siguientes efectos: atraer la atención de un operador; colocar una marca de índice en el lugar apropiado en datos de vídeo grabados; y activar una grabación selectiva de datos de vídeo.

El proceso de aprendizaje puede acumular datos que representan el comportamiento de la (s) pista (s) a lo largo de un periodo de tiempo en un histograma de cuatro dimensiones, representando dichas cuatro dimensiones posición x, posición y, velocidad x y velocidad y, de la (s) pista (s) dentro de la imagen de vídeo. Además, la fase de aprender el comportamiento puede segregar las pistas según un umbral de velocidad; en el que las pistas que se mueven a una velocidad por debajo del umbral de velocidad se consideran estacionarias mientras que las pistas que se mueven a una velocidad superior al umbral de velocidad se consideran móviles; en el que los datos relativos a las pistas móviles se almacenan en dicho histograma de cuatro dimensiones, almacenándose los datos relativos a las pistas estacionarias en un histograma bidimensional, representando dichas dos dimensiones posición x y posición y dentro de la imagen de vídeo. Además, el tamaño de una celda del histograma de cuatro dimensiones puede variar según una velocidad medida en la imagen de cada respectiva pista. El histograma puede desponderarse periódicamente con el fin de desviar el resultado del proceso de aprendizaje hacia eventos más recientes.

El proceso de comparación puede clasificar una pista según una comparación de la frecuencia de ocupación de la correspondiente celda de histograma con un umbral de ocupación. El proceso de comparación puede actuar para clasificar como comportamiento normal una pista adyacente o próxima a una celda que está por encima del umbral de ocupación, a pesar de que la pista aparezca en una celda por debajo del umbral de ocupación, en el que una celda se considera próxima a otra si la distancia entre las mismas está por debajo de un umbral de distancia predeterminado.

Pueden filtrarse pistas anómalas, mediante lo cual se genera una señal de alarma activa en respuesta a una pista anómala que se parece a otras varias pistas anómalas, en cuanto a al menos uno de posición, velocidad y tiempo.

Pueden filtrarse pistas anómalas, mediante lo cual se genera una señal de alarma activa en respuesta sólo a una pista anómala que se ha clasificado como anómala un número predeterminado de ocasiones.

Pueden filtrarse pistas anómalas, mediante lo cual se genera una señal de alarma activa en respuesta sólo a que se clasifique una pista como anómala por primera vez.

Pueden filtrarse pistas anómalas, mediante lo cual se genera una señal de alarma activa sólo en respuesta a que una versión filtrada de la clasificación supere un valor umbral predeterminado.

Pueden inhibirse señales de alarma activa posteriores durante un intervalo de tiempo predeterminado después de que se haya producido una primera señal de alarma activa.

Pueden inhibirse señales de alarma activa posteriores si están provocadas por una pista anómala a una distancia predeterminada de otra pista que ha generado previamente una alarma.

La presente invención también proporciona un aparato para procesar imágenes de vídeo para detectar un evento de interés, que comprende: una fuente de imágenes de vídeo, que produce una señal de vídeo que representa las imágenes de vídeo que van a procesarse; un dispositivo de extracción de características que recibe la señal de vídeo y que produce datos que representan al menos una característica de... [Seguir leyendo]

Reivindicaciones:

1. Método para procesar imágenes de vídeo para detectar un evento de interés, que comprende las etapas de:

- recibir una señal de vídeo (10) que representa las imágenes de vídeo que van a procesarse;

- extraer (1) al menos una característica de punto de la señal de vídeo;

- seguir (2) la posición y movimiento de la al menos una característica de punto dentro de las imágenes de vídeo para generar una correspondiente al menos una pista, representando cada una, una correspondiente característica de punto;

- usar (3) un proceso de aprendizaje iterativo para derivar un patrón normal de comportamiento para cada pista, en el que el proceso de aprendizaje (3) acumula datos que representan el comportamiento de la (s) pista (s) a lo largo de un periodo de tiempo en un histograma de cuatro dimensiones, representando dichas cuatro dimensiones posición x, posición y, velocidad x y velocidad y, de la (s) pista (s) dentro de la imagen de vídeo;

-comparar (4) el comportamiento presente de la al menos una pista con el respectivo patrón normal de comportamiento, en el que el proceso de comparación (4) clasifica una pista como normal según una comparación de la frecuencia de ocupación de la correspondiente celda de histograma con un umbral de ocupación; y

- en respuesta a que el comportamiento presente caiga fuera del patrón normal de comportamiento, generar (5) una señal de alarma (20) .

2. Método según la reivindicación 1, en el que la señal de alarma (20) provoca al menos uno de los siguientes efectos:

-atraer la atención de un operador;

- colocar una marca de índice en el lugar apropiado en datos de vídeo grabados; y

- activar una grabación selectiva de datos de vídeo.

3. Método según cualquier reivindicación anterior, en el que la fase de aprender el comportamiento segrega las pistas según un umbral de velocidad; en el que las pistas que se mueven a una velocidad por debajo del umbral de velocidad se consideran estacionarias mientras que las pistas que se mueven a una velocidad superior al umbral de velocidad se consideran móviles; en el que los datos relativos a las pistas móviles se almacenan en dicho histograma de cuatro dimensiones, almacenándose los datos relativos a las pistas estacionarias en un histograma bidimensional, representando dichas dos dimensiones posición x y posición y dentro de la imagen de vídeo.

4. Método según cualquier reivindicación anterior, en el que un tamaño de celda del histograma de cuatro dimensiones varía según una velocidad medida en la imagen de cada respectiva pista.

5. Método según cualquier reivindicación anterior, en el que el histograma se despondera periódicamente con el fin de desviar el resultado del proceso de aprendizaje (3) hacia eventos más recientes.

6. Método según cualquier reivindicación anterior, en el que el proceso de comparación (4) actúa para clasificar como comportamiento normal una pista adyacente o próxima a una celda que está por encima del umbral de ocupación, a pesar de que la pista aparezca en una celda por debajo del umbral de ocupación, en el que una celda se considera próxima a otra si la distancia entre las mismas está por debajo de un umbral de distancia predeterminado.

7. Método según cualquier reivindicación anterior, en el que se filtran pistas anómalas, mediante lo cual se genera una señal de alarma activa (20) en respuesta a una pista anómala que se parece a otras varias pistas anómalas, en cuanto a al menos uno de posición, velocidad y tiempo.

8. Método según cualquier reivindicación anterior, en el que se filtran pistas anómalas, mediante lo cual se genera una señal de alarma activa (20) en respuesta sólo a una pista anómala que se ha clasificado como anómala un número predeterminado de ocasiones.

9. Método según cualquier reivindicación anterior, en el que se filtran pistas anómalas, mediante lo cual se

genera una señal de alarma activa (20) en respuesta sólo a que se clasifique una pista como anómala por primera vez.

10. Método según cualquier reivindicación anterior, en el que se filtran pistas anómalas, mediante lo cual se genera una señal de alarma activa (20) sólo en respuesta a que una versión filtrada de la clasificación supere un valor umbral predeterminado.

11. Método según cualquier reivindicación anterior, en el que se inhiben señales de alarma activa (20) posteriores durante un intervalo de tiempo predeterminado después de que se haya producido una primera señal de alarma activa (20) .

12. Método según cualquier reivindicación anterior, en el que se inhiben señales de alarma activa (20) posteriores si están provocadas por una pista anómala a una distancia predeterminada de otra pista que ha generado previamente una alarma.

13. Aparato para procesar imágenes de vídeo para detectar un evento de interés, que comprende:

- una fuente de imágenes de vídeo, que produce una señal de vídeo (10) que representa las imágenes de vídeo que van a procesarse;

- un dispositivo de extracción de características (1) que recibe la señal de vídeo y que produce datos (12) que representan al menos una característica de punto detectada dentro de la imagen;

- un dispositivo de seguimiento de características (2) que recibe los datos (12) que representan características de punto y que produce datos (14) que representan pistas, que son representativas de la posición y velocidad de cada respectiva característica de punto, dentro de la imagen;

- un dispositivo de aprendizaje (3) que recibe los datos (14) que representan las pistas y que produce una señal (16) que representa un margen de comportamiento considerado normal por el dispositivo de aprendizaje, en respuesta a la operación de un proceso de aprendizaje sobre los datos (14) que representan las pistas, en el que el dispositivo de aprendizaje (3) acumula datos que representan el comportamiento de la (s) pista (s) a lo largo de un periodo de tiempo en un histograma de cuatro dimensiones, representando dichas cuatro dimensiones posición x, posición y, velocidad x y velocidad y, de la (s) pista (s) dentro de la imagen de vídeo;

- un dispositivo de clasificación (4) que recibe tanto la señal (16) que representa el margen normal de comportamiento de las pistas como los datos (14) que representan las pistas, que está adaptado para comparar la señal (16) y los datos (14) y para emitir una señal de normal/anómalo (18) según el resultado de tal comparación, en el que el proceso de comparación (4) clasifica una pista como normal según una comparación de la frecuencia de ocupación de la correspondiente celda de histograma con un umbral de ocupación; y

- un dispositivo de generación de alarma (5) que recibe la señal de normal/anómalo (18) y que genera al menos una señal de alarma activa (20) en respuesta a que la señal de normal/anómalo indique un comportamiento anómalo de al menos una pista.

Patentes similares o relacionadas:

SISTEMA ANTIRROBO PARA DISPOSITIVOS ELECTRÓNICOS, del 25 de Febrero de 2020, de VAÑO CALATAYUD, Javier: 1. Sistema antirrobo para dispositivos electrónicos, caracterizado por constituirse a partir de un dispositivo electrónico como un teléfono […]

SISTEMA MARÍTIMO DE CONTROL DE ACCESO EN MAR ABIERTO, del 3 de Octubre de 2016, de SCIO SOFT, S.L.: Un sistema marítimo de control de acceso en mar abierto que comprende al menos dos boyas (1, 1a) que, en uso, están fondeadas y separadas entre sí, definiendo […]

ANALISIS DE IMAGENES., del 1 de Marzo de 2007, de ELECTRONIC DATA SYSTEMS CORPORATION: PROCEDIMIENTO Y APARATO PARA ANALIZAR UNA SEÑAL DE IMAGEN ELECTRONICA, SEÑAL QUE ES TRATADA COMO QUE REPRESENTA A UNA O MAS CELULAS CADA UNA DE LAS CUALES COMPRENDE […]

PROCEDIMIENTO Y DISPOSITIVO DE DETECCION DE FUEGOS BASADOS EN EL ANALISIS DE IMAGENES., del 1 de Diciembre de 2005, de FASTCOM TECHNOLOGY S.A.: Procedimiento de detección automática de fuego, basado en el reconocimiento de llamas y/o de humo a partir del análisis de una secuencia de imágenes, basándose el análisis […]

SISTEMA DE CONTROL VISUAL A DISTANCIA INALAMBRICO DE UN AREA O HABITACULO., del 16 de Octubre de 2004, de CELAYA PRIETO,CARLOS GARCIA GONZALEZ,JUAN MARIA: Sistema de control visual a distancia inalámbrico de un área o habitáculo. El sistema de control visual a distancia de un área o habitáculo […]

DISPOSITIVO PARA LA VIGILANCIA DE UN RECINTO., del 16 de Junio de 2004, de SIEMENS BUILDING TECHNOLOGIES AG: Dispositivo para la vigilancia de un recinto, comprendiendo al menos un sensor de imagen y al menos un sensor de presencia o de movimiento […]

DISPOSITIVO PARA LA VIGILANCIA DE UN RECINTO., del 16 de Junio de 2004, de SIEMENS BUILDING TECHNOLOGIES AG: EL EQUIPO CONTIENE AL MENOS UN SENSOR DE IMAGEN Y AL MENOS UN DETECTOR DE MOVIMIENTO O PRESENCIA Y UNA ELECTRONICA DE VALORACION Y CONTROL. LA ELECTRONICA […]

DETECCIÓN DE LA MANIPULACIÓN INDEBIDA DE UNA CÁMARA, del 12 de Diciembre de 2011, de AXIS AB: Un método para identificar la posible manipulación indebida de la visión de una cámara, de tal manera que dicho método comprende: recibir una imagen para su análisis, de una […]