CUARENTENA INTELIGENTE PARA EVITAR EL CORREO NO DESEADO.
Un sistema que facilita la clasificación de mensajes en conexión con la evitación de correo no deseado,
que comprende: un componente (110) adaptado para recibir un conjunto de los mensajes; un primer componente (130, 540, 550) de clasificación adaptado para identificar un subconjunto de los mensajes como CORREO NO DESEADO o para señalar la necesidad de un análisis adicional; un componente (140) de almacenamiento adaptado para almacenar el subconjunto de mensajes durante la duración de un periodo (350, 635) de retraso; y un segundo componente (130, 250, 370) de clasificación adaptado para clasificar el subconjunto almacenado de mensajes después del periodo de retraso como aceptable o como CORREO NO DESEADO a partir de nueva información
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E05100847.
Solicitante: MICROSOFT CORPORATION.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: ONE MICROSOFT WAY REDMOND, WA 98052 ESTADOS UNIDOS DE AMERICA.
Inventor/es: HULTEN,GEOFFREY J, ROUNTHWAITE,ROBERT L, GOODMAN,JOSHUA T, HAZEUR,DEREK,C/O MICROSOFT CORPORATION.
Fecha de Publicación: .
Fecha Solicitud PCT: 7 de Febrero de 2005.
Fecha Concesión Europea: 15 de Septiembre de 2010.
Clasificación Internacional de Patentes:
- G06Q10/00F2
- H04L12/58F
Clasificación PCT:
- H04L12/58 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04L TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION TELEGRAFICA (disposiciones comunes a las comunicaciones telegráficas y telefónicas H04M). › H04L 12/00 Redes de datos de conmutación (interconexión o transferencia de información o de otras señales entre memorias, dispositivos de entrada/salida o unidades de tratamiento G06F 13/00). › Sistemas de conmutación de mensajes.
Clasificación antigua:
- G06F17/60
- H04L12/58 H04L 12/00 […] › Sistemas de conmutación de mensajes.
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.
Fragmento de la descripción:
CAMPO TÉCNICO
La presente invención versa acerca sistemas y procedimientos para identificar información tanto legítima (por ejemplo, correo aceptable) como no deseada (por ejemplo, correo basura), y más en particular acerca de la clasificación de mensajes para evitar el correo no deseado en parte por, al menos, retrasar la entrega de mensajes sospechosos hasta que se pueda reunir información adicional acerca de los mensajes para facilitar una clasificación de tales mensajes.
ANTECEDENTES DE LA INVENCIÓN
La llegada de las redes de comunicaciones globales tales como Internet ha presentado oportunidades comerciales para alcanzar a un gran número de clientes potenciales. La mensajería electrónica, y en particular el correo electrónico (“e-mail”), se está volviendo cada vez más dominante como un medio para diseminar promociones y anuncios no deseados (también denominados “correo no deseado”) a los usuarios de la red.
El Radicati Group, Inc., empresa consultora y de estudio de mercado, estima que en agosto de 2002, se envían cada día dos mil millones de mensajes de correo electrónico no deseados —se espera que se triplique este número cada dos años—. Los individuos y las entidades (por ejemplo, empresas, agencias gubernamentales) están siendo cada vez más molestados y ofendidos a veces por los mensajes basura. Como tal, el correo electrónico basura es ya una amenaza importante a la informática fiable, o lo será pronto.
Una técnica clave utilizada para frustrar el correo electrónico basura es el empleo de sistemas/metodologías de filtrado. Una técnica probada de filtrado está basada en un enfoque de aprendizaje automático —los filtros de aprendizaje automático asignan a un mensaje entrante una probabilidad de que el mensaje sea basura. En este enfoque, normalmente se extraen características de dos clases de mensajes ejemplares (por ejemplo, mensajes basura y no basura), y se aplica un filtro de aprendizaje para discriminar de forma probabilística entre las dos clases. Dado que muchas de las características de los mensajes están relacionadas con el contenido (por ejemplo, palabras y frases en el asunto y/o en el cuerpo del mensaje), se denominan habitualmente tales tipos de filtros como “filtros basados en contenido”.
Algunos filtros de basura/correo no deseado son adaptativos, lo que es importante porque los usuarios de idiomas múltiples y los usuarios que hablan idiomas poco frecuentes necesitan un filtro que pueda adaptarse a sus necesidades específicas. Además, no todos los usuarios están de acuerdo en lo que es o no basura/correo no deseado. En consecuencia, al emplear un filtro que pueda ser entrenado de forma implícita (por ejemplo, mediante la observación del comportamiento del usuario) se puede adaptar de forma dinámica el filtro respectivo para satisfacer las necesidades particulares de identificación de mensajes de un usuario.
Un enfoque para la adaptación del filtrado es solicitar a un usuario que marque mensajes como basura o no basura. Por desgracia, tales técnicas manuales de entrenamiento intensivo no son deseables para muchos usuarios debido a la complejidad asociada con dicho entrenamiento, por no hablar de la cantidad de tiempo requerida para llevar a cabo de forma apropiada dicho entrenamiento. Además, a menudo, tales técnicas manuales de entrenamiento tienen deficiencias por culpa del usuario individual. Por ejemplo, los usuarios olvidan las suscripciones a listas gratuitas de correos y, por lo tanto, estas son marcadas incorrectamente como correo basura. Como resultado, se bloquea correo legítimo de forma indefinida del buzón de correo del usuario. Otro enfoque de entrenamiento de filtro adaptativo es emplear señales de entrenamiento implícito. Por ejemplo, si el usuario responde a un mensaje, o lo reenvía, el enfoque supone que el mensaje no es basura. Sin embargo, el uso exclusivo de señales de mensajes de este tipo introduce desviaciones estadísticas en el procedimiento de entrenamiento, lo que tiene como resultado filtros de una menor precisión respectiva.
Otro enfoque más es utilizar el correo electrónico de todos los usuarios para el entrenamiento, asignando un filtro existente etiquetas iniciales y anulando el o los usuarios a veces las asignaciones con señales explícitas (por ejemplo, un procedimiento de “corrección del usuario”) por ejemplo, seleccionando opciones tales como “borrar como basura” o “no basura” y/o señales implícitas. Aunque tal enfoque es mejor que las técnicas presentadas anteriormente al mismo, sigue siendo deficiente en comparación con la presente invención descrita y reivindicada a continuación.
Además, la tecnología actual de filtros que está diseñada para luchar contra los correos no deseados sigue siendo problemática. Por ejemplo, si un remitente de correo no deseado encuentra un mensaje que es capaz de atravesar un filtro, puede pasar un millón de mensajes no deseados antes de que se actualice el filtro. Con independencia de cuán rápido se actualicen los filtros, los remitentes de correo no deseado pueden enviar sus mensajes se supone que cada vez más rápido simplemente al adquirir un mayor ancho de banda.
El documento US 2002/199095 A1 versa acerca de un procedimiento que emplea un reenvío de correos electrónicos para filtrar mensajes NO DESEADOS en una disposición de red. En general, el reenvío de correos electrónicos proporciona una recopilación de CORREO NO DESEADO y un filtrado de CORREO NO DESEADO que emplea una base de datos de CORREO NO DESEADO. En base a datos de atributos extraídos de los mensajes recibidos, se genera una comparación entre el correo electrónico interceptado y los datos del mensaje del correo electrónico en la base de datos de CORREO NO DESEADO. El resultado de la comparación puede incluir una de tres indicaciones: CORREO NO DESEADO, limpio, y dudoso. Se consigue este resultado al establecer un intervalo umbral para una puntuación de comparación.
RESUMEN DE LA INVENCIÓN
Un objetivo de la invención es proporcionar un procedimiento y un sistema mejorados para evitar el correo no deseado que emplean una cuarentena de los mensajes.
Se logra este objetivo por medio de la presente invención según se reivindica en las reivindicaciones independientes.
Las realizaciones preferentes están definidas por medio de las reivindicaciones dependientes.
A continuación se presenta un resumen simplificado de la invención para proporcionar una comprensión básica de algunos aspectos de la invención. Este resumen no es una visión general extensiva de la invención. No se pretende que identifique elementos clave/críticos de la invención ni delimite el alcance de la invención. Su único fin es presentar algunos conceptos de la invención de forma simplificada como un preludio a la descripción más detallada que se presenta más adelante.
La presente invención proporciona un sistema de cuarentena inteligente y un procedimiento que facilita la clasificación de elementos en conexión con la evitación de correo no deseado. Más específicamente, la invención clasifica o señala mensajes como sospechosos y/o retrasa temporalmente su clasificación (bien como correo no deseado o como aceptable). El filtro y/o el sistema pueden establecer un retraso o un periodo de cuarentena que proporciona una cantidad adecuada de tiempo para aprender más información acerca del o de los mensajes y/o acerca del remitente.
Según un aspecto de la invención, se puede obtener la información de uno o más componentes del sistema que pueden ser configurados para monitorizar las actividades y/o el comportamiento, tal como el volumen de mensajes (por ejemplo, el volumen de mensajes por remitente). Por ejemplo, es menos probable que los mensajes enviados con un volumen pequeño sean correo no deseado. De forma similar, es más probable que los mensajes enviados con un volumen elevado sean correo no deseado.
Según otro aspecto de la invención, se puede analizar el contenido de los mensajes para determinar si se parece sustancialmente a un mensaje que se encuentra en un servidor trampa. Recuérdese que un servidor trampa hace referencia a un objetivo conocido del correo no deseado para identificar mensajes entrantes como correo no deseado y/o para hacer un seguimiento de un procesamiento de dirección del mensaje de un comerciante específico. En general, un servidor trampa es una dirección de correo electrónico en la que se...
Reivindicaciones:
1. Un sistema que facilita la clasificación de mensajes en conexión con la evitación de correo no deseado, que comprende:
un componente (110) adaptado para recibir un conjunto de los mensajes; un primer componente (130, 540, 550) de clasificación adaptado para identificar un subconjunto de los mensajes como CORREO NO DESEADO o para señalar la necesidad de un análisis adicional; un componente (140) de almacenamiento adaptado para almacenar el subconjunto de mensajes durante la duración de un periodo (350, 635) de retraso; y un segundo componente (130, 250, 370) de clasificación adaptado para clasificar el subconjunto almacenado de mensajes después del periodo de retraso como aceptable o como CORREO NO DESEADO a partir de nueva información.
2. El sistema de la reivindicación 1, estando adaptado el segundo componente de clasificación para identificar parte del subconjunto de mensajes como aceptable en base a una falta de suficiente información negativa nueva (230, 360).
3. El sistema de la reivindicación 1, estando adaptado el segundo componente de clasificación para identificar parte del subconjunto de mensajes como aceptable en base a nueva información positiva (230, 360).
4. El sistema de la reivindicación 1, estando adaptado el primer componente de clasificación para clasificar los mensajes como correo no deseado o para señalar la necesidad de un análisis adicional en base a una falta de información.
5. El sistema de la reivindicación 1, estando adaptado el segundo componente de clasificación para clasificar los mensajes en base a información actualizada a partir de un filtro de correo no deseado de aprendizaje automático.
6. El sistema de la reivindicación 2, en el que la falta de suficiente información negativa nueva comprende la no aparición de mensajes similares en servidores trampa.
7. El sistema de la reivindicación 2, en el que la falta de suficiente información negativa
nueva comprende una ausencia de quejas de los usuarios acerca de información similar.
8. El sistema de la reivindicación 2, en el que la falta de suficiente información negativa nueva comprende información proveniente de consultas a usuarios acerca de al menos un subconjunto de mensajes.
9. El sistema de la reivindicación 2, en el que la falta de suficiente información negativa nueva comprende un volumen bajo de mensajes similares.
10. El sistema de la reivindicación 8, en el que el primer componente de clasificación está adaptado para clasificar los mensajes como similares en base a la identidad del remitente.
11. El sistema de la reivindicación 10, en el que la identidad del remitente se clasifica en base a su dirección IP.
12. El sistema de la reivindicación 8, en el que el parecido de los mensajes está basado en los URL contenidos en los mensajes.
13. El sistema de la reivindicación 1, estando adaptado el segundo componente de clasificación para clasificar mensajes como correo no deseado (390) en base a nueva información.
14. El sistema de la reivindicación 13, que comprende medios adaptados para borrar mensajes de forma permanente clasificados como correo no deseado.
15. El sistema de la reivindicación 13, que comprende medios adaptados para mover mensajes clasificados como correo no deseado a una carpeta (260) de mensajes borrados.
16. El sistema de la reivindicación 1, que comprende, además, un componente (170) de información de retorno adaptado para recibir información relativa al o a los componentes primero y/o segundo de clasificación, y está adaptado para emplear la información en conexión con el entrenamiento de un filtro de correo no deseado o el relleno de una lista
de correo no deseado.
17. El sistema de la reivindicación 1, en el que los mensajes comprenden al menos uno de: correo electrónico, e-mail, y mensajes.
18. El sistema de la reivindicación 1, en el que el componente que recibe un conjunto de los mensajes es uno cualquiera de un servidor de correo electrónico, un servidor de mensajes, y software cliente de correo electrónico.
19. El sistema de la reivindicación 1, que comprende, además, un componente de cuarentena adaptado para poner en cuarentena el subconjunto de mensajes en base, al menos en parte, tras la clasificación como la señalización para un análisis adicional por parte del primer componente de clasificación.
20. El sistema de la reivindicación 19, efectuándose la cuarentena mediante la colocación del subconjunto de mensajes en una carpeta (220) aparte de otros mensajes.
21. El sistema de la reivindicación 20, siendo la carpeta visible o invisible para un usuario.
22. El sistema de la reivindicación 1, que comprende, además, un componente de identificación adaptado para identificar una fuente asociada con una incidencia elevada del subconjunto de mensajes.
23. El sistema de la reivindicación 1, que comprende, además, un componente (670) de sello de tiempo adaptado para marcar al menos una de una fecha de llegada original en el mensaje y una fecha de liberación cuando se reanuda la clasificación del mensaje.
24. El sistema de la reivindicación 1, en el que el subconjunto de mensajes excluye al menos uno de los mensajes de remitentes en listas seguras, mensajes identificados fácilmente y clasificados como correo no deseado, mensajes identificados fácilmente y clasificados como aceptables.
25. El sistema de la reivindicación 1, estando adaptado el primer componente de clasificación para determinar la duración del retraso antes de que se lleve a cabo la clasificación del subconjunto de mensajes.
26. El sistema de la reivindicación 25, en el que la duración del retraso está basada al menos en parte en al menos una de los siguientes:
cantidad de tiempo hasta una siguiente actualización programada del filtro; cantidad de tiempo hasta una descarga de un filtro nuevo o actualizado; y puntuación de probabilidad de correo no deseado asignada a mensajes respectivos en el subconjunto.
27. Un entorno informático (1110) adaptado para procesar mensajes de correo electrónico, en el que el entorno informático emplea el sistema de la reivindicación 1.
28. El entorno informático de la reivindicación 27, que comprende un cliente y un servidor, en el que al menos el servidor emplea el sistema de la reivindicación 1.
29. El sistema de la reivindicación 1, que comprende, además, un filtro de aprendizaje automático adaptado para determinar la probabilidad de que la cuarentena ayude finalmente a una clasificación correcta.
30. Un procedimiento para clasificar mensajes, que comprende:
recibir un conjunto de mensajes para ser clasificados; clasificar un subconjunto de los mensajes como poco fiables o sospechosos; almacenar el subconjunto de los mensajes durante la duración de un periodo de retraso; y clasificar el subconjunto almacenado de mensajes después del periodo de retraso cuando se ha obtenido información adicional acerca del subconjunto de mensajes.
31. El procedimiento de la reivindicación 30, excluyendo el subconjunto de mensajes los mensajes que son clasificados fácilmente como correo no deseado o como aceptables o provienen de remitentes en una lista segura.
32. El procedimiento de la reivindicación 30, en el que la clasificación del conjunto de mensajes está basada en al menos uno de los siguientes elementos:
no se ha visto antes la dirección IP del remitente en el mensaje; no se ha visto antes el dominio del remitente; el dominio del remitente carece de una dirección IP inversa; una búsqueda directa del dominio del remitente no coincide al menos aproximadamente con la dirección IP del remitente; el mensaje comprende al menos uno de un nombre de dominio insertado, una macro insertada, y un archivo ejecutable; el mensaje comprende evidencia contradictoria de mensajes aceptables y de correo no deseado; el mensaje se origina en una ubicación asociada con el correo no deseado; el mensaje está escrito en un idioma asociado con el correo no deseado; el mensaje comprende principalmente una imagen; y el mensaje comprende HTML.
33. El procedimiento de la reivindicación 30, que comprende, además, entregar al menos un subconjunto de mensajes sospechosos.
34. El procedimiento de la reivindicación 33, en el que se entrega el subconjunto de mensajes sospechosos a sus respectivos destinatarios previstos y sus acciones facilitan la determinación de si el subconjunto de mensajes es correo no deseado o es aceptable.
35. El procedimiento de la reivindicación 34, en el que el subconjunto de mensajes para el que se busca información de retorno es un porcentaje fijo de mensajes o es una cantidad fija de mensajes por remitente cuya clasificación se retrasa temporalmente.
36. El procedimiento de la reivindicación 34, en el que se permite que el subconjunto de mensajes para el que se busca información de retorno pase sin ser clasificado ni como correo no deseado ni como aceptable para facilitar aprender más acerca de los mensajes.
37. El procedimiento de la reivindicación 30 para clasificar mensajes mediante una cuarentena, comprendiendo el procedimiento:
calcular una puntuación de probabilidad de correo no deseado para los mensajes recibidos; y recomendar un tiempo de cuarentena; en el que el almacenamiento comprende poner en cuarentena el subconjunto de mensajes en base, al menos en parte, a sus puntuaciones respectivas de probabilidad de correo no deseado.
38. El procedimiento de la reivindicación 37, que comprende, además, poner en cuarentena al menos un subconjunto de mensajes hasta la siguiente descarga del filtro, momento en el cual el filtro determina si continuar la cuarentena o reanudar la clasificación de los mensajes; y repetir hasta que se lleva a cabo una clasificación final, bien de correo no deseado o bien de correo aceptable.
39. El procedimiento de la reivindicación 37, que comprende, además, comunicar entre un servidor y un cliente de que un filtro del servidor ha puesto en cuarentena el mensaje respectivo durante un periodo de tiempo; y reducir el tiempo de cuarentena de un filtro del cliente.
40. Un medio legible por un ordenador que tiene almacenadas en el mismo instrucciones
ejecutables por un ordenador que, cuando son ejecutadas por un procesador, llevan a 20 cabo todas las etapas del procedimiento de la reivindicación 30.
Patentes similares o relacionadas:
CONTROL DE MENSAJE A TRANSMITIR DESDE UN DOMINIO DE EMISOR HACIA UN DOMINIO DE DESTINATARIO, del 8 de Septiembre de 2010, de FRANCE TELECOM: Procedimiento para controlar un mensaje (MES) a transmitir por un terminal de remitente (TE) conectado a un dominio de emisor (EM) hacia un dominio de destinatario […]
APARATO Y PROCEDIMIENTO PARA EL REENVIO DE CORREO ELECTRONICO, del 17 de Junio de 2010, de NTT DOCOMO, INC.: Un aparato de gestión de correo electrónico, que comprende: una primera unidad de almacenamiento (332a) que almacena un registro para cada una de una […]
METODO DE FILTRADO DE MENSAJES DE TEXTO EN UN DISPOSITIVO DE COMUNICACION, del 20 de Abril de 2010, de TTPCOM LIMITED: Un método de filtrado de mensajes de texto, comprendiendo el método las etapas de: a) introducir un conjunto de reglas; b) leer un mensaje entrante; c) […]
PROTECCION ANTIVIRUS DE UNA PASARELA DE RED, del 25 de Febrero de 2010, de F-SECURE OYJ: Un procedimiento para evitar la infección de una red informática por un virus informático, en la que el virus puede difundirse por tráfico de correo electrónico, […]
SISTEMA DE CORTAFUEGOS Y ANTI-SPAM PARA REDES ETHERNET, del 16 de Octubre de 2008, de QUETGLAS ARIO,MIGUEL ANGEL: La presente invención describe un sistema para redes informáticas que disponen de un interfaz Ethernet, en que mediante un dispositivo dedicado, situado entre […]
METODO E INTERFAZ DE TELEFONIA MOVIL PARA SOLICITAR ACCIONES SOBRE EL CONTENIDO Y EL REMITENTE, O SOLO EL CONTENIDO DE MENSAJES SMS Y MMS, del 16 de Septiembre de 2007, de VODAFONE ESPAÑA, S.A.: Método e interfaz de telefonía móvil para solicitar acciones sobre el contenido y el remitente, o sólo el contenido de mensajes SMS y MMS.#La presente invención se […]
UN MÉTODO, DISPOSITIVOS Y SISTEMA QUE TIENEN PRESENCIA BASADA FUERA DE LA OFICINA, del 9 de Diciembre de 2011, de RESEARCH IN MOTION LIMITED: Un método para compartir información de presencia, que comprende: recibir una entrada para habilitar una utilidad de situación fuera de la oficina […]
APARATO Y MÉTODO PARA DISTRIBUIR MENSAJES ELECTRÓNICOS A UN DISPOSITIVO INALÁMBRICO DE PROCESAMIENTO DE DATOS, del 5 de Diciembre de 2011, de DANGER RESEARCH, INC: Un método que comprende: recuperar uno o más mensajes de un servidor de correo electrónico en nombre de un usuario y mediante un servicio de […]