Procedimiento y aparato para filtrar correos electrónicos.
Un procedimiento implementado por ordenador para filtrar mensajes que comprende:
determinar (315) una primera ancla semántica (120) que representa un primer vector en un espacio vectorialsemántico correspondiente a un primer grupo de mensajes y una segunda ancla semántica (125) querepresenta un segundo vector en el espacio vectorial semántico correspondiente a un segundo grupo demensajes, en el que el primer vector y el segundo vector fueron derivados a partir de un cuerpo deentrenamiento que comprendía el primer grupo de mensajes y el segundo grupo de mensajes, y en el primergrupo de mensajes y el segundo grupo de mensajes son diferentes;
determinar (325), en el espacio vectorial semántico, una representación matemática como un tercer vectorcorrespondiente a un mensaje entrante que tiene texto reconocido por máquina;
comparar (330) la representación matemática correspondiente al mensaje entrante con la primera anclasemántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor decomparación; y
filtrar el mensaje entrante clasificando el mensaje entrante entre el primer y segundo grupos en base al primervalor de comparación y el segundo valor de comparación.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2002/019015.
Solicitante: APPLE INC..
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 1 INFINITE LOOP CUPERTINO, CA 95014 ESTADOS UNIDOS DE AMERICA.
Inventor/es: BELLEGARDA,Jerome R, NAIK,Devang, SILVERMAN,Kim E. A.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06Q10/00 FISICA. › G06 CALCULO; CONTEO. › G06Q METODOS O SISTEMAS DE PROCESAMIENTO DE DATOS ESPECIALMENTE ADAPTADOS PARA FINES ADMINISTRATIVOS, COMERCIALES, FINANCIEROS, DE GESTION, DE SUPERVISION O DE PRONOSTICO; METODOS O SISTEMAS ESPECIALMENTE ADAPTADOS PARA FINES ADMINISTRATIVOS, COMERCIALES, FINANCIEROS, DE GESTION, DE SUPERVISION O DE PRONOSTICO, NO PREVISTOS EN OTRO LUGAR. › Administración; Gestión.
- H04L12/58 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04L TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION TELEGRAFICA (disposiciones comunes a las comunicaciones telegráficas y telefónicas H04M). › H04L 12/00 Redes de datos de conmutación (interconexión o transferencia de información o de otras señales entre memorias, dispositivos de entrada/salida o unidades de tratamiento G06F 13/00). › Sistemas de conmutación de mensajes.
PDF original: ES-2385029_T3.pdf
Fragmento de la descripción:
Procedimiento y aparato para filtrar correos electrónicos Campo de la invención La presente invención se refiere en general a filtrado de mensajes. Más en particular, esta invención se refiere a filtrado de correos electrónicos usando análisis semántico latente.
Aviso/Permiso de derechos de autor
Una parte de la divulgación de este documento de patente contiene material que está sujeto a protección de derechos de autor. El propietario de los derechos de autor no tiene objeciones a la reproducción en facsímil por cualquiera del documento de patente o la divulgación de patente tal y como aparece en el archivo o en el registro de la Oficina de Patentes y Marcas, sin embargo se reserva todos los derechos de autor. El siguiente aviso se aplica al software y los datos tal y como se describen a continuación y en los dibujos: Derechos de autor © 2000, Apple Computer, Inc., Todos los Derechos Reservados.
Antecedentes
A medida que el uso de ordenadores e Internet han proliferado, también lo ha hecho el uso del correo electrónico. Muchos negocios y usuarios utilizan el correo electrónico como un medio de comunicación prominente. De forma no sorpresiva, el crecimiento exponencial del medio también ha atraído el interés de anunciantes comerciales de correo electrónico. Los anunciantes comerciales de correo electrónico obtienen direcciones de correo electrónico de una variedad de fuentes, por ejemplo, de vendedores de correos electrónicos o de sitios web comerciales, a menudo sin el permiso de los dueños de los correos electrónicos. Estas direcciones de correo electrónico pueden usarse entonces para promover los productos y servicios de los anunciantes de correo electrónico o de las partes que representan.
El resultado es una avalancha de correo electrónico no solicitado recibido por usuarios de correo electrónico insatisfechos. Un procedimiento para encargarse con correos electrónicos no solicitados es que el usuario los seleccione y borre manualmente los correos electrónicos no solicitados. Otros procedimientos permiten reconocer un mensaje enviado de forma masiva a múltiples recipientes y/o descartar o marcar el mensaje como un posible mensaje no solicitado. Otros procedimientos más mantienen una base de datos de direcciones de remitentes conocidos de correo electrónico no solicitado y al recibir el correo electrónico, descartan automáticamente aquellos recibidos de los remitentes conocidos de correo electrónico no solicitado. Otros procedimientos más usan filtros de palabras clave. Este procedimiento permite escanear el asunto y/o el cuerpo del mensaje de correo electrónico en busca de palabras clave predeterminadas, y si se detectan, el mensaje puede ser o descartado o marcado como sospechoso.
A pesar de los procedimientos descritos con anterioridad, los anunciantes comerciales de correo electrónico utilizan métodos ingeniosos para frustrar los esfuerzos de los destinatarios de correos electrónicos. Por ejemplo, para vencer la detección de correos electrónicos masivos, los mensajes de correo electrónico pueden enrutarse a través de un laberinto de servidores de forma que en última instancia, el mensaje no parece ser un mensaje de correo electrónico masivo. Para vencer al sistema que rastrea las direcciones de remitentes conocidos de correo electrónico no solicitado, la dirección originaria de correo electrónico no solicitado puede cambiarse a menudo. Para confundir a los procedimientos de filtrado por palabras clave, el campo asunto del correo electrónico puede titularse de forma engañosa, por ejemplo, “En respuesta a su solicitud”. Además, el procedimiento de filtrado por palabras clave es víctima de otros problemas significativos, por ejemplo, al intentar filtrar mensajes de anunciantes de correo electrónico pornográficos usando la palabra “sexo”, pueden también eliminarse artículos legítimos anatómicos o biológicos que incluyen la palabra “sexo”.
Ejemplos de varias disposiciones del estado de la técnica se analizan en:
D1: PETER W. FOLTZ, SUSAN T. DUMAIS: “Personalized Information Deliver y : An Analysis of Information Filtering Methods” COMMUNICATIONS OF THE ACM, volumen 35, número 12, Diciembre 1992 (1992-12) , páginas 51-60, XP002219345, que divulga un método de filtrado de correo electrónico basado en análisis semántico de texto.
D2: PETER W. FOLTZ: “Using Latent Semantic Indexing for Information Filtering” PROCEEDINGS OF THE CONFERENCE ON OFFICE INFORMATION SYSTEMS” [Online] 1990, páginas 40-47, XP002219344 Cambridge, MA, EE.UU Recuperado de Internet: URL:http://www.psych.nmsu.edu/~pfoltz/cois.html>[recuperado el ];
D3: LI Y H ET AL: “classification of text documents” COMPUTER JOURNAL, OXFORD UNNIVERSITY PRESS; SURREY, GB, volumen 41, número 8, 1998, páginas 537-546, XP002116464 ISSN: 0010-4620.
Algunas realizaciones de la presente invención utilizan una técnica matemática conocida como análisis semántico latente. Esta técnica se explica por ejemplo, en un artículo de uno de los inventores, Jerome R. Bellegarda titulado “Exploiting Latent Semantic Information in Statistical Language Modelling”. Este artículo enseña un entorno de trabajo para clasificación semántica automática en el contexto de modelos estadísticos de lenguaje para su uso en reconocimiento automático de voz.
Resumen de la invención
Un procedimiento y aparato para filtrar mensajes, en particular mensajes de correo electrónico se describe y reivindica tal y como se expone en las reivindicaciones independientes relativo a un procedimiento para filtrar mensajes, un medio legible por máquina que incluye instrucciones que, cuando son ejecutadas por una máquina, la máquina lleva a cabo el procedimiento, un sistema de procesamiento de datos que comprende medios para llevar a cabo el procedimiento y un sistema de ordenador como dicho sistema de procesamiento de datos para llevar a cabo el procedimiento.
Según un aspecto de la presente invención, el procedimiento comprende determinar una primera ancla semántica que corresponde a un primer grupo de mensajes, por ejemplo, mensajes de correo electrónico legítimos y una segunda ancla semántica que corresponde a un segundo grupo de mensajes, por ejemplo, mensajes de correo electrónico no solicitados. El procedimiento determina además un vector que corresponde a un mensaje entrante, compara el vector con al menos uno de la primera ancla semántica y una segunda ancla semántica para obtener al menos un valor de comparación y filtra el mensaje entrante en base al valor de comparación.
Se pueden representar realizaciones de la invención como un producto de software almacenado en un medio legible por ordenador (también denominado medio legible por ordenador o medio legible por procesador) . Según un aspecto de la invención, el medio legible por máquina incluye instrucciones que, cuando son ejecutadas por una máquina hacen que la máquina lleve a acabo operaciones que comprenden determinar una primera ancla semántica que corresponde a un primer grupo de mensajes, por ejemplo, mensajes de correo electrónico legítimos. El medio legible por máquina incluye instrucciones adicionales para determinar una segunda ancla semántica que corresponde a un segundo grupo de mensajes, por ejemplo, mensajes de correo electrónico no solicitados. El medio accesible por máquina incluye instrucciones adicionales para determinar un vector correspondiente a un mensaje entrante, compara el vector con al menos uno de la primera ancla semántica y la segunda ancla semántica para obtener al menos un valor de comparación y filtra el mensaje entrante en base al valor de comparación. Según un aspecto de la invención, la invención puede representarse como un aparato, por ejemplo, sistema de ordenador. El sistema de ordenador comprende un bus, un dispositivo de almacenamiento de datos acoplado al bus y un procesador acoplado al dispositivo de almacenamiento de datos, dicho procesador para llevar a cabo un procedimiento que comprende determinar una primera ancla semántica correspondiente a un primer grupo de mensajes. El procesador también determina una segunda ancla semántica correspondiente a un segundo grupo de mensajes. El procesador determina además un vector correspondiente a un mensaje entrante, compara el vector correspondiente al mensaje de entrada al menos con uno de la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación. El procesador filtra el mensaje entrante en base al primer... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento implementado por ordenador para filtrar mensajes que comprende:
determinar (315) una primera ancla semántica (120) que representa un primer vector en un espacio vectorial semántico correspondiente a un primer grupo de mensajes y una segunda ancla semántica (125) que representa un segundo vector en el espacio vectorial semántico correspondiente a un segundo grupo de mensajes, en el que el primer vector y el segundo vector fueron derivados a partir de un cuerpo de entrenamiento que comprendía el primer grupo de mensajes y el segundo grupo de mensajes, y en el primer grupo de mensajes y el segundo grupo de mensajes son diferentes;
determinar (325) , en el espacio vectorial semántico, una representación matemática como un tercer vector correspondiente a un mensaje entrante que tiene texto reconocido por máquina;
comparar (330) la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación; y filtrar el mensaje entrante clasificando el mensaje entrante entre el primer y segundo grupos en base al primer valor de comparación y el segundo valor de comparación.
2. Un procedimiento según la reivindicación 1, en el que dicho segundo grupo de mensajes se define como mensajes no solicitados, y dicho primer grupo de mensajes se define como no pertenecientes a mensajes no solicitados, y en el que el primer grupo y el segundo grupo están predefinidos antes de determinar la representación matemática correspondiente al mensaje entrante.
3. Un procedimiento según la reivindicación 2, en el que la primera ancla semántica y la segunda ancla semántica son vectores obtenidos respectivamente a partir de mensajes no solicitados recibidos de un cuerpo de mensajes de entrenamiento y mensajes previamente recibidos como no pertenecientes a mensajes no solicitados del cuerpo de mensajes de entrenamiento.
4. Un procedimiento según la reivindicación 3, en el que el cuerpo de mensajes de entrenamiento se utiliza para obtener una matriz W que comprende un factor de distribución de palabras.
5. Un procedimiento según la reivindicación 4, en el que la matriz W se utiliza para generar la primera ancla semántica y la segunda ancla semántica utilizando descomposición en valores singulares.
6. Un procedimiento según la reivindicación 1, en el que el primer grupo de mensajes, el segundo grupo de mensajes y el mensaje entrante comprenden mensajes de al menos uno de: mensajes de correo electrónico, archivos adjuntos de correo electrónico y programas de ordenador.
7. Un procedimiento según la reivindicación 1, en el que determinar la representación matemática correspondiente comprende utilizar descomposición en valores singulares para generar el tercer vector correspondiente al mensaje entrante.
8. Un procedimiento según la reivindicación 1, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprende determinar un ángulo ente el tercer vector correspondiente al mensaje entrante y la primera ancla semántica y la segunda ancla semántica.
9. Un procedimiento según la reivindicación 1, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprende comparar la longitud de una normal entre la primera ancla semántica y el tercer vector correspondiente al mensaje entrante, y la longitud de una normal entre la segunda ancla semántica y el tercer vector correspondiente al mensaje entrante.
10. Un procedimiento según la reivindicación 1, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación comprende permitir a un usuario decidir si el mensaje entrante es del primer grupo de mensajes o del segundo grupo de mensajes cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
11. Un procedimiento según la reivindicación 10, en el que filtrar el mensaje entrante en base al primer valor de
comparación y al segundo valor de comparación comprende al menos uno de filtrar automáticamente los mensajes entrantes y marcar los mensajes entrantes.
12. Un procedimiento según la reivindicación 11, en el que marcar el mensaje entrante comprende al menos uno de marcar el mensaje entrante con una primera marca para un mensaje correspondiente al primer grupo de mensajes, marcar el mensaje entrante con una segunda marca para un mensaje correspondiente al segundo grupo de mensajes y marcar el mensaje entrante con una tercera marca cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
13. Un procedimiento según la reivindicación 1, en el que la segunda ancla semántica corresponde a un centroide de los mensajes no solicitados recibidos previamente de un cuerpo de mensajes de entrenamiento definidos como no pertenecientes a mensajes no solicitados del cuerpo de mensajes de entrenamiento en el espacio vectorial semántico.
14. Un procedimiento según la reivindicación 1, en el que cada uno de las primera y segunda anclas semánticas se determinan en base a primeros números de ocurrencias de un conjunto de palabras en el primer grupo y a segundos números de ocurrencias del conjunto de palabras en el segundo grupo.
15. Un procedimiento según la reivindicación 14, en el que dicho determinar la primera ancla semántica y la segunda ancla semántica comprende:
d eterminar una primera matriz, la matriz comprendiendo:
una primera columna determinada en base a los primeros números de ocurrencias de un conjunto de palabras en el primer grupo; y una segunda columna determinada en base a los segundos números de ocurrencias de un conjunto de palabras en el segundo grupo; y determinar las primera y segunda anclas semánticas en base a una matriz singular derecha de la descomposición en valores singulares de la primera matriz.
16. Un procedimiento según la reivindicación 15, en el que:
la primera columna se determina en base a las frecuencias de ocurrencias del conjunto de palabras en el primer grupo; y la segunda columna se determina en base a las frecuencias de ocurrencias del conjunto de palabras en el segundo grupo.
17. Un procedimiento según la reivindicación 15, en el que dicho determinar la representación matemática correspondiente al mensaje entrante comprende:
determinar terceros números de ocurrencias del conjunto de palabras en el mensaje entrante; y determinar la representación matemática correspondiente al mensaje entrante en base al tercer número de ocurrencias del conjunto de palabras en el mensaje entrante y una matriz singular izquierda de la descomposición en valores singulares de la primera matriz.
18. Un medio legible por máquina que tiene almacenado en él un programa de ordenador en donde dicho programa de ordenador comprende medios de código que, cuando se ejecutan en una máquina de procesado de datos hacen que la máquina lleve a cabo cada una de las etapas del procedimiento de la reivindicación 1.
19. Un medio legible por máquina según la reivindicación 18, en el que dicho segundo grupo de mensajes se define como mensajes no solicitados, y dicho primer grupo de mensajes se define como no pertenecientes a mensajes no solicitados, y en donde el primer grupo y el segundo grupo están predefinidos antes de determinar la representación matemática correspondiente al mensaje entrante.
20. Un medio legible por máquina según la reivindicación 19, en el que dichas instrucciones para obtener la primera ancla semántica y la segunda ancla semántica incluyen instrucciones adicionales para obtener vectores que utilizan un cuerpo de mensajes de entrenamiento que comprende mensajes no solicitados recibidos previamente y mensajes definidos como no pertenecientes a mensajes no recibidos previamente.
21. Un medio legible por máquina según la reivindicación 20, en el que dichas instrucciones para obtener vectores utilizando un cuerpo de mensajes de entrenamiento comprende instrucciones adicionales para obtener una matriz W que comprende un factor de distribución de palabras.
22. Un medio legible por máquina según la reivindicación 21, en el que dichas instrucciones para obtener la matriz W comprenden instrucciones adicionales para generar la primera ancla semántica y la segunda ancla semántica usando descomposición en valores singulares.
12
23. Un medio legible por máquina según la reivindicación 18, en el que dicho primer grupo de mensajes, dicho segundo grupo de mensajes y dicho mensaje entrante comprenden mensajes de al menos uno de mensajes de correo electrónico, archivos adjuntos de correo electrónico y programas de ordenador.
24. Un medio legible por máquina según la reivindicación 18, en el que dichas instrucciones para determinar una representación matemática correspondiente a un mensaje entrante comprende instrucciones adicionales para utilizar descomposición en valores singulares para generar el tercer vector correspondiente al mensaje entrante.
25. Un medio legible por máquina según la reivindicación 18, en el que dichas instrucciones para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprenden instrucciones adicionales para determinar un ángulo entre le tercer vector correspondiente al mensaje entrante y la primera ancla semántica y la segunda ancla semántica.
26. Un medio legible por máquina según la reivindicación 18, en el que dichas instrucciones para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprenden instrucciones adicionales para comparar la longitud de una normal entre la primera ancla semántica y el tercer vector correspondiente al mensaje entrante, y la longitud de una normal entre la segunda ancla semántica y el tercer vector correspondiente al mensaje entrante.
27. Un medio legible por máquina según la reivindicación 18, en el que dichas instrucciones para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación comprenden instrucciones adicionales para permitir a un usuario decidir si el mensaje entrante es del primer grupo de mensajes o del segundo grupo de mensajes cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
28. Un medio legible por máquina según la reivindicación 27, en el que dichas instrucciones para filtrar el mensaje entrante en base al primer valor de comparación y al segundo valor de comparación comprenden instrucciones adicionales para al menos uno de filtrar automáticamente los mensajes entrantes y marcar los mensajes entrantes.
29. Un medio legible por máquina según la reivindicación 28, en el que dichas instrucciones para marcar el mensaje entrante comprenden instrucciones adicionales para al menos uno de marcar el mensaje entrante con una primera marca para un mensaje correspondiente al primer grupo de mensajes, marcar el mensaje entrante con una segunda marca para un mensaje correspondiente al segundo grupo de mensajes y marcar el mensaje entrante con una tercera marca cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
30. Un sistema de procesado de datos que comprende medios para llevar a cabo cada una de las etapas de la reivindicación 1 .
31. Un sistema de procesado de datos según la reivindicación 31, en el que dicho segundo grupo de mensajes se define como mensajes no solicitados, y dicho primer grupo de mensajes se define como no pertenecientes a mensajes no solicitados, y en donde el primer grupo y el segundo grupo están predefinidos antes de determinar la representación matemática correspondiente al mensaje entrante.
32. Un sistema de procesado de datos según la reivindicación 31, en el que la primera ancla semántica y la segunda ancla semántica son vectores obtenidos utilizando un cuerpo de mensajes de entrenamiento que comprende mensajes no solicitados recibidos previamente y mensajes definidos como no pertenecientes a mensajes no recibidos previamente.
33. Un sistema de procesado de datos según la reivindicación 32, en el que el cuerpo de mensajes de entrenamiento se utiliza para obtener una matriz W que comprende un factor de distribución de palabras.
34. Un sistema de procesado de datos según la reivindicación 33, en el que la matriz W se utiliza para generar la primera ancla semántica y la segunda ancla semántica utilizando descomposición en valores singulares.
35. Un sistema de procesado de datos según la reivindicación 30, en el que el primer grupo de mensajes, el segundo grupo de mensajes y el mensaje entrante comprenden mensajes de al menos uno de: mensajes de correo electrónico, archivos adjuntos de correo electrónico y programas de ordenador.
36. Un sistema de procesado de datos según la reivindicación 30, en el que determinar la representación matemática correspondiente comprende utilizar descomposición en valores singulares para generar el tercer vector correspondiente al mensaje entrante.
13
37. Un sistema de procesado de datos según la reivindicación 30, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprende determinar un ángulo ente el tercer vector correspondiente al mensaje entrante y la primera ancla semántica y la segunda ancla semántica.
38. Un sistema de procesado de datos según la reivindicación 30, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica comprende comparar la longitud de una normal entre la primera ancla semántica y el tercer vector correspondiente al mensaje entrante, y la longitud de una normal entre la segunda ancla semántica y el tercer vector correspondiente al mensaje entrante.
39. Un sistema de procesado de datos según la reivindicación 30, en el que comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación comprende permitir a un usuario decidir si el mensaje entrante es del primer grupo de mensajes o del segundo grupo de mensajes cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
40. Un sistema de procesado de datos según la reivindicación 39, en el que filtrar el mensaje entrante en base al primer valor de comparación y al segundo valor de comparación comprende al menos uno de filtrar automáticamente los mensajes entrantes y marcar los mensajes entrantes.
41. Un procedimiento según la reivindicación 40, en el que marcar el mensaje entrante comprende al menos uno de marcar el mensaje entrante con una primera marca para un mensaje correspondiente al primer grupo de mensajes, marcar el mensaje entrante con una segunda marca para un mensaje correspondiente al segundo grupo de mensajes y marcar el mensaje entrante con una tercera marca cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
42. Un sistema de ordenador según el sistema de procesado de datos de la reivindicación 30, los medios para llevarlo a cabo comprendiendo:
un bus;
un dispositivo de almacenamiento de datos acoplado a dicho bus;
un procesador acoplado a dicho dispositivo de almacenamiento de datos;
una unidad de descomposición en valores singulares acoplada de forma comunicativa al procesador para determinar la primera ancla semántica correspondiente al primer grupo de mensajes y la segunda ancla semántica correspondiente al segundo grupo de mensajes;
una unidad de conversión de correos electrónicos entrantes acoplada de forma comunicativa a la unidad de descomposición en valores singulares para determinar la representación matemática correspondiente al mensaje entrante;
una unidad lógica acoplada de forma comunicativa a la unidad de conversión de correos electrónicos entrantes y la unidad de descomposición en valores singulares para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener el primer valor de comparación y el segundo valor de comparación y para filtrar el mensaje entrante en base al primer valor de comparación y al segundo valor de comparación.
43. Un sistema de ordenador según la reivindicación 42, en el que dicho segundo grupo de mensajes se define como mensajes no solicitados, y dicho primer grupo de mensajes se define como no perteneciente a mensajes no solicitados, y en donde el el primer grupo y el segundo grupo están predefinidos antes de determinar la representación matemática correspondiente al mensaje entrante.
44. Un sistema de ordenador según la reivindicación 42, en el que la primera ancla semántica y la segunda ancla semántica son vectores obtenidos utilizando un cuerpo de mensajes de entrenamiento que comprende mensajes no solicitados recibidos previamente y mensajes definidos como no pertenecientes a mensajes no recibidos previamente.
45. Un sistema de ordenador según la reivindicación 44, en el que el cuerpo de mensajes de entrenamiento se utiliza para obtener una matriz W que comprende un factor de distribución de palabras.
46. Un sistema de ordenador según la reivindicación 44, en el que la matriz W se utiliza para generar la primera ancla semántica y la segunda ancla semántica utilizando descomposición en valores singulares.
47. Un sistema de ordenador según la reivindicación 42, en el que el primer grupo de mensajes, el segundo grupo de mensajes y el mensaje entrante comprenden mensajes de al menos uno de: mensajes de correo electrónico, archivos adjuntos de correo electrónico y programas de ordenador.
48. Un sistema de ordenador según la reivindicación 42, en el que una unidad de conversión de correos electrónicos entrantes acoplada de forma comunicativa a la unidad de descomposición en valores singulares para determinar la representación matemática correspondiente al mensaje entrante comprende que la unidad de conversión de correos electrónicos entrantes utilice descomposición en valores singulares para generar el tercer vector correspondiente al mensaje entrante.
49. Un sistema de ordenador según la reivindicación 42, en el que la unidad lógica acoplada de forma comunicativa a la unidad de conversión de correos electrónicos entrantes y la unidad de descomposición en valores singulares para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener un primer valor de comparación y un segundo valor de comparación comprende la unidad lógica para determinar un ángulo entre el tercer vector correspondiente al mensaje entrante y la primera ancla semántica y la segunda ancla semántica.
50. Un sistema de ordenador según la reivindicación 42, en el que la unidad lógica acoplada de forma comunicativa a la unidad de conversión de correos electrónicos entrantes y la unidad de descomposición en valores singulares para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener el primer valor de comparación y el segundo valor de comparación comprende la unidad lógica para comparar la longitud de una normal entre la primera ancla semántica y el tercer vector correspondiente al mensaje entrante, y la longitud de una normal entre la segunda ancla semántica y el tercer vector correspondiente al mensaje entrante.
51. Un sistema de ordenador según la reivindicación 42, en el que la unidad lógica acoplada de forma comunicativa a la unidad de conversión de correos electrónicos entrantes y la unidad de descomposición en valores singulares para comparar la representación matemática correspondiente al mensaje entrante con la primera ancla semántica y la segunda ancla semántica para obtener el primer valor de comparación y el segundo valor de comparación comprende la unidad lógica para permitir a un usuario decidir si el mensaje entrante es del primer grupo de mensajes o del segundo grupo de mensajes cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
52. Un sistema de ordenador según la reivindicación 51, en el que la unidad lógica para filtrar el mensaje entrante en base al primer valor de comparación y al segundo valor de comparación comprende la unidad lógica para al menos uno de filtrar los mensajes entrantes y marcar los mensajes entrantes.
53. Un sistema de ordenador según la reivindicación 52, en el que la unidad lógica para marcar el mensaje entrante comprende al menos uno de marcar el mensaje entrante con una primera marca para un mensaje correspondiente al primer grupo de mensajes, la unidad lógica para marcar el mensaje entrante con una segunda marca para un mensaje correspondiente al segundo grupo de mensajes y la unidad lógica para marcar el mensaje entrante con una tercera marca cuando el primer valor de comparación es sustancialmente igual al segundo valor de comparación.
palabras
Patentes similares o relacionadas:
Combinación de contenidos de comunicación, del 29 de Julio de 2020, de Alibaba Group Holding Limited: Un método para un sistema de combinación de contenidos de comunicación, comprendiendo el sistema un módulo de obtención de relación de correlación y un módulo de combinación […]
MÉTODO DE CONTRATACIÓN CUALIFICADA CERTIFICADA UNIVERSAL, del 9 de Julio de 2020, de LLEIDANETWORKS SERVEIS TELEMÀTICS S.A: El objeto de la invención permite a un operador de telecomunicaciones o un proveedor de comunicaciones electrónicas o proveedor de e-delivery enviar contratos […]
Método para habilitar una comunicación entre un dispositivo móvil y un receptor de comunicación, utilizando conversión de formato, del 24 de Junio de 2020, de Vodafone GmbH: Método, realizado por un dispositivo móvil , para habilitar una comunicación entre dicho dispositivo móvil y un receptor de comunicación […]
Dispositivo de interfaz, procedimiento y programa informático para controlar dispositivos sensores, del 10 de Junio de 2020, de Ubiquiti Inc: Un primer dispositivo de interfaz para su uso en un sistema de domótica , comprendiendo el primer dispositivo de interfaz: un módulo de comunicación […]
Transmisión en red de mensajes de datos recíprocos relacionados con la identidad, del 10 de Junio de 2020, de EQUIFAX, INC: Método para transmitir mensajes relacionados con la identidad, que comprende: Almacenar, en un sistema de información relacionada con […]
Método y aparato para enviar información, del 3 de Junio de 2020, de Advanced New Technologies Co., Ltd: Un método para enviar información, el método que comprende: determinar, por un servidor, la información en cola para ser enviada a un usuario y el tiempo de espera […]
Método, dispositivo y sistema de procesamiento de mensajes, del 3 de Junio de 2020, de Advanced New Technologies Co., Ltd: Un método de procesamiento de mensajes, en donde el método comprende: calcular, mediante una parte llamante, una duración de tiempo de envío para […]
Método de comunicaciones basado en la capacidad de servicio y la presencia social, del 3 de Junio de 2020, de Vodafone IP Licensing Limited: Un método para facilitar la comunicación entre un primer dispositivo de comunicación y un segundo dispositivo de comunicación usando una red que soporta un […]