Sistemas, métodos, interfaces y soporte lógico para recogida e integración automática de datos de entidad en bases de datos y directorios de profesionales en línea.
Un sistema que comprende:
medios (910) para extraer datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad;
medios (920) para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante:
la clasificación de los registros de referencia de entidad por apellido;
la selección de un registro de referencia de entidad no fusionado y la creación de un registro de perfil de entidad a partir del registro de referencia de entidad no fusionado; y
el análisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado;
medios (940) para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomía; y
medios (950) para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/000033.
Solicitante: THOMSON REUTERS GLOBAL RESOURCES.
Nacionalidad solicitante: Suiza.
Dirección: LANDIS + GYR-STRASSE 3 6300 ZUG SUIZA.
Inventor/es: ARUMAINAYAGAM,YOHENDRAN, DOZIER,CHRISTOPER C.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06F17/30
PDF original: ES-2388817_T3.pdf
Fragmento de la descripción:
Sistemas, metodos, interfaces y soporte lógico para recogida e integración automatica de datos de entidad en bases de datos y directorios de profesionales en linea.
Aviso de derechos de autor y permiso
Una parte de este documento de patente contiene material sujeto a protección de derechos de autor. El propietario de los derechos de autor no tiene objeción para la reproducción facsimil por cualquiera del documento de patente o la revelación de patente, como aparece en los archivos o registros de patente de la Oficina de Patentes y Marcas, pero de otro modo reserva todos los derechos de autor que sean. El siguiente aviso aplica a este documento: Derechos de autor © 2003, Thomson Global Resources AG.
Campo tecnico
Varias realizaciones de la presente invención conciernen a sistemas de recuperación de información, tales como aquellos que proporcionan documentos legales u otro contenido relacionado.
Antecedentes
En los ultimos aios, el crecimiento fantastico de Internet y otras redes de ordenadores ha alimentado un crecimiento
igualmente fantastico en los datos accesibles a traves de estas redes. Uno de los modos fundamentales para interactuar con estos datos es a traves del uso de hiperenlaces dentro de documentos electrónicos.
Mas recientemente, ha habido interes en documentos de hiperenlaces a otros documentos en base a los nombres de personas en los documentos. Por ejemplo, para facilitar la busqueda legal, West Publishing Company de St. Paul, Minnesota (que hace negocios como Thomson West) proporciona miles de dictamenes judiciales electrónicos que
hiperenlazan los nombres de abogados y jueces con sus entradas biograficas en linea en el Directorio Legal de West, un directorio propietario de aproximadamente 1.000.000 de abogados y 20.000 jueces de EE.UU. Estos hiperenlaces permiten a los usuarios acceder a dictamenes judiciales para obtener rapidamente contacto y otra información especifica sobre abogados y jueces nombrados en los dictamenes.
Los hiperenlaces en estos dictamenes judiciales se generan automaticamente, usando un sistema que extrae el
nombre, el segundo nombre y el apellido; el nombre de la firma de abogados, la ciudad, y el estado; y la información del tribunal a partir del texto de los dictamenes, y los usa como pistas para determinar si enlazar los abogados y jueces nombrados con sus entradas correspondientes en el directorio de profesionales. Ver Christopher Dozier y Robert Haschart, "Extracción Automatica y Enlace de Nombres de Personas en Texto Legal" (Actas de RIAO 2000: Acceso a Información Multimedia Basada en Contenido. Paris, Francia. Paginas 1305-1321. Abril de 2000) . Una
mejora a este sistema se describe en Christopher Dozier, Sistemas, Metodos Y Soporte L6gico Para Hiperenlace Automatico De Nombres de Personas En Documentos a Directorios Profesionales, WO 2003/060767A3 24 de julio de 2003.
La WO 03/060767 describe un metodo y sistema para aiadir hiperenlaces a nombres en documentos. Los nombres en los documentos se identifican y comparan con direcciones de nombres para formar los hiperenlaces.
La presente invención ha reconocido aun la necesidad adicional de mejora de estos y otros sistemas que generan enlaces automaticos.
De acuerdo con un aspecto, la presente invención proporciona un sistema que comprende: medios para extraer un registro de referencia de entidad de cada uno de una pluralidad de documentos; medios para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad con al menos otro
registro de referencia de entidad; medios para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomia; y medios para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
De acuerdo con un segundo aspecto, la presente invención proporciona un metodo que comprende: extraer un registro de referencia de entidad a partir de cada uno de una pluralidad de documentos; formar al menos un perfil de 45 referencia de entidad fusionando al menos uno de los registros de referencia de entidad con al menos otro registro de referencia de entidad; categorizar automaticamente al menos uno de los registros de perfil de entidad en base a una taxonomia experta; y definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos
o conjuntos de datos.
Breve descripcion de los dibujos
50 La Figura 1 es un diagrama de un sistema de recuperación de información ejemplar 100 que corresponde a una o mas realizaciones de la invención;
La Figura 2 es un diagrama de flujo que corresponde a uno o mas metodos ejemplares del sistema operativo 100 y una o mas realizaciones de la invención;
La Figura 3-8 son facsimiles de interfaces de usuario ejemplares, cada una que corresponde a una o mas realizaciones de la invención.
La Figura 9 es un diagrama de flujo que corresponde a una o mas realizaciones de la invención.
La Figura 10 es un diagrama de flujo que corresponde a una o mas realizaciones adicionales de la invención.
Descripcion detallada de las realizaciones ejemplares
Esta descripción, la cual hace referencia e incorpora las Figuras identificadas anteriormente, describe una o mas realizaciones especificas de una invención. Estas realizaciones, ofrecidas no para limitar sino solamente para ejemplificar y enseiar la invención, se muestran y describen en detalle suficiente para permitir a aquellos expertos en la tecnica implementar o practicar la invención. De esta manera, cuando sea adecuado para evitar oscurecer la invención, la descripción puede omitir cierta información conocida para aquellos de los expertos en la tecnica.
Sistema de recuperación de información ejemplar
La Figura 1 muestra un sistema de recuperación de información en linea ejemplar 100. El sistema 100 incluye una o mas bases de datos 110, uno o mas servidores 120, y uno o mas dispositivos de acceso 130.
Las bases de datos 110 incluyen un conjunto de una o mas bases de datos. En la realización ejemplar, el conjunto incluye una base de datos de jurisprudencia 111, un directorio de peritos 112, directorios profesionales o bases de datos de concesión de licencias 113, una base de datos de veredictos y acuerdos 114, una base de datos de demandas judiciales 116.
La base de datos de jurisprudencia 111 generalmente incluye texto electrónico y copias de imagenes de dictamenes judiciales para casos decididos para una o mas jurisdicciones local, estatal, federal, o internacional. El directorio de peritos 112, que esta definido de acuerdo con uno o mas aspectos de la presente invención, incluye una o mas estructuras de bases de datos o registros, tales como la estructura 1121. La estructura 1121 incluye una parte de identificador de expertos 1121 A la cual esta asociada lógicamente con uno o mas documentos de directorio o entradas 1121B, uno o mas documentos de veredictos o entradas 1121C, y uno o mas articulos 1121D. Algunas realizaciones asocian lógicamente el identificador de expertos con documentos de demandas judiciales, tales como escritos o informes de expertos y/u otros documentos.
Los directorios de profesionales o bases de datos de concesión de licencias 113 incluyen datos de concesión de licencias profesionales de una o mas autoridades de concesión del estado, federal, o internacional. En la realización ejemplar, esto incluye autoridades de concesión de licencias o credenciales legales, medicas, de ingenieria y cientificas. La base de datos de veredictos y acuerdos 114 incluye texto electrónico y copias de imagenes de documentos relacionados con el veredicto determinado, daios juzgados, o acuerdos negociados de disputas legales asociadas con casos dentro de la base de datos de jurisprudencia 111. La base de datos de articulos 115 incluye articulos tecnicos, medicos, profesionales, cientificos u otros diarios academicos o de autoridad y publicaciones comerciales de autoridad. Algunos ejemplos incluyen publicaciones de patentes. La base de datos de demandas judiciales 116 incluye texto electrónico y copias de imagenes de demandas judiciales relacionadas con uno o mas subconjuntos de bases de datos de jurisprudencia de dictamenes judiciales 111. Los... [Seguir leyendo]
Reivindicaciones:
1º Un sistema que comprende:
medios (910) para extraer datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad;
medios (920) para formar al menos un registro de perfil de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante:
la clasificación de los registros de referencia de entidad por apellido;
la selección de un registro de referencia de entidad no fusionado y la creación de un registro de perfil de 10 entidad a partir del registro de referencia de entidad no fusionado; y
el analisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado;
medios (940) para categorizar al menos uno de los registros de perfil de entidad en base a una taxonomia; y
medios (950) para definir enlaces entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
2º El sistema de la reivindicación 1, que ademas comprende:
medios de interfaz grafica de usuario (138) para definir una consulta relacionada con una entidad, para ver al menos un documento resultante de laconsulta, para seleccionar al menos uno de los enlaces definidos dentro de
un documento legal, financiero, sanitario, cientifico, o educativo, y para provocar la recuperación y visualización de al menos una parte de uno de los registros de perfil de entidad.
3º El sistema de la reivindicación 1 o reivindicación 2, en el que al menos uno de los medios enumerados incluye uno o mas procesadores, medio legible por ordenador, dispositivos de visualización, y comunicaciones de red, con el medio legible por ordenador que incluye instrucciones codificadas y estructuras de datos.
4º El sistema de cualquier reivindicación precedente:
en el que al menos uno de otros registros de referencia de entidad estan contenidos en una base de datos (100) ;
en el que los medios para formar al menos un registro de perfil de entidad puede fallar al fusionar al menos uno de los registros de referencia de entidad con al menos uno de otro de los registros de referencia de entidad en la base de datos; y
en el que el sistema ademas comprende:
medios, sensibles a un fallo al fusionar al menos uno de los registros de referencia de entidad con al menos uno de los otros registros de referencia de entidad, para intentar hacer coincidir cada uno del al menos un registro de referencia de entidad con un conjunto de registros de referencia de entidad recolectados fuera de la base de datos; y
medios, sensibles a una coincidencia de al menos uno de los registros de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados, para fusionar los registros y aiadirlos a la base de datos.
5º El sistema de cualquier reivindicación precedente, en el que los documentos comprenden documentos de acuerdos de veredictos del jurado.
6º El sistema de la reivindicación 5, en el que los medios para extraer los registros de entidad comprenden transductores de estado finitos.
ºº El sistema de cualquier reivindicación precedente, en el que los medios para extraer al menos uno de los registros de referencia de entidad incluyen los medios para identificar el nombre, el grado de educación, el area de conocimiento, la organización, la ciudad, y el estado.
45 ºº El sistema de la reivindicación 4, en el que los medios para intentar hacer coincidir al menos uno de los registros de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados incluyen medios para calcular una probabilidad de coincidencia Bayesiana.
9º El sistema de cualquier reivindicación precedente:
en el que cada uno de los registros de referencia de entidad referencia una persona; y
en el que los medios para categorizar al menos uno de los registros de entidad definidos en base a una taxonomia se adaptan para categorizar automaticamente cada registro de referencia de entidad a una taxonomia de conocimiento.
10º El sistema de cualquier reivindicación precedente, los medios para extraer automaticamente registros de referencia de entidad se adaptan para realizar la extracción en base al tipo de documento.
11º Un metodo que comprende:
extraer (910) los datos de referencia de entidad para al menos una persona de cada uno de una pluralidad de documentos para formar registros de referencia de entidad;
formar (920) al menos un perfil de referencia de entidad fusionando al menos uno de los registros de referencia de entidad para una persona con al menos otro registro de referencia de entidad para la misma persona mediante:
la clasificación de los registros de referencia de entidad por apellido;
la selección de un registro de referencia de entidad no fusionado y la creación de un registro de perfil de entidad a partir del registro de referencia de entidad no fusionado; y
el analisis del registro de referencia de entidad no fusionado para determinar una probabilidad de que una persona en un registro de perfil de entidad es la misma persona que se referencia en el registro de referencia de entidad no fusionado seleccionado;
categorizar automaticamente (940) al menos uno de los registros de perfil de entidad en base a una taxonomia de conocimiento; y
definir enlaces (950) entre al menos uno de los registros de perfil de entidad y otros documentos o conjuntos de datos.
12º El metodo de la reivindicación 11, que ademas comprende:
recibir una consulta (210) relacionada con una entidad, visualizando (230) uno o mas documentos resultantes de la consulta, recibir una selección de uno o mas de los enlaces definidos dentro de un documento legal, financiero, sanitario, cientifico, o educativo; y la recuperación y visualización (240) de al menos una parte del al menos un registro de perfil de entidad.
13º El metodo de la reivindicación 11 o reivindicación 12,
en el que el al menos uno de otros registros de entidad estan contenidos en una base de datos (100) ; en el que al menos uno de los registros de referencia de entidad pueden no estar fusionados con al menos uno de otros registros de referencia de entidad en la base de datos; y
en el que el metodo ademas comprende:
en respuesta a un fallo fusionar al menos uno de los registros de referencia de entidad con al menos uno de los otros registros de referencia de entidad, intentar hacer coincidir cada uno del al menos un registro de referencia de entidad con un conjunto de registros de referencia de entidad recolectados fuera de la base de datos; y
en respuesta a una coincidencia del al menos un registro de referencia de entidad con al menos uno de los registros de referencia de entidad recolectados, fusionar los registros coincidentes y aiadirlos a la base de datos.
14º Un medio portador que transporta un código legible por ordenador para controlar un ordenador para llevar a cabo el metodo de cualquiera de las reivindicaciones 11 a 13.
Patentes similares o relacionadas:
Composiciones y métodos para modelar el metabolismo de Saccharomyces cerevisiae, del 3 de Junio de 2020, de THE REGENTS OF THE UNIVERSITY OF CALIFORNIA: Un metodo implementado por computadora para proporcionar a un usuario una simulacion de una funcion fisiologica de levadura relacionada con un gen heterologo […]
Procedimiento de visualización de páginas por medio de un navegador de un equipo como una caja descodificadora Proveedor de Servicios de Internet, del 10 de Enero de 2020, de FREEBOX (100.0%): Un procedimiento de visualización de páginas por un equipo cliente equipado de un sistema cerrado, conectado a un servidor remoto , integrando […]
Procedimiento implementado por ordenador y controlado por ordenador, producto de programa informático y plataforma para disponer datos para su procesamiento y almacenamiento en un motor de almacenamiento de datos, del 4 de Noviembre de 2019, de Dynactionize N.V: Un procedimiento implementado por ordenador y controlado por ordenador de disposición de datos para procesamiento y almacenamiento de los mismos en un […]
MÉTODO DE DOBLAJE Y LOCUCIONES DE AUDIO, del 11 de Julio de 2019, de TANGO VOZ, S.L: Se describe en este documento un método que permite gestionar la producción de doblajes y locuciones de audio destinados a medios audiovisuales de tal manera que no se […]
Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, del 21 de Mayo de 2019, de IG Knowhow Limited: Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, la unidad de procesamiento de datos recibiendo una primera […]
Dispositivo de procesamiento de información, método de procesamiento de información, programa de procesamiento de información y soporte de registro, del 1 de Mayo de 2019, de RAKUTEN, INC: Dispositivo de procesamiento de información que comprende: un medio (12b) de memoria de palabra de área local que almacena una palabra de área […]
Método para proporcionar una estructura de índice en una base de datos, del 1 de Mayo de 2019, de Capish International AB: Metodo para proporcionar una estructura de indice en una base de datos que comprende una pluralidad de tipos de objetos, donde cada tipo de objetos […]
SISTEMA PARA LA DETECCIÓN REMOTA DEL USO DEL CINTURÓN DE SEGURIDAD EN UN VEHÍCULO, del 18 de Abril de 2019, de CASANOVA RENT VOLKS, S.A. DE C.V: La presente invención se refiere a la industria automotriz, particularmente está relacionada con los cinturones de seguridad con que están equipados los vehículos, […]