Procedimientos, arquitecturas, sistemas y software de búsqueda distribuida.

Un sistema (100) de búsqueda en línea que comprende:

una pluralidad de motores (106) de búsqueda;



medios para recibir una solicitud de búsqueda desde un solicitante;

medios para dividir la solicitud de búsqueda recibida en una pluralidad de solicitudes componentes y para asignar cada una de las solicitudes componentes a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda;

medios para combinar los resultados de la búsqueda proporcionados por los motores (106) de búsqueda en respuesta a las solicitudes componentes en un resultado de búsqueda combinado; y

medios para proporcionar el resultado de la búsqueda combinada al solicitante;

caracterizado por que

un índice dividido en una pluralidad de partes índice, en el que a cada uno de entre la pluralidad de motores (106) de búsqueda se le asigna la búsqueda de datos usando al menos una de las partes índice; y por que los motores (106) de búsqueda comprenden medios para recibir el componente de solicitud de búsqueda y el nombre de una parte índice específica y medios para causar la realización de una búsqueda en la parte índice especificada con la solicitud.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2004/012836.

Solicitante: THOMSON REUTERS GLOBAL RESOURCES.

Inventor/es: BLUHM,MARK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06F17/30

PDF original: ES-2453343_T3.pdf

 

Procedimientos, arquitecturas, sistemas y software de búsqueda distribuida.

Fragmento de la descripción:

Procedimientos, arquitecturas, sistemas y software de búsqueda distribuida

Campo técnico

Varias realizaciones de la presente invención se refieren a sistemas de recuperación de información y sistemas de gestión del conocimiento y, más particularmente, se refieren a funciones de búsqueda distribuida dentro de dichos sistemas.

Antecedentes Típicamente, los proveedores modernos de información en línea para ordenadores requieren la capacidad de realizar búsquedas de grandes cantidades de datos. Por ejemplo, el ordenamiento jurídico de Estados Unidos, así como otros ordenamientos jurídicos de todo el mundo, dependen en gran medida de las opiniones judiciales escritas, declaraciones escritas de los jueces, para articular o interpretar las leyes que rigen la resolución de disputas. Como consecuencia, los jueces y abogados de nuestro ordenamiento jurídico están investigando continuamente un cuerpo cada vez mayor de dictámenes anteriores, o jurisprudencia, buscando los más relevantes para la resolución o la prevención de nuevas disputas. Se estudia la relevancia de los casos encontrados y, en última instancia, son citados y discutidos en documentos, denominados producto de trabajo, que, por ejemplo, aconsejan una acción judicial, aconsejan a los clientes sobre las probables acciones judiciales, o educan a los clientes y los abogados acerca del estado de la ley en determinadas jurisdicciones.

Además, los sistemas de gestión del conocimiento, los sistemas de gestión de documentos y otros proveedores de datos en línea requieren, típicamente, información a partir de conjuntos de datos que pueden variar en tamaño, desde grandes a pequeños. Los conjuntos de datos en el rango terabyte ya no son infrecuentes. Por ejemplo, algunos sistemas pueden utilizar registros públicos que comprenden aproximadamente 1, 2 terabytes de datos únicos, y datos fiscales y contables (Tax & Accounting, TA) que incluyen aproximadamente 20 gigabytes (GB) de datos únicos. En los sistemas anteriores, se han producido problemas debido a que, típicamente, el sistema puede almacenar sólo el cinco por ciento de los datos únicos de registros públicos. Además, el sistema es demasiado grande para los datos TA únicos que, típicamente, comparten espacio en el servidor con otros proveedores de datos.

Dichas variaciones en los tamaños de los conjuntos de datos y del sistema tienen un impacto sobre el rendimiento del motor de búsqueda, especialmente en relación con las implementaciones empresa-servidor (incluyendo problemas de disponibilidad inherentes) . Por ejemplo, si se produce un fallo de memoria dentro de la CPU de un sistema, típicamente, el sistema no puede ejecutar el servicio de búsqueda hasta que se resuelva el fallo, y los mecanismos de conmutación por error son problemáticos. Debido a que, típicamente, el servicio de búsqueda hace un uso intensivo de memoria y no está limitado a la CPU, se desperdician recursos en la resolución de estos problemas de error.

Además, a veces, el procesamiento de consultas fuerza al motor de búsqueda a acceder a un disco para obtener páginas de datos si estas no están disponibles en la memoria caché del sistema de archivos. Aunque en algunos casos, los datos pueden encontrarse típicamente en la memoria caché del sistema de archivos si el conjunto de datos es suficientemente pequeño para ser mantenido completamente en memoria RAM, frecuentemente sucede que los conjuntos de datos son tan grandes que el procesamiento de consultas se produce frecuentemente a nivel de disco en lugar de a nivel de caché del sistema de archivos. Además, típicamente, las arquitecturas actuales no aseguran que el mismo motor de búsqueda procesará los mismos datos de manera consistente, lo cual niega las ventajas del almacenamiento en caché del motor de búsqueda.

El documento US 5.590.319 sobre el cual están caracterizadas las reivindicaciones independientes, describe un sistema de búsqueda en línea.

El documento US 2002/0143744 describe un procedimiento y un aparato para realizar búsquedas de información.

El documento WO 00/79436 describe una interfaz de motor de búsqueda.

En consecuencia, el presente inventor ha identificado una necesidad de mejores sistemas, herramientas y procedimientos para proporcionar funciones de búsqueda dentro de las plataformas de distribución en línea.

Sumario Para abordar a esta y/u otras necesidades, el presente inventor ha ideado sistemas, procedimientos y software novedosos para proporcionar una función de búsqueda distribuida para plataformas de distribución en línea

usadas en los bufetes de abogados y otras empresas.

Según un primer aspecto de la presente invención, se proporciona un sistema de búsqueda en línea según se reivindica en la reivindicación 1.

Según un segundo aspecto de la presente invención, se proporciona un procedimiento de realización de una búsqueda según se reivindica en la reivindicación 4.

Por ejemplo, los sistemas, procedimientos y software proporcionan una pluralidad de conjuntos de datos. Los conjuntos de datos comprenden índices a otros conjuntos de datos. Al menos un motor de búsqueda está asociado con cada conjunto de datos. Un sistema que recibe una solicitud de búsqueda determina qué motores de búsqueda se usan para procesar la solicitud de búsqueda en base a los conjuntos de datos implicados en la solicitud de búsqueda. A continuación, la solicitud de búsqueda es reenviada a los motores de búsqueda identificados.

Particularmente, la realización ejemplar proporciona una función de búsqueda que es distribuida a través de múltiples motores de búsqueda en una manera en la que es probable que los datos de búsqueda estén almacenados en caché en la memoria RAM disponible, evitando de esta manera costosas búsquedas en disco.

Breve descripción de los dibujos La Figura 1 es un diagrama de bloques de un sistema 100 de búsqueda distribuida ejemplar que corresponde a una o más realizaciones de la presente invención.

La Figura 2 es un diagrama de bloques que proporciona detalles adicionales de un sistema 200 de búsqueda distribuida ejemplar que corresponde a una o más realizaciones de la presente invención.

La Figura 3 es un diagrama de flujo que corresponde a uno o más procedimientos de funcionamiento ejemplares de un sistema de búsqueda distribuida ejemplar y los componentes asociados que conforman la presente invención.

Descripción detallada de las realizaciones ejemplares La descripción siguiente, que incorpora las figuras y las reivindicaciones adjuntas, describe y/o ilustra una o más realizaciones ejemplares de una o más invenciones. Estas realizaciones, proporcionadas no para limitar sino sólo para ejemplificar y enseñar la invención o las invenciones, se muestran y describen con suficiente detalle para permitir que las personas con conocimientos en la materia realicen y usen la invención o las invenciones. De esta manera, cuando sea apropiado para evitar dificultar la comprensión de las una o más invenciones, la descripción puede omitir cierta información conocida por las personas con conocimientos en la materia relevante.

Sistema de Información Ejemplar

La Figura 1 representa un sistema 100 de búsqueda distribuida ejemplar que incorpora una o más enseñanzas de la presente invención. El sistema 100 incluye un controlador 102 de búsqueda, un conmutador 104 de mensajes, motores 106 de búsqueda, almacenamiento 110 conectado a red (Network Attached Storage, NAS) y la red 108 acopla, de manera comunicativa, los motores 106 de búsqueda al NAS 110. Los componentes indicados anteriormente pueden estar distribuidos a través de uno o más ordenadores servidores. En algunas realizaciones, los ordenadores servidores comprenden ordenadores de servicio basados en blades (blade: ordenador en una tarjeta plana, sin fuente de alimentación) de Sun Microsystems, Inc. Sin embargo, en realizaciones alternativas, pueden usarse servidores basados en arquitecturas de procesadores Intel.

El controlador 102 de búsquedas "escucha" las solicitudes de búsqueda. Utilizando un motor “divisióncombinación” ("split-merge") , el controlador de búsquedas recibe las solicitudes y las divide en solicitudes componentes (atendidas por los motores 106 de búsqueda) . Cuando se reciben las respuestas desde los motores 106 de búsqueda, el controlador de búsqueda combina las respuestas y las envía al solicitante. Pueden realizarse solicitudes de división, a las que se ha referencia programáticamente como "SearchEngineRequest", a los diversos conjuntos de datos que comprenden o son generados a partir de la colección o el conjunto de recogida de datos. El conjunto de datos comprende... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema (100) de búsqueda en línea que comprende: una pluralidad de motores (106) de búsqueda; medios para recibir una solicitud de búsqueda desde un solicitante; medios para dividir la solicitud de búsqueda recibida en una pluralidad de solicitudes componentes y para asignar cada una de las solicitudes componentes a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda; medios para combinar los resultados de la búsqueda proporcionados por los motores (106) de búsqueda en respuesta a las solicitudes componentes en un resultado de búsqueda combinado; y

medios para proporcionar el resultado de la búsqueda combinada al solicitante; caracterizado por que un índice dividido en una pluralidad de partes índice, en el que a cada uno de entre la pluralidad de motores (106) de búsqueda se le asigna la búsqueda de datos usando al menos una de las partes índice; y por que los motores (106) de búsqueda comprenden medios para recibir el componente de solicitud de búsqueda y el nombre de una parte índice específica y medios para causar la realización de una búsqueda en la parte índice especificada con la solicitud.

2. Sistema según la reivindicación 1, que comprende además una pluralidad de colas de mensajes, en el que cada cola de mensaje recibe solicitudes componentes y es asignada a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda.

3. Sistema según la reivindicación 1 o 2, que comprende además un conmutador (104) de mensajes operable para enrutar cada solicitud componente a su motor (106) de búsqueda asignado.

4. Procedimiento para realizar una búsqueda usando una pluralidad de motores (106) de búsqueda, en el que el procedimiento comprende:

recibir una solicitud de búsqueda desde un solicitante;

dividir la solicitud de búsqueda recibida en una pluralidad de solicitudes componentes;

asignar cada una de las solicitudes componentes a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda;

combinar los resultados de búsqueda proporcionados por los motores (106) de búsqueda en respuesta a las solicitudes componentes en un resultado de búsqueda combinado; y

proporcionar el resultado de búsqueda combinado al solicitante; caracterizado por que proporciona un índice dividido en una pluralidad de partes índice, en el que cada parte índice es asignada a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda; y por que los motores (106) de búsqueda reciben el componente de solicitud de búsqueda y el nombre de una parte índice específica y causan la ejecución de una búsqueda sobre la parte índice especificada con la solicitud.

5. Procedimiento según la reivindicación 4, que comprende además comunicar las solicitudes componentes a una pluralidad correspondiente de colas de mensajes, en el que cada cola de mensajes es asignada a un motor de búsqueda correspondiente de entre los motores (106) de búsqueda.

6. Procedimiento según la reivindicación 4, que comprende además almacenar en caché los datos en base a cada una de las solicitudes componentes en una memoria de acceso aleatorio asociada con un motor de búsqueda correspondiente de entre los motores (106) de búsqueda.


 

Patentes similares o relacionadas:

Composiciones y métodos para modelar el metabolismo de Saccharomyces cerevisiae, del 3 de Junio de 2020, de THE REGENTS OF THE UNIVERSITY OF CALIFORNIA: Un metodo implementado por computadora para proporcionar a un usuario una simulacion de una funcion fisiologica de levadura relacionada con un gen heterologo […]

Procedimiento de visualización de páginas por medio de un navegador de un equipo como una caja descodificadora Proveedor de Servicios de Internet, del 10 de Enero de 2020, de FREEBOX (100.0%): Un procedimiento de visualización de páginas por un equipo cliente equipado de un sistema cerrado, conectado a un servidor remoto , integrando […]

Procedimiento implementado por ordenador y controlado por ordenador, producto de programa informático y plataforma para disponer datos para su procesamiento y almacenamiento en un motor de almacenamiento de datos, del 4 de Noviembre de 2019, de Dynactionize N.V: Un procedimiento implementado por ordenador y controlado por ordenador de disposición de datos para procesamiento y almacenamiento de los mismos en un […]

MÉTODO DE DOBLAJE Y LOCUCIONES DE AUDIO, del 11 de Julio de 2019, de TANGO VOZ, S.L: Se describe en este documento un método que permite gestionar la producción de doblajes y locuciones de audio destinados a medios audiovisuales de tal manera que no se […]

Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, del 21 de Mayo de 2019, de IG Knowhow Limited: Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, la unidad de procesamiento de datos recibiendo una primera […]

Dispositivo de procesamiento de información, método de procesamiento de información, programa de procesamiento de información y soporte de registro, del 1 de Mayo de 2019, de RAKUTEN, INC: Dispositivo de procesamiento de información que comprende: un medio (12b) de memoria de palabra de área local que almacena una palabra de área […]

Método para proporcionar una estructura de índice en una base de datos, del 1 de Mayo de 2019, de Capish International AB: Metodo para proporcionar una estructura de indice en una base de datos que comprende una pluralidad de tipos de objetos, donde cada tipo de objetos […]

SISTEMA PARA LA DETECCIÓN REMOTA DEL USO DEL CINTURÓN DE SEGURIDAD EN UN VEHÍCULO, del 18 de Abril de 2019, de CASANOVA RENT VOLKS, S.A. DE C.V: La presente invención se refiere a la industria automotriz, particularmente está relacionada con los cinturones de seguridad con que están equipados los vehículos, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .