Sistema y procedimiento con miras a la recuperación de datos y su utilización en un dispositivo de búsqueda.
Un sistema de búsqueda para recuperación de información, en particular información almacenada en forma de texto,
donde un texto T incluye palabras y/o símbolos s y sus secuencias S, donde la recuperación de información tiene lugar con un grado dado o variable de coincidencia entre una consulta Q, donde la consulta Q incluye palabras y/o símbolos q y sus secuencias P, y la información recuperada R incluyendo palabras y/o símbolos y sus secuencias del texto T, donde el sistema de búsqueda incluye una estructura de datos para almacenar al menos una parte del texto T, y un métrico M que mide el grado de coincidencia entre la consulta Q y la información recuperada R, y donde el sistema de búsqueda implementa algoritmos de búsqueda para ejecutar una búsqueda, en particular una búsqueda de texto completo en base a palabras clave kw, caracterizado porque la estructura de datos incluye una estructura de árbol en forma de un árbol de sufijos escasos no uniformemente espaciados ST(T) para almacenar sufijos de palabras y/o símbolos s y sus secuencias S en el texto T, porque el métrico M incluye una combinación de un métrico de distancia de edición D(s,q) para un grado aproximado de coincidencia entre palabras y/o símbolos s;q respectivamente en el texto T y una consulta Q y un métrico de distancia de edición Dws(S,P) para un grado aproximado de coincidencia entre secuencias S de palabras y/o símbolos s en el texto T y una secuencia de consultas P de palabras y/o símbolos q en la consulta Q, incluyendo este último métrico de distancia de edición ponderar funciones de costo para operaciones de edición que transforman secuencias de palabras y/o símbolos s en el texto T en la secuencia P de palabras y/o símbolos q en la consulta Q, teniendo lugar la ponderación con un valor proporcional a un cambio en la longitud de la secuencia S en una transformación o dependiente del tamaño de las palabras y/o símbolos s;q en secuencias S;P a coincidir, porque los algoritmos de búsqueda implementados incluyen un primer algoritmo para determinar el grado de coincidencia entre palabras y/o símbolos s;q en la representación del árbol de sujos respectivamente del texto T y una consulta Q, y un segundo algoritmo para determinar el grado de coincidencia entre secuencias S;P de palabras y/o símbolos s;q en la representación del árbol de sufijos respectivamente del texto T y la consulta Q, buscando dichos algoritmos primero y/o segundo la estructura de datos con consultas Q en forma de palabras, símbolos, secuencias de palabras o secuencias de símbolos o sus combinaciones, de tal manera que la información R se recupere en base a la consulta Q con un grado especificado de coincidencia entre la primera y la última, y porque los algoritmos de búsqueda también incluyen opcionalmente un tercer algoritmo para determinar la coincidencia exacta entre palabras y/o símbolos s;q en la representación del árbol de sufijos respectivamente del texto T y la consulta y/o un cuarto algoritmo para determinar la coincidencia exacta entre secuencias S;P de palabras y/o símbolos s;q en la representación del árbol de sufijos respectivamente del texto T y la consulta Q, buscando dichos algoritmos tercero y/o cuarto la estructura de datos con consultas Q en forma de palabras, símbolos, secuencias de palabras, o secuencias de símbolos o sus combinaciones, de tal manera que la información R se recupere en base a la consulta Q con una coincidencia exacta entre la primera y la última.
Tipo: Resumen de patente/invención.
Solicitante: FAST SEARCH & TRANSFER ASA.
Nacionalidad solicitante: Noruega.
Dirección: P.O. BOX 1766 VIKA,0120 OSLO.
Inventor/es: RISVIK, KNUT, MAGNE.
Fecha de Publicación: .
Fecha Solicitud PCT: 9 de Julio de 1999.
Fecha Concesión Europea: 30 de Enero de 2002.
Clasificación Internacional de Patentes:
- G06F1/00 FISICA. › G06 CALCULO; CONTEO. › G06F PROCESAMIENTO ELECTRICO DE DATOS DIGITALES (sistemas de computadores basados en modelos de cálculo específicos G06N). › Detalles no cubiertos en los grupos G06F 3/00 - G06F 13/00 y G06F 21/00 (arquitecturas de computadores con programas almacenados de propósito general G06F 15/76).
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Finlandia, Chipre, Oficina Europea de Patentes, Armenia, Azerbayán, Bielorusia, Ghana, Gambia, Kenya, Kirguistán, Kazajstán, Lesotho, República del Moldova, Malawi, Federación de Rusia, Sudán, Sierra Leona, Tayikistán, Turkmenistán, Uganda, Zimbabwe, Burkina Faso, Benin, República Centroafricana, Congo, Costa de Marfil, Camerún, Gabón, Guinea, Malí, Mauritania, Niger, Senegal, Chad, Togo, Organización Regional Africana de la Propiedad Industrial, Swazilandia, Guinea-Bissau, Organización Africana de la Propiedad Intelectual, Organización Eurasiática de Patentes.
Patentes similares o relacionadas:
MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE RECONOCIMIENTO BIOMÉTRICO, del 24 de Junio de 2020, de UNIVERSIDAD AUTONOMA DE MADRID: Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas diferentes […]
Sistema y método para una salida digital pervasiva de dispositivo a dispositivo, del 23 de Octubre de 2019, de Flexiworld Technologies, Inc: Un método de salida de datos para transmitir de forma inalámbrica, en uno o más dispositivos de salida, contenidos digitales a los que se accede mediante un […]
Método y programa de autenticación de usuario, y aparato de formación de imágenes, del 15 de Mayo de 2019, de RICOH COMPANY, LTD.: Un método de autenticación de usuario para un aparato de formación de imágenes que se puede conectar a través de una red a un aparato de […]
Derechos divididos en dominio autorizado, del 27 de Febrero de 2019, de KONINKLIJKE PHILIPS N.V: Un método para controlar el acceso a un elemento de contenido en un sistema que comprende un conjunto de dispositivos, constituyendo el conjunto […]
Método y programa de autenticación de usuario, y aparato de formación de imágenes, del 20 de Febrero de 2019, de RICOH COMPANY, LTD.: Un método de autenticación de usuario para un aparato de formación de imágenes que se puede conectar a través de una red a un aparato […]
Método y sistema para realizar una transacción y para realizar una verificación de acceso legítimo o uso de datos digitales, del 7 de Febrero de 2019, de Ward Participations B.V: Método para realizar una transacción electrónica entre una primera parte de transacción y una segunda parte de transacción usando un dispositivo electrónico operado […]
Método y sistema para realizar una transacción y para realizar una verificación de acceso legítimo o uso de datos digitales, del 16 de Enero de 2019, de Ward Participations B.V: Método para realizar una transacción electrónica entre una primera parte de transacción y una segunda parte de transacción usando un dispositivo […]
Aparato de formación de imágenes, método de borrado y método de gestión de disco duro, del 25 de Octubre de 2018, de RICOH COMPANY, LTD.: Un aparato de formación de imágenes que incluye unos recursos de soporte físico que se van a usar para un proceso de formación de imágenes, al menos un programa para llevar […]