Motor de búsqueda para realizar una búsqueda referida a un lugar.

Motor de búsqueda para realizar una búsqueda por páginas de Internet para las que se cumple un criterio de origen geográfico ingresado por el usuario como término de búsqueda,

presentando el motor de búsqueda:

un dispositivo para escudriñar una pluralidad de páginas de Internet;

un dispositivo (135) para extraer datos de dirección de las paginas escudriñadas (130, 205), designando los datos de dirección extraídos una respectiva asignación geográfica de la página o del ofertante de la página;

un dispositivo (140) para formar un inventario de datos (250) en el que está almacenado un gran número de páginas de Internet escudriñadas para cada una de las cuales se han extraído y asignado datos de dirección procedentes de estas páginas de Internet;

una interfaz de ingreso (145) para ingresar una petición de búsqueda por el usuario, posibilitándole la interfaz de ingreso al usuario el ingreso de un criterio de origen geográfico además de otros términos de búsqueda; y

un dispositivo (150) para escudriñar el inventario de datos y para entregar las páginas de Internet para las cuales se cumplen el criterio de origen geográfico y los demás términos de búsqueda, por cotejo con los contenidos y los datos de dirección extraídos de las páginas de Internet;

caracterizado porque el dispositivo para extraer datos de dirección presenta:

un dispositivo para aplicar un mecanismo de regulación al contenido de una página de Internet a fin de extraer las informaciones que pudieran especificar datos de dirección con arreglo a los criterios del mecanismo de regulación;

un dispositivo para verificar los datos de dirección especificados con arreglo a los criterios del mecanismo de regulación por cotejo con un inventario de datos presente (220) de direcciones existentes, retirándose del inventario de datos (205) a escudriñar los datos de dirección especificados con arreglo a los criterios del mecanismo de regulación para los cuales el cotejo con el inventario de datos presente de direcciones existentes no suministra ninguna coincidencia.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E05109402.

Solicitante: SEARCHTEQ GMBH.

Nacionalidad solicitante: Alemania.

Dirección: Wiesenhüttenstrasse 18 60329 Frankfurt am Main ALEMANIA.

Inventor/es: HANTKE,REIMAR, LOHMEIER,FLORIAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06F17/30

PDF original: ES-2394002_T3.pdf

 


Fragmento de la descripción:

Motor de búsqueda para realizar una búsqueda referida a un lugar.

Campo de la invención

La presente invención concierne a un motor de búsqueda para realizar una búsqueda referida a un lugar.

Antecedentes de la invención

Los motores de búsqueda son ordenadores especiales o instalaciones informáticas programadas para la búsqueda por páginas web que satisfacen determinados criterios de búsqueda ingresados por un usuario. Para desarrollar su cometido, un motor de búsqueda carga las páginas de Internet en el ordenador del motor de búsqueda, indexa las páginas escudriñadas y proporciona también una interfaz de usuario y un mecanismo de consulta para filtrar las páginas indexadas respecto de criterios de búsqueda ingresados por el usuario e indicarle al usuario las páginas entonces encontradas, llamadas aciertos o éxitos (hits) .

Para la descarga, un motor de búsqueda contiene típicamente una llamada araña (crawler) que contacta automáticamente con direcciones de Internet y descarga los contenidos de los sitios web correspondientes para su ulterior procesamiento (indexación) .

No obstante, en contraste con los bancos de datos ya conocidos desde hace bastante tiempo, los contenidos de los sitios web son en general informaciones no estructuradas y el contenido del significado de los distintos conceptos (términos) de un sitio web sólo puede identificarse con dificultad. Esto restringe fuertemente las posibilidades de indexación y, por tanto, las posibilidades de búsqueda. Por tanto, una indexación de páginas web realizada por un motor de búsqueda es de hecho siempre una indexación de texto completo, es decir que a partir de todos los términos que se presentan en el sitio web (exceptuadas palabras de detención predefinidas y carentes de significado) se forma un índice de texto completo con el que se "empareja" después la petición de búsqueda.

En la tecnología convencional de los motores de búsqueda un usuario introduce en una interfaz de ingreso unos términos de búsqueda sobre la base de los cuales se envía después una petición de búsqueda (quer y ) a un inventario de datos del motor de búsqueda, y una aplicación de los términos de búsqueda al inventario de datos o al índice da entonces como resultado eventualmente "coincidencias" o "aciertos" y se indican las páginas o vínculos correspondientes para el usuario.

Un problema de los motores de búsqueda convencionales consiste en que es difícil restringir los aciertos logrados a un criterio de búsqueda geográfico determinado. El usuario puede ciertamente ingresar como término de búsqueda un lugar, por ejemplo "Berlín", pero esto no significa que se encuentren solamente páginas que contengan la referencia geográfica deseada. Por el contrario, debido a la indexación de texto completo, que ciertamente no diferencia según contenidos de significados, se encuentran también páginas en las que la palabra "Berlín" no emerge como lugar de origen geográfico de la oferta de páginas web, sino con otro significado. Así, por ejemplo, con el ingreso de una búsqueda con los términos de búsqueda "taller de automóviles" y "Berlín" puede surgir también como acierto una página en la que alguien informe de su excursión a Berlín, en la que el coche sufrió daños durante la excursión y el interesado tuvo que buscar un taller de automóviles. Sin embargo, tales aciertos son poco deseables en el caso de una búsqueda referida a un lugar que contenga "Berlín" como criterio de origen geográfico.

La solicitud de patente internacional WO 01/63479 A1 se refiere a una codificación y representación espacial de información. En este contexto, la solicitud de patente describe un sistema informático que comprende un sistema de memoria que contiene informaciones en forma de documentos junto con informaciones espaciales sobre estos documentos. Este sistema informático comprende, además, dispositivos para la acumulación de datos, el análisis de datos, la búsqueda de datos, la representación de datos y los servicios de portal. El sistema informático comprende, además, una interfaz de mapa a través de la cual los usuarios pueden consultar el sistema de memoria y ver una representación de los resultados de la consulta presentados en un mapa.

La solicitud de patente norteamericana US 2004/0267723 A1 se ocupa de la reproducción de indicaciones con documentos con uno o varios temas mediante el empleo de informaciones de interés por temas. La solicitud de patente describe que pueden evitarse ambigüedades con respecto al interés principal de un usuario de modo que se pueda indicar una publicidad útil dirigida al interés principal del usuario. Tales ambigüedades pueden resolverse vigilando el comportamiento del usuario, determinando el interés principal del usuario en base al comportamiento vigilado y proporcionando la publicidad que esté dirigida al interés principal así determinado del usuario.

La solicitud de patente europea EP 1039265 A1 muestra un sistema de geoinformación que administra un banco de datos con lugares y proporciona una aplicación que accede a este banco de datos para presentarle a un usuario datos referidos a un lugar. Los usuarios pueden acceder a un servidor en el que está situado el banco de datos del sistema de información geográfica (banco de datos GIS) . Este banco de datos proporciona también un sistema de realimentación mediante el cual un usuario puede confirmar la información del banco de datos GIS cuando éste haya

buscado un lugar en el mundo real.

Por tanto, un cometido de la presente invención consiste en proporcionar un motor de búsqueda que suministre como aciertos aquellas páginas de Internet para las cuales se cumple un criterio de origen geográfico deseado.

Sumario de la invención

Según un ejemplo de realización de la invención, ésta comprende un motor de búsqueda para realizar una búsqueda por páginas de Internet para los cuales se cumpla un criterio de origen geográfico ingresado por el usuario como término de búsqueda, presentando el motor de búsqueda:

un dispositivo para escudriñar en una pluralidad de páginas de Internet;

un dispositivo para extraer datos geográficos de las páginas escudriñadas, designando los datos extraídos la respectiva referencia geográfica o la asignación geográfica de la página o del ofertante de la página;

un dispositivo para formar un inventario de datos en el que están asociados a un gran número de páginas de Internet escudriñadas los respectivos datos geográficos extraídos de estas páginas de Internet;

una interfaz de ingreso para ingresar una petición de búsqueda por el usuario, haciendo posible la interfaz de ingreso que el usuario ingrese un criterio de origen geográfico además de otros términos de búsqueda;

un escudriñamiento del inventario de datos y una entrega de las páginas de Internet para las cuales se cumplen el criterio de origen geográfico de los demás términos de búsqueda por cotejo con los contenidos de las páginas de Internet y los respectivos datos geográficos asignados a éstas.

La extracción de informaciones de origen geográfico y su asignación a páginas individuales hacen posible la creación de un inventario de datos de páginas de Internet que pueden ser escudriñadas deliberadamente según criterios de origen geográfico. El dispositivo para la extracción de información de origen geográfico según el ejemplo de realización antes citado presenta también:

un dispositivo para aplicar un mecanismo de regulación al contenido de una página de Internet a fin de extraer las informaciones que, de conformidad con los criterios del mecanismo de regulación, pudieran especificar una dirección

o un origen geográfico;

un dispositivo para verificar las posibles informaciones de origen geográfico por cotejo con un inventario de datos existente constituido por direcciones y/o partes de dirección existentes,

en donde los datos de dirección especificados según los criterios del mecanismo de regulación para los que el cotejo con el inventario de datos existente de direcciones existentes no suministra ninguna coincidencia son retirados del inventario de datos que se debe escudriñar.

La aplicación de un mecanismo de regulación a los contenidos de páginas de Internet individuales hace posible la comprobación referente a si algunos componentes individuales satisfacen condiciones predeterminadas y, por tanto, entran en consideración como candidatos para informaciones de origen geográfico - por ejemplo, direcciones -, o bien suministra candidatos correspondientes. La comprobación o el cotejo de tales candidatos con un inventario de datos de dirección... [Seguir leyendo]

 


Reivindicaciones:

1. Motor de búsqueda para realizar una búsqueda por páginas de Internet para las que se cumple un criterio de origen geográfico ingresado por el usuario como término de búsqueda, presentando el motor de búsqueda:

un dispositivo para escudriñar una pluralidad de páginas de Internet;

un dispositivo (135) para extraer datos de dirección de las paginas escudriñadas (130, 205) , designando los datos de dirección extraídos una respectiva asignación geográfica de la página o del ofertante de la página;

un dispositivo (140) para formar un inventario de datos (250) en el que está almacenado un gran número de páginas de Internet escudriñadas para cada una de las cuales se han extraído y asignado datos de dirección procedentes de estas páginas de Internet;

una interfaz de ingreso (145) para ingresar una petición de búsqueda por el usuario, posibilitándole la interfaz de ingreso al usuario el ingreso de un criterio de origen geográfico además de otros términos de búsqueda; y

un dispositivo (150) para escudriñar el inventario de datos y para entregar las páginas de Internet para las cuales se cumplen el criterio de origen geográfico y los demás términos de búsqueda, por cotejo con los contenidos y los datos de dirección extraídos de las páginas de Internet;

caracterizado porque el dispositivo para extraer datos de dirección presenta:

un dispositivo para aplicar un mecanismo de regulación al contenido de una página de Internet a fin de extraer las informaciones que pudieran especificar datos de dirección con arreglo a los criterios del mecanismo de regulación;

un dispositivo para verificar los datos de dirección especificados con arreglo a los criterios del mecanismo de regulación por cotejo con un inventario de datos presente (220) de direcciones existentes, retirándose del inventario de datos (205) a escudriñar los datos de dirección especificados con arreglo a los criterios del mecanismo de regulación para los cuales el cotejo con el inventario de datos presente de direcciones existentes no suministra ninguna coincidencia.

2. Motor de búsqueda según la reivindicación 1, que presenta también: un dispositivo para dictaminar si la página escudriñada es la página de un ofertante comercial,

3. Motor de búsqueda según la reivindicación 1 ó 2, que presenta también:

un dispositivo para geocodificar la página de Internet escudriñada estableciendo para una información de dirección extraída en base a los datos de dirección extraídos, por cotejo con un inventario de datos de geoinformación existentes, una geocodificación por medio de un sistema de coordenadas geográficas y asignando esta última a la página de Internet.

4. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 3, que presenta también:

un dispositivo para escudriñar las distintas páginas de Internet según una pluralidad de términos que son adecuados para clasificar las paginas de Internet atendiendo al contenido ofrecido, asignándose en el caso de un acierto eventualmente aplicando otras condiciones - una clasificación correspondiente a la página de Internet.

5. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 4, que presenta también:

un dispositivo para escudriñar por separado partes diferentes de las distintas páginas de Internet según la pluralidad de términos, para establecer y ponderar los aciertos en las diferentes partes y para establecer una puntuación total sobre la base de los aciertos ponderados, siendo decisivo en base a la puntuación total que se confiera una clasificación correspondiente a la respectiva página de Internet.

6. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 5, que presenta también:

un dispositivo para indexar las páginas escudriñadas a las que se han asignado datos de dirección y eventualmente otras informaciones de clasificación;

un dispositivo para emparejar los términos de búsqueda con el contenido del índice formado;

una salida de los aciertos obtenidos, sirviendo los datos de dirección asignados a una página de Internet, por cotejo con el criterio de origen geográfico ingresado en calidad de término de búsqueda, como criterio de filtrado para la entrega de la lista de aciertos.

7. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 6, que presenta también: 13

un dispositivo para formar varios índices parciales para partes diferentes de páginas web;

un dispositivo para emparejar los términos de búsqueda con el contenido de los respectivos índices parciales a fin de encontrar listas de aciertos parciales sobre la base de los índices parciales; un dispositivo para formar una lista de aciertos totales por combinación de las listas de aciertos parciales.

8. Motor de búsqueda según la reivindicación 7, que presenta también: una respectiva ponderación específica de aciertos de las diferentes listas de aciertos parciales; y una combinación de las listas de aciertos parciales con las diferentes ponderaciones para formar una lista de

aciertos totales sobre la base de las listas de aciertos parciales ponderadas combinadas.

9. Motor de búsqueda según la reivindicación 6, 7 u 8, que comprende también:

una asignación de una puntuación a un acierto individual de una lista de aciertos parciales sobre la base de un criterio de valoración para valorar la relevancia del acierto;

una asignación de una ponderación específica para la lista de aciertos parciales a un acierto individual de una lista de aciertos parciales;

un establecimiento de una puntuación total para el acierto de la lista de aciertos parciales por adición de las puntuaciones ponderadas que se han asignado a este acierto en las diferentes listas de aciertos parciales.

10. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 9, que presenta también:

un dispositivo para la normalización de las informaciones geográficas extraídas a fin de poner éstas en un formato estandarizado que entrega después al usuario como "tarjeta de negocio" las informaciones de dirección y eventualmente otras informaciones de contacto junto con la dirección de Internet.

11. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 10, que presenta también:

un inventario de datos de direcciones de Internet que deberán ser descargadas por la araña y escudriñadas por el dispositivo de extracción, un dispositivo para la adaptación dinámica del inventario de datos por: agregación de nuevos vínculos que se han establecido por el dispositivo de extracción al escudriñar las páginas

descargadas; y/o

rechazo de direcciones de Internet en las que el dispositivo de extracción ha verificado que no se cumplen los criterios prefijados para la extracción de una información geográfica; y un dispositivo para la descarga y escudriñamiento repetidos de las direcciones de Internet del inventario de datos.

12. Motor de búsqueda según cualquiera de las reivindicaciones 1 a 11, que presenta también:

un dispositivo para establecer informaciones adicionales a indicar que se indican además de los aciertos indicados ante una petición de búsqueda, presentando este dispositivo: un dispositivo para establecer el sector temático para el que deberán indicarse informaciones adicionales.

13. Motor de búsqueda según la reivindicación 12, en el que el dispositivo para establecer el sector temático presenta:

un dispositivo para contar la frecuencia de palabras individuales que se presentan en el acierto o aciertos a fin de establecer en base a las palabras que se presentan con la mayor frecuencia el sector temático para el cual deberán indicarse informaciones adicionales: y/o

un dispositivo para consultar en sectores temáticos asignados a los respectivos aciertos a fin de establecer basándose en ellos el sector o los sectores temáticos para los cuales deberán indicarse informaciones adicionales.

14. Motor de búsqueda según la reivindicación 12 ó 13, en el que las informaciones adicionales indicadas son vínculos publicitarios y la secuencia de indicación de los vínculos publicitarios se basa en la frecuencia con que se haya clicado ya en un vínculo publicitario.


 

Patentes similares o relacionadas:

Composiciones y métodos para modelar el metabolismo de Saccharomyces cerevisiae, del 3 de Junio de 2020, de THE REGENTS OF THE UNIVERSITY OF CALIFORNIA: Un metodo implementado por computadora para proporcionar a un usuario una simulacion de una funcion fisiologica de levadura relacionada con un gen heterologo […]

Procedimiento de visualización de páginas por medio de un navegador de un equipo como una caja descodificadora Proveedor de Servicios de Internet, del 10 de Enero de 2020, de FREEBOX (100.0%): Un procedimiento de visualización de páginas por un equipo cliente equipado de un sistema cerrado, conectado a un servidor remoto , integrando […]

Procedimiento implementado por ordenador y controlado por ordenador, producto de programa informático y plataforma para disponer datos para su procesamiento y almacenamiento en un motor de almacenamiento de datos, del 4 de Noviembre de 2019, de Dynactionize N.V: Un procedimiento implementado por ordenador y controlado por ordenador de disposición de datos para procesamiento y almacenamiento de los mismos en un […]

MÉTODO DE DOBLAJE Y LOCUCIONES DE AUDIO, del 11 de Julio de 2019, de TANGO VOZ, S.L: Se describe en este documento un método que permite gestionar la producción de doblajes y locuciones de audio destinados a medios audiovisuales de tal manera que no se […]

Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, del 21 de Mayo de 2019, de IG Knowhow Limited: Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, la unidad de procesamiento de datos recibiendo una primera […]

Dispositivo de procesamiento de información, método de procesamiento de información, programa de procesamiento de información y soporte de registro, del 1 de Mayo de 2019, de RAKUTEN, INC: Dispositivo de procesamiento de información que comprende: un medio (12b) de memoria de palabra de área local que almacena una palabra de área […]

Método para proporcionar una estructura de índice en una base de datos, del 1 de Mayo de 2019, de Capish International AB: Metodo para proporcionar una estructura de indice en una base de datos que comprende una pluralidad de tipos de objetos, donde cada tipo de objetos […]

SISTEMA PARA LA DETECCIÓN REMOTA DEL USO DEL CINTURÓN DE SEGURIDAD EN UN VEHÍCULO, del 18 de Abril de 2019, de CASANOVA RENT VOLKS, S.A. DE C.V: La presente invención se refiere a la industria automotriz, particularmente está relacionada con los cinturones de seguridad con que están equipados los vehículos, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .