Dispositivo de procesamiento de información, método de procesamiento de información, programa para dispositivo de procesamiento de información, y medio de grabación.

Un dispositivo de procesamiento de información (10), que comprende:

un medio de generación de palabras de búsqueda de par que

, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda;

un primer medio de cálculo de cómputo de apariciones que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas por el medio de generación de palabras de búsqueda de par;

un segundo medio de cálculo de cómputo de apariciones que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la palabra de búsqueda de par específica; y

un medio de memoria que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2012/070442.

Solicitante: RAKUTEN, INC.

Nacionalidad solicitante: Japón.

Dirección: 4-12-3, HIGASHISHINAGAWA SHINAGAWA-KU TOKYO 140-0002 JAPON.

Inventor/es: INOUE,TEIKO, YASUI,TAKU, SUGIKI,KENJI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)

PDF original: ES-2530365_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Dispositivo de procesamiento de información, método de procesamiento de información, programa para dispositivo de procesamiento de información, y medio de grabación

Campo técnico

La presente invención se refiere a un campo técnico de un dispositivo de procesamiento de información, un método de procesamiento de información, un programa de dispositivo de procesamiento de información y un medio de grabación que generan un diccionario.

Técnica anterior

Los diccionarios de sinónimos (tesauros) son útiles para el procesamiento de búsqueda o el procesamiento de transformación de palabras de búsqueda introducidas para la búsqueda. Por ejemplo, en Internet se ofrecen constantemente nuevos productos o servicios, creándose nuevas palabras. Los tesauros también necesitan incorporar estas nuevas palabras. Por ejemplo, el documento patente 1 da a conocer un dispositivo de generación de diccionario que aprende una asociación entre palabras basándose en una tabla de frecuencias obtenida mediante la integración de una tabla de frecuencias de ocurrencias conjuntas de palabras en un fragmento predeterminado de un documento y una tabla de frecuencias de tesauro obtenida mediante la transformación de información de tesauro en una tabla de frecuencias virtual, y crea un diccionario conceptual comprimiendo la tabla de frecuencias integrada.

El documento patente 2 da a conocer un método de recuperación de documentos que usa datos de tesauro para permitir la creación de un documento base para su uso en un ciclo de búsqueda.

Lista de citas

Documento patente

documento patente 1: solicitud de patente japonesa abierta a inspección pública n.2 25-25762. documento patente 2: publicación de solicitud de patente estadounidense 24/111678 A1.

Resumen de la invención Problema a ser resuleto por la invención

Aunque el documento patente 1 da a conocer una técnica de generación de un diccionario tesauro en una técnica convencional, sigue siendo necesario un procesamiento previo para, por ejemplo, determinar de antemano una estructura de capas entre palabras.

La presente invención se ha realizado en vista de este problema, y un ejemplo de la tarea de la presente invención es proporcionar, por ejemplo, un dispositivo de procesamiento de información que genere un diccionario tesauro a partir de palabras de búsqueda usadas para la búsqueda.

Medios para resolver el problema

Con el fin de resolver el problema anterior, la invención descrita en la reivindicación 1 incluye: un medio de generación de palabras de búsqueda de par que, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda; un primer medio de cálculo de cómputo de apariciones que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas por el medio de generación de palabras de búsqueda de par; un segundo medio de cálculo de cómputo de apariciones que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la palabra de búsqueda de par específica; y un medio de memoria que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.

En el dispositivo de procesamiento de información descrito en la reivindicación 1, la invención descrita en la

reivindicación 2 está caracterizada porque, cuando una diferencia entre el primer cómputo de apariciones y el

segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones está en un intervalo predeterminado, el medio de memoria almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como el tesauro en la base de datos de tesauro.

En el dispositivo de procesamiento de información descrito en la reivindicación 1 o en la reivindicación 2, la invención descrita en la reivindicación 3 está caracterizada porque el medio de generación de palabras de búsqueda de par genera la palabra de búsqueda de par procesando cadenas de caracteres de la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente.

En el dispositivo de procesamiento de información descrito en la reivindicación 3, la invención descrita en la

reivindicación 4 está caracterizada porque el medio de generación de palabras de búsqueda de par genera la

palabra de búsqueda de par llevando a cabo un procesamiento de cadena de caracteres que consiste en borrar una letra predeterminada de la palabra de búsqueda anterior y de la palabra de búsqueda subsiguiente con referencia a un medio de memoria de letras de borrado que almacena de antemano una letra para borrar la letra predeterminada en las palabras de búsqueda.

En el dispositivo de procesamiento de información descrito en una cualquiera de la reivindicación 1 a la reivindicación 4, la invención descrita en la reivindicación 5 está caracterizada porque, cuando el número de palabras de búsqueda es dos o más y hay una palabra de búsqueda común entre la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente, el medio de generación de palabras de búsqueda de par genera la palabra de búsqueda de par a partir de la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente de las que se ha borrado la palabra de búsqueda común.

En el dispositivo de procesamiento de información descrito en una cualquiera de la reivindicación 1 a la reivindicación 5, la invención descrita en la reivindicación 6 está caracterizada porque el dispositivo de procesamiento de información incluye además un medio de adquisición de palabras de búsqueda que adquiere una primera palabra de búsqueda y una segunda palabra de búsqueda con referencia al medio de memoria de palabras de búsqueda, y cuando se procesan cadenas de caracteres de la primera palabra de búsqueda y de la segunda palabra de búsqueda adquiridas por el medio de adquisición de palabras de búsqueda, y cuando se establece una relación de inclusión entre la primera palabra de búsqueda y la segunda palabra de búsqueda cuyas cadenas de caracteres están procesándose, el medio de memoria almacena la primera palabra de búsqueda y la segunda palabra de búsqueda como el tesauro en la base de datos de tesauro.

En el dispositivo de procesamiento de información descrito en la reivindicación 6, la invención descrita en la reivindicación 7 está caracterizada porque cuando la relación de inclusión se determina llevando a cabo un procesamiento de cadena de caracteres que consiste en comparar cada letra de la primera y de la segunda palabra de búsqueda según un orden de las cadenas de caracteres... [Seguir leyendo]

 


Reivindicaciones:

1. Un dispositivo de procesamiento de información (1), que comprende:

un medio de generación de palabras de búsqueda de par que, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda;

un primer medio de cálculo de cómputo de apariciones que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas por el medio de generación de palabras de búsqueda de par;

un segundo medio de cálculo de cómputo de apariciones que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la palabra de búsqueda de par específica; y

un medio de memoria que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.

2. El dispositivo de procesamiento de información (1) según la reivindicación 1, en el que cuando una diferencia entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones está en un intervalo predeterminado, el medio de memoria almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como el tesauro en la base de datos de tesauro.

3. El dispositivo de procesamiento de información (1) según la reivindicación 1 o la reivindicación 2, en el que el medio de generación de palabras de búsqueda de par genera la palabra de búsqueda de par procesando cadenas de caracteres de la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente.

4. El dispositivo de procesamiento de información (1) según la reivindicación 3, en el que el medio de generación de palabras de búsqueda de par genera la palabra de búsqueda de par llevando a cabo un procesamiento de cadena de caracteres que consiste en borrar una letra predeterminada de la palabra de búsqueda anterior y de la palabra de búsqueda subsiguiente con referencia a un medio de memoria de letras de borrado que almacena de antemano una letra para borrar la letra predeterminada en las palabras de búsqueda.

5. El dispositivo de procesamiento de información (1) según una cualquiera de la reivindicación 1 a la reivindicación

4, en el que cuando el número de palabras de búsqueda es dos o más y hay una palabra de búsqueda común entre la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente, el medio de generación de palabras de búsqueda de par genera la palabra de búsqueda de par a partir de la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente de las que se ha borrado la palabra de búsqueda común.

6. El dispositivo de procesamiento de información (1) según una cualquiera de la reivindicación 1 a la reivindicación

5, que comprende además un medio de adquisición de palabras de búsqueda que adquiere una primera palabra de búsqueda y una segunda palabra de búsqueda con referencia al medio de memoria de palabras de búsqueda, en el que, cuando se procesan cadenas de caracteres de la primera palabra de búsqueda y de la segunda palabra de búsqueda adquiridas por el medio de adquisición de palabras de búsqueda, y cuando se establece una relación de inclusión entre la primera palabra de búsqueda y la segunda palabra de búsqueda cuyas cadenas de caracteres están procesándose, el medio de memoria almacena la primera palabra de búsqueda y la segunda palabra de búsqueda como el tesauro en la base de datos de tesauro.

7. El dispositivo de procesamiento de información (1) según la reivindicación 6, en el que cuando la relación de inclusión se determina llevando a cabo un procesamiento de cadena de caracteres que consiste en comparar cada letra de la primera y de la segunda palabra de búsqueda según un orden de las cadenas de caracteres de la primera palabra de búsqueda y de la segunda palabra de búsqueda adquiridas por el medio de adquisición de palabras de búsqueda, y cuando se establece la relación de inclusión, el medio de memoria almacena la primera palabra de búsqueda y la segunda palabra de búsqueda como el tesauro en la base de datos de tesauro.

8. El dispositivo de procesamiento de información (1) según la reivindicación 6 o la reivindicación 7, en el que

cuando el procesamiento de cadena de caracteres que consiste en borrar una letra predeterminada se lleva a cabo en la primera palabra de búsqueda y en la segunda palabra de búsqueda adquiridas por el medio de adquisición de palabras de búsqueda con referencia a un medio de memoria de letras de borrado que almacena de antemano una letra para borrar una letra predeterminada en la palabra de búsqueda, y cuando se establece una relación de inclusión entre la primera palabra de búsqueda y la segunda palabra de búsqueda de las que se ha borrado la letra predeterminada, el medio de memoria almacena la primera palabra de búsqueda y la segunda palabra de búsqueda como el tesauro en la base de datos de tesauro.

9. El dispositivo de procesamiento de información (1) según una cualquiera de la reivindicación 6 a la reivindicación 8, en el que, en caso de que el número de palabras de búsqueda sea dos o más y haya una palabra de búsqueda común entre la primera palabra de búsqueda y la segunda palabra de búsqueda, cuando una relación de inclusión, en caso de que se borre la letra predeterminada, se establece entre la primera y la segunda palabra de búsqueda de las que se ha borrado la palabra de búsqueda común, el medio de memoria almacena como el tesauro en la base de datos de tesauro la primera y la segunda palabra de búsqueda de las que se ha borrado la palabra de búsqueda común.

1. El dispositivo de procesamiento de información (1) según una cualquiera de la reivindicación 1 o la reivindicación 9, en el que el medio de memoria almacena dos palabras de búsqueda como el tesauro junto con una palabra de búsqueda que comprende una relación del tesauro con al menos una de las dos palabras de búsqueda almacenadas como el tesauro con referencia a una base de datos de tesauro de palabras de búsqueda almacenadas como el tesauro en la base de datos de tesauro.

11. Un método de procesamiento de información en un dispositivo de procesamiento de información que procesa información, comprendiendo el método:

una etapa de generación de palabras de búsqueda de par (S4) que, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda;

una primera etapa de cálculo de cómputo de apariciones (S7) que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas en la etapa de generación de palabras de búsqueda de par;

una segunda etapa de cálculo de cómputo de apariciones (S8) que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la palabra de búsqueda de par específica; y

una etapa de memoria (S1) que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados en la primera y en la segunda etapa de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.

12. Un programa de dispositivo de procesamiento de información que hace que un ordenador funcione como:

un medio de generación de palabras de búsqueda de par (1) que, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda;

un primer medio de cálculo de cómputo de apariciones (1) que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas por el medio de generación de palabras de búsqueda de par;

un segundo medio de cálculo de cómputo de apariciones (1) que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la

palabra de búsqueda de par específica; y

un medio de memoria (1) que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.

13. Un medio de grabación que tiene un programa de dispositivo de procesamiento de información legible por ordenador grabado en el mismo que hace que un ordenador funcione como:

un medio de generación de palabras de búsqueda de par (1) que, en asociación con información de especificación de usuario para especificar un usuario que usa palabras de búsqueda y con información de especificación de tiempos de búsqueda para especificar tiempos de búsqueda que son tiempos en los que un procesamiento de búsqueda se ejecuta usando las palabras de búsqueda, genera una palabra de búsqueda de par que se obtiene formando un par compuesto por una palabra de búsqueda anterior y una palabra de búsqueda subsiguiente en los tiempos de búsqueda según un orden de los tiempos de búsqueda, a partir de palabras de búsqueda en las que los intervalos entre los tiempos de búsqueda asociados con la misma información de especificación de usuario están dentro de un tiempo predeterminado, con referencia a un medio de memoria de palabras de búsqueda que almacena las palabras de búsqueda;

un primer medio de cálculo de cómputo de apariciones (1) que calcula un primer cómputo de apariciones de una palabra de búsqueda de par específica entre palabras de búsqueda de par generadas por el medio de generación de palabras de búsqueda de par;

un segundo medio de cálculo de cómputo de apariciones (1) que calcula un segundo cómputo de apariciones de una palabra de búsqueda de par de orden inverso obtenida invirtiendo el orden de los tiempos de búsqueda de la palabra de búsqueda de par específica; y

un medio de memoria (1) que, cuando una relación de magnitud entre el primer cómputo de apariciones y el segundo cómputo de apariciones calculados por el primer y por el segundo medio de cálculo de cómputo de apariciones satisface una condición predeterminada, almacena la palabra de búsqueda anterior y la palabra de búsqueda subsiguiente como un tesauro en una base de datos de tesauro.