Reglas de asociación ponderadas de enlaces directo - inverso de una base de datos expertos.
Un procedimiento de generación de una base de datos expertos para su consulta por un sistema derecomendación de contenido para generar recomendaciones de contenido,
estando constituida la base de datosexpertos por un conjunto de reglas de asociación, generadas mediante el análisis de un conjunto de registros dedatos que describen unas transacciones que implican a unos usuarios con respecto a un conjunto predeterminadode elementos, comprendiendo el procedimiento:
la selección de un procedimiento de generación de enlaces directos entre un conjunto de usuariosidentificados por un conjunto de registros de datos de transacción, de subpoblaciones de usuarios expertospara unos elementos de referencia respectivos; y
la construcción de una estructura de datos de enlace directo de asociaciones de enlace directo entre loselementos de referencia y los elementos relacionados, en los que las asociaciones de enlace directo sedefinen con respecto a las subpoblaciones de usuarios expertos, y en el que cada una de las asociacionesde enlace directo tiene una primera ponderación; y
el cálculo, en un análisis de enlace inverso, de las asociaciones de enlace inverso dentro de la estructura dedatos de enlace directo, reflejando las asociaciones de enlace inverso la profundidad y la consideración delenlace inverso, y en el que cada una de las asociaciones de enlace inverso tiene una segunda ponderación,yla generación de una regla de asociación para cada una de las asociaciones de enlace directo, siendo lasreglas de asociación indicativas de relaciones verificadas entre los elementos de referencia y los elementosrelacionados, y cada una de las reglas de asociación comprende una tercera ponderación calculada sobrela base de la primera ponderación tal como ha sido modificada por la segunda ponderación;
y en el que el procedimiento comprende así mismo:
la generación de la base de datos expertos mediante la población de una base de datos con las reglas deasociación generadas, de tal manera que las recomendaciones de contenido son generadas sobre la basede una consulta y de las reglas de asociación generada
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2003/014884.
Solicitante: MICROSOFT INTERNATIONAL HOLDINGS B.V.
Nacionalidad solicitante: Países Bajos.
Dirección: TELESTONE 8-TELEPORT NARITAWEG 165 1043 BW AMSTERDAM PAISES BAJOS.
Inventor/es: HOSKEN,Benjamin.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06F17/30
- G06F19/00
- G06F7/00 FISICA. › G06 CALCULO; CONTEO. › G06F PROCESAMIENTO ELECTRICO DE DATOS DIGITALES (sistemas de computadores basados en modelos de cálculo específicos G06N). › Métodos o disposiciones para el procesamiento de datos actuando sobre el orden o el contenido de los datos tratados (circuitos lógicos H03K 19/00).
- G06N5/02 G06 […] › G06N SISTEMAS DE COMPUTADORES BASADOS EN MODELOS DE CALCULO ESPECIFICOS. › G06N 5/00 Sistemas de computadores que utilizan modelos basados en el conocimiento. › Representación del conocimiento.
- G06N5/04 G06N 5/00 […] › Métodos o dispositivos de inferencia.
PDF original: ES-2386540_T3.pdf
Fragmento de la descripción:
Reglas de asociación ponderadas de enlaces directo -inverso de una base de datos expertos
Antecedentes de la invención
Campo de la invención:
La presente invención se refiere, en general, al campo de los sistemas y procedimientos de análisis de la información de las bases de datos transaccionales respecto de las reglas de asociación de elementos de minería de datos y, en particular, a un sistema y a un procedimiento de análisis de refuerzo del enlace inverso de datos transaccionales para establecer unas normas emergentes de asociación ponderadas.
Descripción de la técnica relacionada:
Los sistemas y herramientas de minería de datos son utilizados para determinar las relaciones asociativas dentro de los datos tal y como se contienen en las típicas bases de datos de informaciones a gran escala. Cuando la información de fuente representa, por ejemplo, las transacciones comerciales conducidas con respecto a elementos específicos, las relaciones de asociación entre los diferentes elementos pueden ser determinadas mediante análisis con unos grados de precisión y confianza relativos. Estas relaciones de asociación pueden, a continuación, ser utilizadas con diversos fines incluyendo, en particular, la predicción de comportamientos probables del consumidor con respecto al conjunto de elementos cubiertos por los datos de transacción. En términos prácticos la presentación y sustancia de los diseños de los productos, de las campañas de comercialización y circunstancias similares pueden, a continuación, ser personalizadas de manera eficiente para reflejar el interés y la demanda de los consumidores.
Tradicionalmente, las relaciones minadas a partir de las bases de datos de informaciones transaccionales son recogidas como reglas de asociación dentro de una base de datos de referencia, en general designada como base de datos expertos. Cada regla de asociación es calificada, con respecto a los elementos relacionados, con una ponderación que representa la significación o la cohesión de la asociación entre los elementos. Un conjunto agrupado de reglas de asociación puede entonces ser utilizado para proporcionar soluciones a los diversos problemas presentados como afirmaciones de consulta contra la base de datos expertos. En una implementación convencional, una traza relacional a través de la base de datos expertos, que discrimina entre las diversas ramificaciones de relaciones en base a las ponderaciones relativas asociadas, hace posible que se resuelva una consulta en un conjunto de soluciones extremadamente relacionadas de elementos correlacionados. La consulta propiamente dicha puede ser representada como un elemento identificado, un conjunto de elementos o unos atributos que estén asociados con los elementos identificados dentro de la base de datos expertos.
Las técnicas de minería de asociación automáticas, por oposición a los procedimientos manuales de ingeniería del conocimiento utilizados para crear bases de datos expertos, son preferentes, en particular cuando el volumen de datos que va a ser evaluado es considerable y cuando la utilidad de las asociaciones minadas se degrada rápidamente con el tiempo. Las técnicas de análisis de minería de asociación automáticas convencionales, sin embargo, están sometidas a una serie de limitaciones. En particular, las técnicas automáticas tienden a identificar las asociaciones de manera exponencial con la pluralidad de elementos identificados dentro de los datos de transacción. La realización de consultas contra una base de datos expertos se degrada de forma natural al incrementarse el tamaño de la base de datos. Así mismo, muchas de las reglas de asociación generadas pueden ser irrelevantes para ser definidas o incluso probablemente las consultas que serán afirmadas contra la base de datos expertos.
Otro problema es que las variaciones de los datos transaccionales subyacentes pueden afectar a la calidad relativa de las asociaciones potenciales. La consistencia determinada del análisis de las asociaciones identificadas puede resultar distorsionada por el número de veces en las que los elementos concretos son identificados en los datos transaccionales y por la distribución de los elementos del conjunto de mayor amplitud de las transacciones. De esta manera, la confianza en las consideraciones determinadas de las relaciones identificadas por el análisis automático puede variar de manera considerable.
En sistemas convencionales, las reglas de asociación son generadas a través de un procesamiento algorítmico de un conjunto de registros de datos de transacciones que represente, por ejemplo, una serie de transacciones comerciales. Dependiendo de la naturaleza de los datos transaccionales de fuente, las asociaciones de elementos son inicialmente identificadas en base a la tasa de aparición de los emparejamientos únicos de elementos o, cuando una transacción implique múltiples elementos, conjuntos de elementos. La frecuencia de aparición para un conjunto de elementos específico dentro del conjunto de registros de datos de transacción se designa tradicionalmente como el soporte de los conjuntos de elementos. Tal y como se describe en el artículo “Reglas de Asociación de Minería entre Conjuntos de Elementos en Grandes Bases de Datos” [“Mining Association Rules between Sets of Items in Large Databases”] de Agrawal, Imielinski y Swami, Actas de la Conferencia ACM SigMod de 1993 sobre Gestión de Datos, mayo 1993, pp 207 a 216, un umbral de soporte mínimo puede ser establecido para discriminar dejando fuera conjuntos de elementos insignificantes. Tal y como se describe en el citado artículo, el valor del soporte de umbral se selecciona de forma empírica para presentar una significación estadística determinada por razones comerciales.
En un ejemplo suministrado, el valor del soporte mínimo de umbral se fijó en un 1%. Las reglas de asociación que presentan un soporte inferior al del valor del soporte de umbral, que representen asociaciones inferiores a la significación mínima son descartadas.
El artículo de Agrawal, describe, así mismo, el uso de restricciones sintácticas para reducir el tamaño de la base de datos expertos generados. Los elementos que son de interés para consultas o, al contrario, los elementos que no son de interés pueden ser conocidos antes de la generación de las reglas. Una correspondiente restricción respecto de la generación de reglas de asociación es implementada en el examen algorítmico de los registros de datos de las transacciones con el resultado de que solo las reglas de asociación de interés son generadas y almacenadas en la base de datos expertos.
Por último, el artículo de Agrawal describe una técnica para evaluar la confianza de la consistencia de las reglas de asociación. La técnica presume que, en el descubrimiento del conjunto de soluciones para una consulta, la validez relativa de las consistencias de las reglas dentro de las trayectorias de las soluciones puede ser normalizada en base a la representación relativa de las reglas de asociación existentes dentro del conjunto de datos de las transacciones. El cálculo convencional de confianza para una regla de asociación determinada, tal y como se representa por parte de Agrawal, es la fracción de los registros de datos de transacciones de fuente que soportan la regla de asociación, esto es, la confianza C de una regla de asociación X -I, donde X es un conjunto de elementos identificado dentro de un conjunto de datos de transacción T e I es un elemento único no en X, es la relación del soporte de X -I dividido por el soporte de X.
La confianza determinada para una regla de asociación tal y como se utiliza en el artículo de Agrawal, puede ser utilizada como un valor de umbral para la calificación de las reglas de asociación generadas para su inclusión en la base de datos expertos. Las reglas de asociación con un nivel que sobrepasa un determinado valor mínimo definido son, en efecto, consideradas mínimamente fiable. La determinación del nivel de confianza de umbral es de nuevo empírica, basada generalmente en una evaluación de la insignificancia estadística de las reglas excluidas.
Los valores de soporte y confianza determinados para las reglas de asociación mínimamente relevantes y fiables son tradicionalmente almacenadas con las reglas correspondientes dentro de las bases de datos expertos. La evaluación subsecuentes de las consultas contra la base de datos expertos puede utilizar estos valores de soporte y confianza, en parte, para determinar los conjuntos de soluciones... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento de generación de una base de datos expertos para su consulta por un sistema de recomendación de contenido para generar recomendaciones de contenido, estando constituida la base de datos expertos por un conjunto de reglas de asociación, generadas mediante el análisis de un conjunto de registros de datos que describen unas transacciones que implican a unos usuarios con respecto a un conjunto predeterminado de elementos, comprendiendo el procedimiento:
la selección de un procedimiento de generación de enlaces directos entre un conjunto de usuarios identificados por un conjunto de registros de datos de transacción, de subpoblaciones de usuarios expertos para unos elementos de referencia respectivos; y
la construcción de una estructura de datos de enlace directo de asociaciones de enlace directo entre los elementos de referencia y los elementos relacionados, en los que las asociaciones de enlace directo se definen con respecto a las subpoblaciones de usuarios expertos, y en el que cada una de las asociaciones de enlace directo tiene una primera ponderación; y
el cálculo, en un análisis de enlace inverso, de las asociaciones de enlace inverso dentro de la estructura de datos de enlace directo, reflejando las asociaciones de enlace inverso la profundidad y la consideración del enlace inverso, y en el que cada una de las asociaciones de enlace inverso tiene una segunda ponderación, y
la generación de una regla de asociación para cada una de las asociaciones de enlace directo, siendo las reglas de asociación indicativas de relaciones verificadas entre los elementos de referencia y los elementos relacionados, y cada una de las reglas de asociación comprende una tercera ponderación calculada sobre la base de la primera ponderación tal como ha sido modificada por la segunda ponderación;
y en el que el procedimiento comprende así mismo:
la generación de la base de datos expertos mediante la población de una base de datos con las reglas de asociación generadas, de tal manera que las recomendaciones de contenido son generadas sobre la base de una consulta y de las reglas de asociación generadas.
2. El procedimiento de la Reivindicación 1, en el que cada una de las subpoblaciones de usuarios expertos presenta al menos un nivel predeterminado de experiencia, definido por unos criterios predeterminados, con respecto a un elemento de referencia correspondiente.
3. El procedimiento de la Reivindicación 2, en el que el nivel predeterminado de experiencia limita una subpoblación predeterminada de usuarios expertos a menos del 50% del conjunto de usuarios.
4. El procedimiento de la Reivindicación 3, en el que la estructura de datos de enlace directo excluye asociaciones que presenten un nivel inferior a un nivel predeterminado de soporte por las correspondientes subpoblaciones de usuarios expertos.
5. El procedimiento de la Reivindicación 4, en el que las segundas ponderaciones son inversamente proporcionales al número respectivo de asociaciones entre elementos de referencia y relacionados necesario para establecer los enlaces inversos.
6. El procedimiento de la Reivindicación 5, en el que las segundas ponderaciones son, así mismo, proporcionales a la intensidad de las asociaciones de cada una de las respectivas asociaciones de enlaces inversos.
7. Un sistema para generar reglas de asociación para las bases de datos expertos una computadora, de implementación, comprendiendo el sistema:
a) una primera base de datos que almacena un conjunto de datos de transacción;
b) una segunda base de datos suministrada para almacenar un conjunto de reglas de asociación, en el que cada regla de asociación define una ponderación de asociación; y
c) una computadora acoplada entre las primera y segunda bases de datos, implementando la computadora un programa de generación analítica selectiva para generar un conjunto de reglas de asociación a partir del conjunto de registros de datos de transacción, en el que
el programa de transacción analítica selectiva proporciona la identificación de un conjunto de asociaciones de enlaces inversos dentro de un conjunto de asociaciones de enlace directo definido por el conjunto de registros de datos de transacción; y
la generación de unas ponderaciones de enlace inverso para el conjunto de asociaciones de enlace inverso; y la generación de unas ponderaciones de asociaciones para cada una de las reglas de asociación sobre la base de una ponderación de enlace inverso tal como ha sido modificada por la ponderación de enlace inverso y la población de la segunda base de datos con las reglas de asociación y las correspondientes ponderaciones de asociación.
8. El sistema de la Reivindicación 7, en el que el conjunto de transacciones define unas acciones realizadas por unos usuarios con respecto a unos elementos y en el que la computadora está así mismo acoplada para recibir unos parámetros de análisis predeterminados para controlar el funcionamiento del programa de generación analítica selectiva que incluye un primer parámetro que define unas subpoblaciones de usuarios cuyas acciones con respecto a los elementos determinan el soporte de las reglas de asociación correspondientes de los elementos y un segundo parámetro que define un nivel mínimo de soporte requerido para cada regla de asociación que debe ser incluida en la segunda base de datos.
9. El sistema de la Reivindicación 7, en el que el programa de generación analítica selectiva proporciona la identificación de subpoblaciones de usuarios expertos respectivos de los elementos a partir de las cuales el conjunto de asociaciones de enlace directo son identificadas de manera selectiva entre el conjunto de registros de datos de transacción.
10. El sistema de la Reivindicación 9, en el que las subpoblaciones de usuarios expertos incluyen unas subpoblaciones de usuarios que son inferiores al 50% de la población de usuarios identificada dentro del conjunto de registros de datos de transacción.
11. El sistema de la Reivindicación 10, en el que el conjunto de asociaciones de enlace directo está restringida a las asociaciones de enlace directo que presentan un soporte definido determinado en relación con las respectivas subpoblaciones de expertos de los elementos.
12. El sistema de la Reivindicación 11, en el que las ponderaciones de enlace inverso para el conjunto de asociaciones de enlace inverso se determina con respecto a un soporte de umbral definido para el enlace inverso correspondiente a las asociaciones de enlace directo del conjunto de asociaciones de enlace directo.
13. El sistema de la Reivindicación 12, en el que las ponderaciones respectivas de enlace inverso para el conjunto de asociaciones de enlace inverso son, así mismo, inversamente proporcionales a la profundidad de los enlaces inversos en las respectivas series de asociaciones de enlace directo.
14. El sistema de la Reivindicación 13, en el que las ponderaciones de enlace inverso respectivas para el conjunto de asociaciones de enlace inverso son, así mismo, proporcionales al tamaño relativo de las subpoblaciones de usuarios expertos específicos de los elementos correspondientes a las asociaciones de enlace inverso y a la población de usuarios identificados dentro del conjunto de registros de datos de transacción.
15. El sistema de la Reivindicación 14, en el que el programa de generación analítica selectiva responde a unos parámetros de análisis predeterminados que incluyen un primer parámetro que controla el tamaño de las subpoblaciones de usuarios expertos específicos de los elementos y un segundo parámetro que determina el soporte de umbral definido.
16. Un sistema de recomendación de contenido, dispuesto para generar recomendaciones de contenido, comprendiendo el sistema:
una base de datos expertos generada de acuerdo con el procedimiento de las Reivindicaciones 1 a 6; y
un medio de consulta por un usuario dispuesto para permitir la entrada de la consulta del usuario dentro del sistema por parte del usuario; y en el que
el sistema está dispuesto para consultar a la base de datos expertos, estando constituida la base de datos expertos por unas reglas de asociación que representan las relaciones verificadas entre los elementos de referencia y los elementos relacionados, para generar las recomendaciones de contenido sobre la base de la consulta y de las reglas de asociación.
DATOS ENLACES INVERSOS
Patentes similares o relacionadas:
Composiciones y métodos para modelar el metabolismo de Saccharomyces cerevisiae, del 3 de Junio de 2020, de THE REGENTS OF THE UNIVERSITY OF CALIFORNIA: Un metodo implementado por computadora para proporcionar a un usuario una simulacion de una funcion fisiologica de levadura relacionada con un gen heterologo […]
Procedimiento de visualización de páginas por medio de un navegador de un equipo como una caja descodificadora Proveedor de Servicios de Internet, del 10 de Enero de 2020, de FREEBOX (100.0%): Un procedimiento de visualización de páginas por un equipo cliente equipado de un sistema cerrado, conectado a un servidor remoto , integrando […]
Procedimiento implementado por ordenador y controlado por ordenador, producto de programa informático y plataforma para disponer datos para su procesamiento y almacenamiento en un motor de almacenamiento de datos, del 4 de Noviembre de 2019, de Dynactionize N.V: Un procedimiento implementado por ordenador y controlado por ordenador de disposición de datos para procesamiento y almacenamiento de los mismos en un […]
MÉTODO DE DOBLAJE Y LOCUCIONES DE AUDIO, del 11 de Julio de 2019, de TANGO VOZ, S.L: Se describe en este documento un método que permite gestionar la producción de doblajes y locuciones de audio destinados a medios audiovisuales de tal manera que no se […]
Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, del 21 de Mayo de 2019, de IG Knowhow Limited: Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, la unidad de procesamiento de datos recibiendo una primera […]
Dispositivo de procesamiento de información, método de procesamiento de información, programa de procesamiento de información y soporte de registro, del 1 de Mayo de 2019, de RAKUTEN, INC: Dispositivo de procesamiento de información que comprende: un medio (12b) de memoria de palabra de área local que almacena una palabra de área […]
Método para proporcionar una estructura de índice en una base de datos, del 1 de Mayo de 2019, de Capish International AB: Metodo para proporcionar una estructura de indice en una base de datos que comprende una pluralidad de tipos de objetos, donde cada tipo de objetos […]
SISTEMA PARA LA DETECCIÓN REMOTA DEL USO DEL CINTURÓN DE SEGURIDAD EN UN VEHÍCULO, del 18 de Abril de 2019, de CASANOVA RENT VOLKS, S.A. DE C.V: La presente invención se refiere a la industria automotriz, particularmente está relacionada con los cinturones de seguridad con que están equipados los vehículos, […]