Representación de información de documentos.

Un sistema (10) para extracción automática de datos no estructurados introduce un formato de datos estructurado que comprende:



un servidor (12) que incluye un procesador (14) y memoria (16, 20) que almacena instrucciones que, en respuesta a recibir una primera solicitud para acceder a un servicio, hacen que el procesador (14):

identifique (62) mediante un módulo de normalización (24) los atributos de un evento incluido en un documento de texto no estructurado, siendo cada uno de los atributos identificados similar a al menos un atributo de evento incluido en el conjunto de atributos de eventos predefinidos;

genere (64) mediante un módulo de funciones (26) funciones del documento para cada uno de los atributos identificados;

aplique (66) mediante un módulo de clasificación (28) al menos uno de la pluralidad de clasificadores a cada una de las funciones del documento generado, el al menos un clasificador previamente entrenado utilizando el atributo de evento predefinido correspondiente al atributo de evento identificado;

calcule (68) mediante el módulo de clasificación (28) un valor de probabilidad a partir de una puntuación de clasificación generada por el al menos un clasificador usando un modelo de estimación de probabilidad, el valor de probabilidad indicando una probabilidad de que el atributo de evento identificado corresponda a uno del conjunto de atributos de eventos definidos;

combine (70) mediante el módulo de clasificación (28) una pluralidad de valores de probabilidad calculados asociados con los atributos identificados para generar una puntuación de clasificación; y

extraiga (84) mediante un módulo de extracción (32), del documento de texto no estructurado, el evento y los atributos identificados, en donde el módulo de extracción (32) se extrae automáticamente del documento de texto no estructurado en un formato estructurado basado, al menos en parte, en la puntuación de clasificación.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2012/034871.

Solicitante: Financial & Risk Organisation Limited.

Nacionalidad solicitante: Reino Unido.

Dirección: Five Canada Square, Canary Wharf London, E14 5AQ REINO UNIDO.

Inventor/es: MALIK,HASSAN H, BHARDWAJ,VIKAS S, FIORLETTA,HUASCAR, RAFAT,ARMUGHAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06F17/27 SECCION G — FISICA.G06 COMPUTO; CALCULO; CONTEO.G06F TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores en los que una parte del cálculo se efectúa hidráulica o neumáticamente G06D, ópticamente G06E; sistemas de computadores basados en modelos de cálculo específicos G06N). › G06F 17/00 Equipo o métodos de tratamiento de datos o de cálculo digital, especialmente adaptados para funciones específicas. › Análisis automático, p. ej. análisis gramatical, corrección ortográfica.

PDF original: ES-2784180_T3.pdf

 

Patentes similares o relacionadas:

MÉTODO DE ANÁLISIS DE SENTIMIENTO EN UN TEXTO BASADO EN MODELO LÉXICON, del 27 de Junio de 2019, de ZARAGOZA SICRE, Sergio Jesús: El general de un lexicón que se presenta para el análisis de sentimientos que permite integrar técnicas de aprendizaje automático al análisis basado en lexicones, […]

Procedimiento, sistema y producto de programa informático para proporcionar una descripción de un programa a un equipo de usuario, del 18 de Enero de 2019, de TV Control Ltd: Un procedimiento para proporcionar una descripción de un programa a un equipo de usuario, que comprende: - mantener, para un usuario y/o un equipo […]

METODO Y SISTEMA PARA COMUNICACION ENTRE DISPOSITIVOS A TRAVES DE LENGUAJE NATURAL USANDO APLICACIONES DE MENSAJERIA INSTANTANEA E IDENTIFICADORES PUBLICOS INTEROPERABLES, del 16 de Agosto de 2018, de GONZALO VACA, Antonio: Sistema y un método para comunicación entre dispositivos a través de lenguaje natural usando aplicaciones de mensajería instantánea e identificadores públicos interoperables […]

MODELO LÉXICO PARA EL ANÁLISIS DE SENTIMIENTOS EN UN TEXTO, del 21 de Junio de 2018, de ZARAGOZA SICRE, Sergio Jesús: El general de un lexicón que se presenta para el análisis de sentimientos que permite integrar técnicas de aprendizaje automático al análisis basado en lexicones, el modelo […]

Dispositivo contador, programa de conteo, medio de memoria y procedimiento de conteo, del 20 de Septiembre de 2017, de RAKUTEN, INC: Dispositivo contador, que comprende: una parte de entrada para introducir una primera oración y una segunda oración; una parte de […]

Dispositivo de registro de palabras relacionadas, dispositivo de procesamiento de información, método de registro de palabras relacionadas, programa para dispositivo de registro de palabras relacionadas, y medio de almacenamiento, del 30 de Agosto de 2017, de RAKUTEN, INC: Un dispositivo de registro de palabras relacionadas que comprende: un medio de recepción configurado para recibir una consulta de búsqueda […]

Un método para la extracción de patrones de relación a partir de artículos, del 7 de Junio de 2017, de THE EUROPEAN UNION, REPRESENTED BY THE EUROPEAN COMMISSION: Un método para formar relaciones de implicación; comprendiendo proporcionar un dispositivo informático y a) proporcionar a dicho dispositivo informático […]

SEGMENTACIÓN AUTOMÁTICA DE TEXTOS QUE COMPRENDEN FRAGMENTOS SIN SEPARADORES, del 2 de Diciembre de 2011, de LOQUENDO SPA: Procedimiento implementado por ordenador de segmentación en fragmentos, sintagmas de un texto escrito que incluyen elementos individuales, sin separadores, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .