Método para seleccionar información.
Método implementado por ordenador para seleccionar información de características con el fin de producir unaseñal de control para un robot,
y procesándose información de entrada en dicho método con la intención de hallarinformación útil con vistas a la tarea de producir la señal de control, consistiendo dicha información de entrada, enunas entradas primarias y en un contexto que representa información general relacionada con la tarea que se va allevar a cabo, con lo cual la entrada primaria consiste en datos sensoriales y el contexto consiste en una señal decontrol para el robot, con lo cual la información de características que se va a seleccionar se forma a partir de lainformación de entrada como preactivaciones en forma de valores numéricos, procesándose además los valores dela información de características sobre la base de su utilidad, caracterizado porque
a) se forma una predicción sobre la información de características final para producir la señal de control, a partirde un primer contexto de un conjunto de información de entrada por medio de unos primeros parámetros yuna función parametrizada para la señal de control,
b) se forman preactivaciones de la información de características para producir la señal de control, en forma devalores numéricos a partir de la primera entrada primaria del conjunto de información de entrada por mediode unos segundos parámetros y una función parametrizada para la señal de control,
c) se forma la información de características a partir de las preactivaciones combinando la predicción con laspreactivaciones, de manera que la información de características que se estima que tiene una utilidadsuperior se refuerza y otra información de características se debilita, con lo cual se considera que lainformación de características tiene una utilidad superior si se predice en la etapa a),
d) los segundos parámetros se modifican de tal manera que, la función parametrizada de la etapa b), usada conlos segundos parámetros modificados, forma la información de características formada en la etapa c),
e) las etapas a) a d) se repiten para cada elemento del conjunto de información de entrada.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FI2008/000031.
Solicitante: ZenRobotics Oy.
Nacionalidad solicitante: Finlandia.
Dirección: Vilhonkatu 5 A 00100 Helsinki FINLANDIA.
Inventor/es: VALPOLA,HARRI, YLI-KREKOLA,ANTTI.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06F17/00 FISICA. › G06 CALCULO; CONTEO. › G06F PROCESAMIENTO ELECTRICO DE DATOS DIGITALES (sistemas de computadores basados en modelos de cálculo específicos G06N). › Equipo o métodos de procesamiento de datos o de cálculo digital, especialmente adaptados para funciones específicas (recuperación de la información, estructuras de las bases de datos o estructuras de los sistemas de archivos G06F 16/00).
- G06N3/08 G06 […] › G06N SISTEMAS DE COMPUTADORES BASADOS EN MODELOS DE CALCULO ESPECIFICOS. › G06N 3/00 Sistemas de computadores basados en modelos biológicos. › Métodos de aprendizaje.
- G06N7/00 G06N […] › Sistemas de computadores basados en modelos matemáticos específicos.
PDF original: ES-2429214_T3.pdf
Fragmento de la descripción:
Método para seleccionar información
Campo técnico
El objetivo de la invención es un método adecuado, por ejemplo, para el control, el reconocimiento de patrones o la predicción, usándose dicho método para la integración y la selección de información y el aprendizaje de su representación.
Antecedentes de la invención La información incluida en señales de entrada o datos de observación se debe gestionar en muchas aplicaciones, como la visión computarizada o el control de un robot autónomo, y con este fin se han desarrollado varios tipos diferentes de métodos.
Por ejemplo, varios de estos métodos se han presentado en el aprendizaje automático y en el análisis estadístico, los cuales se pueden usar para el aprendizaje de la representación de información, en otras palabras, parámetros que definen la representación de información se adaptan sobre la base de datos de observación. Normalmente, la finalidad de la adaptación es encontrar dichas características útiles a partir de observaciones, que se pueden usar, por ejemplo, para el reconocimiento de patrones, control o acciones correspondientes. Por ejemplo, el análisis de componentes independientes se usa para hallar características descriptivas de señales de entrada a partir de datos de observación. Es común para muchos de estos métodos que, sobre la base de vectores de entrada, una unidad de procesado de información forme vectores de características, los cuales describen propiedades de vectores de entrada, y el significado de los elementos de los vectores de características, en otras palabras, las características, cambian como resultado de la adaptación. En la medida en la que un vector de estado de un filtro de Kalman se puede considerar como un vector de características, el vector de estado describe información incluida en vectores de entrada.
Muchos de estos métodos antes descritos se pueden interpretar considerando la estadística bayesiana, en donde las probabilidades describen un grado de creencia, y la regla de Bayes especifica cómo integrar información de fuentes diferentes. Por ejemplo, cuando se calcula un valor de un vector de estado en el caso de un filtro de Kalman, se combina la información obtenida a partir de señales de observación y valores previos de vectores de estado. En términos de estadística bayesiana: una distribución a priori, que se calcula usando vectores de estado previos, y una verosimilitud, que se calcula sobre la base de señales de observación, se combinan en una distribución a posteriori del vector de estado, la cual describe las probabilidades de diferentes valores del vector de estado. La distribución a posteriori sigue la distribución gaussiana en el caso del filtro de Kalman y se representa por medio de una covarianza y una media a posteriori. En algunos otros métodos, la incertidumbre a posteriori no se representa en absoluto, aunque sin embargo estos métodos se pueden interpretar como aproximaciones del método bayesiano.
Merece la pena indicar en los métodos que el valor de un vector de características describe una señal de observación, aunque la información se integra también a partir de información a priori.
El reconocimiento de patrones es una parte del aprendizaje automático basado en información que pretende desarrollar modelos o sistemas que reconozcan patrones. El reconocimiento de patrones se aplica, por ejemplo, en la tecnología de la información y en robótica, aunque también en la tecnología médica y en la investigación de la interacción hombre-ordenador. Un sistema de reconocimiento de patrones se define como un proceso con cuatro etapas - medición, preprocesado, extracción de características y clasificación.
En la primera etapa, se adquieren los datos necesarios, principalmente midiendo variables físicas y convirtiendo datos analógicos obtenidos, en formato digital. En la segunda etapa, se preprocesan datos, frecuentemente usando diferentes tipos de métodos de procesado de señal digital, como el filtrado o un análisis de componentes principales. En la tercera etapa, se establecen correspondencias de datos de medición preprocesados en el espacio de características. En esta etapa, los datos se pueden interpretar como convertidos en información. En la cuarta etapa, las muestras de las cuales se ha establecido una correspondencia en el espacio de características, se clasifican en dos o más categorías usando un clasificador.
En tareas de reconocimiento de patrones exigentes, como el reconocimiento de caracteres escritos a mano, con frecuencia el procesado de vectores de características se organiza jerárquicamente, de tal manera que en cada nivel existen varias unidades de procesado y las mismas obtienen vectores de características como entrada proveniente de una parte de las unidades de niveles inferiores de jerarquía. En tales sistemas, las unidades de procesado, como contexto, pueden obtener características de unidades superiores y posiblemente también de unidades del mismo nivel. Una ventaja del uso de la jerarquía es que el número de conexiones permanece bajo, aunque, de todos modos, es posible integrar información a partir de una gran cantidad de señales de entrada. Un ejemplo clásico de un modelo jerárquico de este tipo es Neocognitron de Fukushima (Fukushima, 1980) .
En muchas aplicaciones, se afronta una situación en la que los datos de observación contienen más estructura estadística de la que puede representar la unidad de procesado usada. En un caso de este tipo, resulta necesario seleccionar información que sea útil para la tarea. Con frecuencia es necesario adaptar el modelo de tal modo que las características que el mismo representa describan información útil para la tarea.
En algunos casos, un aprendizaje supervisado, el cual constituye un método de aprendizaje automático, resulta adecuado para una selección controlada de características útiles. El aprendizaje controlado se corresponde con la regresión en estadística. El objetivo de la regresión es hallar una correspondencia de un vector de entrada con otro, denominado vector objetivo. Si el establecimiento de correspondencias de vectores de entrada con vectores objetivo se realiza en varias etapas, los resultados intermedios se pueden interpretar como vectores de características especialmente si la estructura del modelo se selecciona de tal manera que la dimensión del resultado intermedio es menor que la de los vectores de entrada y objetivo (Hecht-Nielsen, 1993) . En el caso más sencillo, se pueden usar dos correspondencias lineales secuenciales, siendo el resultado esencialmente el mismo que en el análisis de correlación canónica. El vector de entrada se puede interpretar como una entrada primaria y el vector objetivo como un contexto, puesto que el vector de características, en el cual se utilizan métodos de aprendizaje supervisado descritos anteriormente, depende inmediatamente del vector de entrada, aunque durante la instrucción, la representación se modifica de tal manera que las características contienen tanta información del vector objetivo como sea posible.
Un problema con estos métodos es que es necesaria una cantidad enorme de datos de observación para el aprendizaje supervisado del establecimiento de correspondencias de múltiples etapas, haciendo que el aprendizaje de muchos problemas cotidianos resulte lento hasta niveles poco prácticos o imposible cuando faltan datos de observación adecuados. Típicamente, el problema se intenta resolver usando algún método de aprendizaje supervisado como preprocesado, por ejemplo, el análisis antes mencionado de componentes independientes. En una solución de este tipo, el problema es que el aprendizaje supervisado únicamente pretende describir los datos de observación, pero no intenta seleccionar información útil para la tarea. Una solución presentada es, por ejemplo, hallar características invariantes en el tiempo. No obstante, con mucha frecuencia esto no limita en grado suficiente el conjunto de características potencialmente útiles y, por otro lado, se puede perder información útil, que resulte no ser invariante en el tiempo.
Básicamente, el problema es que los métodos basados en la inferencia estadística bayesiana (como la memoria temporal jerárquica descrita en las publicaciones W02006063291 y US2007005531) pueden representar el grado de creencia y los fenómenos subrayan las observaciones, pero la selección de información útil es por naturaleza un problema teórico de decisión. Además del grado de creencia, es importante considerar la utilidad, tal como se denomina en la teoría de la decisión. La probabilidad de la característica responde a la pregunta, si la característica está presente en las observaciones, pero también es necesario considerar... [Seguir leyendo]
Reivindicaciones:
1. Método implementado por ordenador para seleccionar información de características con el fin de producir una señal de control para un robot, y procesándose información de entrada en dicho método con la intención de hallar información útil con vistas a la tarea de producir la señal de control, consistiendo dicha información de entrada, en unas entradas primarias y en un contexto que representa información general relacionada con la tarea que se va a llevar a cabo, con lo cual la entrada primaria consiste en datos sensoriales y el contexto consiste en una señal de control para el robot, con lo cual la información de características que se va a seleccionar se forma a partir de la información de entrada como preactivaciones en forma de valores numéricos, procesándose además los valores de la información de características sobre la base de su utilidad, caracterizado porque a) se forma una predicción sobre la información de características final para producir la señal de control, a partir de un primer contexto de un conjunto de información de entrada por medio de unos primeros parámetros y una función parametrizada para la señal de control,
b) se forman preactivaciones de la información de características para producir la señal de control, en forma de valores numéricos a partir de la primera entrada primaria del conjunto de información de entrada por medio de unos segundos parámetros y una función parametrizada para la señal de control,
c) se forma la información de características a partir de las preactivaciones combinando la predicción con las preactivaciones, de manera que la información de características que se estima que tiene una utilidad superior se refuerza y otra información de características se debilita, con lo cual se considera que la información de características tiene una utilidad superior si se predice en la etapa a) ,
d) los segundos parámetros se modifican de tal manera que, la función parametrizada de la etapa b) , usada con los segundos parámetros modificados, forma la información de características formada en la etapa c) ,
e) las etapas a) a d) se repiten para cada elemento del conjunto de información de entrada.
2. Método según la reivindicación 1, caracterizado porque en la etapa d) , los primeros parámetros se modifican también, de tal manera que la función parametrizada de la etapa a) , usada con los primeros parámetros modificados, forma la preactivación de la etapa b) o la información de características de la etapa c) .
3. Método según cualquiera de las reivindicaciones 1 a 2, caracterizado porque los resultados de cálculo calculados sobre la base de los parámetros de las etapas a) y/o b) son promedios ponderados con los parámetros.
4. Método según cualquiera de las reivindicaciones 1 a 3, caracterizado porque la información de características obtenida en la etapa c) se decorrelaciona eliminando correlaciones de los valores de la información de características con el fin de enfatizar las diferencias de los valores que constituyen la información para lograr información de características mejorada.
5. Método según cualquiera de las reivindicaciones 1 a 4, caracterizado porque la información de características obtenida en la etapa c) o la información de características según la reivindicación anterior se dispersa (sparsified) seleccionando los números más altos de la información con el fin de mejorar adicionalmente la información de características.
6. Método según cualquiera de las reivindicaciones 1 a 5, caracterizado porque la información de características se usa para producir una señal de control para un robot, con lo cual la entrada primaria consiste en información sobre el entorno y el estado del robot medida por los sensores del robot, y el contexto consiste en señales inmediatamente relacionadas con el control del robot, tales como señales de control de los motores del robot.
7. Método según cualquiera de las reivindicaciones 1 a 6, caracterizado porque la utilidad que se va a obtener a partir de la representación de características se estima en la etapa c) implícitamente.
8. Método según cualquiera de las reivindicaciones 1 a 7, caracterizado porque la utilidad que se va a obtener a partir de la representación de características se estima en la etapa c) explícitamente.
9. Método según cualquiera de las reivindicaciones 1 a 8, caracterizado porque la utilidad de la modificación de parámetros se estima implícitamente en la etapa d) .
10. Método según cualquiera de las reivindicaciones 1 a 9, caracterizado porque la utilidad de la modificación de parámetros se estima explícitamente en la etapa d) .
11. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque uno o más tipos de entrada se blanquean parcial o completamente.
12. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque los números de la información de características se sensibilizan de manera que el promedio de cada número que describe un carácter correspondiente con respecto a un conjunto de información de entrada es aproximadamente el mismo.
13. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque se lleva a cabo en varias unidades de procesado conectando entre sí las unidades de procesado, de tal manera que las mismas se entregan mutuamente la información de características que han formado, como su entrada primaria.
14. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque se lleva a cabo en varias unidades de procesado conectando entre sí las unidades de procesado, de tal manera que se entregan mutuamente la información de características que han formado, como contexto.
15. Método según la reivindicación 14, caracterizado porque las unidades de procesado se conectan entre sí de una manera jerárquica.
16. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque, cuando se estima la utilidad de cada característica en la etapa c) , un hecho que reduce la utilidad y que se tiene en consideración es que el valor de un elemento del vector de características en cuestión ha sido diferente de cero para los miembros del conjunto anterior de información de entrada.
17. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque, cuando se estima la utilidad de cada característica en la etapa c) , un hecho que reduce la utilidad y que se tiene en consideración es que se ha predicho que el valor de un elemento de un vector de características en cuestión difiere de cero sobre la base de los contextos del conjunto anterior de información de entrada.
18. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque la modificación de los segundos parámetros en la etapa d) se lleva a cabo cuando la unidad de procesado ha procesado miembros nuevos del conjunto de información de entrada, y la información de características producida por la etapa c) que es el fundamento para la modificación se calcula nuevamente de tal manera que, cuando se estima la utilidad de cada característica en la etapa c) , se tiene en cuenta como un factor que hace que aumenta la utilidad un hecho tal que el valor del elemento del vector de características en cuestión se estima que difiere de cero, sobre la base de contextos nuevos del conjunto de información de entrada.
19. Método según cualquiera de las reivindicaciones anteriores, caracterizado porque, cuando se estima la utilidad de las características de la unidad de procesado completa en la etapa c) , se tiene en cuenta como contexto una evaluación, proporcionada por un módulo externo, sobre la utilidad de las características representadas por la unidad de procesado.
Patentes similares o relacionadas:
SISTEMA DE PREPARACIÓN DE ALIMENTOS, del 2 de Junio de 2020, de BSH ELECTRODOMESTICOS ESPAÑA S.A.: Sistema de preparación de alimentos. La presente invención hace referencia a un sistema de preparación de alimentos (10a) con al menos una unidad […]
MÉTODO PARA CONSTRUCCIÓN DE SISTEMA DE PROTECCIÓN SOLAR PARA FACHADAS DE EDIFICIOS, del 28 de Mayo de 2020, de PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE: La presente invención se relaciona con un método para producir un sistema de protección solar en fachada de edificio que comprende las siguientes etapas, […]
SISTEMA DE PREPARACIÓN DE ALIMENTOS, del 27 de Mayo de 2020, de BSH ELECTRODOMESTICOS ESPAÑA S.A.: Sistema de preparación de alimentos. La presente invención hace referencia a un sistema de preparación de alimentos (10a) con al menos una unidad […]
SISTEMA DE PREPARACIÓN DE ALIMENTOS, del 27 de Mayo de 2020, de BSH ELECTRODOMESTICOS ESPAÑA S.A.: Sistema de preparación de alimentos. La presente invención hace referencia a un sistema de preparación de alimentos (10a) con al menos una […]
Sistemas, métodos e interfaces para proporcionar versiones de libros electrónicos dentro de un dispositivo de acceso, del 27 de Mayo de 2020, de Thomson Reuters Enterprise Centre GmbH: Un dispositivo de acceso que comprende: a. un procesador ; b. una memoria acoplada al procesador ; y c. un programa de software de […]
CONFIGURACIÓN Y VISUALIZACIÓN DE UNA INTERFAZ DE USUARIO CON ESTUDIOS DE ATENCIÓN SANITARIA, del 22 de Mayo de 2020, de FUJIFILM MEDICAL SYSTEMS USA INC: Configuración y visualización de una interfaz de usuario con estudios de atención sanitaria. Método y aparato para configurar y visualizar una interfaz de […]
Sistema y procedimiento de control de calidad de platos preparados, del 14 de Mayo de 2020, de BEABLOO, S.L: Sistema y procedimiento de control de calidad de platos preparados. El sistema comprende medios de detección para detectar los ingredientes […]
Método para establecer un ángulo de conformación para un producto conformado tridimensional, del 15 de Abril de 2020, de MATSUURA MACHINERY CORPORATION: Un método para establecer ángulos de conformación en un método de conformación para un producto conformado tridimensional que tiene una región de corte […]