Clasificación utilizando máquinas de vectores de soporte y selección de variables.

Un método para derivación de un discriminador para clasificar ítems de moneda circulante utilizando una pluralidad de variables para la caracterización de los ítems de moneda,

comprendiendo el método la determinación de un subconjunto representativo de las variables para qué dicho discriminador retenga, incluidas las etapas de: entrenar una máquina de vectores de soporte con toda la pluralidad de variables, en donde la máquina de vectores de soporte retorna los vectores soporte que están siendo utilizados para construir un vector discriminante;

proyectar los datos medidos de toda la pluralidad de variables para un número predeterminado de ítems de prueba de moneda sobre un vector discriminante; inicializar un conjunto de variables restantes con toda la pluralidad de variables y un conjunto vacío de variables seleccionadas; y

repetir, hasta que una cantidad de variables seleccionadas o una adecuación alcancen un valor dado, las etapas de: evaluar un criterio de adecuación que comprende el cálculo de la correlación entre las variables y los datos medidos proyectados para todo el resto de variables para obtener un listado de adecuaciones;

encontrar una variable que maximice la adecuación del listado de adecuaciones;

añadir esta variable al conjunto de variables seleccionadas;

remover esta variable del conjunto de variables restantes; y

entrenar nuevamente la máquina de vectores de soporte con las variables seleccionadas y retener un segundo vector discriminante como el discriminador.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2006/002398.

Solicitante: MEI, INC..

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 1301 WILSON DRIVE WEST CHESTER, PA 19380 ESTADOS UNIDOS DE AMERICA.

Inventor/es: BAUDAT, GASTON, ANOUAR,FATIHA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06K9/62 FISICA.G06 CALCULO; CONTEO.G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › G06K 9/00 Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00). › Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos.

PDF original: ES-2381860_T3.pdf

 

Clasificación utilizando máquinas de vectores de soporte y selección de variables.

Fragmento de la descripción:

Clasificación utilizando máquinas de vectores de soporte y selección de variables.

La invención se relaciona con mejoras en la clasificación. La invención es especialmente aplicable a la clasificación de ítems de dinero circulante o valores, tales como billetes o monedas.

La invención se relaciona con nuestras solicitudes en trámite, EP 1 217 589 y EP 1 516 293 A.

En adelante, SVM significa máquina de vectores de soporte (por sus siglas en inglés) , FVS significa selección del vector de características (por sus siglas en inglés) (véase EP 1 516 293 A mencionada anteriormente) y el término forma de introducir un billete se refiere a la alimentación de un billete en un validador en una orientación. Por lo tanto, existen 4 formas de introducir un billete por cada denominación.

Fung et al. describen en "Data Selection for Support Vector Machine Classifiers", publicada en los Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discover y and Data Mining 2000, páginas 64 a 70 una formulación para el problema de extracción de un número mínimo de datos de un gran conjunto de datos, con el propósito de generar un clasificador de una máquina de vectores de soporte (SVM) como un problema de minimización cóncava resuelto por medio de un número finito de programas lineales. Este conjunto mínimo de datos, que es el número más pequeño de vectores de soporte que caracterizan completamente un clasificador de separación de superficie plana, es considerablemente más pequeño que aquel requerido por una máquina estándar de vectores de soporte 1-norm con o sin selección de características. El enfoque propuesto también incorpora un procedimiento de selección de características que da como resultado un número mínimo de características de entrada utilizadas por el clasificador.

EP-A1-1 217 589 se relaciona con un método para derivar una función de clasificación para clasificar ítems de dinero circulante utilizando un mapeo desde un primer espacio hasta un segundo espacio y la correspondiente función del kernel.

WO 2004/001683 A se relaciona con un método para derivar una función para clasificar ítems de dinero circulante utilizando una máquina de vectores de soporte y un subconjunto de un conjunto de vectores de datos de entrenamiento.

G. Baudat y F. Anouar: "Feature selection ad projection using kernels", Neurocomputing, col. 55, 27 de junio de 2003 (2003 - 06 - 27) , páginas 21 - 38, se relaciona con la selección y proyección de un vector de características utilizando kernels. Un método de kernel es utilizado para elegir a partir de los datos un subconjunto relevante de vectores de características que forman una base en un espacio de características F.

En un aceptador de billetes que consta de medios de transporte, medios sensores, medios de memoria y de procesamiento, escaneo del documento con muchos sensores y muchas longitudes de onda, se produce un gran volumen de datos de múltiples variables que se almacenan en una memoria que puede ser utilizada para discriminar y autenticar los documentos, y para darle denominación a un billete en el caso de un aceptador de billetes de banco. Es deseable que este proceso sea rápido y se sabe que un subconjunto de los datos puede ser suficiente para lograr un mejor resultado. Esta solicitud se relaciona con el hallazgo de un subconjunto óptimo de variables que representan los datos.

Los aspectos de la invención se exponen en las reivindicaciones acompañantes.

Este nuevo algoritmo de denominación se relaciona con la selección de los datos de entrada que se le suministran a un algoritmo de una SVM (máquina de vectores de soporte) .

El propósito de la selección de variables es eliminar variables irrelevantes o menos relevantes para los propósitos de clasificación y al mismo tiempo mantener un alto desempeño de separación. La idea es encontrar un conjunto de variables que estén altamente correlacionadas con los datos proyectados sobre el vector de separación obtenido con la SVM cuando se entrena con todas las variables.

El proceso puede ser utilizado para generar entradas de datos para el validador de billetes que son utilizadas con el propósito de denominar billetes a partir de las clases que comprenden un conjunto predefinido de billetes. Las clases pueden ser las 4 formas de introducir un billete de una denominación particular y/o de otras denominaciones. Las variables seleccionadas y los ejes discriminante generado por el proceso pueden ser cargados en la memoria del validador. Ellos son utilizados por el validador para validar posteriormente una nueva muestra presentada a la unidad como un miembro de una de las clases.

Aunque las modalidades de la invención son descritas en el contexto de la denominación de billetes, el proceso puede se puede aplicar ampliamente a cualquier problema de selección de variables, incluido por ejemplo el problema de autenticación en el contexto de validación de un billete.

Las realizaciones de la invención serán descritas con referencia a los dibujos acompañantes en los cuales:

La Fig. 1 es un diagrama esquemático de un sistema de detección de billetes;

La Fig. 2 es una vista en planta desde la parte superior del arreglo del sensor del sistema de detección de la Fig. 1;

La Fig. 3 es una vista en planta desde la parte inferior del arreglo de la fuente de luz del sistema de detección de la Fig. 1;

La Fig. 4 es un gráfico que ilustra la clasificación.

Un sistema de detección de billetes de acuerdo con una realización de la invención es mostrado esquemáticamente en la Fig. 1. El sistema incluye un arreglo de una fuente de luz 2 dispuesto a un lado de un trayecto para transporte del billete, y un arreglo de un sensor de luz 4 dispuesto al otro lado del trayecto para transporte del billete, opuesto al arreglo de la fuente de luz 2. El sistema incluye un medio de transporte para el billete en la forma de cuatro grupos de rodillos 6 para transportar un billete 8 a lo largo del trayecto de transporte entre el arreglo de la fuente de luz 2 y el arreglo del sensor de luz 4. El arreglo de la fuente de luz se conecta a un procesador 10 y el sistema se controla por medio de un controlador 12. Se dispone un difusor 14 para la difusión y mezcla de la luz emitida desde el arreglo de la fuente de luz 2 entre el arreglo de la fuente de luz 2 y el trayecto de transporte del billete.

La Fig. 2 es una vista en planta desde la parte de abajo del arreglo de la fuente de luz 2. Como se muestra, el arreglo de la fuente de luz es un arreglo lineal de una pluralidad de fuentes de luz 9. El arreglo está dispuesto en grupos 11 de seis fuentes, y cada fuente en un grupo emite luz de una longitud de onda diferente, que se escogen como adecuadas para la aplicación, usualmente variedades de azul y rojo. Se dispone una pluralidad de tales grupos 11 en forma lineal a través del trayecto de transporte, de tal manera que las fuentes de luz para cada longitud de onda estén dispuestas a través del trayecto del transporte.

La Fig. 3 es una vista en planta desde la parte superior del arreglo del sensor de luz 4. Como se muestra, el arreglo del sensor de luz incluye ocho sensores de luz circulares dispuestos en una línea a través del trayecto de transporte. Los sensores son de 7 mm de diámetro y los centros están espaciados cada 7 mm en una línea, de tal manera que los sensores están uno al lado del otro.

Las Figs. 2 y 3 no están a escala, y los arreglos de la fuente de luz y del sensor de luz son aproximadamente el mismo tamaño.

En operación, un billete es transportado por lo rodillos 6, bajo el control del controlador 12, a lo largo del trayecto de transporte entre los arreglos de la fuente y del sensor 2, 4. El billete es transportado una distancia predeterminada y luego detenido. Se operan todas las fuentes de luz de una longitud de onda y, después de mezclar la luz en el difusor 14 para difundirla uniformemente sobre el ancho del billete, la luz incide sobre el billete. La luz transmitida a través del billete es detectada por el arreglo del sensor 4, y se derivan señales a partir de los sensores para cada punto de medición sobre el billete correspondiente a cada sensor. En forma similar, las fuentes de luz de todas las otras longitudes de onda son operadas en forma similar en forma sucesiva, derivándose mediciones para los sensores para cada longitud de onda, para la línea correspondiente.

A... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para derivación de un discriminador para clasificar ítems de moneda circulante utilizando una pluralidad de variables para la caracterización de los ítems de moneda, comprendiendo el método la determinación de un subconjunto representativo de las variables para qué dicho discriminador retenga, incluidas las etapas de:

entrenar una máquina de vectores de soporte con toda la pluralidad de variables, en donde la máquina de vectores de soporte retorna los vectores soporte que están siendo utilizados para construir un vector discriminante; proyectar los datos medidos de toda la pluralidad de variables para un número predeterminado de ítems de prueba de moneda sobre un vector discriminante;

inicializar un conjunto de variables restantes con toda la pluralidad de variables y un conjunto vacío de variables seleccionadas; y repetir, hasta que una cantidad de variables seleccionadas o una adecuación alcancen un valor dado, las etapas de: evaluar un criterio de adecuación que comprende el cálculo de la correlación entre las variables y los datos medidos proyectados para todo el resto de variables para obtener un listado de adecuaciones; encontrar una variable que maximice la adecuación del listado de adecuaciones; añadir esta variable al conjunto de variables seleccionadas; remover esta variable del conjunto de variables restantes; y entrenar nuevamente la máquina de vectores de soporte con las variables seleccionadas y retener un segundo vector discriminante como el discriminador.

2. El método de la reivindicación 1 en donde dicho criterio de adecuación se basa en una correlación de variables.

3. El método de las reivindicaciones 1 ó 2, que comprende además: centrar y escalar la representación obtenida por medio de los datos de proyección medidos.

4. El método de cualquier reivindicación anterior que comprende el escalamiento de los datos medidos.

5. El método de la reivindicación 4 en donde el escalamiento se basa en un subconjunto de los datos medidos.

6. El método de la reivindicación 5 en donde el escalamiento se basa en los datos medidos para una clase de referencia.

7. El método de la reivindicación 6 en donde el escalamiento se basa en el promedio y la desviación estándar.

8. Un método para probar un ítem de moneda utilizando el discriminador derivado utilizando el método de cualquier reivindicación anterior.

9. El método de la reivindicación 8 en donde el ítem de moneda es diferente de los ítems de moneda utilizados para derivar el discriminador.

10. El método de la reivindicación 7 o la reivindicación 8 que comprende la medición del ítem de moneda, la extracción de datos para las variables seleccionadas, y la utilización de los datos para las variables seleccionadas y el discriminador para derivar un valor escalar.

11. El método de la reivindicación 10 que comprende la proyección de los datos para las variables seleccionadas sobre un eje discriminante para derivar el valor escalar.

12. El método de la reivindicación 10 o la reivindicación 11 que comprende la aceptación o el rechazo del ítem de moneda dependiendo de si el escalar está por encima o por debajo de un umbral, o

aceptar el ítem de moneda si el escalar está entre dos umbrales o bien rechazarlo.

13. Un método de fabricación de un validador de moneda que comprende el almacenamiento de una representación del discriminador derivado utilizando el método de cualquiera de las reivindicaciones 1 a 7 en el validador.

14. Un programa informático para ejecutar el método de cualquiera de las reivindicaciones 1 a 7.

15. Un validador de moneda que almacena una representación de un discriminador de la SVM y que tiene medios correspondientes al método de cualquiera de las reivindicaciones 1 a 7.

 

Patentes similares o relacionadas:

Dispositivo de procesamiento de imágenes, método de procesamiento de imágenes y programa, del 29 de Julio de 2020, de RAKUTEN, INC: Dispositivo de procesamiento de imágenes, que comprende: medios de obtención de imágenes captadas para la lectura de datos […]

PROCEDIMIENTO DE IDENTIFICACIÓN DE IMÁGENES ÓSEAS, del 2 de Julio de 2020, de UNIVERSIDAD DE GRANADA: La presente invención tiene por objeto un procedimiento para asistir en la toma de decisiones a un experto forense de cara a la identificación de […]

MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE RECONOCIMIENTO BIOMÉTRICO, del 2 de Julio de 2020, de UNIVERSIDAD AUTONOMA DE MADRID: Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas […]

Detección y seguimiento de objetos en imágenes, del 19 de Febrero de 2020, de QUALCOMM INCORPORATED: Un procedimiento implementado por ordenador que comprende: detectar, dentro de una imagen, un objeto cerca de una superficie usando […]

Sistema y método para la autenticación biométrica en conexión con dispositivos equipados con cámara, del 19 de Febrero de 2020, de Element, Inc: Un sistema antisuplantación para detectar y usar características tridimensionales de una huella de la palma humana con el fin de proporcionar acceso selectivo a los […]

Caracterización de una colisión de vehículo, del 1 de Enero de 2020, de GEOTAB Inc: Un método que comprende: en respuesta a la obtención de información con respecto a una colisión potencial entre un vehículo y un objeto, obtener, durante un periodo de […]

Un sistema de visualización de información personal y método asociado, del 11 de Diciembre de 2019, de AMADEUS S.A.S.: Un sistema para identificación y/o autenticación de un usuario en una terminal de viaje, comprendiendo el sistema: una base de datos […]

Procedimiento de procesamiento de una señal asíncrona, del 16 de Octubre de 2019, de Sorbonne Université: Procedimiento de reconocimiento de formas en una señal asíncrona producida por un sensor de luz, teniendo el sensor una matriz de píxeles dispuesta frente […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .