METODO PARA FUSIONAR OCR POSTALES QUE EXPLOTA FUNCIONES DE CREENCIA.
Un método para decodificar direcciones postales sobre imágenes de envíos (1) postales con varios tratamientos OCR postales (LAP1,
LAP2, LAP3) en paralelo, en el cual se fusionan los resultados producidos por los OCR, que comprenden decisiones completas, decisiones parciales o también una decisión de rechazo completo, para decidir un resultado global de dirección postal, caracterizado:
porque los mencionados resultados de OCR se fusionan considerando estas decisiones de OCR en un marco de discernimiento de varios niveles de conjuntos de clases de un modelo jerárquico de creencias transferibles, porque se genera, por tanto, partir de los resultados de los OCR funciones/masas (m1, m2, m3) de creencia a partir de matrices de confusión asociadas respectivamente a los OCR, obteniéndose cada matriz de fusión asociada a un OCR por aprendizaje con el OCR considerando un modelo jerárquico de las decisiones del OCR, correspondiente a una jerarquía de distribución postal, con un nivel superior (nivel rechazo completo), que corresponde a un rechazo completo del OCR, un nivel inferior (nivel distribución), que corresponde a una decisión completa del OCR, y niveles intermedios (niveles encaminamiento - nivel calle), que corresponden a decisiones parciales del OCR, y categorías de decisión del OCR (por ejemplo, Ciudad no Distribuible - Ciudad Distribuible - Calle Numerada - Apartado Postal- Sin Portal), que corresponden a diferentes tipos de puntos de distribución postal, conteniendo la mencionada matriz valores de comportamiento calculados a partir de determinaciones de conformidad para cada categoría de decisiones y para cada nivel de decisión, porque, para cada resultado OCR, se identifica la categoría de decisiones a la cual corresponde dicho resultado de OCR y se recuperan los valores de comportamiento correspondientes en la matriz de confusión, asociada al OCR para producir funciones/masas (m1, m2, m3) de creencia atribuidas a esta categoría de decisiones para el nivel de decisión, al cual corresponde el mencionado resultado OCR, pero igualmente funciones/masas (m1, m2, m3) de creencia atribuidas a esta categoría de decisiones para niveles de decisión intermedios superiores a dicho nivel de decisión, considerando el mencionado modelo jerárquico de decisiones, porque se fusionan las mencionadas funciones/masas (m1, m2, m3) de creencia producidas tomando como base resultados de OCR de una función/masa (m) de creencia resultante, la cual es transformada (4) en una medida de probabilidad para decidir el resultado global de dirección postal
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E07103995.
Solicitante: SOLYSTIC.
Nacionalidad solicitante: Francia.
Dirección: 14, AVENUE RASPAIL,94257 GENTILLY CEDEX.
Inventor/es: BENYOUB, BELKACEM, MERCIER,DAVID, CRON,GENEVIEVE.
Fecha de Publicación: .
Fecha Solicitud PCT: 13 de Marzo de 2007.
Fecha Concesión Europea: 4 de Noviembre de 2009.
Clasificación Internacional de Patentes:
- G06K9/62F3
Clasificación PCT:
- G06K9/62 FISICA. › G06 CALCULO; CONTEO. › G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › G06K 9/00 Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00). › Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos.
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.
Fragmento de la descripción:
Método para fusionar OCR postales que explota funciones de creencia.
El invento se refiere a la decodificación de imágenes para lectura automática de información y, en particular, a la decodificación de imágenes de envíos postales para lectura automática de direcciones y/o de distribución inscritas en los envíos postales.
La decodificación de imágenes de envíos postales se realiza generalmente por un tratamiento de reconocimiento óptico de caracteres (OCR).
Una lectura de direcciones en una aplicación de tratamiento postal se construye en torno a cuatro grandes operaciones: localización del bloque de dirección en la imagen del envío, binarización del bloque de dirección, tratamiento de OCR y extracción en las bases de datos de direcciones postales válidas.
En resumen, la localización del bloque de dirección consiste en encontrar en la imagen de una cara de un envío el bloque de dirección del destinatario del envío.
La binarización de la imagen consiste en transformar una imagen, que está en niveles múltiples de gris, en una imagen binaria.
El tratamiento de OCR consiste en extraer de la imagen binaria los caracteres alfanuméricos en forma de cadenas de caracteres correspondientes a campos del bloque de dirección.
La extracción en las bases de datos de direcciones postales válidas consiste en verificar la analogía entre la dirección o las partes de dirección extraídas de la imagen binaria por tratamiento de OCR y una dirección o partes de dirección presentes en las bases de datos para suministrar un resultado de decodificación con una fiabilidad razonable.
Estos procesos diferentes de tratamientos de datos, que se encadenan en un lector de direcciones postales, se reagruparán más tarde bajo el vocablo general de OCR postal. El OCR postal es precedido, evidentemente, en el lector de direcciones por una toma de imagen de una cara de un envío postal a continuación de la cual la imagen numérica del envío estará disponible para el OCR postal.
Considerando la complejidad de un OCR postal y el alto grado de variabilidad de una dirección postal en la cara de un envío, la fiabilidad de los resultados producidos en la salida de un OCR postal puede variar de un modo muy importante.
En la selección postal automática, se busca generalmente conseguir los dos criterios de comportamiento, que son la cuota de lectura y la cuota de error.
La cuota de lectura es una magnitud estadística, que expresa la proporción de lecturas de dirección correspondiente efectivamente a la dirección del envío, en relación con un cierto número de envíos realizados. La cuota de error es una magnitud estadística, que expresa la proporción de direcciones reconocidas automáticamente, pero que son erróneas y que al final necesitan, por tanto, un tratamiento manual. Estos dos criterios de comportamiento pueden ser diferentes de una aplicación postal a otra y/o de un Operador postal a otro y/o de un país a otro.
Generalmente, para decodificar automáticamente las imágenes de envíos postales, se hace pasar estas imágenes en un solo OCR postal. Sin embargo, para asegurar una lectura/decodificación aún más fiable de las direcciones de los envíos postales, ya se ha pensado en hacer trabajar varios OCR postales en un mismo sistema de decodificación de direcciones postales, (es decir, en una misma máquina de selección postal).
El hecho de utilizar los resultados de varios OCR postales para la lectura de direcciones es un principio conocido para intentar mejorar los dos criterios de comportamiento precedentes y, de modo más general, la fiabilidad de la decodificación.
Se distinguen, en las publicaciones habituales, los sistemas con puesta en serie de varios OCR postales y los sistemas con puesta en paralelo de varios OCR postales.
En un funcionamiento de puesta en serie de varios OCR postales, una imagen de un envío postal se somete a un primer OCR postal, luego a un segundo, luego a un tercero, si el primer OCR postal y luego el segundo respectivamente no llegan a leer/decodificar automáticamente la imagen. Si efectivamente la imagen es decodificada completamente por uno de los OCR postales, se produce un resultado de decodificación en forma de una dirección postal (más exactamente de un código de indexación correspondiente a dicha dirección postal) en la salida del sistema de multi-OCR postales en serie.
Aunque este principio de funcionamiento en serie de varios OCR postales pueda mejorar la fiabilidad de la decodificación, no permite aumentar la cuota de lectura ni disminuir la cuota de error en proporciones todavía satisfactorias. La limitación de este sistema reside más particularmente en el hecho de que los OCR postales en serie pueden imponer un tiempo de tratamiento global demasiado importante para las presiones de tiempo real de una aplicación postal. Por otro lado, la incorporación de un OCR postal suplementario en tal sistema es relativamente compleja y, por tanto, costosa. En el documento de patente EP-1594077, se describe también un método para decodificar imágenes de envíos postales utilizando varios OCR postales, que funcionan en serie.
En un funcionamiento de varios OCR postales puestos en paralelo, los resultados respectivos de decodificación producidos por los OCR postales se reagrupan con el fin de determinar uno de los resultados, que es el más fiable para decodificar la dirección de un envío.
Así, pues, existen sistemas de lectura/decodificación de direcciones postales, cuyas salidas de los OCR postales se conectan a un dispositivo de coto. El dispositivo de voto considera todos los resultados producidos en paralelo por los OCR postales para una imagen de entrada dada y produce un resultado final basado en una regla de mayoría. La limitación de este principio es que para tres OCR postales en paralelo, hace falta que dos OCR postales produzcan el mismo resultado de decodificación para satisfacer una regla de mayoría.
Con este principio, no siempre es fácil obtener una cuota de lectura satisfactoria. En el documento de patente WO2005/050545, se describe también un método para decodificar imágenes de envíos postales utilizando varios OCR postales, que colaboran en paralelo, típicamente dos o más de dos OCR postales. El principio descrito consiste en afectar a cada tratamiento de OCR un valor de comportamiento. Estos valores de comportamientos se conservan en una tabla preestablecida por aprendizaje. Se parte del principio de que las imágenes de los envíos postales sometidas a tratamientos de OCR pueden clasificarse según categorías predefinidas refiriéndose al tipo de envío postal (carta, objeto plano, carta con ventanilla traslúcida,...), a las características de la escritura de la dirección postal (dirección postal manuscrita, escrita a máquina de impresión por aguja, en color,...), a las características de presentación del bloque de dirección (bloque inclinado,...), etc....Se considera también en este documento que el comportamiento de un tratamiento de OCR puede variar en función de las características intrínsecas del correo. En el documento de patente WO2005/050545, se somete previamente imágenes de prueba de envíos postales a los OCR postales haciendo notar cada vez, a partir de la imagen, la categoría del tipo de envío y el resultado de decodificación producido por el tratamiento de OCR considerado. Así, se puede afectar a cada OCR postal unos valores de comportamiento para las diferentes categorías de envíos postales. En operación, es posible ponderar, a partir de una tabla que reagrupe los valores de comportamiento de los OCR postales, por categoría los resultados producidos en paralelo por los OCR postales y, por tanto, producir un resultado final, que fusione por decirlo así los resultados producidos individualmente por los OCR postales.
Sin embargo, en este conocido sistema de decodificación de imágenes de envíos postales, el resultado final queda idéntico al resultado producido por uno de los tratamientos de OCR en paralelo.
Se conoce igualmente por el documento de patente US5970171 un método de fusión de los resultados producidos por sistemas inteligentes de reconocimiento de cadena de caracteres, que explota funciones de creencia. Sin embargo, este método no suministra una decodificación suficientemente fiable. En la publicación de International Conference o Information Fusión del 28 de julio de 2005 a nombre de David Mercier, se presenta la utilización de funciones de creencia para el reconocimiento de caracteres. No obstante, en el...
Reivindicaciones:
1. Un método para decodificar direcciones postales sobre imágenes de envíos (1) postales con varios tratamientos OCR postales (LAP1, LAP2, LAP3) en paralelo, en el cual se fusionan los resultados producidos por los OCR, que comprenden decisiones completas, decisiones parciales o también una decisión de rechazo completo, para decidir un resultado global de dirección postal, caracterizado:
2. El método según la reivindicación 1, en el cual las mencionadas funciones (m1, m2, m3) de creencia se fusionan (3) por una combinación coyuntiva de Dempster Shafer.
3. El método según una de las reivindicaciones 1 a 2, en el que los resultados producidos por los OCR postales (LAP1, LAP2. LAP3) comprenden resultados derivados (resultados obtenidos a partir de informaciones textuales reconocidas por OCR, sin haber sido decididas por el OCR, después de extracción en la base de direcciones válidas).
4. El método según una de las reivindicaciones 1 a 3, en el que los resultados producidos por los OCR postales (LAP1, LAP2, LAP3) comprenden resultados filtrados (códigos de indexación completos o parciales, que siguen en orden decreciente de fiabilidad el código de indexación producido por el OCR).
5. El método según una de las reivindicaciones 1 a 4, en el que se aprovechan registros asociados a dichos resultados de OCR para generar (61, 62) las funciones/masas de creencia.
6. El método según una de las reivindicaciones 1 a 5, en el que se aprovechan (4) valores representativos de costes de distribución postal para decidir un resultado global de dirección postal.
7. Un sistema para aplicar el método según una de las reivindicaciones 1 a 6, caracterizado porque los mencionados OCR postales forman parte de un mismo lector de direcciones postales, incluyendo una cámara para realizar una imagen de un envío postal corriente, produciendo los mencionados OCR postales en paralelo los mencionados resultados de dirección postal para un envío a partir de una misma imagen del envío.
8. Un sistema para aplicar el método según una de las reivindicaciones 1 a 6, caracterizado porque comprende múltiples lectores de direcciones postales, incluyendo cada uno una cámara y un OCR postal, produciendo los mencionados OCR postales en paralelo los mencionados resultados de dirección postal para un envío a partir de múltiples imágenes del envío.
Patentes similares o relacionadas:
ANALISIS DE IMAGENES ASISTIDO POR ORDENADOR, del 27 de Abril de 2010, de HEALTH DISCOVERY CORPORATION: Un procedimiento implementado por ordenador para el análisis de una imagen digitalizada, comprendiendo el procedimiento: (a) ingresar un conjunto de entrenamiento […]
Dispositivo de procesamiento de imágenes, método de procesamiento de imágenes y programa, del 29 de Julio de 2020, de RAKUTEN, INC: Dispositivo de procesamiento de imágenes, que comprende: medios de obtención de imágenes captadas para la lectura de datos […]
PROCEDIMIENTO DE IDENTIFICACIÓN DE IMÁGENES ÓSEAS, del 2 de Julio de 2020, de UNIVERSIDAD DE GRANADA: La presente invención tiene por objeto un procedimiento para asistir en la toma de decisiones a un experto forense de cara a la identificación de […]
MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE RECONOCIMIENTO BIOMÉTRICO, del 2 de Julio de 2020, de UNIVERSIDAD AUTONOMA DE MADRID: Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas […]
Detección y seguimiento de objetos en imágenes, del 19 de Febrero de 2020, de QUALCOMM INCORPORATED: Un procedimiento implementado por ordenador que comprende: detectar, dentro de una imagen, un objeto cerca de una superficie usando […]
Sistema y método para la autenticación biométrica en conexión con dispositivos equipados con cámara, del 19 de Febrero de 2020, de Element, Inc: Un sistema antisuplantación para detectar y usar características tridimensionales de una huella de la palma humana con el fin de proporcionar acceso selectivo a los […]
Caracterización de una colisión de vehículo, del 1 de Enero de 2020, de GEOTAB Inc: Un método que comprende: en respuesta a la obtención de información con respecto a una colisión potencial entre un vehículo y un objeto, obtener, durante un periodo de […]
Un sistema de visualización de información personal y método asociado, del 11 de Diciembre de 2019, de AMADEUS S.A.S.: Un sistema para identificación y/o autenticación de un usuario en una terminal de viaje, comprendiendo el sistema: una base de datos […]