Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la capacidad comunicativa en personas con alteraciones del lenguaje.

El sistema tiene como objetivo la aplicación de algoritmos de reconocimiento de clases de objetos en imágenes para mejorar la capacidad comunicativa en personas con alteraciones del lenguaje.

Para ello se emplea un sistema de captura de imágenes (1), encargado de obtener la imagen que será procesada por un módulo que implementa un sistema de localización de clases de objetos en imágenes (2), el cual está basado en técnicas de visión artificial. Este módulo (2) ofrecerá una salida visual (3) en la que se recuadran las clases de objetos reconocidas en la imagen. El sistema interactuará con el usuario (4), ofreciéndole la información del objeto localizado, o interrogándole sobre el mismo para que sea él quien introduzca la información relativa a la clase reconocida. En este segundo modo, el sistema informará al usuario si el ejercicio se completó correctamente.

Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P201132071.

Solicitante: UNIVERSIDAD DE ALCALA..

Nacionalidad solicitante: España.

Inventor/es: MALDONADO BASCÓN,SATURNINO, GIL JIMENEZ,PEDRO, GOMEZ MORENO,HILARIO, LAFUENTE ARROYO,SERGIO, ACEVEDO RODRÍGUEZ,Francisco Javier, LÓPEZ SASTRE,Roberto Javier.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06K9/00 FISICA.G06 CALCULO; CONTEO.G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00).
  • G06K9/46 G06K […] › G06K 9/00 Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00). › Extracción de elementos o de características de la imagen.
  • G06K9/62 G06K 9/00 […] › Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos.
  • G06T7/00 G06 […] › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL.Análisis de imagen.
  • G09B21/00 G […] › G09 ENSEÑANZA; CRIPTOGRAFIA; PRESENTACION; PUBLICIDAD; PRECINTOS.G09B MATERIAL EDUCATIVO O DE DEMOSTRACION; MEDIOS DE ENSEÑANZA O DE COMUNICACION DESTINADOS A LOS CIEGOS, SORDOS O MUDOS; MODELOS; PLANETARIOS; GLOBOS; MAPAS GEOGRAFICOS; DIAGRAMAS.Medios de enseñanza o de comunicación destinados a los ciegos, sordos o mudos (presentación sonora del objeto a estudiar G09B 5/04).

Fragmento de la descripción:

SISTEMA DE RECONOCIMIENTO DE CLASES DE OBJETOS POR VISIÓN ARTIFICIAL PARA LA MEJORA DE LA CAPACIDAD COMUNICATIVA EN PERSONAS CON ALTERACIONES DEL LENGUAJE

SECTOR DE LA TÉCNICA La presente invención se enmarca dentro de las tecnologías de la información y las comunicaciones, y dentro del campo del reconocimiento de clases de objetos mediante técnicas de visión artificial. También, dentro del campo de metodologías y terapias para el tratamiento de alteraciones del lenguaje.

ESTADO DE LA TÉCNICA

La aplicación de las tecnologías de la información y las comunicaciones (TIC) para mejorar la capacidad comunicativa en personas con alteraciones del lenguaje ha despertado, recientemente, un gran interés en la comunidad científica. Existen numerosas tecnologías de 15 ayuda para el apoyo de las personas con dificultades de expresión y comprensión del lenguaje [1]. La mayoría de estas ayudas técnicas, se basan en el reconocimiento de dibujos y/o fotografías, bien sobre tableros o fichas, bien sobre sistemas electrónicos, como la pantalla del ordenador. Así pues, esta tecnología permite a los usuarios realizar un ejercicio de asociación entre imágenes y texto, con la única limitación de que las imágenes deben haber sido 20 seleccionadas previamente para ser utilizadas en el sistema. El acceso a la palabra se suele realizar mediante un interfaz que puede ser táctil para seleccionar el pictograma correspondiente, controlado por la voz, o mediante editores predictivos, que se integran en el elemento de apoyo más recomendado, como los comunicadores personales, que permiten una comunicación funcional básica. Estas tecnologías son utilizadas con propósito terapéutico, 25 rehabilitador, o como elementos de apoyo para la compensación de alteraciones. Ejemplos de estos sistemas son: PLAPHOONS [2], PREDWIN [3] o C-SPEAK APHASIA [4], entre otros.

En esta línea, se encuentran también algunas patentes relacionadas [5-6]. Mientras que en [6] se describe un comunicador controlado por medio de la voz, en [5] se detalla un sistema 30 terapéutico específico para el tratamiento de la afasia, que presenta por pantalla una imagen al

usuario, para que éste, por medio de su voz, decida de qué imagen se trata.

Cabría destacar que ninguno de los sistemas descritos en [1-6] utiliza ningún sistema para la captura de imágenes, ni ninguna técnica de reconocimiento de clases de objetos para realizar 5 el reconocimiento en tiempo real de los objetos que aparecen en imágenes capturadas por el mismo usuario. Ésta es una diferencia fundamental con respecto a la invención objeto de esta patente: por primera vez se aplican técnicas de visión artificial, para que el sistema pueda reconocer automáticamente clases de objetos en las imágenes que el usuario captura mientras interactúa con el sistema, es decir, que éstas no tienen que estar incluidas en el sistema con antelación.

Así pues, la utilización de técnicas de visión artificial para el reconocimiento de clases de objetos en imágenes, para la mejora de la capacidad comunicativa en personas con alteraciones del lenguaje, no presenta ningún precedente en la revisión del estado de la técnica.

EXPLICACIÓN

Breve descripción El sistema objeto de esta invención aplica algoritmos de visión artificial para el reconocimiento de clases de objetos en imágenes, con el objetivo de mejorar la capacidad 20 comunicativa en personas con alteraciones del lenguaje. El sistema propuesto debe disponer de una cámara (1) que le permita al usuario del mismo capturar imágenes. El sistema realizará un reconocimiento automático de las clases de objetos que estén presentes en la imagen (2) , localizando las clases detectadas (p. ej. la clase persona) en la misma imagen (3) . Por último, el sistema dispondrá de una interfaz de usuario (4) que le permitirá al mismo interactuar con la aplicación, de modo que pueda mejorar su capacidad comunicativa. Este interfaz, ofrecerá la información relativa al objeto detectado, tanto de forma visual como auditiva, y además podrá utilizarse para interrogar al usuario sobre el objeto reconocido, de modo que sea él mismo el que introduzca el nombre de la clase detectada (4) . El sistema informará al usuario de si el ejercicio se completó correctamente.

El sistema puede implementarse tanto en dispositivos móviles con cámara, como en sistemas no móviles que también dispongan de un sistema de captura de imágenes.

La principal diferencia de este sistema con respecto al estado de la técnica, es la utilización de imágenes reales, capturadas por el sistema y procesadas en tiempo real mediante algoritmos de visión artificial para la localización de clases de objetos, así como la aplicación de estas técnicas a la mejora de la capacidad comunicativa en personas con alteraciones del lenguaje.

Descripción detallada El sistema que se describe permite la aplicación de técnicas de visión artificial de reconocimiento y detección de clases de objetos en imágenes, para mejorar la capacidad comunicativa en personas con alteraciones del lenguaje. En la mayoría de las TIC aplicadas a este problema [1-6], los usuarios no pueden trabajar con imágenes capturadas en el momento por ellos mismo, sino con bancos de imágenes que son precargados en las aplicaciones, y que en muchas ocasiones son principalmente pictogramas. Los usuarios realizan un ejercicio de asociación entre la imagen y la palabra que les evoca la misma. Este ejercicio es de gran utilidad a la hora de trabajar con personas que presenten alteraciones del lenguaje, como podrían ser la afasia, la anartria o la disartria.

El sistema objeto de la invención puede ser implementado tanto en un dispositivo móvil, como no móvil. El sistema debe disponer de un sensor para la captura de imágenes, una cámara (1) . El usuario utilizará la cámara para capturar las imágenes que serán procesadas por el módulo de reconocimiento de clases de objetos (2) . Este módulo recibe como entrada una imagen capturada por el usuario, y será el encargado de localizar las clases de objetos para las que ha sido entrenado. La localización se realizará recuadrando en la imagen dónde aparecen las clases detectadas (3) . Es importante destacar que el sistema trabaja en el nivel de las clases, las categorías, es decir, que no sólo reconocerá un objeto concreto, sino la clase a la que el objeto pertenece. Algunos ejemplos de clases para las que puede ser entrenado el sistema son: persona, animal, coche, moto, perro, etc. Una vez el módulo de localización (2) identifica las clases en la imagen, el interfaz de usuario del sistema (4) será el encargado de transmitir ésta información. Así, el interfaz (4) podrá directamente identificar las clases detectadas e informar e interactuar con el usuario de forma visual y/o auditiva, es decir, visualizando el nombre en la pantalla del sistema de la clase reconocida, o emitiendo de forma sonora dicha información. También contemplamos que el interfaz (4) pueda interrogar al usuario acerca de la clase reconocida, de modo que sea él mismo quien tenga que proporcionar esta información, y que sea el sistema quien valide la información e informe al usuario de si la información fue introducida de forma correcta.

Así pues, el sistema descrito en esta patente resulta novedoso, y las principales características del mismo que lo diferencian de forma fundamental con respecto al resto de sistemas que abordan el mismo problema son: a) el dispositivo para la captura de imágenes, que permite al usuario trabajar con imágenes reales, de modo el conjunto de imágenes que maneja el sistema es dinámico y no tiene que estar precargado en el mismo; b) la utilización de técnicas de visión artificial para el reconocimiento y localización de clases de objetos en imágenes, que permiten al sistema localizar los objetos con los que el usuario podrá trabajar.

DESCRIPCIÓN DE LOS DIBUJOS

El sistema objeto de esta invención se ilustra en las Figuras 1 y 2.

Figura 1 -El sistema debe incorporar al menos un sistema de captura de imágenes (p. ej. una cámara) representado en (1) , donde se observa cómo el usuario puede capturar con el sistema una imagen de su entorno. La imagen capturada será procesada por el módulo de localización de clases de objetos, representado en (2) . El resultado del módulo de detección de clases de objetos (2) se representa en (3) , donde observamos cómo el sistema enmarca las clases que es capaz de identificar en la imagen proporcionada por el usuario. En el ejemplo representado, el módulo ha detectado cuatro objetos de la clase “persona” en la imagen.

Figura 2 -Se muestra un posible diseño para la interfaz gráfica (4) , a través del la cual el sistema...

 


Reivindicaciones:

1. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la

capacidad comunicativa en personas con alteraciones del lenguaje, que consta de:

5 a. Un subsistema de captura de imágenes encargado de obtener las imágenes que

serán procesadas por el sistema.

b. Un subsistema para el procesado digital de imágenes, computador, procesador o

cualquier otro sistema que permita operar con las imágenes capturadas.

c. Un subsistema de reconocimiento y localización de clases de objetos en

10 imágenes, que contiene el software necesario para realizar estas tareas,

aplicando técnicas de visión artificial.

d. Un interfaz que permitirá al usuario controlar e interactuar con la aplicación.

e. Una pantalla donde el sistema visualizará el resultado de la detección y parte

del interfaz de usuario.

15

2. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la

capacidad comunicativa en personas con alteraciones del lenguaje, según

reivindicación 1, caracterizado por estar implementado en una arquitectura móvil,

smartphone, tablet u ordenador portátil, donde se integren todos los subsistemas y

20 elementos descritos en la reivindicación 1.

3. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la

capacidad comunicativa en personas con alteraciones del lenguaje, según

reivindicaciones 1 y 2, caracterizado por disponer de múltiples cámaras. Éstas serán

25 utilizadas para realizar las tareas de localización de clases de objetos en las imágenes

que capturen, y/o funcionar como sensores de un interfaz natural de usuario para

interactuar y controlar el sistema.

4. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la

30 capacidad comunicativa en personas con alteraciones del lenguaje, según

reivindicaciones 1 y 2, caracterizado por disponer de una o múltiples cámaras de tiempo de vuelo, o por cualquier sistema de cámaras que permita recuperar, para cada píxel de la imagen, una medida de profundidad o distancia. La información proporcionada por estas cámaras podrá ser utilizada para realizar las tareas de localización y reconocimiento de clases de objetos en las imágenes que capturen, y/o funcionar como sensores de un interfaz natural de usuario para interactuar y controlar el sistema.

5. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la capacidad comunicativa en personas con alteraciones del lenguaje, según reivindicaciones 1 y 2, caracterizado por disponer de un interfaz táctil que permita al usuario interactuar con el sistema.

6. Sistema de reconocimiento de clases de objetos por visión artificial para la mejora de la capacidad comunicativa en personas con alteraciones del lenguaje, según reivindicaciones 1 y 2, caracterizado por disponer de un micrófono que permite al usuario controlar e interactuar con el sistema, controlándolo por voz.

Figura 1

Figura 2


 

Patentes similares o relacionadas:

Método y aparato de autentificación de identidad, terminal y servidor, del 29 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un método de autenticación de identidad, en donde el método comprende: adquirir información de rasgos faciales de un usuario y utilizar la información […]

Imagen de 'Sistema de generación de marcador y método'Sistema de generación de marcador y método, del 29 de Julio de 2020, de NEC CORPORATION: Un sistema de generación de marcador que comprende: medios de entrada de imagen de vídeo para proporcionar como entrada una imagen de vídeo; […]

Dispositivo de procesamiento de imágenes, método de procesamiento de imágenes y programa, del 29 de Julio de 2020, de RAKUTEN, INC: Dispositivo de procesamiento de imágenes, que comprende: medios de obtención de imágenes captadas para la lectura de datos […]

PROCEDIMIENTO Y DISPOSITIVO DE REGISTRO AUTOMÁTICO DE LA LOCOMOCIÓN DE NEMATODOS U ORGANISMOS PEQUEÑOS DE TAMAÑOS SIMILARES POR INTERFEROMETRÍA TEMPORAL DE MICROHACES DE LUZ, del 23 de Julio de 2020, de PHYLUMTECH S.A: Procedimiento y dispositivo de registro automático de la locomoción de nematodos u organismos pequeños de tamaños similares por interferometría temporal de microhaces […]

MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE RECONOCIMIENTO BIOMÉTRICO, del 2 de Julio de 2020, de UNIVERSIDAD AUTONOMA DE MADRID: Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas […]

Cámara inteligente para compartir fotografías automáticamente, del 1 de Julio de 2020, de QUALCOMM INCORPORATED: Un procedimiento para compartir una imagen final utilizando un dispositivo, en el que el procedimiento es realizado por un servidor y comprende: […]

Método, dispositivo de generación de imagen y sistema para generar una medición de autenticidad de un objeto, del 1 de Julio de 2020, de SICPA HOLDING SA: Un método, llevado a cabo por un dispositivo de generación de imagen , para generar una medición de autenticidad de un objeto o para contribuir en la generación […]

Estimación de una postura basada en la silueta, del 24 de Junio de 2020, de VIZRT AG: Un método implementado por ordenador para estimar una postura de un modelo de objeto articulado , en el que el modelo de objeto articulado […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .