ANALISIS DE IMAGENES ASISTIDO POR ORDENADOR.
Un procedimiento implementado por ordenador para el análisis de una imagen digitalizada,
comprendiendo el procedimiento:
(a) ingresar un conjunto de entrenamiento de datos de imágenes y un conjunto de prueba de datos de imágenes a un procesador, para ejecutar una pluralidad de subsistemas de detección, estando cada subsistema de detección adaptado para detectar y clasificar uno entre una pluralidad de distintos rasgos de interés, en donde cada rasgo de interés tiene una pluralidad de posibles características del rasgo, y en donde cada subsistema de detección genera una salida para su correspondiente rasgo de interés, en donde cada subsistema de detección ejecuta las etapas de:
(i) preprocesar cada conjunto de datos de imágenes para detectar y extraer la presencia de un rasgo de interés dentro de los datos de imágenes;
(ii) entrenar y probar al menos una máquina de vectores de soporte con al menos un núcleo que utiliza los conjuntos preprocesados de datos de imágenes para clasificar el rasgo de interés extraído en al menos una entre una pluralidad de clases de posibles características del rasgo;
(iii) comparar los rasgos clasificados a partir del conjunto de prueba de datos de imágenes con resultados conocidos del conjunto de prueba de datos de imágenes, a fin de determinar si se obtiene una solución óptima;
(iv) repetir las etapas (ii) y (iii) si no se obtiene la solución óptima;
(v) si se obtiene la solución óptima, ingresar un conjunto real de datos de imágenes en el procesador;
(vi) preprocesar el conjunto real de datos de imágenes para detectar y extraer la presencia de rasgos de interés dentro de los datos de imágenes;
(vii) clasificar al menos dicho rasgo de interés; y
(viii) generar una salida que comprende el rasgo, o rasgos, de interés clasificado(s) a partir del conjunto real de datos de imágenes;
(b) ingresar las salidas de cada uno de la pluralidad de subsistemas en una máquina global de vectores de soporte con al menos un núcleo; y
(c) generar una única salida global que comprende una clasificación de la imagen digitalizada
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US02/03070.
Solicitante: HEALTH DISCOVERY CORPORATION.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 6709 WATERS AVENUE,SAVANNAH, GA 31406.
Inventor/es: BARNHILL, STEPHEN D., ZHANG, HONG, CARLS,GARRY.
Fecha de Publicación: .
Fecha Concesión Europea: 2 de Diciembre de 2009.
Clasificación Internacional de Patentes:
- G06K9/62F3
- G06T7/00B2
Clasificación PCT:
- G06F15/18
- G06K9/62 FISICA. › G06 CALCULO; CONTEO. › G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › G06K 9/00 Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00). › Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos.
- G06T7/00 G06 […] › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Análisis de imagen.
Clasificación antigua:
Fragmento de la descripción:
Análisis de imágenes asistido por ordenador.
Campo de la invención
La presente invención se refiere, en general, al análisis asistido por ordenador de imágenes y, más específicamente, al análisis de imágenes asistido por ordenador utilizando máquinas de vectores de soporte.
Antecedentes de la invención
La extracción óptima de datos contenidos dentro de una señal electromagnética requiere la capacidad de identificar componentes importantes de la señal, a pesar del ruido y las limitaciones de la fuente de señal y la instrumentación utilizada para detectar la señal. Un área clave en la cual se busca la extracción y reconstrucción optimizadas de datos es el campo del análisis de imágenes, donde fuentes de ruido y otros factores pueden afectar negativamente la capacidad de extraer datos de la imagen, deteriorando así la efectividad del procedimiento de formación de imágenes para su uso concebido. Los ejemplos de áreas en las cuales el análisis de imágenes puede ser problemático incluyen la observación astronómica y la exploración planetaria, donde las fuentes pueden ser tenues y la interferencia atmosférica introduce ruido y distorsión; la vigilancia militar y de seguridad, donde la luz puede ser poca y el movimiento rápido de los objetivos dan como resultado un contraste bajo y una mancha; y la formación de imágenes médicas, que a menudo padece de contraste bajo, manchas y distorsión, debido a limitaciones de la fuente y de los instrumentos. Se añade a la dificultad del análisis de imágenes el gran volumen de datos contenidos dentro de una imagen digitalizada, ya que, con frecuencia, el valor de cualquier punto dado de datos no puede establecerse hasta que se procesa la imagen entera.
El desarrollo de procedimientos para el análisis automatizado de imágenes digitales ha recibido una considerable atención durante las pocas décadas anteriores, siendo una de las áreas claves de interés el campo médico. Las aplicaciones incluyen el análisis de imágenes de patologías generadas utilizando la emisión visual, de ultrasonido, de rayos X y de positrones, la resonancia magnética y otros procedimientos de formación de imágenes. Como ocurre en el caso de las imágenes médicas interpretadas por humanos, un analizador automatizado de imágenes debe ser capaz de reconocer y clasificar características borrosas dentro de las imágenes, lo que a menudo requiere la discriminación de límites indistintos entre áreas que difieren sólo en unos pocos niveles de gris o tonos de color.
En los años recientes, se han explorado ampliamente enfoques de aprendizaje por máquina para el análisis de imágenes, a fin de reconocer patrones que, a su vez, permiten la extracción de rasgos significativos dentro de una imagen en un fondo de detalle irrelevante. Las máquinas aprendices comprenden algoritmos que pueden ser entrenados para generalizar, utilizando datos con resultados conocidos. Los algoritmos de máquinas aprendices entrenadas, que incluyen las redes neurales, los modelos ocultos de Markov, las redes de creencia y las máquinas de vectores de soporte, son idealmente adecuadas para dominios caracterizados por la existencia de grandes cantidades de datos, patrones ruidosos y la ausencia de teorías generales. El foco específico entre tales enfoques ha sido la aplicación de redes neurales artificiales al análisis de imágenes biomédicas, con resultados informados en el uso de redes neurales para analizar imágenes visuales de especímenes citológicos y mamogramas para el diagnóstico del cáncer de pecho, la clasificación de imágenes de retina de diabéticos, el kariotipado (análisis visual de imágenes de cromosomas) para identificar anormalidades genéticas y la detección de tumores en imágenes de ultrasonido, entre otros.
La mayoría de las máquinas aprendices que se han aplicado al análisis de imágenes son redes neurales entrenadas utilizando la retropropagación, un procedimiento basado en gradientes en el cual los errores en la clasificación de los datos de entrenamiento se propagan hacia atrás a través de la red, para ajustar las ponderaciones de sesgo de los elementos de red, hasta que se minimice el error cuadrático medio. Un inconveniente significativo de las redes neurales de retropropagación es que la función de riesgo empírico puede tener muchos mínimos locales, un caso que puede oscurecer fácilmente el descubrimiento de la solución óptima. Los procedimientos estándar de optimización empleados por las redes neurales de retropropagación pueden converger hacia un mínimo, pero el procedimiento de la red neural no puede garantizar que se alcance siquiera un mínimo localizado, y mucho menos el mínimo global deseado. La calidad de la solución obtenida de una red neural depende de muchos factores. En particular, la habilidad del médico que implementa la red neural determina el provecho definitivo, pero incluso factores tan aparentemente benignos como la selección aleatoria de las ponderaciones iniciales puede llevar a resultados pobres. Además, la convergencia del procedimiento basado en el gradiente, utilizado en el aprendizaje de redes neurales, es inherentemente lenta. Un inconveniente adicional es que la función sigmoide tiene un factor de escala, que afecta a la calidad de la aproximación. Posiblemente, el mayor factor de limitación de las redes neurales, en lo que atañe al descubrimiento de conocimiento, es la "maldición de la dimensionalidad" asociada al crecimiento desproporcionado en el tiempo y potencia de cálculo requeridos para cada rasgo o dimensión adicional en los datos de entrenamiento.
El inconveniente de las redes neurales puede ser superado utilizando otro tipo de máquina aprendiz: la máquina de vectores de soporte. En términos generales, una máquina de vectores de soporte asocia vectores de entrada al espacio de rasgos de alta dimensión, a través de una función de asociación no lineal, escogida a priori. En este espacio de rasgos de alta dimensión, se construye un hiperplano separador óptimo. El hiperplano óptimo se utiliza entonces para determinar la realización de operaciones tales como separaciones de clases, ajuste de regresión o estimación de densidad.
Dentro de una máquina de vectores de soporte, la dimensión del espacio de rasgos puede ser muy alta. Por ejemplo, una función de asociación polinómica de cuarto grado causa que un espacio de entrada de dimensión 200 sea asociado a un espacio de rasgos de dimensión 1.600.000.000. El truco del núcleo y la dimensión de Vapnik-Chervonenkis ("VC") permiten que la máquina de vectores de soporte evite la "maldición de la dimensionalidad" que limita habitualmente otros procedimientos, y que derive eficazmente respuestas generalizables a partir de este espacio de rasgos de muy alta dimensión.
Si los vectores de entrenamiento están separados por el hiperplano óptimo (o hiperplano óptimo generalizado), el valor esperado de la probabilidad de cometer un error en un ejemplo de prueba está acotado por los ejemplos en el conjunto de entrenamiento. Esta cota no depende de la dimensión del espacio de rasgos, la norma del vector de coeficientes ni la cota del número de los vectores de entrada. Por lo tanto, si el hiperplano óptimo puede construirse a partir de un pequeño número de vectores de soporte con relación al tamaño del conjunto de entrenamiento, la capacidad de generalización será alta, incluso en el espacio de dimensión infinita.
Así pues, las máquinas de vectores de soporte proporcionan una solución deseable para el problema de analizar una imagen digital a partir de vastas cantidades de datos de entrada. Sin embargo, la capacidad de una máquina de vectores de soporte para analizar una imagen digitalizada a partir de un conjunto de datos está limitada en proporción a la información incluida dentro del conjunto de datos de entrenamiento. En consecuencia, existe una necesidad para un sistema y procedimiento para preprocesar datos a fin de aumentar los datos de entrenamiento para maximizar el análisis por ordenador de una imagen por parte de la máquina de vectores de soporte.
Breve resumen de la invención
El sistema y procedimiento para analizar imágenes digitalizadas utiliza una máquina aprendiz en general, y una máquina de vectores de soporte en particular. Un conjunto de datos de entrenamiento, que consiste en datos de imágenes digitales generados a partir de la formación de imágenes de un asunto biológico o médico con un resultado conocido, es preprocesado para permitir la aplicación más ventajosa de la máquina aprendiz. Para los fines de la presente invención, la imagen puede derivarse ex vivo, p. ej.,...
Reivindicaciones:
1. Un procedimiento implementado por ordenador para el análisis de una imagen digitalizada, comprendiendo el procedimiento:
2. El procedimiento de la reivindicación 1, en el cual la máquina aprendiz global es una máquina de vectores de soporte de margen suave, en la cual se aplica una penalización variable para los errores de clasificación.
3. El procedimiento de la reivindicación 1, en el cual las etapas (ii) y (vi) de preprocesamiento comprenden segmentar el rasgo de interés para separar el rasgo de interés de un fondo;
identificar mínimos y máximos locales correspondientes a cada rasgo segmentado de interés en los datos de imágenes; y
generar un valor numérico para el rasgo de interés segmentado.
4. El procedimiento de la reivindicación 3, en el cual el rasgo de interés comprende un punto que tiene un cierto brillo, y la identificación de mínimos y máximos locales comprende clasificar el brillo del punto en uno o más entre una pluralidad de niveles de brillo.
5. El procedimiento de la reivindicación 4, en el cual la geometría es una posible característica de rasgo, y la geometría se determina midiendo un cambio en la pendiente entre los bordes del punto, en dos distintos niveles de brillo.
6. El procedimiento de la reivindicación 1, en el cual las etapas (ii) y (vi) de preprocesamiento comprenden segmentar el rasgo de interés y transformar el rasgo segmentado en un vector de dimensión fija, en el cual la transformación comprende;
calcular un centroide del rasgo de interés;
muestrear un contorno del rasgo de interés utilizando un sistema de coordenadas polares con un origen en el centroide, para proporcionar una pluralidad de medidas radiales;
formar un vector utilizando la pluralidad de medidas radiales; y
aplicar una transformada de Fourier al vector para proporcionar el vector de dimensión fija.
7. El procedimiento de la reivindicación 1 o la reivindicación 2, en el cual el rasgo, o rasgos, de interés, com-prende(n) una pluralidad de rasgos de interés, y las etapas (ii) y (iv) de preprocesamiento comprenden segmentar un primer rasgo de interés de un segundo rasgo de interés, solapado al menos parcialmente, aplicando un modelo de gravitación a cada rasgo de interés para contraer cada rasgo en un cuerpo distinto.
8. El procedimiento de la reivindicación 1 o la reivindicación 2, en el cual las etapas (ii) y (iv) de preprocesamiento comprenden aplicar una transformación a los datos de imágenes, siendo la transformación seleccionada entre un grupo que consiste en las transformadas de ondículas, las transformadas de Radon y las transformadas de Hough.
9. El procedimiento de cualquiera de las reivindicaciones 1 a 8, en el cual la imagen digitalizada comprende un mamograma y la pluralidad de subsistemas comprende un subsistema de detección de calcificación, un subsistema de detección de masas y un subsistema de distorsión de estructuras.
10. Un sistema de ordenador para el análisis de una imagen digitalizada, con una pluralidad de rasgos de interés, comprendiendo el sistema de ordenador:
un procesador;
un dispositivo de entrada para recibir datos de imágenes a procesar;
un dispositivo de memoria, en comunicación con el procesador, que tiene una pluralidad de subsistemas de detección almacenados en el mismo, en donde el procesador y la memoria están adaptados para ejecutar el procedimiento de cualquiera de las reivindicaciones 1 a 9.
Patentes similares o relacionadas:
METODO PARA FUSIONAR OCR POSTALES QUE EXPLOTA FUNCIONES DE CREENCIA, del 5 de Abril de 2010, de SOLYSTIC: Un método para decodificar direcciones postales sobre imágenes de envíos postales con varios tratamientos OCR postales (LAP1, LAP2, LAP3) en paralelo, en el cual […]
METODO DE IDENTIFICACION DE LOS DISTINTOS TIPOS DE TEJIDO OSEO A NIVEL SUBCONDRAL MEDIANTE MICROTOMOGRAFIA COMPUTARIZADA DE ALTA RESOLUCION, del 13 de Junio de 2011, de TRABECULAE EMPRESA DE BASE TECNOLOGICA S.L. (35%) CAEIRO REY (25%), JOSE R. DAPIA ROBLEDA (25%), SONIA HERRERO-BEAUMONT CUENCA (10%), GABRIEL LEANDRO GUEDE RODRIGUEZ (5%), DAVID: Método de identificación de los distintos tipos de tejido óseo a nivel subcondral mediante microtomografía computarizada de alta resolución objeto de la presente patente de […]
PROCEDIMIENTO Y DISPOSITIVO PARA DETERMINAR UN CONTORNO CELULAR DE UNA CÉLULA, del 4 de Febrero de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Procedimiento para determinar un contorno celular de una célula con un núcleo celular y un plasma celular en una imagen de la célula, que comprende: […]
DISPOSITIVO PORTATIL PARA EL SEGUIMIENTO TEMPORAL DE ALTERACIONES CUTANEAS Y PROCEDIMIENTO ASOCIADO, del 22 de Octubre de 2010, de CATFOSC.HEALTH MADE TO MEASURE, S. L: Dispositivo portátil para el seguimiento temporal de alteraciones cutáneas y procedimiento asociado. Dispositivo portátil para el seguimiento temporal de alteraciones […]
APARATO DE DETECCION Y DE CARACTERIZACION DE LOS TEJIDOS BIOLOGICOS, del 24 de Septiembre de 2010, de SOPRO (SOCIETE ANONYME): Procedimiento de detección y de localización de la diferencia de densidad y/o de estructura y/o de composición química de un tejido biológico que se somete a una iluminación […]
ANALISIS DE UNA IMAGEN MEDICA, del 24 de Agosto de 2010, de BOSTON SCIENTIFIC LIMITED: Un procedimiento de análisis de una imagen médica que comprende: recibir una imagen médica ; analizar la imagen médica; determinar […]
METODO DE IDENTIFICACION DE MUESTRAS Y SISTEMA UTILIZADO, del 24 de Mayo de 2010, de UNIVERSIDAD DEL PAIS VASCO-EUSKAL HERRIKO UNIVERTSITATEA: Método de identificación de muestras y sistema utilizado. El sistema que comprende un dispositivo electrónico de comunicación portátil y un servidor […]
EVALUACION DE CARACTERISTICAS DE LA IMAGEN DE UNA ESTRUCTURA ANATOMICA EN IMAGENES DE TOMOGRAFIA DE COHERENCIA OPTICA, del 26 de Abril de 2010, de THE GENERAL HOSPITAL CORPORATION: Una disposición de procesado para procesar al menos una nueva imagen de biopsia asociada con al menos una porción de una estructura anatómica, […]