MÉTODO DE CLASIFICACIÓN DE IMÁGENES.
Un método para clasificar una imagen respecto a una determinada cualidad subjetiva,
donde dicho método comprende:
- identificar las regiones relevantes y acentuadas de dicha imagen;
- obtener una pluralidad de medidas de características relacionadas con la composición de dicha imagen, donde dichas características comprenden al menos una de las siguientes:
- una característica basada en el número de regiones relevantes y/o acentuadas de dicha imagen,
- una característica basada en la homogeneidad del diseño de dichas regiones relevantes,
- una característica basada en la correlación de las posiciones que ocupan dichas regiones relevantes dentro del encuadre de dicha imagen;
- seleccionar al menos una medida de dicha pluralidad de medidas de características relacionadas con la composición de la imagen para clasificar dicha imagen respecto a una determinada cualidad subjetiva.
Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P201031332.
Solicitante: TELEFONICA, S.A..
Nacionalidad solicitante: España.
Inventor/es: OLIVER RAMÍREZ,NURIA, OBRADOR ESPINOSA,Pere, SCHMIDT-HACKENBERG,Ludwig.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G06K9/00 FISICA. › G06 CALCULO; CONTEO. › G06K RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES DE REGISTROS; MANIPULACION DE SOPORTES DE REGISTROS (impresión per se B41J). › Métodos o disposiciones para la lectura o el reconocimiento de caracteres impresos o escritos o el reconocimiento de formas, p. ej. de huellas dactilares (métodos y disposiciones para la lectura de grafos o para la conversión de patrones de parámetros mecánicos, p.e. la fuerza o la presencia, en señales eléctricas G06K 11/00; reconocimiento de la voz G10L 15/00).
- G06T7/00 G06 […] › G06T TRATAMIENTO O GENERACIÓN DE DATOS DE IMAGEN, EN GENERAL. › Análisis de imagen.
Fragmento de la descripción:
CAMPO DE LA INVENCIÓN
La presente invención se engloba en el campo de la identificación de imágenes y dentro de este ámbito, en el de los métodos para la clasificación de imágenes atendiendo a su apariencia.
ANTECEDENTES DE LA INVENCIÓN
La estética de las imágenes está relacionada con la creación y la apreciación de belleza en las mismas. La estética implica una gran variedad de factores tanto psicológicos como perceptuales, entre los que se incluyen la presencia de personas en la imagen y sus expresiones faciales, la claridad, el colorido, la harmonía y una adecuada composición. El número de repositorios de imágenes tanto personales como presentes en la web está aumentando exponencialmente, siendo cada vez más necesarios algari tmos computarizados que sean capaces de diferenciar automáticamente imágenes estéticamente atrayentes de aquellas que no lo son. Dichos algoritmos formarán una parte muy importante entre las futuras herramientas de gestión de imágenes y en algunos casos han sido ya propuestos como motores de búsqueda y reclasificación de imágenes tanto en la web como en repositorios personales.
Cuantificar el valor estético de una fotografía puede resultar bastante difícil, lo que explica por qué un
problema más sencillo como, simplemente, diferenciar imágenes atendiendo a su alta vs. baja atracción se ha convertido en una cuestión importante en la comunidad investigadora.
A pesar de que se ha comprobado que la composición de una imagen es el atributo más importante a la hora de evaluar la atracción de una imagen, los algoritmos informáticos relacionados con la estética de imágenes, desarrollados
hasta ahora, no comprenden un análisis en profundidad de las características que se refieren a la composición de imágenes.La simplicidad se ha considerado en diversos trabajos de varias formas: por ejemplo, el número de colores, cuantificándolo en 4096, en el fondo de la escena de la región de interés (L1) [Y. Luo and X. Tang, "Photo and Video Quality Evaluation: Focusing on the Subject, /1 in Proc. of the 10th European Conf. on Computer Vision: Part III. Springer-Verlag, 2008, p. 399.; el número, hasta 5, de regiones segmentadas mayores que el 1% del tamaño de la imagen (D1 ) [R. Datta, D. Joshi, J. Li, and J.Z. Wang, "Studying aesthetics ~n photographic images using a computational approach, " Lecture Notes in Computer Science, vol. 3953, pp. 288, 2006., o el número total de regiones seqmentadas (F1) [E. Fedorovskaya, C. Neustaedter, and
W. Hao, "Image harmony for consumer images, " in IEEE International Conference on Image Processing, San Diego, California, USA, 2008]. La poca profundidad del campo de fotografía (i. e., enfocado a la región de interés de la imagen y sacando de este enfoque el fondo de la misma que ha sido tenida en cuenta en [Y. Luo and X. Tang, "Photo and Video Quality Evaluation: Focusing on the Subject, n in Proc.
of the 10th European Conf. on Computer Vision: Part III. Springer-Verlag, 2008, p. 399.) , [P. Obrador, "Regían based image appeal metric for consumer photos, N in 2008 IEEE 1Oth Workshop on Multimedia Signal Processing, 2008, pp. 696-701] and R. Datta, D. Joshi, J. Li, and J.Z. Wang, "Studying aesthetics in photographic images using a computational approach, N Lecture Notes in Computer Science, vol. 3953, pp. 288, 2006.) ) , así como lo saliente que se encuentre el sujeto principal (considerado en [L. K. Wong and K. L. Low, "Saliency-Enhanced Image Aesthetics Class Prediction, N ~n 16th IEEE International Conference on Image Processing (ICIP 2009) , Cairo, Egypt, 2009.) ]) pueden también ayudar a reducir la complejidad de este tipo de análisis. El balance visual conforme a la regla de los tercios (en inglés rule of thirds) es medido en el trabajo de Luo and Tang work calculando la distancia mínima del centroide de la región de interés a los cuatro puntos de intersección (L2) • Para finalizar en las contribuciones de Datta, Joshi, Li and Wang así como en las de Wong and Low's, las medias aritméticas de la tonalidad, saturación y brillo (del inglés, HSV color
space- Hue, Saturation and brightness Value) dentro del rectángulo interior de la regla de los tercios han sido evaluadas.RESUMEN DE LA INVENCIÓN
La presente invención se centra en el impacto que la composición de imágenes tiene en la estética de las mismas, haciendo uso de la teoría de composición y proponiendo medidas básicas de características que están relacionadas con las llamadas reglas generales de composición de imágenes. Además se describe un experimento concreto, en el que un clasificador utiliza estas medidas a para
automáticamente clasificar imágenes atendiendo a su atracción visual.
En concreto en una realización de la presente invención se presenta un método para clasificar una imagen respecto a una determinada cualidad subjetiva, donde dicho método comprende:
- identificar las regiones relevantes y acentuadas de dicha
imagen;
- obtener una pluralidad de medidas de características
relacionadas con la composición de dicha imagen, donde
dichas características comprenden al menos una de las
siguientes:
• una característica basada en el número de regiones relevantes y/o acentuadas de dicha imagen,
• una característica basada en la homogeneidad del diseño de dichas regiones relevantes,
• una características basada en la correlación de las posiciones que ocupan dichas regiones relevantes dentro del encuadre de dicha imagen;
- seleccionar al menos una medida de dicha pluralidad de medidas de características relacionadas con la composición de la imagen para clasificar dicha imagen respecto a una determinada cualidad subjetiva.
Una región se deflne como relevante s1 su relevancia está por encima de un umbral, donde dicho umbral es un porcentaje de la relevancia de la región con máxima relevancia y donde dicha relevancia de una región se calcula como el producto de su tamaño por su brillo relativo, donde dicho brillo relativo se obtiene de determinadas tablas de brillos asociados a colores.
Opcionalmente las regiones acentuadas se seleccionan mediante la inspección de los colores no asociados a riinguna región relevante siendo la mayor región de dichos colores no asociados a ninguna región relevante una región acentuada si su tamaño se encuentra por encima de un umbral, donde dicho umbral es un porcentaje de la suma de tamaños de todas las regiones de dicho color.
Preferentemente, la pluralidad de medidas de características relacionadas con la composición de imágenes basadas en la homogeneidad del diseño de las regiones relevantes comprende al menos una de las siguientes medidas:
• la distancia media entre los centroides de las regiones relevantes;
• la distancia media entre los centroides de las regiones relevantes, normalizada con la diagonal de la imagen;
• la desviación estándar de la distancia media entre los centroides de las regiones relevantes;
• la distancia media normalizada entre los centroides de las regiones relevantes menos el radio de las regiones relevantes;
• la desviación estándar de la distancia media normalizada entre los centroides de las regiones
relevantes menos el radio de las regiones relevantes;
• la desviación estándar de la distancia media absoluta entre los centroides de las regiones relevantes menos el radio de las regiones relevantes.
La pluralidad de medidas de características relacionadas con la composición de imágenes basadas en la correlación de las posiciones que ocupan dichas regiones relevantes dentro del encuadre de dicha imagen comprende, al menos, una medida F
obtenida como:
donde (Cxj, Cyj) son las coordenadas del centroide...
Reivindicaciones:
l. Un método para clasificar una imagen respecto a una determinada cualidad subjetiva, donde dicho método comprende: -identificar las regiones relevantes y acentuadas de dicha imagen; -obtener una pluralidad de medidas de características relacionadas con la composición de dicha imagen, donde dichas características comprenden al menos una de las siguientes:
• una característica basada en el número de regiones relevantes y/o acentuadas de dicha imagen,
• una característica basada en la homogeneidad del diseño de dichas regiones relevantes,
• una características basada en la correlación de las posiciones que ocupan dichas regiones relevantes dentro del encuadre de dicha imagen;
- seleccionar al menos una medida de dicha pluralidad de medidas de características relacionadas con la composición de la imagen para clasificar dicha imagen respecto a una determinada cualidad subjetiva.
2. El método según la reivindicación 1, donde una región se define como relevante si su relevancia está por encima de un umbral, donde dicho umbral es un porcentaje de la relevancia de la región con máxima relevancia y donde dicha relevancia de una región se calcula como el producto de su tamaño por su brillo relativo, donde dicho brillo relativo se obtiene de determinadas tablas de brillos asociados a colores.
3. El método según la reivindicación 2, donde las regiones acentuadas se seleccionan mediante la inspección de los colores no asociados a ninguna región relevante siendo la mayor región de dichos colores no asociados a ninguna región relevante una región acentuada si su tamaño se encuentra por encima de un umbral, donde dicho umbral es un porcentaje de la suma de tamaños de todas las regiones de dicho color.
4. El método según cualquiera de las reivindicaciones anteriores, donde dicha pluralidad de medidas de características relacionadas con la composición de imágenes basadas en la homogeneidad del diseño de las regiones relevantes comprende al menos una de las siguientes medidas:
• la distancia media entre los centroides de las regiones relevantes;
• la distancia media entre los centroides de las regiones relevantes, normalizada con la diagonal de la imagen;
• la desviación estándar de la distancia media entre los centroides de las regiones relevantes;
• la distancia media normalizada entre los centroides de las regiones relevantes menos el radio de las regiones relevantes;
• la desviación estándar de la distancia media normalizada entre los centroides de las regiones
relevantes menos el radio de las regiones relevantes;
• la desviación estándar de la distancia media absoluta entre los centroides de las regiones relevantes menos el radio de las regiones relevantes.
5. EL método según cualquiera de las reivindicaciones
anteriores, donde dicha pluralidad de medidas de características relacionadas con la composición de imágenes basadas en la correlación de las posiciones que ocupan dichas regiones relevantes dentro del encuadre de dicha imagen comprende, al menos, una medida F obtenida como:
donde (Cxj, Cyj) son las coordenadas del centroide de la región relevante J, M es el número de regiones relevantes de la imagen y 0 se obtiene de la siguiente expresión:
donde li es la i-ésima línea divisora de una regla general
de composición de imágenes, D es el número de líneas de dicha regla general de composición de imágenes, a es la desviación estándar de una distribución 2G gaussiana discreta y K es un factor de normalización.
6. El método según la reivindicación 5, donde dicha regla general de composición de imágenes es la regla de los tercios.
7. El método según la reivindicación 5, donde dicha regla general de composición de imágenes es la regla de la media áurea o de los rectángulos áureos.
8 . El método según la reivindicación 5, donde dicha regla general de composición de imágenes es la regla de los
triángulos áureos o de los triángulos dorados.
9. El método según la reivindicación 8, donde ~ se evalúa para todas las posibles rotaciones del patrón de dicha regla de composición de imágenes.
10. El método según cualquiera de las reivindicaciones 5, 6, 7, 8 y 9, donde ~ se evalúa individualmente para cada línea del patrón de dicha regla general de composición de imágenes.
11. El método según cualquiera de las reivindicaciones 5,
6, 7, 8, 9 y 10, donde o-=Lmax/20, siendo Lmax la longitud del lado mayor de la imagen.
12. El método según cualquiera de las reívindicaciones 5, 6, 7, 8, 9, 1 O y 11, donde dicho factor de normalización se obtiene dividiendo por el número total de regiones relevantes, K=l/M.
13. Un sistema que comprende medios adaptados para llevar a cabo el método de cualquiera de las reivindicaciones anteriores.
14. Un programa informático que comprende medios de código de programa informático adaptados para realizar las etapas del método según cualquiera de las reivindicaciones de la 1 a la 12, cuando dicho programa se ejecuta en un ordenador, un procesador de señal digital, una disposición
Patentes similares o relacionadas:
Método y aparato de autentificación de identidad, terminal y servidor, del 29 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un método de autenticación de identidad, en donde el método comprende: adquirir información de rasgos faciales de un usuario y utilizar la información […]
Sistema de generación de marcador y método, del 29 de Julio de 2020, de NEC CORPORATION: Un sistema de generación de marcador que comprende: medios de entrada de imagen de vídeo para proporcionar como entrada una imagen de vídeo; […]
Dispositivo de procesamiento de imágenes, método de procesamiento de imágenes y programa, del 29 de Julio de 2020, de RAKUTEN, INC: Dispositivo de procesamiento de imágenes, que comprende: medios de obtención de imágenes captadas para la lectura de datos […]
PROCEDIMIENTO Y DISPOSITIVO DE REGISTRO AUTOMÁTICO DE LA LOCOMOCIÓN DE NEMATODOS U ORGANISMOS PEQUEÑOS DE TAMAÑOS SIMILARES POR INTERFEROMETRÍA TEMPORAL DE MICROHACES DE LUZ, del 23 de Julio de 2020, de PHYLUMTECH S.A: Procedimiento y dispositivo de registro automático de la locomoción de nematodos u organismos pequeños de tamaños similares por interferometría temporal de microhaces […]
MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE RECONOCIMIENTO BIOMÉTRICO, del 2 de Julio de 2020, de UNIVERSIDAD AUTONOMA DE MADRID: Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas […]
Método, dispositivo de generación de imagen y sistema para generar una medición de autenticidad de un objeto, del 1 de Julio de 2020, de SICPA HOLDING SA: Un método, llevado a cabo por un dispositivo de generación de imagen , para generar una medición de autenticidad de un objeto o para contribuir en la generación […]
Cámara inteligente para compartir fotografías automáticamente, del 1 de Julio de 2020, de QUALCOMM INCORPORATED: Un procedimiento para compartir una imagen final utilizando un dispositivo, en el que el procedimiento es realizado por un servidor y comprende: […]
Estimación de una postura basada en la silueta, del 24 de Junio de 2020, de VIZRT AG: Un método implementado por ordenador para estimar una postura de un modelo de objeto articulado , en el que el modelo de objeto articulado […]