Método y sistema para analizar una imagen generada mediante al menos una cámara.

Un método para analizar una imagen de un objeto real generada mediante al menos una cámara

(11), que comprende:

- generar al menos una primera imagen (15) mediante la cámara (11) capturando al menos un objeto (12) real proporcionado con un sistema (17) de coordenadas de objeto,

- definir un primer dominio (D1) de búsqueda que comprende múltiples conjuntos (51 - S5) de datos del objeto (12) real, siendo cada uno de los conjuntos de datos indicativo de una porción (P1 - P10) respectiva del objeto real.

- analizar al menos una propiedad característica de la primera imagen de la cámara con respecto al primer dominio (D1) de búsqueda, para determinar si la al menos una propiedad característica corresponde a información (F1 - F3) de al menos uno particular de los conjuntos de datos (S1 - 55) del primer dominio (D1) de búsqueda,

- si se determina que la al menos una propiedad característica corresponde a información (F1 - F3) de al menos uno (S1, S1a, S1b) particular de los conjuntos de datos, que define un segundo dominio (D2) de búsqueda que comprende un número (S1) reducido de los conjuntos de datos en comparación con el primer dominio (D1) de búsqueda y usar el segundo domino (D2) de búsqueda para analizar al menos una segunda imagen (16), o la primera imagen (15) y al menos una segunda imagen (16) generada mediante la cámara,

- analizar al menos una propiedad característica de la segunda imagen (16) de la cámara con respecto al segundo dominio (D2) de búsqueda, para determinar si la al menos una propiedad característica de la segunda imagen corresponde a información (F1 - F3) de uno (S1, S1a, S1b) particular de los conjuntos de datos del segundo dominio de búsqueda,

y para identificar el objeto (12) real y la posición y orientación del sistema (17) de coordenadas de objeto con respecto a la cámara (11),

donde analizar una imagen con respecto al primer dominio de búsqueda incluye un primer algoritmo y analizar una imagen con respecto al segundo dominio de búsqueda incluye un segundo algoritmo, que es diferente del primer algoritmo, donde el primer algoritmo calcula una representación compacta de un rasgo que es invariable a diferentes posiciones de cámara o cambios de luz, y el segundo algoritmo funciona pudiendo encontrar y coincidir un rasgo usando una estructura de datos optimizada que se proporciona al segundo algoritmo y en el que se almacenan las características de un rasgo específico desde muchas vistas diferentes.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2008/009481.

Solicitante: metaio GmbH.

Nacionalidad solicitante: Alemania.

Dirección: Hackerbrücke 6 80335 München ALEMANIA.

Inventor/es: MEIER, PETER, LIEBERKNECHT,SEBASTIAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)

PDF original: ES-2482997_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

E08875012

DESCRIPCIÓN

Método y sistema para analizar una imagen generada mediante al menos una cámara La presente invención se refiere a un método y sistema para analizar una imagen generada mediante al menos una cámara, donde la al menos una imagen se genera mediante la cámara capturando al menos un objeto de medio impreso.

En la técnica anterior se conocen aplicaciones que aumentan objetos de medio impreso, tales como libros convencionales, con objetos virtuales usando la denominada tecnología de Realidad Aumentada (RA) : H.K.U.I.P. Mark Billinghurst, The Magic Book: A transitional AR interface, Computers and Graphics, 25 (5) , 2001, páginas 745 753 y John McKenzie y Doreen Darnell, The eyeMagic Book -A Report into Augmented Reality Stor y telling in the Context of a Childrenâ?s Workshop, 2003.

En tal aplicación, una cámara acoplada a un ordenador toma una imagen de un libro leído por una persona, donde el libro se presenta en una pantalla de visualización y pueden presentarse objetos virtuales además de la imagen del mundo real que contiene el libro, de modo que el libro presentado en la pantalla de visualización se aumenta con objetos virtuales de cualquier tipo en una pantalla de visualización. En tal aplicación, para aumentar la imagen con objetos virtuales, existe la necesidad para que el sistema informático identifique el objeto real, tal como una respectiva página del libro, y su posición y orientación con respecto a la cámara para presentar correctamente el objeto virtual en la imagen tomada mediante la cámara.

Generalmente, cada página doble, es decir las páginas del libro que son simultáneamente visibles cuando se lee el libro, se representan mediante un respetivo conjunto de datos almacenado en el sistema informático. Cuando el libro se sitúa con una página doble abierta sobre una mesa, por ejemplo, y la cámara está tomando una imagen del libro, la imagen de la cámara está capturando la página doble abierta delante de la cámara. Para identificar una página doble particular del libro para presentar correctamente el objeto virtual en la imagen de esa página doble, se requiere que el sistema informático compare uno o más rasgos de la imagen tomada mediante la cámara con todos los conjuntos de datos almacenados en el sistema informático para el libro, cuyo proceso es consume bastante tiempo y requiere gran rendimiento de procesamiento del sistema informático.

Antunez E. et al.: â??HOTPAPER: Multimedia Interaction with Paper using Mobile Phonesâ?? INTERNET, [En línea] 26 de octubre -31 de octubre de 2008, páginas 399-408 desvela un algoritmo de reconocimiento de documento que determina automáticamente la localización de un pedazo del texto en una gran colección de imágenes de documento proporcionando una imagen de documento pequeña. Un algoritmo de Codificación de Muro de Ladrillos (BWC) proporciona una imagen de consulta desde la que se extraen cajas que limitan palabras y se representan mediante vectores de rasgo de BWC. Los vectores de rasgo de BWC se someten a consultas a una base de datos, y los pedazos del documento original que contienen rasgos de BWC en la imagen de consulta se recuperan con búsqueda de troceo. Los N mejores pedazos de documento recuperados candidatos que tienen el número más alto de rasgos de BWC se identifican a continuación para una etapa de verificación geométrica posterior. En esta etapa, se calcula la similitud de localizaciones relativas de sus descriptores para la imagen de consulta buscando el pedazo de documento con la mejor puntuación.

Es por lo tanto un objeto de la invención proporcionar un método y un sistema para analizar una imagen de un objeto 45 real generada mediante al menos una cámara que puede realizarse con requisitos de procesamiento reducidos y/o a una velocidad de procesamiento más alta.

La invención se refiere a un método de acuerdo con los rasgos de la reivindicación 1. Adicionalmente, la invención se refiere a un sistema de acuerdo con los rasgos de la reivindicación 12 y un producto programable informático de acuerdo con la reivindicación 13.

De acuerdo con un primer aspecto de la invención, se desvela un método para analizar una imagen de un objeto real generado mediante al menos una cámara, donde el método comprende las siguientes etapas: generar al menos una primera imagen mediante la cámara capturando al menos un objeto real, definir un primer dominio de búsqueda que 55 comprende múltiples conjuntos de datos del objeto real, siendo cada uno de los conjuntos de datos indicativo de una porción respectiva del objeto real, y analizar al menos una propiedad característica de la primera imagen de la cámara con respecto al primer dominio de búsqueda, para determinar si la al menos una propiedad característica corresponde a información de al menos uno particular de los conjuntos de datos del primer dominio de búsqueda. Si se determina que la al menos una propiedad característica corresponde a información de al menos uno particular de los conjuntos de datos, el método incluye la etapa de definir un segundo dominio de búsqueda que comprende un número reducido de los conjuntos de datos en comparación con el primer dominio de búsqueda y usar el segundo dominio de búsqueda para analizar la primera imagen y/o al menos una segunda imagen generada mediante la cámara.

Por lo tanto, el método proporciona la ventaja de que para analizar al menos una segunda y siguientes imágenes generadas mediante la cámara, cualquier dominio de búsqueda predefinido usado para analizar las imágenes puede E08875012

reducirse significativamente a un tamaño más pequeño, particularmente para comprender únicamente el conjunto de datos o conjuntos de datos para los que se ha encontrado una correspondencia previa, de modo que es necesaria menos potencia de procesamiento para el proceso de análisis y/o puede aumentarse la velocidad de procesamiento.

Una realización de la invención comprende que el objeto real sea un objeto de medio impreso que es un objeto ventajoso para el que la presente invención puede aplicarse.

La invención usa ventajosamente el hallazgo de los presentes inventores que en ciertas aplicaciones todas las porciones de un objeto real, tales como todas las páginas de un libro, no pueden capturarse mediante la cámara simultáneamente. En su lugar, tomando una imagen de un objeto real, tal como un libro, únicamente una porción particular de ese objeto, tal como una página doble particular de un libro, puede capturarse a la vez mediante la cámara. La invención usa este hallazgo en que el dominio de búsqueda para el siguiente proceso de análisis se reduce a un número reducido de conjuntos de datos una vez que ha encontrado que existe una correspondencia entre al menos una propiedad característica de la imagen actual y una particular de los conjuntos de datos.

Las realizaciones de un objeto de medio impreso como se entiende en el contexto de la presente invención incluyen, por ejemplo, un libro, una revista impresa, un periódico, un catálogo, una carpeta o cualquier otro tipo de dispositivo usado de la misma manera o similar o para el mismo fin o similar. Generalmente, un objeto de medio impreso, como puede usarse con la presente invención, puede ser un impreso, sustancialmente plano o incluso un objeto que comprende una o más páginas impresas que pueden darse la vuelta mediante un usuario desde una página o página doble a otra página o página doble, respectivamente, y puede situarse delante de una cámara. La invención puede aplicarse también a otros tipos de objetos reales que tienen porciones y conjuntos de datos correspondientes que no son visibles simultáneamente.

Particularmente, el método incluye la etapa de analizar al menos una propiedad... [Seguir leyendo]

 


Reivindicaciones:

E08875012

1. Un método para analizar una imagen de un objeto real generada mediante al menos una cámara (11) , que comprende:

- generar al menos una primera imagen (15) mediante la cámara (11) capturando al menos un objeto (12) real proporcionado con un sistema (17) de coordenadas de objeto, -definir un primer dominio (D1) de búsqueda que comprende múltiples conjuntos (51 -S5) de datos del objeto (12) real, siendo cada uno de los conjuntos de datos indicativo de una porción (P1 -P10) respectiva del objeto real. -analizar al menos una propiedad característica de la primera imagen de la cámara con respecto al primer dominio (D1) de búsqueda, para determinar si la al menos una propiedad característica corresponde a información (F1 -F3) de al menos uno particular de los conjuntos de datos (S1 -55) del primer dominio (D1) de búsqueda, -si se determina que la al menos una propiedad característica corresponde a información (F1 -F3) de al menos uno (S1, S1a, S1b) particular de los conjuntos de datos, que define un segundo dominio (D2) de búsqueda que comprende un número (S1) reducido de los conjuntos de datos en comparación con el primer dominio (D1) de búsqueda y usar el segundo domino (D2) de búsqueda para analizar al menos una segunda imagen (16) , o la primera imagen (15) y al menos una segunda imagen (16) generada mediante la cámara, -analizar al menos una propiedad característica de la segunda imagen (16) de la cámara con respecto al segundo dominio (D2) de búsqueda, para determinar si la al menos una propiedad característica de la segunda imagen corresponde a información (F1 -F3) de uno (S1, S1a, S1b) particular de los conjuntos de datos del segundo dominio de búsqueda, y para identificar el objeto (12) real y la posición y orientación del sistema (17) de coordenadas de objeto con respecto a la cámara (11) , donde analizar una imagen con respecto al primer dominio de búsqueda incluye un primer algoritmo y analizar una imagen con respecto al segundo dominio de búsqueda incluye un segundo algoritmo, que es diferente del primer algoritmo, donde el primer algoritmo calcula una representación compacta de un rasgo que es invariable a diferentes posiciones de cámara o cambios de luz, y el segundo algoritmo funciona pudiendo encontrar y coincidir un rasgo usando una estructura de datos optimizada que se proporciona al segundo algoritmo y en el que se almacenan las características de un rasgo específico desde muchas vistas diferentes.

2. El método de la reivindicación 1, donde el objeto (12) real es un objeto de medio impreso.

3. El método de la reivindicación 1 o 2, donde el segundo dominio (D2) de búsqueda se define para comprender únicamente el uno (S1) particular de los conjuntos de datos (51 -55) o únicamente los conjuntos (S1a, S1b) de datos siendo indicativos de al menos una parte de una página (P1/P2) doble particular que comprende la propiedad característica.

4. El método de una de las reivindicaciones 1 a 3, que incluye adicionalmente las etapas de

- establecer un periodo de tiempo o un número de imágenes capturadas mediante la cámara para analizar imágenes posteriores con respecto al segundo dominio (D2) de búsqueda, y -si se determina que ninguna de las propiedades características de las imágenes posteriores corresponde a información (F1 -F3) de uno (S1, S1a, 45 S1b) particular de los conjuntos de datos del segundo dominio (D2) de búsqueda en el periodo de tiempo establecido o en el número de imágenes capturadas, usar el primer dominio (D1) de búsqueda para analizar al menos una imagen adicional capturada mediante la cámara.

5. El método de una de las reivindicaciones 1 a 4, que incluye adicionalmente las etapas de 50 -presentar la primera y segunda imágenes (15, 16) en un medio (13) de presentación de imagen, -donde la al menos una de las imágenes (15, 16) se aumenta con al menos un objeto virtual usando una tecnología de Realidad Aumentada.

6. El método de una de las reivindicaciones 1 a 5, donde el objeto (12) real es un objeto de medio impreso y cada uno de los conjuntos (S1 -55) de datos es indicativo de una página o página doble (P1 -P10) respectiva del objeto (12) de medio impreso.

7. El método de una de las reivindicaciones 1 a 6, donde la etapa de analizar la al menos una propiedad 60 característica de la primera imagen (15) y de la segunda imagen (16) incluye analizar al menos un rasgo de la imagen respectiva.

8. El método de una de las reivindicaciones 1 a 7, donde la etapa de analizar la al menos una propiedad característica de la primera imagen (15) y de la segunda imagen (16) incluye aplicar un algoritmo de rastreo sin 65 marcador.

E08875012

9. Un sistema (1) para analizar una imagen, que comprende:

- una cámara (11) para generar al menos una primera y segunda imágenes (15, 16) capturando al menos un objeto (12) real, -una unidad (14) de procesamiento conectada con la cámara (11) y programada para realizar las siguientes etapas: -definir un primer dominio (D1) de búsqueda que comprende múltiples conjuntos (S1 -S5) de datos del objeto (12) real, siendo cada uno de los conjuntos de datos indicativo de una porción (P1 -P10) respectiva del objeto real, -analizar al menos una propiedad característica de la primera imagen (15) de la cámara con respecto al primer dominio (D1) de búsqueda, para determinar si la al menos una propiedad característica corresponde a información (F1 -F3) de al menos uno particular de los conjuntos (S1 -S5) de datos del primer dominio (D1) de búsqueda, -si se determina que la al menos una propiedad característica corresponde a información (F1 -F3) del al menos uno (S1) particular de los conjuntos de datos, definir un segundo dominio (D2) de búsqueda que comprende un número (S1) reducido de los conjuntos de datos en comparación con el primer dominio (D1) de búsqueda y usar el segundo dominio (D2) de búsqueda para analizar al menos una segunda imagen (16) , o la primera imagen (15) y al menos una segunda imagen (16) generada mediante la cámara, -analizar al menos una propiedad característica de la segunda imagen (16) de la cámara con respecto al segundo dominio (D2) de búsqueda, para determinar si la al menos una propiedad característica de la segunda imagen corresponde a información (F1 -F3) de uno particular (S1, S1a, S1b) de los conjuntos de datos en el segundo dominio de búsqueda, y para identificar el objeto (12) real y la posición y orientación de un sistema (17) de coordenadas de objeto con respecto a la cámara (11) , donde analizar una imagen con respecto al primer dominio de búsqueda incluye un primer algoritmo y analizar una imagen con respecto al segundo dominio de búsqueda incluye un segundo algoritmo, que es diferente del primer algoritmo, donde el primer algoritmo calcula una representación compacta de un rasgo que es invariable a diferentes posiciones de cámara o cambios de luz, y el segundo algoritmo funciona pudiendo encontrar y coincidir un rasgo usando una estructura de datos optimizada que está presente en la memoria de la unidad de procesamiento y en la que se almacenan las características de un rasgo específico desde muchas vistas diferentes.

10. Producto programable informático que tiene secciones de código de software que están adaptadas para llevar a cabo el método de acuerdo con una de las reivindicaciones 1 a 9 cuando las secciones de código se cargan en una 35 memoria interna de un dispositivo informático.