Método para descubrir y reconocer patrones.

Método (200) para reconocer un concepto en una señal, por ejemplo una señal de voz, mediante un aparato, comprendiendo el método:

recibir

(210), mediante un receptor del aparato, una primera señal,

muestrear (215, 220, 225), mediante el aparato, la primera señal para formar una primera secuencia de símbolos unidimensional a partir de la primera señal recibida, por ejemplo usando cuantificación vectorial,

especificar la presencia de un concepto en la primera secuencia mediante una etiqueta de concepto, para cada etiqueta de concepto ck, variando k desde 1 hasta Nc, y para cada retardo ld dado, variando d desde 1 hasta Nl, donde un retardo ld indica una distancia de d elementos en la secuencia de símbolos:

obtener (230, 235), mediante el aparato, una matriz de frecuencia de transición T(ai, aj|ld, ck) de tamaño Nq x Nq, donde Nq es el número de posibles símbolos, incrementando el elemento de matriz en la posición i,j siempre que los símbolos ai y aj aparezcan en conjunto en la primera secuencia con el retardo ld en presencia de la etiqueta de concepto ck,

obtener (240), mediante el aparato, una matriz de probabilidad de transición P'(ai, aj|ld, ck) normalizando la matriz de frecuencia de transición T mediante todas las posibles transiciones

obtener, mediante el aparato, una matriz de probabilidad de etiqueta P(ai, aj|ld, ck) mediante

donde

recibir (270), mediante el receptor del aparato, una segunda señal, y

reconocer (280, 285), mediante el aparato, la presencia de un concepto en la posición t en una segunda secuencia de símbolos, que se forma a partir de la segunda señal recibida, como la etiqueta de concepto ck que maximiza el valor de

siendo i desde 1 hasta Nc.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FI2009/051041.

Solicitante: Aalto-Korkeakoulusäätiö.

Nacionalidad solicitante: Finlandia.

Dirección: PL 11000 00076 Aalto FINLANDIA.

Inventor/es: LAINE,UNTO, RÄSÄNEN,OKKO.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > RECONOCIMIENTO DE DATOS; PRESENTACION DE DATOS; SOPORTES... > Métodos o disposiciones para la lectura o el reconocimiento... > G06K9/62 (Métodos o disposiciones para el reconocimiento que utilizan medios electrónicos)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Reconocimiento de la voz (G10L 17/00 tiene prioridad) > G10L15/14 (utilizando técnicas de programación dinámica, p.ej. normalización temporal por comparación dinámica [DTW] (G10L 15/18  tiene prioridad))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Reconocimiento de la voz (G10L 17/00 tiene prioridad) > G10L15/18 (utilizando una modelización del lenguaje natural)

PDF original: ES-2536560_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método para descubrir y reconocer patrones Campo técnico de la invención La invención se refiere en general a un método para descubrir y reconocer patrones.

Antecedentes de la invención Una idea básica en todos los métodos para descubrir patrones es modelar regularidades estadísticas y comparar un modelo con una representación real con el fin de medir una similitud o similitudes entre el modelo creado (aprendido) y un patrón actual que está analizándose.

Uno de los métodos y técnicas conocidos utilizado para modelar y reconocer patrones en secuencias es el modelo de Markov, que supone que una secuencia que va a modelarse tiene la propiedad de Markov. Tener la propiedad de Markov significa que, dado un estado actual, los estados futuros son independientes de los estados pasados. Dicho de otro modo, la descripción del estado actual en sí misma capta completamente toda la información que podría influir en la evolución futura del procedimiento. Los estados futuros se alcanzarán a través de un procedimiento probabilístico en lugar de un procedimiento determinístico.

En cada etapa un sistema puede cambiar su estado del estado actual a otro estado, o permanecer en el mismo estado, según una cierta distribución de probabilidad. Los cambios del estado se denominan transiciones y las probabilidades asociadas con diversos cambios de estado se denominan probabilidades de transición.

Muchos procedimientos físicos y correspondientes secuencias observables, que se crean mediante los procedimientos físicos, tienen estructuras fuertes tales como estructuras temporales que pueden medirse mediante coeficientes de correlación de orden superior. Por tanto, dependiendo de la resolución temporal usada la secuencia creada puede tener estructuras amplias (por el tiempo o espacio) , que no pueden modelarse con precisión mediante una cadena de Markov en la que los estados futuros son independientes de los estados pasados.

Un objeto de la invención es proporcionar un método para descubrir y reconocer patrones, un producto de programa informático para descubrir y reconocer patrones y un aparato para descubrir y reconocer patrones.

Un objeto de la invención se alcanza proporcionando un método según la reivindicación 1, un producto de programa informático según la reivindicación 8 y un aparato según la reivindicación 9.

Una realización de la presente invención se refiere a un método según la reivindicación 1, una realización a un producto de programa informático según la reivindicación 8 y una realización a un aparato según la reivindicación 9.

En las reivindicaciones dependientes se definen realizaciones adicionales.

Según una realización de la invención un método comprende recibir una primera secuencia que comprende símbolos de primera secuencia en relación con el concepto y una etiqueta asociada a la primera secuencia, obtener matrices de probabilidad de transición a partir de matrices de frecuencia de transición que representan datos de frecuencia de incidencia de transiciones entre los símbolos de primera secuencia a diferentes distancias en la primera secuencia y aprender las matrices de probabilidad de transición para cada etiqueta y cada distancia para obtener una función de activación que determina el concepto que se produce en una segunda secuencia.

El método según las realizaciones de la invención puede realizarse en un aparato, que puede ser por ejemplo un sistema informático, un portátil o un teléfono móvil, en el que un software ejecuta el procedimiento para descubrir y reconocer patrones. En segundo lugar, el procedimiento para descubrir y reconocer patrones puede ejecutarse mediante un procesador (por ejemplo un chip de procesador de señal digital (DSP) ) , que se ha adaptado para realizar el procedimiento para descubrir y reconocer patrones.

El término "concepto" (patrón) se refiere a un cierto tipo de regularidad estadística en una secuencia (o entre dos secuencias diferentes) , que difiere de otros conceptos (otras regularidades) y forma un claro contraste con todas las irregularidades de tipo ruido.

El término "etiqueta" se refiere a una indicación, que está asociada con una secuencia o varias etiquetas están asociadas a la misma secuencia y estas asociaciones se denominan conceptos.

El término "transiciones" se refiere a pares de símbolos de secuencia (índice, indicador) . Los símbolos de secuencia

son los elementos básicos de las secuencias y los pares de símbolos de secuencia tienen distancias entre los símbolos de secuencia dentro de un par (Dicho de otro modo, cada par de símbolos tiene una cierta ubicación y distancia entre sí (diferencia en las ubicaciones) en la secuencia) .

Según una realización de la invención el método, que se da a conocer en una realización anterior, comprende recibir la primera información que comprende el concepto. La primera información puede ser por ejemplo voz o imagen.

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, comprende asociar la etiqueta a la primera secuencia.

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, comprende discretizar y cuantificar primera información que comprende el concepto y representar la primera información en forma de la primera secuencia unidimensional (1D) . Además, puede muestrearse información 2D visual (espacial) de diferentes maneras para formar secuencias 1D. Por este motivo la descripción detallada se limita solamente a la información secuencial (1D) . En un caso más complicado es posible tratar con un conjunto de secuencias 1D y también asociaciones entre estas secuencias (por ejemplo asociaciones entre representaciones de audio y visuales) .

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, recopila los datos de frecuencia de la incidencia de las transiciones entre los símbolos de secuencia en la primera secuencia. Se formula un grupo de matrices que comprende al menos una matriz, que consiste en los datos de frecuencia, para cada etiqueta. El número de las matrices en el grupo depende del número de las diferentes distancias de los pares de símbolos recopilados a partir de la secuencia y el número de etiquetas asociadas con conceptos (por ejemplo matriz M (a, b|distancia, etiqueta) , donde a*b define el tamaño de la matriz y el número de las matrices es igual a distancias por etiquetas) .

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, comprende almacenar los datos de frecuencia de la incidencia de las transiciones en la primera secuencia en las matrices de frecuencia de transición.

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, comprende normalizar las matrices de frecuencia de transición a las matrices de probabilidad de transición según ecuaciones representadas posteriormente (1) - (3) .

Según una realización de la invención en el método, que se da a conocer en cualquiera de las realizaciones anteriores, la (s) segunda (s) secuencia (s) se procesa (n) a partir de segunda información real que comprende el concepto discretizando y cuantificando la segunda información para representar la segunda información en forma de la (s) segunda (s) secuencia (s) .

Según una realización de la invención el método, que se da a conocer en cualquiera de las realizaciones anteriores, se usa para un reconocimiento de patrones en relación con por ejemplo un reconocimiento de voz o un reconocimiento de imagen. El algoritmo usado... [Seguir leyendo]

 


Reivindicaciones:

1. Método (200) para reconocer un concepto en una señal, por ejemplo una señal de voz, mediante un aparato, comprendiendo el método:

recibir (210) , mediante un receptor del aparato, una primera señal, muestrear (215, 220, 225) , mediante el aparato, la primera señal para formar una primera secuencia de símbolos unidimensional a partir de la primera señal recibida, por ejemplo usando cuantificación vectorial, especificar la presencia de un concepto en la primera secuencia mediante una etiqueta de concepto, para cada etiqueta de concepto ck, variando k desde 1 hasta Nc, y para cada retardo ld dado, variando d desde 1 hasta Nl, donde un retardo ld indica una distancia de d elementos en la secuencia de símbolos:

obtener (230, 235) , mediante el aparato, una matriz de frecuencia de transición T (ai, aj|ld, ck) de tamaño Nq x Nq, donde Nq es el número de posibles símbolos, incrementando el elemento de matriz en la posición i, j siempre que los símbolos ai y aj aparezcan en conjunto en la primera secuencia con el retardo ld en presencia de la etiqueta de concepto ck, obtener (240) , mediante el aparato, una matriz de probabilidad de transición P (ai, aj|ld, ck) normalizando la matriz de frecuencia de transición T mediante todas las posibles transiciones

** (Ver fórmula) **

obtener, mediante el aparato, una matriz de probabilidad de etiqueta P (ai, aj|ld, ck) mediante

** (Ver fórmula) **

donde

** (Ver fórmula) **

recibir (270) , mediante el receptor del aparato, una segunda señal, y reconocer (280, 285) , mediante el aparato, la presencia de un concepto en la posición t en una segunda secuencia de símbolos, que se forma a partir de la segunda señal recibida, como la etiqueta de concepto ck que maximiza el valor de

** (Ver fórmula) **

siendo i desde 1 hasta Nc.

2. Método según la reivindicación 1, que comprende además sumar las probabilidades de suma obtenidas en una ventana temporal que tiene una longitud que corresponde a una duración esperada del patrón que va a reconocerse para detectar la etiqueta de valor máximo.

3. Método según cualquier reivindicación anterior, en el que el resultado del reconocimiento se procesa mediante un filtrado de mediana o de paso bajo.

4. Método según cualquier reivindicación anterior, en el que una longitud de un filtro de mediana o paso bajo se estima mediante una longitud del patrón.

5. Método según cualquier reivindicación anterior, que comprende además almacenar (235) los datos de frecuencia recopilados de la incidencia de las transiciones en la primera secuencia en la matriz de frecuencia de transición T.

6. Método según cualquier reivindicación anterior, en el que la segunda señal se discretiza y cuantifica (275) para representarla en forma de segunda secuencia.

7. Método según cualquier reivindicación anterior, que se usa para un reconocimiento de voz o un reconocimiento de imagen.

8. Producto de programa informático configurado para ejecutar el método según cualquiera de las reivindicaciones 1-7, cuando el producto de programa informático se ejecuta mediante un procesador.

9. Aparato configurado para ejecutar el método según cualquiera de las reivindicaciones 1-7.