MÉTODO PARA EL RECONOCIMIENTO DE UNA SEÑAL DE SONIDO IMPLEMENTADO MEDIANTE MICROCONTROLADOR.

Método para el reconocimiento de señales, siempre que la señal esté limitada en el tiempo y sea periódica,

que comprende la obtención de la envolvente, la toma de muestras del valor instantáneo de su amplitud que mediante diversos parámetros temporales y su comparación con diferentes matrices de referencia, que permiten identificar su pertenencia a una de dichas matrices mediante el usode un microcontrolador de bajo coste, ya que la potencia de cálculo necesaria es para realizar operaciones básicas de cálculo, incorporadas en los microcontroladores más sencillos

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/ES2005/000484.

Solicitante: BILOOP TECNOLOGIC, S.L.

Nacionalidad solicitante: España.

Provincia: ILLES BALEARS.

Inventor/es: BARRERA VAZQUEZ,Juan Pedro , MECA CASTANY,Luis Gonzaga , PONS FULLANA,Gabriel.

Fecha de Publicación: .

Fecha Solicitud PCT: 7 de Septiembre de 2005.

Clasificación Internacional de Patentes:

  • G10L15/28 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › Detalles estructurales de sistemas de reconocimiento de la voz.
  • G10L17/00C

Clasificación PCT:

  • G10L15/02 G10L 15/00 […] › Extracción de características para el reconocimiento de la voz; Selección de la unidad de reconocimiento.
  • G10L15/28 G10L 15/00 […] › Detalles estructurales de sistemas de reconocimiento de la voz.
  • G10L17/00 G10L […] › Identificación o verificación de la persona que habla.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

MÉTODO PARA EL RECONOCIMIENTO DE UNA SEÑAL DE SONIDO IMPLEMENTADO MEDIANTE MICROCONTROLADOR.

Fragmento de la descripción:

Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador.

Objeto de la invención

La presente invención se refiere a un método para reconocer una forma de onda mediante la utilización de un microcontrolador de baja potencia de cálculo.

Su ámbito de aplicación es muy amplio siempre que la señal esté limitada en el tiempo y sea periódica, por ejemplo para diferenciar entre los diferentes tipos de llanto de un bebé, la rutina de una máquina, etc.

Antecedentes de la invención

Actualmente existen métodos para el reconocimiento de formas de onda basados en la utilización de un dispositivo electrónico conocido como Procesador Digital de Señal (o DSP).

Este tipo de dispositivos electrónicos se caracterizan por ofrecer una gran potencia de cálculo, pero tiene el inconveniente de un coste relativamente alto.

La potencia de cálculo que poseen, es necesaria para llevar a cabo el método tradicional de análisis de señal mediante la Transformada Rápida de Fourier (FFT). Este método, la FFT, convierte la señal desde el campo temporal al campo frecuencial, lo que facilita el análisis y el procesado de las señales en el ámbito de las frecuencias.

Los métodos de análisis de voz con dominio temporal están anticipados por ejemplo en la patente US2005/0131692.

Existen múltiples aplicaciones en el campo del procesado de las señales de sonido, tanto en el ámbito de la música como en el campo del reconocimiento de voz, todas ellas basadas en el uso de un tipo u otro de Procesador Digital de Señal (DSP).

Sin embargo, el gran coste asociado a este tipo de dispositivos electrónicos, impide su empleo en aquellos aparatos del campo de la electrónica de consumo, donde el coste es uno de los factores principales para juzgar la viabilidad de un aparato determinado.

Descripción de la invención

Para solucionar este inconveniente, un método de reconocimiento de forma de onda tal y como se define en la reivindicación 1 se puede implementar en un microcontrolador de bajo coste. Ello permite su utilización en todos aquellos aparatos de electrónica de consumo para los que antes estaba descartado.

Este método requiere que la señal a analizar sea limitada en el tiempo y repetitiva. Los ejemplos de este tipo de señales son múltiples, por ejemplo, el llanto de un niño, el ladrido de un perro, el ruido de una máquina, y en general todos aquellos sonidos repetitivos que emitan las personas, animales o cosas.

La originalidad del método reside en no utilizar un análisis de la señal en el campo de la frecuencia, sino en el campo temporal. Este cambio, por sí sólo, descarta la necesidad de usar la Transformada Rápida de Fourier y por lo tanto el empleo de los procesadores digitales de señal.

El método de la presente patente, descarta el uso de patrones almacenados en una memoria, con los cuales se compara la señal a analizar. En su lugar se realiza un procedimiento de identificación mediante un algoritmo de lógica difusa (Fuzzy Logic).

El uso de dicho algoritmo, permite absorber ciertas variaciones de amplitud en la señal de entrada que de otra forma serían descartadas como no coincidentes con un patrón. No obstante, se requiere que la señal a analizar tengo un margen dinámico muy reducido, por lo que es imprescindible un control automático de la amplitud de la señal que se analiza.

El método de análisis de señal, de esta invención, se basa en la utilización de un microcontrolador de bajo coste que incorpore un convertidor analógico/digital.

En el momento en que se detecte el comienzo de la señal periódica, comienza la fase de toma de muestras.

Mediante este convertidor se toman una serie de muestras a intervalos regulares, del valor de la amplitud de la envolvente de la señal.

No se toman muestras directas de la señal, sino que se obtiene previamente la forma de onda de su envolvente.

Esta diferencia es la clave para poder utilizar un dispositivo sin grandes exigencias en cuanto a potencia de cálculo, ya que transforma la señal a analizar en otra similar pero mucho más simple desde el punto de vista del análisis.

El hecho de que la señal sea repetitiva, nos permite tomar las muestras de la envolvente sólo durante un período de repetición de la señal.

La primera consecuencia es la reducción en la velocidad de la señal. Esto implica la posibilidad de usar un microcontrolador de baja potencia de cálculo.

En segundo lugar se produce un filtrado automático de las frecuencias altas, asociadas al ruido ambiente, con lo que el método posee una gran resistencia al ruido ambiente, si se compara con los métodos tradicionales.

En tercer lugar se elimina la información de frecuencia instantánea de la señal. Esto hace al método independiente de la frecuencia.

La baja frecuencia de la señal a analizar, permite tomar un número de muestras mucho mayor que el límite inferior de la frecuencia de Nyquist.

Para poder aplicar métodos de comparación por redundancia, se tomarán un número de muestras 2X veces la frecuencia de Nyquist.

Este sobre-muestreo de la señal a analizar, nos permite realizar el análisis de forma repetida con las dos secuencias de muestras.

Esta repetición del análisis nos permite comparar los resultados obtenidos según la secuencia de muestras analizada y aplicar diferentes algoritmos de validación que garantizan la fiabilidad del resultado final.

La redundancia de resultados obtenidos en series consecutivas de muestras, nos permite a su vez poder descartar aquellas que se hayan visto afectadas por un ruido de tipo impulsivo.

Para el caso en que se utilice este método en aparatos portátiles, hay que tener en cuenta el efecto sobre las muestras, producido por el desgaste de las baterías.

La forma en que se caracteriza la forma de onda a analizar está basada en la utilización de una matriz de parámetros temporales de la forma de onda.

A partir de las muestras tomadas, verificadas y con los errores corregidos, el microprocesador realiza una serie de cálculos para obtener los siguientes parámetros:

1.- Valor medio. 2.- Valor cuadrático medio. 3.- Ciclo de trabajo. 4.- Derivada de primer orden. 5.- Derivada de segundo orden. 6.- Valor Máximo. 7.- Valor Mínimo.

Para determinar si una señal pertenece a un conjunto de señales de referencia, se realiza una comparación entre los elementos obtenidos de la señal y los elementos de las diferentes matrices de referencia.

Para asignar la pertenencia de una matriz determinada a un grupo de referencia, ésta debe mostrar una correlación entre todos los elementos de la matriz superior a un índice determinado.

El valor de dicho índice se calcula de forma relativa con respecto a las demás matrices de referencia.

El hecho de que el índice no tenga un valor prefijado, nos permite aceptar formas de onda con valores de semejanza muy dispares en apariencia pero que tienen entre sí un alto grado de semejanza en varios elementos de la matriz.

Por ejemplo, el valor medio podría ser muy distinto del de referencia, pero si los valores del resto de los elementos tienen un alto grado de correlación, la identificación es positiva.

Este método, permite corregir de forma automática la disminución de los valores medios de la señal como consecuencia del desgaste de las baterías en los aparatos portátiles.

Hay que señalar que sólo se utilizan un número muy reducido de valores por cada señal a analizar (en esta caso siete), o lo que es lo mismo, muy pocos registros de la RAM del microprocesador.

En cuanto a las muestras, se toman el número máximo que permita la memoria RAM interna del microcontrolador (en este caso 64),...

 


Reivindicaciones:

1. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador, comprendiendo el método: obtener una envolvente en el dominio del tiempo de la señal; tomar muestras de la envolvente durante un periodo de repetición de la señal; obtener varios parámetros en el dominio del tiempo basándose en las muestras tomadas; comparar esos parámetros con diferentes matrices de referencia para identificar su pertenencia a una de dichas matrices.

2. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador según la reivindicación 1, caracterizado porque los parámetros de la señal que se comparan comprenden el valor medio, el valor cuadrático medio, el ciclo de trabajo, la primera derivada, la segunda derivada, el valor máximo y el valor mínimo, de la propia señal.

3. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador según la reivindicación 1, caracterizado por usar un regulador automático de volumen para compensar el cambio de los valores de la señal producido por el desgaste de las baterías en los aparatos portátiles.

4. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador según la reivindicación 1, caracterizado porque utiliza un método de ponderación de comparación relativa de los parámetros de medida, basado en los principios de "lógica difusa" para incrementar el índice de aciertos.

5. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador según la reivindicación 1, caracterizado porque utiliza el análisis temporal de una señal mediante un microcontrolador con muy poca capacidad de memoria.

6. Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador según la reivindicación 1, caracterizado porque utiliza un control automático de nivel de la señal de entrada, de modo que el resultado del análisis sea casi independiente de la distancia de captación del sonido.


 

Patentes similares o relacionadas:

Método y aparato de intercambio de información, del 20 de Mayo de 2020, de Advanced New Technologies Co., Ltd: Un método de intercambio de información, realizado en un dispositivo terminal, caracterizado porque el método comprende: determinar […]

Imagen de 'Máquina de cocina eléctricamente accionada con dispositivo de…'Máquina de cocina eléctricamente accionada con dispositivo de reconocimiento de voz, del 11 de Julio de 2018, de VORWERK & CO. INTERHOLDING GMBH: Máquina de cocina eléctricamente accionada que comprende - un dispositivo de reconocimiento de voz que está concebido para comparar señales de voz de un usuario […]

Sistema y método de diálogo de múltiples intervalos, del 22 de Febrero de 2017, de 24/7 Customer, Inc: Un sistema para construir y procesar un diálogo de múltiples intervalos con un usuario, que comprende: un procesador; e instrucciones de software que cuando se ejecutan […]

Procedimiento, servidor y sistema para la transcripción de lengua hablada, del 25 de Diciembre de 2013, de VerbaVoice GmbH: Un procedimiento de transcripción para la transcripción de lengua hablada en texto continuo para un usuario (U) que comprende las etapas de: (a) introducir una lengua […]

Cuantificación de la frecuencia fundamental para el reconocimiento de voz distribuido, del 14 de Noviembre de 2012, de Motorola Mobility LLC (50.0%): Un método para un sistema de procesamiento de información para cuantificar la información de la frecuenciafundamental de audio, que comprende: capturar audio […]

Imagen de 'Procedimiento y dispositivo de conversión de voz'Procedimiento y dispositivo de conversión de voz, del 24 de Agosto de 2012, de Mobiter Dicta Oy: Dispositivo electrónico para facilitar un procedimiento de conversión de voz a texto, que comprende: - unos medios de entrada de voz para obtener una señal […]

SISTEMA DE RECONOCIMIENTO QUE UTILIZA ARBOLES LEXICOS., del 1 de Septiembre de 2005, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: Sistema de procesamiento dinámico, que comprende una estructura de datos en árbol implementada en una memoria legible por ordenador, accesible […]

Imagen de 'PROCEDIMIENTO Y SISTEMA PARA EDITAR TEXTO EN UN DISPOSITIVO ELECTRONICO…'PROCEDIMIENTO Y SISTEMA PARA EDITAR TEXTO EN UN DISPOSITIVO ELECTRONICO DE MANO, del 17 de Marzo de 2010, de NOKIA CORPORATION: Un procedimiento de modificación de texto , controlada por la voz, en un dispositivo electrónico de mano, en una sesión de edición, incluyendo […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .