SISTEMA Y PROCEDIMIENTO DE DETECCION E IDENTIFICACION DE SONIDOS EN TIEMPO REAL PRODUCIDOS POR FUENTES SONORAS ESPECIFICAS.

Sistema y procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas,

que comprende: muestrear, una señal analógica de audio captada por unos medios sensores (1) a partir de al menos una fuente sonora objetivo (2); digitalizar la señal muestreada; enventanar la señal digitalizada para obtener tramas de carácter estacionario; extraer, para cada trama, al menos un vector de características; clasificar los vectores de características extraídos; estandarizar la salida de la clasificación; almacenar la señal de salida normalizada; suavizar la señal de salida normalizada almacenada y marcar y extraer eventos sonoros de la señal suavizada a partir de unos parámetros configurados por el usuario.Adicionalmente, comprende una etapa de optimización que permite obtener indicadores estadísticos en la detección y unir eventos sonoros temporalmente próximos de acuerdo a un parámetro configurable por el usuario

Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P200930730.

Solicitante: UNIVERSIDAD POLITECNICA DE MADRID.

Nacionalidad solicitante: España.

Provincia: MADRID.

Inventor/es: RUIZ GONZALEZ,MARIANO, RECUERO LOPEZ,MANUEL, ASENSIO RIVERA,CESAR.

Fecha de Solicitud: 24 de Septiembre de 2009.

Fecha de Publicación: .

Fecha de Concesión: 5 de Julio de 2011.

Clasificación Internacional de Patentes:

  • G01H3/08 FISICA.G01 METROLOGIA; ENSAYOS.G01H MEDIDA DE VIBRACIONES MECANICAS O DE ONDAS ULTRASONORAS, SONORAS O INFRASONORAS.G01H 3/00 Medida de vibraciones utilizando un detector en un fluido (G01H 7/00, G01H 9/00, G01H 11/00 tienen prioridad). › Análisis de las frecuencias presentes en vibraciones complejas, p. ej. comparando los armónicos presentes.
  • G10L15/14 G […] › G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › utilizando técnicas de programación dinámica, p. ej. normalización temporal por comparación dinámica [DTW] (G10L 15/18  tiene prioridad).

Clasificación PCT:

  • G01H3/08 G01H 3/00 […] › Análisis de las frecuencias presentes en vibraciones complejas, p. ej. comparando los armónicos presentes.
  • G10L15/14 G10L 15/00 […] › utilizando técnicas de programación dinámica, p. ej. normalización temporal por comparación dinámica [DTW] (G10L 15/18  tiene prioridad).

Fragmento de la descripción:

Sistema y procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas.

Campo de la invención

La invención se encuadra en el campo técnico de los procesos de monitorización de contaminantes ambientales, concretamente en lo relativo a la medida y monitorización de las emisiones e inmisiones acústicas producidas por los medios del transporte.

Estado de la técnica

La contaminación acústica se ha convertido en una de las principales preocupaciones en materia medioambiental de nuestra sociedad. Dicha preocupación ha propiciado la aparición de legislación comunitaria, nacional, autonómica y local cuyo objetivo consiste en gestionar y reducir la contaminación acústica y sus efectos sobre las personas y el medio ambiente.

En este sentido, en relación a las infraestructuras del transporte, y de modo muy especial en los aeropuertos y líneas ferroviarias, el monitorado del ruido se convierte en una herramienta de suma importancia para la gestión del ruido, la planificación del territorio y la adopción de planes de acción.

Los terminales de monitorado de ruido ambiental, que se utilizan fundamentalmente en los aeropuertos, realizan una medición del nivel de ruido ambiental, y evalúan la aportación de las fuentes sonoras objetivo (según el caso aeronaves, trenes,...) al ambiente sonoro general. Para ello deben ser capaces de medir la evolución temporal del ruido, identificar eventos sonoros y clasificar aquellos que se correspondan con los producidos por la fuente sonora objetivo.

Por ejemplo, en lo referente al ruido de aeronaves, la propuesta de norma ISO/FDIS 20906, "Unattended monitoring of aircraft sound in the vicinity of airports", establece los siguientes requisitos (traducido):

- La incertidumbre expandida del nivel de exposición sonora acumulado para todos los eventos sonoros de aeronaves no excederá de 3 dB.

- Al menos el 50% de los eventos sonoros provocados verdaderamente por aeronaves serán correctamente clasificados como ruido de aeronaves.

- El número de eventos sonoros no provocado por aeronaves que es clasificado de forma incorrecta como ruido de aeronaves es menor que el 50% del número de verdaderos eventos sonoros producidos por aeronaves.

Es precisamente en este aspecto de la identificación del origen del ruido, donde los sistemas existentes en el mercado presentan las principales carencias.

Un sistema básico de monitorado de ruido realiza la detección de eventos mediante la utilización de umbrales, efectuando el marcado de eventos cuando el nivel sonoro L(t) supera el umbral definido, de forma ininterrumpida, un intervalo temporal predefinido.

Las técnicas de reconocimiento de patrones y reconocimiento automático de habla han sido aplicadas previamente al reconocimiento de fuentes de ruido ambiental. Sin embargo, el ámbito de actuación no permite concluir que los buenos resultados obtenidos en laboratorio (u otros entornos específicos controlados) puedan ser generalizados, y extrapolados a ambientes reales, en los que predominen altos niveles de ruido de fondo.

En el caso de ruido de aeronaves, los sistemas comerciales más avanzados, se integran con el sistema de radar del aeropuerto, de manera que son capaces de detectar eventos sonoros y determinar si los ha producido una aeronave en función de la distancia a la aeronave más cercana. Sin embargo este tipo de técnicas, que no realizan las tareas de identificación a partir del análisis de la señal audio, presentan problemas debido a que para poder clasificar un evento sonoro es necesario detectarlo previamente mediante umbrales de nivel.

Era por tanto deseable un sistema de detección e identificación de eventos sonoros producidos por una fuente sonora objetivo, que permitiera optimizar los procesos ya conocidos de detección, identificación, medida, monitorado o inspección de los indicadores acústicos asociados a una determinada fuente de ruido ambiental, independizando dicha tarea de elementos ajenos (como el radar), y que permitiera complementar el funcionamiento de los monitores de ruido (y sonómetros) comerciales.

Descripción de la invención

La presente invención resuelve los problemas existentes en el estado de la técnica mediante un sistema de detección de eventos sonoros en función del grado de semejanza con la fuente sonora objetivo, de forma independiente del nivel sonoro absoluto alcanzado, minimizando así la importancia del ruido de fondo existente en la zona.

La invención dispone de un sensor, o entrada equivalente, que le permite analizar el sonido existente a partir de una señal audio analógica. Dicha señal es muestreada y digitalizada en tiempo real (en este aspecto cabe destacar que la invención realiza la detección de la fuente objetivo en tiempo real, por lo que no es necesario almacenar la totalidad del sonido para poder efectuar la clasificación, minimizando los costes de transmisión y/o almacenamiento).

A continuación se produce un proceso de enventanado y extracción de vectores de características. Cada trama es representada por un único vector de características que será la entrada del sistema de clasificación o reconocimiento de patrones. El sistema de clasificación contará con una configuración de entrenamiento por defecto, y dejará abierta la posibilidad a nuevas configuraciones.

La salida del clasificador será normalizada, tomando valores entre 0 y 1 según el grado de semejanza del vector con la representación vectorial del sonido producido por la fuente sonora objetivo. Esta salida, denominada ANL (Aircraft Noise Likeness) indica la probabilidad de pertenencia del vector evaluado a la clase objetivo, en este caso, a la fuente sonora objetivo. Este índice ANL es refrescado continuamente, conforme al tamaño de la ventana y grado de solapamiento definidos. Su seguimiento permite la detección del sonido producido por fuentes sonoras objetivo.

La secuencia ANL es almacenada en memoria y suavizada, recibiendo el nombre de soft ANL, para proceder al marcado y extracción de eventos sonoros provocados por la fuente sonora objetivo.

La extracción de eventos se realiza en paralelo a la generación del índice ANL, pudiendo ser la cadencia de representación distinta de la de generación de la misma. La extracción de eventos sonoros se efectúa en función de un umbral y una duración definidos por el usuario, lo que le permitirá adecuar el funcionamiento del sistema al entorno acústico donde se efectúen las medidas.

Finalmente, el sistema realiza un proceso de optimización, que permite añadir criterios estadísticos a la detección, y une eventos sonoros temporalmente próximos.

Las salidas ofrecidas por la invención serán las siguientes:

- evolución temporal del índice ANL;

- evolución temporal del índice soft ANL;

- listado de eventos correspondientes a la fuente sonora objetivo, caracterizados por:

\medcirc instante de inicio del evento, \medcirc instante de finalización del evento, \medcirc indicadores estadísticos del índice ANL durante el evento.

El procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, comprende las siguientes etapas:

a) muestrear, una señal analógica de audio producida por una fuente sonora objetivo y captada por unos medios sensores;

b) digitalizar la señal muestreada;

c) enventanar la señal digitalizada para obtener tramas de carácter estacionario;

d) extraer, para cada trama, al menos un vector de características para su clasificación;

e) detectar, mediante identificación por clasificación, los sonidos producidos por la fuente sonora objetivo, comprendiendo:

\medcirc clasificar los vectores de características extraídos para...

 


Reivindicaciones:

1. Procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, caracterizado porque comprende las siguientes etapas:

a) muestrear, una señal analógica de audio producida por una fuente sonora objetivo (2) y captada por unos medios sensores (1);

b) digitalizar la señal muestreada;

c) enventanar la señal digitalizada para obtener tramas de carácter estacionario;

d) extraer, para cada trama, al menos un vector de características para su clasificación mediante la obtención de trece coeficientes MFCC (Mel Frequency Cepstra Coefficients);

e) detectar, mediante identificación por clasificación, los sonidos producidos por la fuente sonora objetivo (2), comprendiendo:

\medcirc clasificar los vectores de características extraídos mediante un clasificador uniclase para obtener una salida que indica el grado de semejanza de los vectores de características con la representación vectorial del sonido producido por la fuente sonora objetivo (2) identificando la fuente sonora a la que pertenecen dichos sonidos; \medcirc normalizar la salida de la clasificación anterior para obtener la probabilidad de pertenencia de los vectores de características a la fuente sonora objetivo (2); \medcirc almacenar la señal de salida normalizada; \medcirc suavizar la señal de salida normalizada almacenada para eliminar las irregularidades de la misma; \medcirc extraer y marcar temporalmente los eventos sonoros de la señal suavizada a partir de parámetros configurables por el usuario.

2. Procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según la reivindicación anterior, caracterizado porque comprende una etapa de optimización que permite obtener indicadores estadísticos en la detección y unir eventos sonoros mediante la configuración de un parámetro por el usuario, obteniéndose en dicha etapa de optimización:

• el instante de inicio del evento;

• el instante de fin del evento;

• indicadores estadísticos de la salida normalizada de la etapa e), a su vez comprendiendo el valor medio de dicha salida y una pluralidad de percentiles.

3. Procedimiento automático de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según cualquiera de las reivindicaciones anteriores, caracterizado porque la extracción de eventos sonoros se realiza en función de un umbral y una duración definidos por el usuario.

4. Procedimiento de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según cualquiera de las reivindicaciones anteriores, caracterizado porque el enventanado permite configurar el tamaño de ventana y el grado de solapamiento.

5. Sistema de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, caracterizado porque comprende:

• unos medios sensores (1) configurados para obtener señales analógicas de audio a partir de al menos una fuente sonora objetivo (2);

• unos medios de procesamiento (3) configurados para la realización de las siguientes etapas:

f) muestrear, una señal analógica de audio producida por la fuente sonora objetivo (2) y captada por los medios sensores (1); g) digitalizar la señal muestreada; h) enventanar la señal digitalizada para obtener tramas de carácter estacionario; i) extraer, para cada trama, al menos un vector de características para la detección de eventos sonoros de la fuente sonora objetivo (2) mediante la obtención de trece coeficientes MFCC (Mel Frequency Cepstra Coefficients); j) detectar, mediante identificación por clasificación, los sonidos producidos por la fuente sonora objetivo (2), comprendiendo: \medcirc clasificar los vectores de características extraídos mediante un clasificador uniclase para obtener una salida que indica el grado de semejanza de los vectores de características con la representación vectorial del sonido producido por la fuente sonora objetivo (2) identificando la fuente sonora a la que pertenecen dichos sonidos; \medcirc normalizar la salida de la clasificación anterior para obtener la probabilidad de pertenencia de los vectores de características a la fuente sonora objetivo (2); \medcircalmacenar la señal de salida normalizada; \medcirc suavizar la señal de salida normalizada almacenada para eliminar las irregularidades de la misma; \medcircextraer y marcar temporalmente los eventos sonoros de la señal suavizada a partir de parámetros configurables por el usuario.

6. Sistema de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según la reivindicación 5, caracterizado porque los medios de procesamiento (3) están configurados para realizar una etapa de optimización que permite obtener indicadores estadísticos en la detección y unir eventos sonoros temporalmente próximos de acuerdo a un parámetro configurable por el usuario, obteniéndose en dicha etapa de optimización:

• el instante de inicio del evento;

• el instante de fin del evento;

• indicadores estadísticos de la salida estandarizada de la etapa j), a su vez comprendiendo el valor medio de dicha salida y una pluralidad de percentiles.

7. Sistema de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según cualquiera de las reivindicaciones 5-6, caracterizado porque los medios de procesamiento (3) están configurados para extraer eventos sonoros en función de un umbral y una duración definidos por el usuario.

8. Sistema de detección e identificación de sonidos en tiempo real producidos por fuentes sonoras específicas, según cualquiera de las reivindicaciones 5-7, caracterizado porque los medios de procesamiento (3) están configurados para configurar el tamaño de ventana y el grado de solapamiento del enventanado.


 

Patentes similares o relacionadas:

Metodología para el reconocimiento automatizado de reptiles mediante la transformación del modelo de Markov de la fusión paramétrica de características de su producción sonora., del 12 de Abril de 2017, de UNIVERSIDAD DE LAS PALMAS DE GRAN CANARIA: La presente invención se refiere a un procedimiento para el reconocimiento y censo automatizado de reptiles a través de la transformación usando modelos ocultos de […]

Método para descubrir y reconocer patrones, del 18 de Febrero de 2015, de Aalto-Korkeakoulusäätiö: Método para reconocer un concepto en una señal, por ejemplo una señal de voz, mediante un aparato, comprendiendo el método: recibir , […]

Imagen de 'Procedimiento de detección de segmentos de habla'Procedimiento de detección de segmentos de habla, del 11 de Diciembre de 2013, de TELEFONICA, S.A.: Procedimiento de detección de segmentos de habla y de ruido en una señal digital de audio de entrada, estando dividida dicha señal de entrada en […]

COMPRESION DE PROTOTIPOS HMM (MODELOS DE MARKOV ESCONDIDOS)., del 16 de Abril de 2007, de SIEMENS AKTIENGESELLSCHAFT: Procedimiento para comprimir prototipos HMM, - prescribiéndose prototipos HMM (Xj); - reproduciéndose los prototipos HMM (Xj) sobre prototipos HMM comprimidos (YJ); - previéndose […]

METODO PARA IDENTIFICACION DE SECUENCIAS DE AUDIO., del 16 de Noviembre de 2004, de UNIVERSITAT POMPEU FABRA: Método para identificación de secuencias de audio. Comprende las siguientes etapas; 1. preprocesado de la secuencia de audio, comprendiendo […]

PROCEDIMIENTO PARA LA ADAPTACION DE UN MODELO DE SONIDO HIDDEN MARKOV EN UN SISTEMA DE RECONOCIMIENTO DE VOZ., del 1 de Julio de 2002, de SIEMENS AKTIENGESELLSCHAFT: LA INVENCION SE REFIERE A UN PROCEDIMIENTO PARA ADAPTACION DE UN LIBRO (CB) DE CODIGO DISPONIBLE GENERALMENTE PARA APLICACIONES ESPECIALES CON UN SISTEMA DE RECONOCIMIENTO […]

PROCEDIMIENTO PARA CALCULAR UN VALOR UMBRAL PARA EL RECONOCIMIENTO DE VOZ EN UNA PALABRA CLAVE., del 1 de Julio de 2002, de SIEMENS AKTIENGESELLSCHAFT: LA INVENCION PROPONE UN METODO QUE PERMITE CALCULAR EL VALOR UMBRAL DE ACEPTACION, A NIVEL DE PALABRA INDIVIDUAL, DE PALABRAS CLAVE. LA NOVEDAD DE LA INVENCION CONSISTE […]

SISTEMA DE RECONOCIMIENTO DE LA VOZ QUE USA ADAPTACIÓN IMPLÍCITA AL ORADOR, del 27 de Diciembre de 2011, de QUALCOMM INCORPORATED: Un procedimiento para realizar el reconocimiento de voz que comprende: realizar el apareo de patrones de un primer segmento de voz de entrada con al menos una primera plantilla […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .