PROCEDIMIENTO DE ESTIMACIÓN DE RUIDO USANDO APRENDIZAJE INCREMENTAL BAYESIANO.

Un procedimiento para estimar el ruido en una señal ruidosa, comprendiendo el procedimiento:



dividir (300) la señal ruidosa en tramas; y

determinar (302) una estimación del ruido para una trama usando el aprendizaje incremental de Bayes, basándose la estimación del ruido en una aproximación Gaussiana, e incluyendo parámetros que definen tanto una media como una varianza de la distribución anterior del ruido, donde se supone una distribución anterior del ruido variable a lo largo del tiempo, y se actualiza recursivamente una estimación del ruido usando una aproximación para el ruido posterior calculado en una trama precedente, en base a una aplicación iterativa de la regla de Bayes.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E04006719.

Solicitante: MICROSOFT CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: ONE MICROSOFT WAY REDMOND, WASHINGTON 98052 ESTADOS UNIDOS DE AMERICA.

Inventor/es: DENG, LI, Acero,Alejandro, Droppo,James G.

Fecha de Publicación: .

Fecha Solicitud PCT: 19 de Marzo de 2004.

Clasificación Internacional de Patentes:

  • G10L21/02A1

Clasificación PCT:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Clasificación antigua:

  • G10L21/02 G10L 21/00 […] › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2371548_T3.pdf

 


Fragmento de la descripción:

Procedimiento de estimación de ruido usando aprendizaje incremental bayesiano Antecedentes de la invención La presente invención se refiere a la estimación del ruido. En particular, la presente invención se refiere a la estimación del ruido en señales usadas en el reconocimiento de patrones. Un sistema de reconocimiento de patrones, tal como un sistema de reconocimiento del habla, toma una señal de entrada e intenta descodificar la señal para hallar un patrón representado por la señal. Por ejemplo, en un sistema de reconocimiento del habla, una señal de habla (a menudo denominada una señal de prueba) es recibida por el sistema de reconocimiento y es descodificada para identificar una cadena de palabras representadas por la señal de habla. Las señales de entrada están habitualmente corrompidas por alguna forma de ruido. Para mejorar las prestaciones del sistema de reconocimiento de patrones, a menudo es deseable estimar el ruido en la señal ruidosa. En el pasado, se han usado algunos entornos para estimar el ruido en una señal. En un entorno, se usan algoritmos en lotes que estiman el ruido en cada trama de la señal de entrada, independientemente del ruido hallado en otras tramas en la señal. Las estimaciones individuales de ruido se promedian luego entre sí para formar un valor de consenso del ruido para todas las tramas. En un segundo entorno, se usa un algoritmo recursivo que estima el ruido en la trama actual en base a estimaciones de ruido para una o más tramas anteriores o sucesivas. Tales técnicas recursivas admiten que el ruido cambie lentamente a lo largo del tiempo. En una técnica recursiva, se supone que una señal ruidosa es una función no lineal de una señal limpia y de una señal de ruido. Para ayudar en el cálculo, esta función no lineal se aproxima a menudo por una expansión truncada en serie de Taylor, que se calcula alrededor de algún punto de expansión. En general, la expansión en serie de Taylor proporciona sus mejores estimaciones de la función en el punto de expansión. Así, la aproximación por serie de Taylor es sólo tan buena como la selección del punto de expansión. En la técnica anterior, sin embargo, el punto de expansión para la serie de Taylor no estaba optimizado para cada trama. Como resultado, la estimación del ruido producido por los algoritmos recursivos ha sido menos que ideal. Se han usado técnicas de máxima probabilidad (ML) y de máximo a posteriori (MAP) para la estimación de puntos secuenciales del ruido no estacionario, usando un modelo no lineal iterativamente linealizado para el entorno acústico. La técnica de ML se ilustra en el documento de la técnica anterior de L. Deng et al. Recursive noise estimation using iterative stochastic approximation for stereo-based robust speech recognition [Estimación recursiva del ruido usando aproximación estocástica iterativa para el reconocimiento de voz robusto con base estéreo], págs. 81 a 84, Taller del IEEE de Reconocimiento y Comprensión Automática del Habla, 2001. ASRU01, 9 al 13 de diciembre de 2001. La técnica de MAP se ilustra en el documento de la técnica anterior de L. Deng et al. Log-domain speech feature enhancement using sequential MAP noise estimation and a phase-sensitive model of the acoustic environment [Mejora de características del habla en el dominio del registro usando estimación secuencial de ruido de MAP y un modelo sensible a la fase del entorno acústico], págs. 1813 a 1816, anales de ICSLP 2002: 7ª conferencia internacional sobre el procesamiento del lenguaje hablado, 16 al 20 de septiembre de 2002. En general, usando un sencillo modelo Gaussiano para la distribución del ruido, la estimación de MAP proporcionaba una mejor calidad de la estimación del ruido. Sin embargo, en la técnica de MAP, los parámetros de media y varianza asociados a la técnica anterior del ruido Gaussiano se fijan a partir de un segmento de cada emisión de prueba libre de habla. Para el ruido no estático, esta aproximación puede no reflejar debidamente estadísticas anteriores realistas del ruido. Resumen de la invención Es el objeto de la invención proporcionar un procedimiento mejorado para estimar el ruido en una señal ruidosa, y un correspondiente medio y sistema legible por ordenador, que sean más efectivos para estimar el ruido en señales de patrones. Este objeto es resuelto por la invención, según se reivindica en las reivindicaciones independientes. Las realizaciones preferidas se definen en las reivindicaciones dependientes. Un nuevo enfoque de la estimación del ruido no estático usa el aprendizaje incremental de Bayes. En un aspecto, esta técnica puede definirse como que supone una distribución anterior del ruido variable en el tiempo, donde la estimación del ruido, que puede ser definida por hiperparámetros (media y varianza), se actualiza recursivamente usando una aproximación posterior calculada en una etapa precedente en el tiempo o en las tramas. En otro aspecto, esta técnica 2 E04006719 11-11-2011   puede definirse como estimar sucesivamente, para cada trama, el ruido en cada trama, de modo tal que una estimación del ruido para una trama actual se base en una aproximación Gaussiana de la probabilidad de datos para la trama actual y una aproximación Gaussiana del ruido en una secuencia de tramas anteriores. Breve descripción de los dibujos La FIG. 1 es un diagrama en bloques de un entorno de cálculo en el cual puede ponerse en práctica la presente invención. La FIG. 2 es un diagrama en bloques de un entorno alternativo de cálculo en el cual puede ponerse en práctica la presente invención. La FIG. 3 es un diagrama de flujo de un procedimiento de estimación del ruido en una realización de la presente invención. La FIG. 4 es un diagrama en bloques de un sistema de reconocimiento de patrones en el cual puede usarse la presente invención. Descripción detallada de realizaciones ilustrativas La FIG. 1 ilustra un ejemplo de un entorno 100 de un sistema informático adecuado en el cual puede implementarse la invención. El entorno 100 de sistema informático es sólo un ejemplo de un entorno informático adecuado y no está concebido para sugerir ninguna limitación en cuanto al alcance del uso o a la funcionalidad de la invención. Tampoco debería interpretarse que el entorno informático 100 tenga alguna dependencia o requisito con respecto a cualquiera, o a una combinación, de los componentes ilustrados en el entorno operativo ejemplar 100. La invención es operativa con otros numerosos entornos o configuraciones de sistema informático de propósito general o de propósito especial. Los ejemplos de sistemas informáticos, entornos y / o configuraciones bien conocidos, que pueden ser adecuados para su uso con la invención incluyen, pero no se limitan a, los ordenadores personales, los ordenadores servidores, los dispositivos de mano o portátiles, los sistemas multiprocesadores, los sistemas basados en microprocesadores, los equipos de sobremesa, los equipos electrónicos programables de consumo, los ordenadores personales en red, los miniordenadores, los ordenadores centrales, los sistemas de telefonía, los entornos informáticos distribuidos que incluyen a cualquiera de los sistemas o dispositivos anteriores, y similares. La invención puede describirse en el contexto general de instrucciones ejecutables por ordenador, tales como módulos de programa ejecutados por un ordenador. En general, los módulos de programa incluyen rutinas, programas, objetos, componentes, estructuras de datos, etc., que realizan tareas específicas o implementan tipos específicos de datos abstractos. Las tareas realizadas por los programas y módulos se describen más adelante, y con ayuda de figuras. Los expertos en la técnica pueden implementar la descripción y / o las figuras en el presente documento como instrucciones ejecutables por ordenador, que pueden realizarse en cualquier forma de medio legible por ordenador expuesto más adelante. La invención también puede ponerse en práctica en entornos informáticos distribuidos donde las tareas son realizadas por dispositivos de procesamiento remoto que están enlazados a través de una red de comunicaciones. En un entorno informático distribuido, los módulos de programa pueden localizarse en medios de almacenamiento de ordenador, tanto locales como remotos, incluyendo dispositivos de almacenamiento de memoria. Con referencia a la FIG. 1, un sistema ejemplar para implementar la invención incluye un dispositivo informático de propósito general en forma de un ordenador 110. Los componentes del ordenador 110 pueden incluir, pero no se limitan a, una unidad 120 de procesamiento, una memoria 130 del sistema y un bus 121 del sistema que acopla diversos componentes del sistema, incluyendo la memoria del sistema, con la unidad 120 de procesamiento. El bus 121 del sistema puede ser cualquiera de diversos tipos... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento para estimar el ruido en una señal ruidosa, comprendiendo el procedimiento: dividir (300) la señal ruidosa en tramas; y determinar (302) una estimación del ruido para una trama usando el aprendizaje incremental de Bayes, basándose la estimación del ruido en una aproximación Gaussiana, e incluyendo parámetros que definen tanto una media como una varianza de la distribución anterior del ruido, donde se supone una distribución anterior del ruido variable a lo largo del tiempo, y se actualiza recursivamente una estimación del ruido usando una aproximación para el ruido posterior calculado en una trama precedente, en base a una aplicación iterativa de la regla de Bayes. 2. El procedimiento de la reivindicación 1, en el cual la determinación de una estimación del ruido comprende: determinar una estimación del ruido para una primera trama de la señal ruidosa usando una aproximación para el ruido posterior calculado en una trama precedente; determinar una estimación de probabilidad de datos para una segunda trama de la señal ruidosa; y usar la estimación de probabilidad de datos para la segunda trama y la estimación de ruido para la primera trama, a fin de determinar una estimación del ruido para la segunda trama. 3. El procedimiento de la reivindicación 2, en el cual la determinación de la estimación de probabilidad de datos para la segunda trama comprende usar la estimación de probabilidad de datos para la segunda trama en una ecuación que se basa en parte en una definición de la señal ruidosa como una función no lineal de una señal limpia y de una señal ruidosa. 4. El procedimiento de la reivindicación 3, en el cual la ecuación se basa adicionalmente en una aproximación a la función no lineal. 5. El procedimiento de una de las reivindicaciones 2 a 4, en el cual la aproximación es igual a la función no lineal en un punto definido en parte por la estimación del ruido para la primera trama. 6. El procedimiento de la reivindicación 5, en el cual la aproximación es una expansión en serie de Taylor. 7. El procedimiento de la reivindicación 6, en el cual la aproximación comprende adicionalmente adoptar una aproximación de Laplace. 8. El procedimiento de una de las reivindicaciones 2 a 4, en el cual el uso de la estimación de probabilidad de datos para la segunda trama comprende usar la estimación de ruido para la primera trama como un punto de expansión para una expansión en serie de Taylor de una función no lineal. 9. El procedimiento de una de las reivindicaciones 1 a 4, en el cual el uso de una aproximación para el ruido posterior comprende usar una aproximación Gaussiana. 10. El procedimiento de la reivindicación 1, en el cual la determinación de la estimación del ruido comprende determinar sucesivamente una estimación del ruido para cada trama. 11. El procedimiento de la reivindicación 1, en el cual la etapa de determinación comprende: estimar sucesivamente para cada trama el ruido en cada trama, de modo tal que una estimación del ruido para una trama actual se base en una aproximación Gaussiana de la probabilidad de datos para la trama actual y en una aproximación Gaussiana del ruido en una secuencia de tramas anteriores. 12. El procedimiento de la reivindicación 11, en el cual la estimación del ruido en cada trama comprende usar una ecuación que se basa en parte en una definición de la señal ruidosa como una función no lineal de una señal limpia y de una señal ruidosa, para determinar la aproximación de la probabilidad de datos en la trama actual. 13. El procedimiento de la reivindicación 12, en el cual la ecuación se basa adicionalmente en una aproximación a la función no lineal. 14. El procedimiento de la reivindicación 13, en el cual la aproximación es igual a la función no lineal en un punto definido en parte por la estimación del ruido para la trama anterior. 15. El procedimiento de la reivindicación 14, en el cual la aproximación es una expansión en serie de Taylor. 16. El procedimiento de la reivindicación 15, en el cual la aproximación incluye adicionalmente una aproximación de 11 E04006719 11-11-2011   Laplace. 17. Un medio legible por ordenador que incluye instrucciones legibles por un ordenador que, cuando se implementan, causan que el ordenador realice cualquiera de los procedimientos de las reivindicaciones 1 a 16. 18. Un sistema adaptado para realizar uno cualquiera de los procedimientos de las reivindicaciones 1 a 16. 12 E04006719 11-11-2011   13 E04006719 11-11-2011   14 E04006719 11-11-2011   E04006719 11-11-2011   16 E04006719 11-11-2011

 

Patentes similares o relacionadas:

Imagen de 'PROCEDIMIENTO Y DISPOSITIVO DE REDUCCION DE RUIDO'PROCEDIMIENTO Y DISPOSITIVO DE REDUCCION DE RUIDO, del 4 de Noviembre de 2010, de FRANCE TELECOM: Procedimiento de reducción de ruido en sucesivas tramas de una señal de entrada x(n), que incluye las siguientes etapas para por lo menos algunas de las tramas: […]

Imagen de 'PROCESAMIENTO DIGITAL DIFERENCIADO DE LA VOZ Y DE LA MUSICA,…'PROCESAMIENTO DIGITAL DIFERENCIADO DE LA VOZ Y DE LA MUSICA, LA FILTRACION DEL RUIDO, LA CREACION DE EFECTOS ESPECIALES ASI COMO UN DISPOSITIVO PARA LA APLICACION DE DICHO PROCEDIMIENTO, del 9 de Julio de 2010, de CREBOUW, JEAN-LUC: Procedimiento para el tratamiento numérico diferenciado de una señal acústica, constituido en el intervalo de una trama por la suma de seno de amplitud fija […]

Imagen de 'PROCEDIMIENTO DE MEDIDA DE LA MOLESTIA DEBIDA AL RUIDO DE UNA…'PROCEDIMIENTO DE MEDIDA DE LA MOLESTIA DEBIDA AL RUIDO DE UNA SEÑAL DE AUDIO, del 2 de Diciembre de 2009, de FRANCE TELECOM: Procedimiento de cálculo de una puntuación objetiva (NOB) de la molestia debida al ruido en una señal de audio procesada mediante una función […]

Imagen de 'PROCEDIMIENTO Y DISPOSITIVO PARA LA MEJORA DE VOZ EN PRESENCIA…'PROCEDIMIENTO Y DISPOSITIVO PARA LA MEJORA DE VOZ EN PRESENCIA DE RUIDO DE FONDO, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para la supresión de ruido de una señal de voz, que comprende: llevar a cabo un análisis de frecuencia para generar una representación de dominio […]

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .