Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido.
Un circuito de supresión de ruido (300) para su uso en un circuito de procesamiento de señal de audio,
comprendiendo el circuito de supresión de ruido:
una pluralidad de diferentes tipos de detectores de actividad de voz (304) donde cada detector de actividad de voz está adaptado para detectar la presencia de un tipo diferente de ruido en una señal recibida, incluyendo rumor y ruido estacionario; y
Un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304); y
una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido (316) y un circuito de sustracción de ruido (318), donde cada circuito de reducción de ruido está adaptado para eliminar un tipo de ruido detectado diferente, donde cada circuito de reducción de ruido respectivamente corresponde a uno de la pluralidad de detectores de actividad de voz (304) correspondiendo el circuito de atenuación de ruido (316) a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido (318) a la detección del rumor;
Donde cada uno de la pluralidad de detectores de actividad de voz (304) detecta la presencia de un tipo de ruido correspondiente en la señal recibida, el respectivo circuito de reducción de ruido es selectivamente activado para condicionar la señal recibida para reducir la cantidad de los tipos de ruido detectados.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/083906.
Solicitante: Motorola Mobility LLC .
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 600 North US Highway 45 Libertyville, IL 60048 ESTADOS UNIDOS DE AMERICA.
Inventor/es: CLARK,JOEL A, SONG,JIANMING J.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L15/20 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › Técnicas de reconocimiento de la voz especialmente adaptadas para trabajar en ambientes adversos, p. ej. en presencia de ruido o para voz emitida en situaciones de estrés (G10L 21/02 tiene prioridad).
- H04B15/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04B TRANSMISION. › Supresión o limitación del ruido o de las interferencias (por medios asociados al receptor H04B 1/10).
- H04M1/00 H04 […] › H04M COMUNICACIONES TELEFONICAS (circuitos para el control de otros aparatos vía cable telefónico y que no implican aparatos de conmutación telefónica G08). › Equipos de subestaciones, p. ej. para utilización por el abonado (servicios de abonado o instalaciones proporcionadas en las centrales H04M 3/00; aparatos con fichas de pago previo H04M 17/00; disposiciones de suministro de corriente H04M 19/08).
PDF original: ES-2454645_T3.pdf
Fragmento de la descripción:
Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido Referencia cruzada a aplicaciones relacionadas Esta aplicación reivindica la prioridad de una Solicitud de Patente Provisional de US de Nº de Serie 60/882, 926, presentada el 30 de Diciembre de 2006.
Campo de la invención La presente invención se refiere en general a unos circuitos de supresión de ruido y a correspondientes métodos, y más particularmente, a un método y circuito de supresión de ruido que incorpora múltiples técnicas de supresión que incluyen un detector para detectar múltiples tipos de ruido y múltiples técnicas correspondientes para eliminar el ruido detectado.
Antecedentes de la invención La presencia de ruido ambiente o de fondo tiene un efecto significativo en la calidad de audio experimentada por uno o los dos participantes de una llamada, sobre todo si uno o los dos participantes están en un entorno ruidoso. Con respecto a la calidad del audio, la calidad y la inteligibilidad de voz son generalmente asuntos prominentes. No obstante, cuando se habla en un entorno ruidoso, el filtrado para eliminar el ruido ambiente que puede en ocasiones ser recogido por un micrófono además de la voz del usuario puede muy a menudo presentar muchas dificultades. Esto puede ser sobre todo cierto donde el ruido ambiente podría consistir en muchas personas hablando de fondo, lo que a menudo se denomina rumor. Esto es porque las voces de fondo tienen características que son similares a las señales de conversación deseada que son producidas por el usuario, y por lo tanto pueden ser más difíciles de distinguir y detectar.
Aunque históricamente las personas han buscado en ocasiones un ambiente tranquilo para hablar por teléfono, lo que intentaba mitigar los problemas de cualquier ruido ambiental evitándolo en su totalidad, un entorno tranquilo tal como una cabina telefónica no siempre está convenientemente disponible, y la necesidad de un ambiente tranquilo puede en ocasiones impactar negativamente en la movilidad y la conveniencia asociadas con utilizar un teléfono móvil y/o un teléfono acoplado a una línea terrestre en un entorno que es sólo algunas veces ruidoso.
Más recientemente, los intentos de reducir el ruido de ambiente y mejorar las relaciones de conversación a ruido se han centrado ampliamente en el ruido ambiente que es bastante estacionario, y/o que es ruido asociado con fuentes conocidas, tales como el ruido del motor de un coche. Algunos de estos planteamientos han intentado centrarse en los periodos de tiempo durante los cuales la voz de una persona es detectada como no actualmente presente, e intentando mitigar el ruido durante estos periodos. No obstante, se ha probado que los intentos de solucionar los tipos de ruido no estacionario, tal como el rumor, son más problemáticos. Muchos de los más recientes intentos han intentado aplicar técnicas basadas en un análisis acústico más instantáneo, que aplican modelos relativamente estáticos, que no son generalmente efectivos para tipos de ruido menos estacionarios. Además, las técnicas asociadas con solucionar casos en los cuales la conversación prevista no está presente, no son muy efectivas en la eliminación de ruido, que está superpuesto a la conversación prevista.
En consecuencia, los actuales inventores han reconocido que sería deseable distinguir entre diferentes tipos de ruido de la conversación prevista, tal como el rumor y/o el ruido estacionario, y poder implementar técnicas selectivamente aplicadas y específicamente adaptadas para solucionar cada tipo de ruido, cuando el mismo es detectado como presente, mientras que al mismo tiempo se evitan y/o mitigan los efectos de cualquier artefacto audible desagradable.
TAKESHI YAMADA1 EAT AL: "Integration of Noise Reduction Algorithms for Aurora2 Task", 20030901, 1 de Septiembre de 2003 (2003-09-01) , página 1769, describe, con el objetivo de conseguir un alto rendimiento de reconocimiento para una amplia variedad de ruido y para una amplia gama de relaciones de señal a ruido, la integración de cuatro algoritmos de reducción de ruido: sustracción espectral con suavizado de la dirección de tiempo, mejora de la conversación basada en SVD de dominio temporal, estimación de conversación basada en GMM y filtrado combinado basado en KLT.
YUSUKE KIDA, TATSUYA KAWAHARA: "Voice Activity Detection Based on Optimally Weighted Combination of Multiple Features", INTERSPEECH'2005 - EUROSPEECH, 4 de Septiembre de 2005 (2005-09-04) , páginas 26212624, presenta un esquema de detección de actividad de voz que es robusto frente al ruido, basándose en una combinación ponderada óptima de características.
YUSUKE KIDA, TATSUYA KAWAHARA: "Evaluation of Voice Activity Detection by Combining Multiple Features with Weight Adaptation", INTERSPEECH-2006, 17 de Septiembre de 2006 (2006-09-17) , propone, para un reconocimiento de conversación automático robusto frente al ruido, un método de detección de actividad de voz basado en una combinación de múltiples características.
SRINIVASAN K ET AL: "Voice activity detection for cellular networks", 19931013; 19931013 - 19931015, 13 de Octubre de 1993 (1993-10-13) , páginas 85-86, presenta algoritmos para la detección de actividad de voz en presencia de ruido de vehículos y de rumor.
Compendio de la invención En un primer aspecto, la presente invención proporciona un circuito de supresión de ruido, de acuerdo con la reivindicación 1.
En otro aspecto, la presente invención proporciona un método para suprimir el ruido en una señal de audio, de acuerdo con la reivindicación 11.
Estas y otras características y ventajas de esta invención resultan evidentes a partir de la siguiente descripción de una o más de las realizaciones preferidas de esta invención, con referencia a los dibujos que se acompañan.
Breve descripción de los dibujos La FIG. 1 es un diagrama de bloques de un circuito de procesamiento de señal de audio de ejemplo;
la FIG. 2 es un diagrama de bloques de un circuito de eliminación de ruido, asociado con al menos una técnica anterior de ejemplo;
la FIG. 3 es un diagrama de bloques de un circuito de supresión de ruido, de acuerdo con al menos una realización de la presente invención;
la FIG. 4 es un diagrama de bloques más detallado que ilustra un detector de voz de Modelo de Mezcla Gausiano de ejemplo, del tipo ilustrado como parte del circuito de supresión de ruido, ilustrado en la FIG. 3;
la FIG. 5 es un diagrama de bloques de un dispositivo de comunicación bidireccional de ejemplo, en el cual el circuito de supresión de ruido, ilustrado en la FIG. 3, puede ser implementado; y
la FIG. 6 es un método para la supresión de ruido en una señal de audio, de acuerdo con al menos una realización de la presente invención.
Descripción detallada de la realización o realizaciones preferida o preferidas Aunque la presente invención es susceptible de ser realizada de varias formas, se muestran en los dibujos y se describirán ahora en lo que sigue en esta memoria realizaciones preferidas, entendiéndose que la presente descripción debe considerarse como un ejemplo de la invención y no pretende limitar la invención a las realizaciones específicas ilustradas.
La FIG. 1 ilustra un diagrama de bloques de un circuito de procesamiento de señal de audio 100 de ejemplo. El circuito de procesamiento de señal de audio 100 incluye una primera ruta dirigida a recibir un flujo de datos de audio entrante 102 y a reproducir la correspondiente señal de audio en un altavoz 104, y una segunda ruta dirigida a recibir una señal de audio en un micrófono 106 y a convertir la señal de audio recibida en el micrófono 106 en un flujo de datos de audio saliente 108.
La primera ruta incluye un circuito descodificador de conversación 110, que recibe el flujo de datos de audio entrante 102 que puede ser codificado como paquetes de datos adecuados para su transmisión a través de una interfaz de comunicación de frecuencia de radio, y recombina los paquetes de datos recibidos y convierte a los mismos en datos de conversación digitales. Los datos de conversación digitales son a continuación recibidos por un circuito de mejora de conversación 112, que lleva a cabo cualquier corrección de error o mejora de datos necesaria en los datos de audio como resultado de errores durante la transmisión de los datos y/o de cualquier paquete de datos faltante. El flujo de datos mejorado o corregido es a continuación convertido de una señal digital a una señal analógica a través de un convertidor analógico 114 y transportado a un altavoz 104 para la reproducción de la señal de audio que va a oír el usuario.
La... [Seguir leyendo]
Reivindicaciones:
1. Un circuito de supresión de ruido (300) para su uso en un circuito de procesamiento de señal de audio, comprendiendo el circuito de supresión de ruido:
una pluralidad de diferentes tipos de detectores de actividad de voz (304) donde cada detector de actividad de voz está adaptado para detectar la presencia de un tipo diferente de ruido en una señal recibida, incluyendo rumor y ruido estacionario; y
Un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304) ; y
una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido (316) y un circuito de sustracción de ruido (318) , donde cada circuito de reducción de ruido está adaptado para eliminar un tipo de ruido detectado diferente, donde cada circuito de reducción de ruido respectivamente corresponde a uno de la pluralidad de detectores de actividad de voz (304) correspondiendo el circuito de atenuación de ruido (316) a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido (318) a la detección del rumor;
Donde cada uno de la pluralidad de detectores de actividad de voz (304) detecta la presencia de un tipo de ruido correspondiente en la señal recibida, el respectivo circuito de reducción de ruido es selectivamente activado para condicionar la señal recibida para reducir la cantidad de los tipos de ruido detectados.
2. Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que la detección de ruido estacionario incluye un detector de actividad de voz del dominio del espectro (306) y un detector de actividad de voz del dominio del tiempo (308) .
3. Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que la detección del rumor incluye un modelo de mezcla Gausiano.
4. Un circuito de supresión de ruido de acuerdo con la reivindicación 3, en el que el modelo de mezcla Gausiano incluye un modelo de conversación (404) para detectar la presencia de una señal de voz deseada, y un modelo de ruido (406) para detectar la presencia de rumor.
5. Un circuito de supresión de ruido de acuerdo con la reivindicación 4, en el que la señal de voz detectada y el rumor detectado se utilizan para formular una señal para ser utilizada para uno correspondiente de los circuitos de reducción de ruido.
6. Un circuito de supresión de ruido de acuerdo con la reivindicación 4, en el que el rumor detectado se utiliza para actualizar el modelo de ruido.
7. Un circuito de supresión de ruido de acuerdo con la reivindicación 1, que comprende también una fuente de ruido de comodidad (324) para producir una señal de ruido de comodidad, y un mezclador (322) para combinar la señal de ruido de comodidad con la señal recibida, que ha sido acondicionada para reducir la cantidad de tipos de ruido detectados.
8. Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que el circuito de supresión de ruido está incorporado en un dispositivo de comunicación bidireccional (500) que incluye un micrófono (106) y un altavoz (104) .
9. Un circuito de supresión de ruido de acuerdo con la reivindicación 8, que comprende también un circuito de cancelación de eco (120) para recibir una señal para ser reproducida por el altavoz (104) y eliminar cualquier señal reproducida por el altavoz detectada por el micrófono (106) .
10. Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que el circuito de supresión de ruido es incorporado como parte de un teléfono de radio frecuencia.
11. Un método para suprimir ruido en una señal de audio, comprendiendo el método:
detectar, con una pluralidad de diferentes tipos de detectores de actividad de voz (304) , la presencia de un tipo de ruido diferente en una señal recibida, incluyendo rumor y ruido estacionario; y
determinar, con un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304) ;
suprimir (604) el tipo de ruido detectado en la señal de audio utilizando uno de una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido (316) y un circuito de sustracción de ruido (318) , donde cada circuito de reducción de ruido está adaptado para eliminar un tipo diferente de ruido detectado, donde cada circuito de reducción de ruido respectivamente corresponde a uno de una pluralidad de detectores de actividad de voz, correspondiendo el circuito de atenuación de ruido a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido a la detección de rumor, cuando el respectivo detector detecta la presencia del correspondiente tipo de ruido activando selectivamente el respectivo circuito de reducción de ruido.
Patentes similares o relacionadas:
Procedimiento para la identificación y la comprobación de mensajes radiotelefónicos, del 28 de Noviembre de 2018, de Frequentis AG: Procedimiento para la identificación y la comprobación de mensajes radiotelefónicos (M1...M3), así como para la asignación de mensajes radiotelefónicos […]
PROCEDIMIENTO DE DETECCIÓN DE SEGMENTOS DE VOZ, del 8 de Agosto de 2012, de TELEFONICA, S.A.: La presente invención se refiere a un procedimiento de detección de segmentos de voz y de ruido en una señal digital de audio de entrada, estando dividida […]
PROCEDIMIENTO ADAPTATIVO AL USUARIO PARA LA MODELIZACION DE RUIDOS, del 7 de Mayo de 2010, de SIEMENS AKTIENGESELLSCHAFT: Procedimiento para el reconocimiento de voz con un banco de datos con varios perfiles de ruido de fondo, que representan distintos fondos de […]
ELECTRODOMESTICO CONTROLADO POR VOZ., del 1 de Junio de 2007, de BSH BOSCH UND SIEMENS HAUSGERATE GMBH: Electrodoméstico, en particular campana extractora de humos , con una unidad de control por voz que tiene un micrófono y un dispositivo de reconocimiento […]
DETECCION DEL HABLA UTILIZANDO MEDIDAS DE CONFIANZA EN EL ESPECTRO DE FRECUENCIAS., del 16 de Julio de 2006, de PANASONIC TECHNOLOGIES, INC.: 2005 (2005/46) por "Refrigerator". OG: A-04246
METODO, DISPOSITIVO, TERMINAL Y SISTEMA PARA EL RECONOCIMIENTO AUTOMATICO DE DATOS DE VOZ DISTORSIONADOS., del 1 de Diciembre de 2005, de TELEFONAKTIEBOLAGET L M ERICSSON (PUBL): Un método de procesar espectros de voz distorsionada de corto período para reconocimiento automático de voz, en el que los datos de voz distorsionada […]
DETECCION DE PALABRAS CLAVE EN UNA SEÑAL RUIDOSA., del 1 de Diciembre de 2005, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: Método para detectar palabras en una señal de habla, que comprende las etapas de: generar una pluralidad de puntuaciones de reconocimiento […]
DISPOSITIVO Y PROCEDIMIENTO PARA GENERAR UN PATRÓN DE ACTIVIDAD FILTRADO, SEPARADOR DE FUENTES, PROCEDIMIENTO PARA GENERAR UNA SEÑAL DE AUDIO DEPURADA Y PROGRAMA INFORMÁTICO, del 29 de Abril de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para generar un patrón de actividad filtrado basándose en un primer patrón de actividad de un modelo auditivo […]