Detector de actividad de voz de múltiples micrófonos.

Un procedimiento para llevar a cabo una detección de actividad de voz,

que comprende:

recibir una primera señal de un primer micrófono, incluyendo la primera señal una primera componente objetivo y una primera componente perturbadora;

recibir una segunda señal de un segundo micrófono desplazado con respecto al primer micrófono en una distancia, incluyendo la segunda señal una segunda componente objetivo y una segunda componente perturbadora, donde la primera componente objetivo difiere de la segunda componente objetivo en función de la distancia, y donde la primera componente perturbadora difiere de la segunda componente perturbadora en función de la distancia;

estimar un primer nivel de señal en función de la primera señal;

estimar un segundo nivel de señal en función de la segunda señal;

estimar un primer nivel de ruido en función de la primera señal;

estimar un segundo nivel de ruido en función de la segunda señal;

calcular una primera relación en función del primer nivel de señal y del primer nivel de ruido;

calcular una segunda relación en función del segundo nivel de señal y del segundo nivel de ruido; y

calcular una decisión de actividad de voz actual, donde la decisión de actividad de voz actual significa que no se detecta ninguna actividad de voz si una diferencia entre la primera relación y la segunda relación es más pequeña que un umbral preseleccionado, donde el umbral es (1-p) ξ min, donde p es un factor de desvanecimiento de propagación y donde ξ min es un umbral SNR mínimo preseleccionado para la presencia de voz en el micrófono más cercano al sonido objetivo, y donde la decisión de actividad de voz actual significa que se detecta actividad de voz si la diferencia es mayor o igual al umbral preseleccionado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/048562.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: YU,RONGSHAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L11/02

PDF original: ES-2582232_T3.pdf

 

Patentes similares o relacionadas:

Clasificación de señales de audio basada en marcos, del 31 de Diciembre de 2014, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de clasificación de señales de audio basado en marcos o cuadros, caracterizado por los pasos de: determinar (S1), para cada uno […]

Un detector de voz y un método para suprimir sub-bandas en un detector de voz, del 24 de Septiembre de 2014, de TELEFONAKTIEBOLAGET L M ERICSSON (PUBL): Un detector de voz que responde a una señal de entrada que se divide en sub-señales, representando cada una de ellas una sub-banda (n) de […]

Imagen de 'PROCEDIMIENTO DE DETECCIÓN DE SEGMENTOS DE VOZ'PROCEDIMIENTO DE DETECCIÓN DE SEGMENTOS DE VOZ, del 8 de Agosto de 2012, de TELEFONICA, S.A.: La presente invención se refiere a un procedimiento de detección de segmentos de voz y de ruido en una señal digital de audio de entrada, estando dividida […]

Identificación de personas usando múltiples tipos de entradas, del 25 de Julio de 2012, de MICROSOFT CORPORATION: Un procedimiento para detección de hablantes que comprende: identificar una serie de características que comprende al menos una característica […]

Imagen de 'Realce de voz en audio de entretenimiento'Realce de voz en audio de entretenimiento, del 11 de Julio de 2012, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para realzar la voz en audio de entretenimiento , que comprende procesar, en respuesta a uno omás controles , dicho audio […]

DETECTOR DE ACTIVIDAD VOCAL EN MÚLTIPLES MICRÓFONOS, del 6 de Febrero de 2012, de QUALCOMM INCORPORATED: Un procedimiento para detectar actividad vocal, comprendiendo el procedimiento: recibir una señal de referencia de frecuencia vocal procedente […]

Imagen de 'VOCODIFICADOR DE VELOCIDAD VARIABLE'VOCODIFICADOR DE VELOCIDAD VARIABLE, del 2 de Diciembre de 2010, de QUALCOMM INCORPORATED: - Un procedimiento de procesamiento de una señal de voz que comprende una pluralidad de tramas, comprendiendo el procedimiento: calcular un nivel de energía […]

Imagen de 'PROCEDIMIENTO DE TRANSMISION DE MARCAS DE FIN DE VOZ EN UN SISTEMA…'PROCEDIMIENTO DE TRANSMISION DE MARCAS DE FIN DE VOZ EN UN SISTEMA DE RECONOCIMIENTO DE VOZ, del 1 de Mayo de 2009, de FRANCE TELECOM: Procedimiento de transmisión de marcas de fin de voz en un sistema de reconocimiento distribuido de voz que funciona en modo de transmisión discontinua, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .