Procedimiento de detección de la voz.

Procedimiento de detección de la voz que permite detectar la presencia de señales de habla en una señal acústica x(t) ruidosa procedente de un micrófono,

que comprende las etapas sucesivas siguientes:

- una etapa previa de muestreo que comprende una segmentación de la señal acústica x(t) en una señal acústica discreta ξ compuesta por una secuencia de vectores asociados a unas tramas i temporales de longitud N, correspondiendo N al número de puntos de muestreo, en donde cada vector traduce el contenido acústico de la trama i asociada y está compuesto por N muestras x(i-1)N+1, x(i-1)N+2,...,xiN-1, xiN, siendo i un entero positivo;

- una etapa de cálculo de una función de detección FD(τ ) basada en el cálculo de una función diferencia D(τ ) que varía en función del desplazamiento τ sobre una ventana de integración de longitud W que comienza en el tiempo t0, con:**Fórmula**

en donde 0 ≤ τ ≤ max(τ );

en donde esta etapa de cálculo de la función de detección FD(τ ) consiste en un cálculo de una función de detección discreta FDi(τ ) asociada a las tramas i;

- una etapa de búsqueda del mínimo de la función de detección FD(τ ) y comparación de este mínimo con un umbral, variando τ dentro de un intervalo de tiempo determinado, denominado intervalo en curso, para detectar la presencia o no de una frecuencia fundamental F0 característica de una señal de habla en dicho intervalo en curso, en donde esta etapa de búsqueda del mínimo de la función de detección FD(τ ) y la comparación de este mínimo con un umbral se realizan buscando, en cada trama i, el mínimo rr(i) de la función de detección discreta FDi(τ );

estando dicho procedimiento caracterizado por que comprende:

- una etapa de adaptación del umbral en dicho intervalo en curso, en función de valores calculados a partir de la señal acústica x(t) establecidos en dicho intervalo en curso,

en el que esta etapa de adaptación del umbral consiste en, para cada trama i, adaptar un umbral Ωi propio de la trama i en función de valores de referencia calculados a partir de los valores de las muestras de la señal acústica discreta ξ en dicha trama i;

en el que dicha etapa de búsqueda del mínimo de la función de detección FD(τ ) y la comparación de este mínimo con un umbral se realizan comparando, en cada trama i, el mínimo rr(i) de la función de detección discreta FDi(τ ) con un umbral Ωi propio de la trama i;

y, en el que, la etapa de adaptación de los umbrales Ωi para cada trama i comprende las etapas siguientes: a)- se subdivide la trama i que comprende N puntos de muestreo en T subtramas de longitud L, donde N es un múltiplo de T con el fin de que la longitud L≥N/T sea un entero, y de manera que las muestras de la señal acústica discreta ξ dentro de una subtrama de índice j de la trama i comprendan las L muestras siguientes:

x(i-1)N+(j-1)L + 1, x(i-1)N+(j-1)L+2, ..., x(i-1)N+jL, siendo j un entero positivo comprendido entre 1 y T;

b)- se calculan los valores máximos mi,j de la señal acústica discreta ξ en cada subtrama de índice j de la trama i, con:

c)- se calcula por lo menos un valor de referencia Refi,j, MRefi,j propio de la subtrama j de la trama i, siendo el valor o cada valor de referencia Refi,j, MRefi,j, por cada subtrama j calculado a partir del valor máximo mi,j en la subtrama j de la trama i;

d)- se establece el valor del umbral Ωi propio de la trama i en función de todos los valores de referencia Refi,j, MRefi,j calculados en las subtramas j de la trama i;

y en el que, en la etapa c), se realizan las siguientes subetapas sobre cada trama i:

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2014/053065.

Solicitante: ADEUNIS RF.

Nacionalidad solicitante: Francia.

Dirección: 283 rue Louis Néel Parc Technologique Pré Roux 38920 Crolles FRANCIA.

Inventor/es: MAOUCHE,KARIM.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L25/78 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p.ej. detectar cuando no hay ninguna señal,  H03G 3/34). › Detección de presencia o ausencia de señales de voz (con conmutación de dirección de transmisión por frecuencia vocal en sistemas telefónicas bidireccionales de altavoz H04M 9/10).
  • G10L25/84 G10L 25/00 […] › para discriminar voz de ruido.

PDF original: ES-2684604_T3.pdf

 

  • Fb
  • Twitter
  • G+
  • 📞

Patentes similares o relacionadas:

Sistema y procedimiento de registro de audio inteligente para dispositivos móviles, del 2 de Noviembre de 2018, de QUALCOMM INCORPORATED: Un procedimiento para un dispositivo móvil, comprendiendo el procedimiento: mientras el dispositivo móvil está en una modalidad de reposo, capturar una señal […]

Método y aparato para realizar una detección de actividad vocal, del 5 de Octubre de 2018, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para Detección de Actividad Vocal, VAD, que comprende: la adquisición de un valor de característica fluctuante de un ruido de fondo […]

Método y discriminador para clasificar diferentes segmentos de una señal de audio que comprende segmentos de voz y música, del 2 de Octubre de 2018, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para clasificar diferentes segmentos de una señal de audio, comprendiendo la señal de audio segmentos de voz y de música, comprendiendo […]

Procedimiento de sincronización entre una operación de procesamiento de reconocimiento vocal y una acción de activación de dicho procesamiento, del 4 de Abril de 2018, de Orange: Procedimiento de sincronización entre, por una parte, una operación de procesamiento por reconocimiento automático de la voz de una secuencia […]

Libro de códigos de dominio de transformada en un codificador y decodificador CELP, del 28 de Marzo de 2018, de VOICEAGE CORPORATION: Un codificador de una señal (s(n)) de audio de entrada, que comprende: una etapa de libro de códigos adaptativo estructurada para buscar […]

Aparato para realizar una detección de actividad de voz, del 21 de Febrero de 2018, de HUAWEI TECHNOLOGIES CO., LTD.: Un aparato de detección de actividad de voz para determinar una decisión de detección de actividad de voz, VADD, para una señal de audio […]

Generación de ruido de confort, del 12 de Julio de 2017, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Método de generación de parámetros de control de ruido de confort, CN, que comprende: almacenar (S1; 1a) parámetros de CN **Fórmula** para […]

‹‹ Llave para un cilindro de cierre

Disposición para la protección contra el calor de una fuente de calor de un material sensible al calor, placa de cocina y método de protección contra el calor ››