Procedimiento de detección de la voz.
Procedimiento de detección de la voz que permite detectar la presencia de señales de habla en una señal acústica x(t) ruidosa procedente de un micrófono,
que comprende las etapas sucesivas siguientes:
- una etapa previa de muestreo que comprende una segmentación de la señal acústica x(t) en una señal acústica discreta ξ compuesta por una secuencia de vectores asociados a unas tramas i temporales de longitud N, correspondiendo N al número de puntos de muestreo, en donde cada vector traduce el contenido acústico de la trama i asociada y está compuesto por N muestras x(i-1)N+1, x(i-1)N+2,...,xiN-1, xiN, siendo i un entero positivo;
- una etapa de cálculo de una función de detección FD(τ ) basada en el cálculo de una función diferencia D(τ ) que varía en función del desplazamiento τ sobre una ventana de integración de longitud W que comienza en el tiempo t0, con:**Fórmula**
en donde 0 ≤ τ ≤ max(τ );
en donde esta etapa de cálculo de la función de detección FD(τ ) consiste en un cálculo de una función de detección discreta FDi(τ ) asociada a las tramas i;
- una etapa de búsqueda del mínimo de la función de detección FD(τ ) y comparación de este mínimo con un umbral, variando τ dentro de un intervalo de tiempo determinado, denominado intervalo en curso, para detectar la presencia o no de una frecuencia fundamental F0 característica de una señal de habla en dicho intervalo en curso, en donde esta etapa de búsqueda del mínimo de la función de detección FD(τ ) y la comparación de este mínimo con un umbral se realizan buscando, en cada trama i, el mínimo rr(i) de la función de detección discreta FDi(τ );
estando dicho procedimiento caracterizado por que comprende:
- una etapa de adaptación del umbral en dicho intervalo en curso, en función de valores calculados a partir de la señal acústica x(t) establecidos en dicho intervalo en curso,
en el que esta etapa de adaptación del umbral consiste en, para cada trama i, adaptar un umbral Ωi propio de la trama i en función de valores de referencia calculados a partir de los valores de las muestras de la señal acústica discreta ξ en dicha trama i;
en el que dicha etapa de búsqueda del mínimo de la función de detección FD(τ ) y la comparación de este mínimo con un umbral se realizan comparando, en cada trama i, el mínimo rr(i) de la función de detección discreta FDi(τ ) con un umbral Ωi propio de la trama i;
y, en el que, la etapa de adaptación de los umbrales Ωi para cada trama i comprende las etapas siguientes: a)- se subdivide la trama i que comprende N puntos de muestreo en T subtramas de longitud L, donde N es un múltiplo de T con el fin de que la longitud L≥N/T sea un entero, y de manera que las muestras de la señal acústica discreta ξ dentro de una subtrama de índice j de la trama i comprendan las L muestras siguientes:
x(i-1)N+(j-1)L + 1, x(i-1)N+(j-1)L+2, ..., x(i-1)N+jL, siendo j un entero positivo comprendido entre 1 y T;
b)- se calculan los valores máximos mi,j de la señal acústica discreta ξ en cada subtrama de índice j de la trama i, con:
c)- se calcula por lo menos un valor de referencia Refi,j, MRefi,j propio de la subtrama j de la trama i, siendo el valor o cada valor de referencia Refi,j, MRefi,j, por cada subtrama j calculado a partir del valor máximo mi,j en la subtrama j de la trama i;
d)- se establece el valor del umbral Ωi propio de la trama i en función de todos los valores de referencia Refi,j, MRefi,j calculados en las subtramas j de la trama i;
y en el que, en la etapa c), se realizan las siguientes subetapas sobre cada trama i:
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2014/053065.
Solicitante: ADEUNIS RF.
Nacionalidad solicitante: Francia.
Dirección: 283 rue Louis Néel Parc Technologique Pré Roux 38920 Crolles FRANCIA.
Inventor/es: MAOUCHE,KARIM.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L25/78 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal, H03G 3/34). › Detección de presencia o ausencia de señales de voz (con conmutación de dirección de transmisión por frecuencia vocal en sistemas telefónicas bidireccionales de altavoz H04M 9/10).
- G10L25/84 G10L 25/00 […] › para discriminar voz de ruido.
PDF original: ES-2684604_T3.pdf
Patentes similares o relacionadas:
Dispositivo de almacenamiento de sonido selectivo, del 8 de Julio de 2020, de Gibson Brands, Inc: Un medio legible por ordenador que tiene almacenadas en el mismo instrucciones legibles por ordenador que cuando las ejecuta un controlador hacen […]
Estimación de ruido de fondo en señales de audio, del 24 de Junio de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método para la estimación de ruido de fondo en un segmento de señal de audio que comprende una pluralidad de subbandas, comprendiendo el método: calcular una […]
Mejora del contenido insonoro para decodificador CELP de tasa baja, del 17 de Junio de 2020, de VoiceAge EVS LLC: Un dispositivo para modificar, durante la decodificación de una señal de sonido, una síntesis de una excitación de dominio de tiempo decodificada […]
Método para la determinación de señal de ruido y aparato del mismo, del 10 de Junio de 2020, de Advanced New Technologies Co., Ltd: Un método para determinar una señal de ruido en un segmento de señal de voz, el método que comprende: determinar un segmento de señal […]
Método y sistema para verificación de orador, del 20 de Mayo de 2020, de BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT CO., LTD: Un método de verificación de orador, que comprende: adquirir una grabación de audio; extraer señales de voz de la grabación de audio; extraer características […]
Sistema y procedimiento de procesamiento de voz, del 26 de Febrero de 2020, de The Chancellor, Masters and Scholars of the University of Cambridge: Sistema de procesamiento de voz que comprende: una entrada para recibir un enunciado de entrada pronunciado por un usuario; un sistema de reconocimiento de […]
Método y dispositivo para detectar la señal de audio, del 12 de Febrero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para detectar una señal activa, en donde el método comprende: cuando se determina que una señal de audio es una señal sin voz, […]
Procedimiento y dispositivo de clasificación de señales de audio, del 6 de Noviembre de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de clasificación de señales de audio, que comprende: determinar , según actividad de voz de una trama de audio actual, si hay que […]