CIP-2021 : G10L 17/02 : Operaciones anteriores al procesamiento, p. ej. elección del segmento;

Representación o modelado de patrones, p. ej. basados en Análisis Discriminante Linear (LDA) o componentes principales; Elección o extracción de características.

CIP-2021 › G › G10 › G10L › G10L 17/00 › G10L 17/02^[1] › Operaciones anteriores al procesamiento, p. ej. elección del segmento; Representación o modelado de patrones, p. ej. basados en Análisis Discriminante Linear (LDA) o componentes principales; Elección o extracción de características.

G FISICA.

G10 INSTRUMENTOS MUSICALES; ACUSTICA.

G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.

G10L 17/00 Identificación o verificación de la persona que habla.

G10L 17/02 · Operaciones anteriores al procesamiento, p. ej. elección del segmento; Representación o modelado de patrones, p. ej. basados en Análisis Discriminante Linear (LDA) o componentes principales; Elección o extracción de características.

CIP2021: Invenciones publicadas en esta sección.

Método y sistema para verificación de orador.

(20/05/2020). Solicitante/s: BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT CO., LTD. Inventor/es: CHEN,JIE, SU,DAN, FU,TIANXIAO, HU,NA.

Un método de verificación de orador, que comprende: adquirir una grabación de audio; extraer señales de voz de la grabación de audio; extraer características de las señales de voz extraídas; y determinar si las señales de voz extraídas representan la voz de un orador predeterminado basándose en las características extraídas y un modelo de orador entrenado con datos de voz de referencia del orador predeterminado en el que extraer las señales de voz comprende: determinar los niveles de energía de la grabación de audio que comprende determinar un espectro de imagen de resonancia de tiempo-frecuencia (RTFI) de la grabación de audio; y extraer las señales de voz basadas en los niveles de energía.

PDF original: ES-2800348_T3.pdf

Procedimiento para verificar la identidad de un orador y medio legible por ordenador y ordenador relacionados.

(12/10/2016) Procedimiento para verificar la identidad de un orador en base a la voz de oradores, que comprende las etapas de: a) recibir una expresión de voz de una palabra o una frase de contraseña; b) utilizar datos de voz biométricos para verificar que la voz de los oradores corresponde con el orador cuya identidad se va a verificar en base a la expresión de voz recibida; c) rechazar al orador si la voz de los oradores no se verifica; y, sólo si se verifica la voz de los oradores: d) verificar que la expresión de voz recibida no está falsificada, lo que comprende determinar si la expresión de voz puede estar falsificada y aceptar al orador, si se determina que la expresión de voz no está falsificada y solicitar una segunda expresión…

Procedimiento para identificar a un hablante usando ecualización de formante.

(24/06/2015) Un procedimiento para la identificación de un hablante a partir de una grabación de audio de habla oral, en el que el procedimiento comprende: evaluar la similitud entre una primera grabación de audio de un hablante y una segunda grabación de audio o muestra por una coincidencia de las frecuencias de los formantes en los fragmentos de referencia de la señal de voz seleccionada para la comparación a partir de la primera grabación de audio y la segunda grabación de audio, y comprende además: seleccionar fragmentos de referencia de la señal de voz desde la primera grabación de audio y la segunda grabación de audio de manera que los fragmentos de referencia comprendan trayectorias de los formantes de al menos tres frecuencias de los formantes; para cada fragmento de…

Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz.

(03/12/2013) Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz. La presente invención se refiere a un método que evalúa de forma objetiva una grabación de la fonación sostenida de una vocal por medio de un sistema informático. Este método mide, de forma objetiva, cuatro aspectos de la calidad de la voz: la estabilidad de la voz, la riqueza espectral, la presencia de ruido y las irregularidades en las masas. Para ello asigna el valor de una determinada medida a cada una de los diferentes aspectos que caracterizan la calidad de la voz, donde además se han identificado los rangos de normalidad.

Detección de falsificación por cortar y pegar por alineamiento temporal dinámico.

(27/11/2013) Procedimiento para comparar expresiones de voz, comprendiendo el procedimiento las etapas de: extraer una pluralidad de rasgos de una primera expresión de voz de una muestra de texto determinada yextraer una pluralidad de rasgos de una segunda expresión de voz de dicha muestra de texto determinada, enel que cada rasgo se extrae en función del tiempo, y en el que cada rasgo de la segunda expresión de vozcorresponde a un rasgo de la primera expresión de voz; aplicar alineamiento temporal dinámico a por lo menos dos características que dependen del tiempo de laprimera y/o la segunda expresión de voz minimizando una o más medidas de distancia, en el que una medida dedistancia es una medida de la diferencia de una característica que depende del tiempo…