CIP-2021 : G10L 17/06 : Técnicas de toma de decisiones; Estrategia de ajuste de patrones.
CIP-2021 › G › G10 › G10L › G10L 17/00 › G10L 17/06[1] › Técnicas de toma de decisiones; Estrategia de ajuste de patrones.
G FISICA.
G10 INSTRUMENTOS MUSICALES; ACUSTICA.
G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.
G10L 17/00 Identificación o verificación de la persona que habla.
G10L 17/06 · Técnicas de toma de decisiones; Estrategia de ajuste de patrones.
CIP2021: Invenciones publicadas en esta sección.
Método y sistema para verificación de orador.
(20/05/2020). Solicitante/s: BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT CO., LTD. Inventor/es: CHEN,JIE, SU,DAN, FU,TIANXIAO, HU,NA.
Un método de verificación de orador, que comprende:
adquirir una grabación de audio;
extraer señales de voz de la grabación de audio;
extraer características de las señales de voz extraídas; y
determinar si las señales de voz extraídas representan la voz de un orador predeterminado basándose en las características extraídas y un modelo de orador entrenado con datos de voz de referencia del orador predeterminado
en el que extraer las señales de voz comprende:
determinar los niveles de energía de la grabación de audio que comprende determinar un espectro de imagen de resonancia de tiempo-frecuencia (RTFI) de la grabación de audio; y
extraer las señales de voz basadas en los niveles de energía.
PDF original: ES-2800348_T3.pdf
Estimación de la fiabilidad del reconocimiento de un orador.
(12/10/2016) Procedimiento para estimar la fiabilidad de un resultado de un sistema de reconocimiento de un orador respecto a un audio de prueba o una impresión de voz de prueba y un modelo de orador, que está basado en un audio modelo, utilizando el procedimiento una Red Bayesiana para estimar si el resultado es fiable, en el que, para estimar la fiabilidad del resultado del sistema de reconocimiento de un orador, se utiliza una, dos, tres, cuatro, o más de cuatro medidas de la calidad del audio de prueba y una, dos, tres, cuatro, o más de cuatro medidas de calidad del modelo de audio,
en el que la Red Bayesiana utiliza
como nodos que describen parámetros vistos en una calificación vista S i y las medidas de calidad Qi, en el que un índice…
Procedimiento para identificar a un hablante usando ecualización de formante.
(24/06/2015) Un procedimiento para la identificación de un hablante a partir de una grabación de audio de habla oral, en el que el procedimiento comprende:
evaluar la similitud entre una primera grabación de audio de un hablante y una segunda grabación de audio o muestra por una coincidencia de las frecuencias de los formantes en los fragmentos de referencia de la señal de voz seleccionada para la comparación a partir de la primera grabación de audio y la segunda grabación de audio, y comprende además:
seleccionar fragmentos de referencia de la señal de voz desde la primera grabación de audio y la segunda grabación de audio de manera que los fragmentos de referencia comprendan trayectorias de los formantes de al menos tres frecuencias de los formantes;
para cada fragmento de…