Método y sistema para verificación de orador.

Un método de verificación de orador, que comprende:

adquirir una grabación de audio;



extraer señales de voz de la grabación de audio;

extraer características de las señales de voz extraídas; y

determinar si las señales de voz extraídas representan la voz de un orador predeterminado basándose en las características extraídas y un modelo de orador entrenado con datos de voz de referencia del orador predeterminado

en el que extraer las señales de voz comprende:

determinar los niveles de energía de la grabación de audio que comprende determinar un espectro de imagen de resonancia de tiempo-frecuencia (RTFI) de la grabación de audio; y

extraer las señales de voz basadas en los niveles de energía.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CN2017/088073.

Solicitante: BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT CO., LTD.

Inventor/es: CHEN,JIE, SU,DAN, FU,TIANXIAO, HU,NA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L17/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 17/00 Identificación o verificación de la persona que habla. › Operaciones anteriores al procesamiento, p. ej. elección del segmento; Representación o modelado de patrones, p. ej. basados en Análisis Discriminante Linear (LDA) o componentes principales; Elección o extracción de características.
  • G10L17/06 G10L 17/00 […] › Técnicas de toma de decisiones; Estrategia de ajuste de patrones.
  • G10L25/18 G10L […] › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal,  H03G 3/34). › siendo los parámetros extraídos información espectral de cada una de las subbandas.
  • G10L25/78 G10L 25/00 […] › Detección de presencia o ausencia de señales de voz (con conmutación de dirección de transmisión por frecuencia vocal en sistemas telefónicas bidireccionales de altavoz H04M 9/10).

PDF original: ES-2800348_T3.pdf

 

Patentes similares o relacionadas:

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Método y dispositivo para detectar la señal de audio, del 12 de Febrero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para detectar una señal activa, en donde el método comprende: cuando se determina que una señal de audio es una señal sin voz, […]

Seleccionar un procedimiento de ocultación de pérdida de paquetes, del 8 de Enero de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método para seleccionar un procedimiento de ocultación de pérdida de paquetes, comprendiendo el método: detectar un tipo de audio […]

Estimación de audibilidad de muestras de audio, del 12 de Noviembre de 2019, de BMAT LICENSING, S.L.U: Un procedimiento para estimar la audibilidad de una muestra de audio en una mezcla de audio de un programa de medio de radio difusión, que comprende: […]

Procedimiento y dispositivo de clasificación de señales de audio, del 6 de Noviembre de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de clasificación de señales de audio, que comprende: determinar , según actividad de voz de una trama de audio actual, si hay que […]

Dispositivo de iluminación y marco con dicho dispositivo de iluminación unido al mismo, del 9 de Octubre de 2019, de AG Inc: Un dispositivo de iluminación adaptado para iluminar una pintura (P) que está parcialmente dibujada con pintura especial que emite o refleja la luz tras la […]

Clasificador de señales de audio, del 18 de Septiembre de 2019, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método para clasificar señales de audio, comprendiendo el método: para un segmento de una señal de audio: - identificar un conjunto de picos espectrales; […]

Procedimiento para verificar la identidad de un orador y medio legible por ordenador y ordenador relacionados, del 12 de Octubre de 2016, de AGNITIO, S.L.: Procedimiento para verificar la identidad de un orador en base a la voz de oradores, que comprende las etapas de: a) recibir una expresión de voz de una palabra o una […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .