Estimación de la fiabilidad del reconocimiento de un orador.

Procedimiento para estimar la fiabilidad de un resultado de un sistema de reconocimiento de un orador respecto a un audio de prueba o una impresión de voz de prueba y un modelo de orador,

que está basado en un audio modelo, utilizando el procedimiento una Red Bayesiana para estimar si el resultado es fiable, en el que, para estimar la fiabilidad del resultado del sistema de reconocimiento de un orador, se utiliza una, dos, tres, cuatro, o más de cuatro medidas de la calidad del audio de prueba y una, dos, tres, cuatro, o más de cuatro medidas de calidad del modelo de audio,

en el que la Red Bayesiana utiliza

como nodos que describen parámetros vistos en una calificación vista S i y las medidas de calidad Qi, en el que un índice i indica una prueba i-ésima, como nodos que describen parámetros ocultos como una calificación oculta si, estados se calidad zi, coeficientes de la distribución que describen los estados de calidad, media y precisión que describen los grupos de las medidas de calidad, media y precisión que describen la distribución de la desviación Δsi entre la calificación vista y oculta, media y precisión que describen la distribución de la calificación oculta; y la etiqueta real de la prueba y como nodo que describe un valor determinístico una hipótesis previa, en el que

la calificación vista depende de los estados de calidad, la calificación limpia, la etiqueta de prueba real y la media y la precisión de la distribución que describe la desviación entre la calificación vista y la calificación oculta, y

la etiqueta de prueba real depende de la hipótesis previa,

la calificación oculta depende de la etiqueta real de la prueba y la media y la precisión de la distribución que describe la calificación limpia,

los estados de calidad dependen de los coeficientes de la distribución opcionalmente discreta que describe los estados de calidad,

las medidas de calidad vistas dependen de los estados de calidad y la media y la precisión de la distribución que describe los grupos de medidas de calidad vista,

en el que la probabilidad de fiabilidad se calcula utilizando la siguiente expresión: **Fórmula**

donde es la fiabilidad oculta de la prueba, donde es la hipótesis de que la decisión es fiable y U no fiable, en el que θi ≥ T es la decisión del sistema de reconocimiento de un orador de que la persona es el objetivo, en el que θi ≥ NT es la decisión del sistema de reconocimiento de un orador de que la persona no es el objetivo, y en el que φ θ es el umbral del sistema de reconocimiento de un orador.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E13165466.

Solicitante: AGNITIO, S.L.

Inventor/es: VILLALBA LÓPEZ,JESÚS ANTONIO, BUERA RODRÍGUEZ,LUIS, VAQUERO AVILÉS-CASCO,CARLOS.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L17/04 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 17/00 Identificación o verificación de la persona que habla. › Entrenamiento, registro o construcción de modelos.
  • G10L17/06 G10L 17/00 […] › Técnicas de toma de decisiones; Estrategia de ajuste de patrones.
  • G10L17/10 G10L 17/00 […] › Sistemas multimodales, p. ej. basados en la integración de múltiples motores de reconocimiento o la fusión de sistemas expertos.
  • G10L17/20 G10L 17/00 […] › Transformación de patrones operaciones dirigidas al incremento de la robustez del sistema, p. ej. contra el ruido del canal o las diferentes condiciones de trabajo.

PDF original: ES-2600461_T3.pdf

 

Patentes similares o relacionadas:

Procedimiento para la identificación y la comprobación de mensajes radiotelefónicos, del 28 de Noviembre de 2018, de Frequentis AG: Procedimiento para la identificación y la comprobación de mensajes radiotelefónicos (M1...M3), así como para la asignación de mensajes radiotelefónicos […]

Reconocimiento de orador, del 9 de Noviembre de 2016, de AGNITIO, S.L.: Procedimiento para el reconocimiento de orador dependiente de texto utilizando un modelo de orador obtenido mediante la adaptación de un Modelo […]

Procedimiento y dispositivo para la clasificación de interlocutores, del 18 de Marzo de 2015, de DEUTSCHE TELEKOM AG: Procedimiento para la clasificación automática de un interlocutor gracias a un sistema numérico, en el que se aplican, como mínimo, dos procedimientos distintos […]

Procedimiento para identificar a un hablante usando ecualización de formante, del 24 de Junio de 2015, de SPEECH TECHNOLOGY CENTER LIMITED: Un procedimiento para la identificación de un hablante a partir de una grabación de audio de habla oral, en el que el procedimiento comprende: evaluar la similitud […]

Creación de una base de datos de referencia de parámetros de habla para clasificar expresiones del habla, del 24 de Enero de 2018, de VOICESENSE LTD.: Un método implementado por ordenador de creación de una base de datos de referencia de parámetros de habla para clasificar expresiones del habla según diversas características […]

Otras patentes de la CIP G10L17/20

 

 

Últimas patentes publicadas