CIP-2021 : G10L 17/22 : Procedimientos interactivos; Interfaces hombre-máquina.
CIP-2021 › G › G10 › G10L › G10L 17/00 › G10L 17/22[1] › Procedimientos interactivos; Interfaces hombre-máquina.
G FISICA.
G10 INSTRUMENTOS MUSICALES; ACUSTICA.
G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.
G10L 17/00 Identificación o verificación de la persona que habla.
G10L 17/22 · Procedimientos interactivos; Interfaces hombre-máquina.
CIP2021: Invenciones publicadas en esta sección.
Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados.
(20/05/2020). Solicitante/s: Cerence Operating Company. Inventor/es: HAULICK, TIM, PFEFFINGER,MEIK, MATHEJA,TIMO, HERBIG,TOBIAS.
Un sistema para detectar al menos una palabra de activación designada para al menos una aplicación controlada por voz, comprendiendo el sistema:
al menos un micrófono; y
al menos un procesador de hardware de ordenador configurado para realizar:
recibir una señal acústica generada por el al menos un micrófono, al menos en parte, como resultado de recibir un enunciado pronunciado por una persona que habla;
obtener información indicativa de la identidad de la persona que habla;
interpretar la señal acústica al menos en parte determinando, utilizando la información indicativa de la identidad de la persona que habla y el reconocimiento automático de voz, si el enunciado pronunciado por la persona que habla incluye la al menos una palabra de activación designada; e
interactuar con la persona que habla en función, al menos en parte, de los resultados de la interpretación.
PDF original: ES-2806204_T3.pdf
Prueba de interacción humana de audio basada en la conversión texto-a-voz y la semántica.
(29/03/2017) Proceso implementado por ordenador para proporcionar una prueba de interacción humana automática, que comprende:
seleccionar una cadena de texto de entre una pluralidad de frases de texto o una pluralidad de palabras, comprendiendo la cadena de texto seleccionada una pregunta o instrucción referente al texto;
aplicar un motor de texto-a-voz a la cadena de texto seleccionada para generar un desafío de audio, requiriendo el desafío de audio un conocimiento semántico de la pregunta o instrucción a responder, comprendiendo además la aplicación de una o más distorsiones durante la generación del desafío de audio mediante…