CIP-2021 : G10L 17/22 : Procedimientos interactivos; Interfaces hombre-máquina.

CIP-2021 › G › G10 › G10L › G10L 17/00 › G10L 17/22^[1] › Procedimientos interactivos; Interfaces hombre-máquina.

G FISICA.

G10 INSTRUMENTOS MUSICALES; ACUSTICA.

G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.

G10L 17/00 Identificación o verificación de la persona que habla.

G10L 17/22 · Procedimientos interactivos; Interfaces hombre-máquina.

CIP2021: Invenciones publicadas en esta sección.

Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados.

(20/05/2020). Solicitante/s: Cerence Operating Company. Inventor/es: HAULICK, TIM, PFEFFINGER,MEIK, MATHEJA,TIMO, HERBIG,TOBIAS.

Un sistema para detectar al menos una palabra de activación designada para al menos una aplicación controlada por voz, comprendiendo el sistema: al menos un micrófono; y al menos un procesador de hardware de ordenador configurado para realizar: recibir una señal acústica generada por el al menos un micrófono, al menos en parte, como resultado de recibir un enunciado pronunciado por una persona que habla; obtener información indicativa de la identidad de la persona que habla; interpretar la señal acústica al menos en parte determinando, utilizando la información indicativa de la identidad de la persona que habla y el reconocimiento automático de voz, si el enunciado pronunciado por la persona que habla incluye la al menos una palabra de activación designada; e interactuar con la persona que habla en función, al menos en parte, de los resultados de la interpretación.

PDF original: ES-2806204_T3.pdf

Prueba de interacción humana de audio basada en la conversión texto-a-voz y la semántica.

(29/03/2017) Proceso implementado por ordenador para proporcionar una prueba de interacción humana automática, que comprende: seleccionar una cadena de texto de entre una pluralidad de frases de texto o una pluralidad de palabras, comprendiendo la cadena de texto seleccionada una pregunta o instrucción referente al texto; aplicar un motor de texto-a-voz a la cadena de texto seleccionada para generar un desafío de audio, requiriendo el desafío de audio un conocimiento semántico de la pregunta o instrucción a responder, comprendiendo además la aplicación de una o más distorsiones durante la generación del desafío de audio mediante…