CIP 2015 : G10L 15/00 : Reconocimiento de la voz (G10L 17/00 tiene prioridad).

CIP2015GG10G10LG10L 15/00[m] › Reconocimiento de la voz (G10L 17/00 tiene prioridad).

Notas[t] desde G01 hasta G12: INSTRUMENTOS

G10L 15/01 · Valoración o evaluación de los sistemas de reconocimiento de voz.

G10L 15/02 · Extracción de características para el reconocimiento de la voz; Selección de la unidad de reconocimiento.

G10L 15/04 · Segmentación o detección de los límites de las palabras.

G10L 15/05 · · Detección de los límites de las palabras.

G10L 15/06 · Creación de plantillas de referencia; Entrenamiento de sistemas de reconocimiento de la voz, p. ej. adaptación a las características de la voz de la persona que habla (G10L 15/14 tiene prioridad).

G10L 15/065 · · Adaptación.

G10L 15/07 · · · a la persona que habla.

G10L 15/08 · Búsqueda o clasificación de la voz.

G10L 15/10 · · utilizando medidas de distorsión o distancia entre la voz desconocida y las plantillas de referencia.

G10L 15/12 · · utilizando técnicas de programación dinámica, p.ej. normalización temporal por comparación dinámica [DTW].

G10L 15/14 · · utilizando técnicas de programación dinámica, p.ej. normalización temporal por comparación dinámica [DTW] (G10L 15/18  tiene prioridad).

G10L 15/16 · · utilizando redes neuronales artificiales.

G10L 15/18 · · utilizando una modelización del lenguaje natural.

G10L 15/183 · · · utilizando dependencias del contexto, p. ej. modelos del lenguaje.

G10L 15/187 · · · · Contextos fonémicos, p. ej. reglas de pronunciación, impedimentos fonotácticos, n-grama de fonemas.

G10L 15/19 · · · · Contexto gramatical, p. ej. desambiguación de las hipótesis de reconocimiento basadas en reglas de secuencias de palabras.

G10L 15/193 · · · · · Gramática formal, p. ej. autómatas finitos, gramática libre de contexto o cadenas de palabras.

G10L 15/197 · · · · · Gramática probabilística, p. ej. n-gramas de palabras.

G10L 15/20 · Técnicas de reconocimiento de la voz especialmente adaptadas para trabajar en ambientes adversos, p. ej. en presencia de ruido o para voz emitida en situaciones de estrés (G10L 21/02  tiene prioridad).

G10L 15/22 · Procedimientos utilizados durante el proceso de reconocimiento de la voz, p. ej. diálogo hombre-máquina.

G10L 15/24 · Reconocimiento de la voz mediante la utilización de medios no acústicos.

G10L 15/25 · · utilizando la posición de los labios, el movimiento de los labios o el análisis del rostro.

G10L 15/26 · Sistemas de síntesis de texto a partir de la voz (G10L 15/08 tiene prioridad).

G10L 15/28 · Detalles estructurales de sistemas de reconocimiento de la voz.

G10L 15/30 · · Reconocimiento distribuido, p. ej. en sistemas cliente-servidor, para teléfonos móviles o aplicaciones en red.

G10L 15/32 · · Reconocedores múltiples usados en serie o en paralelo; Basados en sistemas de puntuaciones combinadas, p. ej. sistemas de voto..

G10L 15/34 · · Adaptación de un reconocedor individual a un procesamiento en paralelo, p. ej. usando procesadores múltiples o computación en la nube (cloud computing)..

CIP2015: Invenciones publicadas en esta sección.

SISTEMA DE IDENTIFICACIÓN DE SONIDOS MEDIANTE CLASIFICACIÓN PARAMÉTRICA DE SERIES DERIVADAS.

(17/05/2018). Solicitante/s: UNIVERSIDAD DE SEVILLA. Inventor/es: BARBANCHO CONCEJERO,Julio, CARRASCO MUÑOZ,Alejandro, ROMERO LEMOS,Javier, LUQUE SENDRA Amalia.

La presente invención tiene por objeto un sistema de identificación de sonidos que se basa en la descripción y selección de unos pocos parámetros caracterizadores de los mismos, la obtención de series derivadas de puntuaciones de clasificación de los mismos, y la asignación definitiva a una ciase de sonido mediante la caracterización paramétrica y la clasificación de la serie derivada. La invención se encuadra en el sector de la tecnología electrónica y de las comunicaciones, concretamente de aplicación en sistemas de proceso de información y sistemas de archivo y recuperación, entre otros.

Sistema de identificación de sonidos mediante clasificación paramétrica de series derivadas.

(11/05/2018). Solicitante/s: UNIVERSIDAD DE SEVILLA. Inventor/es: BARBANCHO CONCEJERO,Julio, CARRASCO MUÑOZ,Alejandro, LUQUE SANDRA,Amalia, ROMERO LEMOS,Javier.

La presente invención tiene por objeto un sistema de identificación de sonidos que se basa en la descripción y selección de unos pocos parámetros caracterizadores de los mismos, la obtención de series derivadas de puntuaciones de clasificación de los mismos, y la asignación definitiva a una clase de sonido mediante la caracterización paramétrica y la clasificación de la serie derivada. La invención se encuadra en el sector de la tecnología electrónica y de las comunicaciones, concretamente de aplicación en sistemas de proceso de información y sistemas de archivo y recuperación, entre otros.

PDF original: ES-2667626_A1.pdf

SISTEMA Y MÉTODO PARA LA AUTOMATIZACIÓN Y USO SEGURO DE APLICACIONES MÓVILES EN VEHÍCULOS.

(21/09/2017). Solicitante/s: UNIVERSIDAD DE LA LAGUNA. Inventor/es: CABALLERO GIL,Pino, CABALLERO GIL,Cándido, MOLINA GIL,Jezabel.

Sistema y método para la automatización y uso seguro de aplicaciones móviles especialmente diseñado para, ser utilizado por conductores de vehículos mientras se conduce para evitar distracciones y reducir accidentes en carretera. Esta invención puede utilizarse con el habitual dispositivo manos libres Bluetooth (IEEE 802.15.1) presente en la mayoría de vehículos, lo que elimina a la vez la necesidad de contar con alguna OBU compleja integrada a bordo del vehículo, y la limitación de uso a determinados vehículos.

Tarjeta inteligente con micrófono.

(07/01/2015) Una tarjeta inteligente, que comprende un micrófono para capturar una señal de audio, y al menos un medio (104; 110; 111i) de procesamiento para procesar la señal de audio y evitar la manipulación indebida de la señal de audio, estando dicha tarjeta inteligente configurada para su uso en un dispositivo de comunicación móvil, que está conectado a una red de comunicación móvil, caracterizada porque la tarjeta inteligente es un módulo de identidad del abonado o módulo de identidad del abonado universal que proporciona funciones para acceder a servicios de la red de comunicación móvil, como GSM o UMTS, incluyendo la autentificación de un abonado hacia la red de comunicación asignada a la tarjeta inteligente, en la que la tarjeta inteligente está configurada para emitir un comando…

Método e instalación de comprobación de sistemas de alarma a distancia en ascensores.

(07/05/2014) Método e instalación de comprobación de sistemas de alarma a distancia en ascensores. Permiten realizar una comprobación completa, eficaz y rápida de los sistemas de alarma de los ascensores , siendo dicha comprobación totalmente independiente del modelo y/o fabricante del sistema de alarma en cuestión a comprobar, dotando al método y a la instalación aquí descritos de un carácter universal, válido para cualquier ascensor equipado de sistema de alarma , y con posibilidad de ejecutar dicha comprobación sin necesidad de requerir de ningún operador humano.

Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz.

(03/12/2013) Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz. La presente invención se refiere a un método que evalúa de forma objetiva una grabación de la fonación sostenida de una vocal por medio de un sistema informático. Este método mide, de forma objetiva, cuatro aspectos de la calidad de la voz: la estabilidad de la voz, la riqueza espectral, la presencia de ruido y las irregularidades en las masas. Para ello asigna el valor de una determinada medida a cada una de los diferentes aspectos que caracterizan la calidad de la voz, donde además se han identificado los rangos de normalidad.

MÉTODO PARA GESTIONAR EL RECONOCIMIENTO DEL HABLA DE LLAMADAS DE AUDIO.

(26/06/2013) Método para gestionar el reconocimiento del habla de llamadas de audio. En el método de la invención dichas llamadas de audio se realizan en un sistema basado en protocolo de control de recursos de medios, o MRCP, y dicho reconocimiento del habla se lleva a cabo por un motor ASR controlado por un servidor de MRCP buscando una coincidencia entre un flujo de audio generado por un usuario y una gramática compilada. El método se caracteriza porque comprende realizar dicho reconocimiento del habla de manera continua enviando, dicho servidor de MRCP, eventos regularmente a dicho usuario cuando se producen coincidencias, indicando cada uno de dichos eventos un resultado parcial de dicho reconocimiento del habla e ignorando…

Sistema y método para determinar un perfil personal SHG por análisis de voz.

(15/01/2013) Un método para analizar una voz de un locutor, que comprende: recibir, por un ordenador, datos indicativos de voz desde el locutor; calcular, por un ordenador, sobre la base de los datos recibidos, un valor medio de la intensidad para cada una de una pluralidad de frecuencias, en el que el cálculo del valor de la intensidad media para cada frecuencia se basa en: i) dividir, por un ordenador, los datos recibidos en un número de periodos de tiempo; ii) obtener, por un ordenador, una intensidad de la voz del locutor para cada frecuencia durante cada periodo de tiempo; iii) obtener, por un ordenador, una suma de valores de intensidad para cada frecuencia durante todos los periodos de tiempo; y iv) dividir, por un ordenador, la suma de valores de intensidad para cada frecuencia por el número de periodos de tiempo; calcular,…

MÉTODO Y SISTEMA PARA LA ESTIMACIÓN DE PARÁMETROS FISIOLÓGICOS DE LA FONACIÓN.

(03/01/2013) La invención consiste en un método y sistema de cómputo para el registro y análisis de la voz, que permite calcular una serie de parámetros de la fonación. Estos transportan información relevante sobre influencias causadas por trastornos orgánicos (que afectan a la fisiología de la laringe) o neurológicos (que afectan a los centros cerebrales del habla). Asimismo se consideran parte esencial de la invención los procedimientos clasificatorios que permiten obtener estimaciones de la disfunción presente y de asignación de personalidad. La utilidad de la invención se enmarca, en la posibilidad de aplicar la estimación de disfunción en los centros médicos de asistencia primaria para el cribado de pacientes a los centros de atención especializada,…

INTERACCION MULTIMODAL SOBRE APLICACIONES DE TELEVISION DIGITAL.

(13/06/2012) La invención propone un método de interacción multimodal sobre aplicaciones de televisión digital donde la aplicación multimodal reside en un servidor web y es descargada por un navegador que reside en el propio descodificador de televisión . Utilizando un sistema distribuido de componentes y a través de los protocolos de comunicaciones se pueden realizar todos los procesos de análisis de interacción multimodal en tiempo real. El sistema permite la interacción del usuario con la aplicación mediante el uso del mando a distancia o de la voz.

Método para la conversión automática de mensajes de texto o similares a voz.

(11/06/2012) Método para la conversión automática de mensajes de texto en un mensaje de voz, así como la transmisión y emisión del mensaje de voz a al menos una conexión telefónica que presenta un número de llamada en una red de telefonía fija o móvil del receptor, en donde el mensaje de texto a transmitir se introduce mediante un programa de correo electrónico cualquiera y un terminal que está apropiado para la transmisión de correos electrónicos según el protocolo SMTP u otros protocolos apropiados en internet y se transmite el mensaje de texto a trasmitir mediante una red de transmisión hacia un equipo de red y se convierte por el equipo de red en un formato de voz, caracterizado porque el número de teléfono del receptor se introduce en forma de una dirección de correo electrónico, en donde el nombre del dominio se deriva del nombre del operador…

PROCEDIMIENTO Y SISTEMA PARA EL RECONOCIMIENTO DE VOZ PARA UN APARATO PEQUEÑO.

(16/08/2005) Procedimiento para el reconocimiento de voz para un aparato pequeño (MS, T) unido con una red de telecomunicaciones o bien una red de datos (GSM, TN), donde el procedimiento incluye un reconocimiento de cadenas de letras o bien caracteres como palabras, que se emiten como palabra escrita y/o se utiliza para fines de mando, y el reconocimiento de las cadenas de letras o bien caracteres se realiza al menos parcialmente en un servidor central (PRO) unido a través de la red de comunicaciones o bien de datos con el aparato pequeño, caracterizado porque las cadenas de letras o bien caracteres a reconocer se forman a partir de letras o bien caracteres individuales pronunciados, y en el aparato pequeño (MST) se realiza en una primera etapa de transformación una conversión voz-texto de la cadena de letras o bien caracteres pronunciada en…

METODOS Y APARATOS PARA PROBAR LA INTEGRIDAD DE LA INTERFAZ DEL USUARIO EN DISPOSITIVOS ACTIVADOS VOCALMENTE.

(16/06/2005). Ver ilustración. Solicitante/s: QUALCOMM INCORPORATED. Inventor/es: GARUDADRI, HARINATH, DEJACO, ANDREW, P., WALTERS, RICHARD, P.

Dispositivo para probar y preparar un reconocedor de voz, que consta de: medios para almacenar una serie de emisiones vocales; medios para probar el reconocedor de voz, que constan de: medios para recibir un incitador para una primera operación del reconocedor de voz. medios para responder al incitador para la primera operación con una primera selección de la serie de emisiones vocales. medios para suministrar una entrada de audio al reconocedor de voz correspondiente a la primera selección, y medios para monitorizar el reconocedor de voz y que ejecute con éxito la primera operación.

METODO PARA RECONOCIMIENTO DE VOZ AUTOMATICO DE PALABRAS HABLADAS ARBITRARIAS.

(16/06/2005). Solicitante/s: AT&T IPM CORP.. Inventor/es: GARBERG, ROGER BORGAN, YUDKOWSKY, MICHAEL ALLEN.

SE PRESENTA UN METODO Y UN SISTEMA PARA HACER POSIBLE QUE UN SISTEMA DE RECONOCIMIENTO AUTOMATICO DEL HABLA (ASR) RECONOZCA PALABRAS ARBITRARIAS, ACCEDIENDO A LA INFORMACION EN UNA BASE DE DATOS SUPLEMENTARIA. LA BASE DE DATOS SUPLEMENTARIA ES ACCEDIDA PARA RECUPERAR INFORMACION TEXTUAL SUPLEMENTARIA, TAL COMO UN NOMBRE PROPIO. SE UTILIZA UN MEDIO DE TEXTO-A-HABLA PARA GENERAR UNA TRANSCRIPCION DE FONEMAS DEL TEXTO RECUPERADO DE LA BASE DE DATOS SUPLEMENTARIA, DE MANERA QUE PUEDA UTILIZARSE LA TRANSCRIPCION COMO PLANTILLA INDEPENDIENTE DE LA PERSONA QUE HABLA POR EL SISTEMA ASR PARA RECONOCER UNA PALABRA HABLADA.

METODO Y APARATO PARA INFORMACION COMBINADA A PARTIR DE SEÑALES DE VOZ PARA INTERACCION ADAPTABLE EN ENSEÑANZA Y ENSAYOS.

(16/02/2003) SISTEMA INFORMATICO CON UNA COMPONENTE DE RECONOCIMIENTO DE VOZ QUE PROPORCIONA UN PROCEDIMIENTO Y UN APARATO PARA ENSEÑAR Y EVALUAR LA PROFICIENCIA DE USUARIOS HUMANOS EN HABILIDADES QUE PUEDEN SER EXHIBIDAS AL HABLAR. EL SISTEMA INFORMATIZADO SIGUE LAS CARACTERISTICAS LINGUISTICAS, DE INDEXACION Y PARALINGUISTICAS DE LAS SEÑALES HABLADAS POR LOS USUARIOS Y EJECUTA JUEGOS, ACCESO A DATOS, SISTEMAS DE INSTRUCCION Y EXAMENES. EL SISTEMA INFORMATIZADO COMBINA AUTOMATICAMENTE LAS CARACTERISTICAS DE LA SEÑAL HABLADA PARA SELECCIONAR UN MATERIAL ADECUADO Y PRESENTARLO EN UNA FORMA ADECUADA PARA EL USUARIO. EN UNA REALIZACION, EL SISTEMA INFORMATIZADO MIDE LA LATENCIA DE…

RECONOCIMIENTO Y VERIFICACION DE VOZ SIMULTANEOS, INDEPENDIENTES DEL LOCUTOR, EN UNA RED TELEFONICA.

(16/01/2003). Ver ilustración. Solicitante/s: VCS INDUSTRIES, INC. Inventor/es: HUNT, ALAN K., SCHALK, THOMAS B..

A LA PERSONA QUE LLAMA SE LE PIDE QUE ENUNCIE UNA FRASE ALFANUMERICA QUE COMPRENDE UN CIERTO NUMERO DE CARACTERES. HABIENDO PUESTO A CERO UN REGISTRADOR DE DISTANCIA DE RECONOCIMIENTO ACUMULATIVO O SU EQUIVALENTE, CADA UNO DE LOS CARACTERES ES CAPTADO Y ANALIZADO Y SE CALCULA UNA FORMA DE DISIMILITUD ACUSTICA EN RELACION CON UN CORRESPONDIENTE CARACTER DE REFERENCIA PREVIAMENTE ALMACENADO DE UNA SERIE ALFANUMERICA DE REFERENCIA. EL REGISTRO ES INCREMENTADO MEDIANTE UNA DIFERENCIA CUANTIFICADA ENTRE EL CARACTER DE REFERENCIA Y EL CARACTER CAPTADO Y POSTERIORMENTE SE EFECTUA UNA VALORACION PARA DETERMINAR CUAL DE LAS SERIES ALFANUMERICAS DE REFERENCIA TIENE LA MENOR DISTANCIA DE RECONOCIMIENTO ACUMULATIVO LO CUAL INDICA QUE ESTA FUE LA FRASE ALFANUMERICA PRONUNCIADA POR QUIEN LLAMA. DE ESTA FORMA SE CONSIGUE UN ROBUSTO SISTEMA DE RECONOCIMIENTO DE FRASES MEDIANTE LA METODOLOGIA QUE ILUSTRA LA FIGURA 6.

PROCEDIMIENTO PARA AJUSTAR PARAMETROS ESPECIFICOS DE UN TERMINAL DE COMUNICACION.

(16/10/2002) SE EXPONE UN PROCEDIMIENTO PARA AJUSTAR PARAMETROS ESPECIFICOS DE UN TERMINAL DE COMUNICACIONES, QUE CONSISTE EN LAS ETAPAS SIGUIENTES: A) ACTIVACION DE UN DISPOSITIVO DE RECONOCIMIENTO VOCAL PARA CONVERTIR SEÑALES ACUSTICAS EN UNA SECUENCIA DE DATOS Y RECONOCER LA CONCORDANCIA DE AL MENOS PARTE DE ESTA SECUENCIA DE DATOS CON UN MODELO DE REFERENCIA QUE CORRESPONDE A UN COMANDO VOCAL DETERMINADO; B) INTRODUCIR UN COMANDO VOCAL POR PARTE DE UN OPERADOR Y DETECTAR, POR PARTE DEL DISPOSITIVO DE RECONOCIMIENTO VOCAL, DE ACUERDO CON ESTE COMANDO VOCAL, UN MANDO DE VOZ ASIGNADO A UN DETERMINADO PARAMETRO ESPECIFICO DEL TERMINAL; C) EN EL CASO DE CONCORDANCIA ENTRE EL COMANDO VOCAL INTRODUCIDO Y EL COMANDO VOCAL ASIGNADO AL PERIMETRO, LA ACTIVACION DEL MODO DE AJUSTE DE ESTE PARAMETRO SE DETECTA POR PARTE DEL DISPOSITIVO DE CONTROL; D) SACAR UNA INDICACION…

SISTEMA Y METODO PARA PRESENTACION EN PANTALLA DE VIDEO CONTROLADO POR VOZ.

(16/04/2002). Solicitante/s: AT&T IPM CORP.. Inventor/es: BROWN, MICHAEL KENNETH, BUNTSCHUH, BRUCE MELVIN.

SE PRESENTA UN SISTEMA Y UN METODO PARA UN SISTEMA DE REPRESENTACION DE IMAGENES SOBRE PANTALLA DE VIDEO CONTROLADO POR LA VOZ. EL SISTEMA CONTROLADO POR LA VOZ ES UTIL PARA SUMINISTRAR UNA NAVEGACION DE "MANOS LIBRES" A TRAVES DE LAS DIFERENTES REPRESENTACIONES DE IMAGENES EN UNA PANTALLA DE VIDEO TAL COMO LA RED WORLD WIDE WEB Y LA REPRESENTACION DE IMAGENES DE LA TELEVISION INTERACTIVA. DURANTE LA OPERACION DEL SISTEMA, LOS MODELOS DEL IDIOMA SE DERIVAN DE LOS DATOS ENTRANTES EN APLICACIONES TALES COMO LA RED WORLD WIDE WEB.

RECONOCIMIENTO DEL HABLA.

(01/03/2002). Ver ilustración. Solicitante/s: BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY. Inventor/es: SCAHILL, FRANCIS, JAMES, SIMONS, ALISON, DIANE, WHITTAKER, STEVEN, JOHN.

SE PROPORCIONA UN RECONOCEDOR CON UNOS VALORES DE PROBABILIDAD A PRIORI (POR EJEMPLO, DE ALGUN RECONOCIMIENTO ANTERIOR) INDICANDO QUE PROBABILIDADES TIENEN LAS DIFERENTES PALABRAS DEL VOCABULARIO DEL RECONOCEDOR DE OCURRIR EN EL CONTEXTO PARTICULAR, Y A ESTOS VALORES SE LES DAN "PUNTOS" DE RECONOCIMIENTO ANTES DE QUE SE ELIJA UN RESULTADO (O RESULTADOS). EL RECONOCEDOR TAMBIEN EMPLEA "PODA" DE FORMA QUE RESULTADOS PARCIALES DE BAJA PUNTUACION SE DESCARTAN PARA ACELERAR EL PROCESO DE RECONOCIMIENTO. PARA EVITAR LA PODA PREMATURA DE LAS PALABRAS MAS PROBABLES, LOS VALORES DE PROBABILIDAD SE APLICAN ANTES DE QUE SE TOMEN LAS DECISIONES DE PODA. SE DESCRIBE UN METODO PARA APLICAR ESTOS VALORES DE PROBABILIDAD.

PROCEDIMIENTO PARA EL RECONOCIMIENTO DE PALABRAS CON FASE DE APRENDIZAJE.

(01/12/2000). Ver ilustración. Solicitante/s: MATRA NORTEL COMMUNICATIONS. Inventor/es: ALEXANDRE, PATRICE, LOCKWOOD, PHILIP.

EN LA FASE DE RECONOCIMIENTO, SE PROCESAN LAS SEÑALES PROCEDENTES DE UN SENSOR PARA OBTENER PARAMETROS QUE SE COMPARAN CON LOS ALMACENADOS EN UN DICCIONARIO EN LA FASE DE APRENDIZAJE A FIN DE RECONOCER LAS ESTRUCTURAS VOCALES PRONUNCIADAS POR EL USUARIO EN AMBIENTES RUIDOSOS. EL REGISTRO DE DICHOS PARAMETROS EN LAS FASES DE APRENDIZAJE Y RECONOCIMIENTO COMPRENDE LA FORMACION DE TRAMAS NUMERICAS (S(N)) DE LONGITUD PREDETERMINADA A PARTIR DE LA SEÑAL PROCEDENTE DEL SENSOR, LA TRANSFORMACION DE CADA TRAMA DEL CAMPO TEMPORAL AL CAMPO FRECUENCIAL PARA OBTENER UN ESPECTRO X(I) Y LA APLICACION DE UNA TRANSFORMACION INVERSA, DEL CAMPO FRECUENCIAL AL CAMPO TEMPORAL, SEGUN UNA MAGNITUD [X(I)] SUP, GA}}, DONDE [X(I)] REPRESENTA EL MODULO DEL ESPECTRO Y GA}, UN EXPONENTE ADECUADO, QUE PUEDE VARIAR DURANTE LA FASE DE RECONOCIMIENTO.

 

Patentes más consultadas

 

Clasificación Internacional de Patentes 2015