Método y aparato para reconocimiento de voz automático.

Método de reconocimiento de voz automático, comprendiendo el método las etapas de:

recibir una señal de voz (10, 30),

dividir la señal de voz en ventanas de tiempo,

para cada ventana de tiempo;

determinar parámetros acústicos (31 a 36) de la señal de voz dentro de esa ventana, e identificar características fonológicas (51) a partir de los parámetros acústicos, de manera que se genera una secuencia de características fonológicas para la señal de voz,

separar la secuencia de características fonológicas en una secuencia de zonas (13) determinando una puntuación de inestabilidad para cada punto de tiempo en la secuencia de características fonológicas;

determinándose la puntuación de inestabilidad comparando las características extraídas en un punto de tiempo con aquellas en puntos de tiempo que preceden el punto de tiempo, de vuelta a un número configurable de milisegundos; comparar las puntuaciones de inestabilidad con un umbral de inestabilidad y una longitud de zona estable mínima para identificar zonas estables y no estables, en el que las zonas no estables se encuentran entre zonas estables (65); y comparar la secuencia de zonas con una entrada léxica que comprende una secuencia de segmentos fonológicos en un diccionario almacenado para identificar una o más palabras en la señal de voz (14, 15, 16); en el que para una entrada léxica que comprende una descripción de una palabra en cuanto a segmentos fonológicos; emparejar las zonas estables con los segmentos fonológicos de la entrada léxica, y para cada zona estable, determinar una penalización para cada característica fonológica dependiendo de las características fonológicas presentes en el segmento fonológico emparejado de la entrada léxica; y

para cada característica fonológica en una zona no estable, determinar una penalización de zona no estable, dependiendo de las características fonológicas presentes en los segmentos fonológicos emparejados de la entrada léxica alineadas con la zona estable en cada lado de la zona no estable, en donde la penalización de zona no estable más baja se selecciona para contribuir a la puntuación de emparejamiento; y

calcular una puntuación de emparejamiento a partir de las penalizaciones determinadas.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2014/067023.

Solicitante: Oxford University Innovation Limited.

Inventor/es: LAHIRI,ADITI, REETZ,HENNING, ROBERTS,PHILIP.

Fecha de Publicación: 3 de Abril de 2019.

Clasificación Internacional de Patentes:

G10L15/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 15/00 Reconocimiento de la voz (G10L 17/00 tiene prioridad). › Extracción de características para el reconocimiento de la voz; Selección de la unidad de reconocimiento.
G10L25/75 G10L […] › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal, H03G 3/34). › para modelar parámetros de la cavidad vocal.

PDF original: ES-2728871_T3.pdf

Patentes similares o relacionadas:

SISTEMA DE IDENTIFICACIÓN DE SONIDOS MEDIANTE CLASIFICACIÓN PARAMÉTRICA DE SERIES DERIVADAS, del 17 de Mayo de 2018, de UNIVERSIDAD DE SEVILLA: La presente invención tiene por objeto un sistema de identificación de sonidos que se basa en la descripción y selección de unos pocos parámetros […]

Sistema de identificación de sonidos mediante clasificación paramétrica de series derivadas, del 11 de Mayo de 2018, de UNIVERSIDAD DE SEVILLA: La presente invención tiene por objeto un sistema de identificación de sonidos que se basa en la descripción y selección de unos pocos parámetros […]

Sistema y método para realizar consultas textuales en comunicaciones de voz, del 6 de Enero de 2016, de JaJah Ltd: Un sistema para realizar consultas textuales en comunicaciones de voz, comprendiendo el sistema: un servicio de índices para almacenar […]

Sistema y método para reconocer un comando de voz de usuario en un entorno con ruido, del 1 de Abril de 2015, de Veovox SA: Sistema automático de reconocimiento de voz para reconocer un comando de voz de usuario en un entorno con ruido, que comprende: - unos medios de concordancia para […]

Procedimiento y dispositivo para generar una huella digital y procedimiento y dispositivo para identificar una señal de audio, del 15 de Junio de 2012, de M2ANY GMBH: Procedimiento para generar una huella digital de una señal de audio utilizando información de modo, que define una pluralidad de modos de huella […]

PROCEDIMIENTO DE RECONOCIMIENTO DE VOZ., del 1 de Septiembre de 2006, de PROUS SCIENCE, S.A.: Procedimiento de reconocimiento de voz, que comprende: (a) una etapa de descomposición de una señal de voz digitalizada en una pluralidad de fracciones, (b) una etapa de representación […]

EXTRACCION ADAPTABLE DE ONDICULAS PARA RECONOCIMIENTO DE VOZ., del 16 de Octubre de 2005, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD.: Método para extraer características para el reconocimiento automático de la voz, que comprende las etapas de: descomponer una señal acústica […]

MÉTODO PARA EL RECONOCIMIENTO DE UNA SEÑAL DE SONIDO IMPLEMENTADO MEDIANTE MICROCONTROLADOR, del 17 de Marzo de 2011, de BILOOP TECNOLOGIC, S.L: Método para el reconocimiento de señales, siempre que la señal esté limitada en el tiempo y sea periódica, que comprende la obtención de la envolvente, la toma de muestras […]