Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz.
Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz.
La presente invención se refiere a un método que evalúa de forma objetiva una grabación de la fonación sostenida de una vocal por medio de un sistema informático. Este método mide, de forma objetiva, cuatro aspectos de la calidad de la voz: la estabilidad de la voz, la riqueza espectral, la presencia de ruido y las irregularidades en las masas. Para ello asigna el valor de una determinada medida a cada una de los diferentes aspectos que caracterizan la calidad de la voz, donde además se han identificado los rangos de normalidad.
Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P201200636.
Solicitante: UNIVERSIDAD DE LAS PALMAS DE GRAN CANARIA.
Nacionalidad solicitante: España.
Inventor/es: TRAVIESO GONZÁLEZ,Carlos Manuel, ALONSO HERNÁNDEZ,Jesús Bernardino, FERRER BALLESTER,Miguel Ángel, DE LEÓN Y DE JUAN,José.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L15/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Reconocimiento de la voz (G10L 17/00 tiene prioridad).
- G10L17/00 G10L […] › Identificación o verificación de la persona que habla.
- G10L17/02 G10L […] › G10L 17/00 Identificación o verificación de la persona que habla. › Operaciones anteriores al procesamiento, p. ej. elección del segmento; Representación o modelado de patrones, p. ej. basados en Análisis Discriminante Linear (LDA) o componentes principales; Elección o extracción de características.
- G10L25/24 G10L […] › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal, H03G 3/34). › siendo los parámetros extraídos el cepstrum.
- G10L25/66 G10L 25/00 […] › para extraer parámetros relacionados con cuestiones de salud (detección y medidas para diagnóstico A61B 5/00).
Fragmento de la descripción:
Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz
Objeto de la invención La presente invención se refiere a un método que evalúa de forma objetiva una grabación de la fonación sostenida de una vocal por medio de un sistema informático. Este método mide, de forma objetiva, cuatro aspectos de la calidad de la voz: la estabilidad de la voz, la riqueza espectral, la presencia de ruido y las irregularidades en las masas. Para ello asigna el valor de una determinada medida a cada una de los diferentes aspectos que caracterizan la calidad de la voz, donde además se han identificado los rangos de normalidad.
Antecedentes de la invención Las técnicas basadas en métodos de inspección visual directa son las técnicas que permiten obtener la mejor valoración del estado del sistema fonador de un locutor aunque sin embargo estas técnicas presenta ciertos inconvenientes como el hecho de tratarse de técnicas invasivas, con la correspondiente incomodidad para el locutor que se preste a la evaluación, o el hecho de que este tipo de pruebas han de ser realizadas por profesionales del ámbito médico especializado. Sin embargo en determinadas ocasiones no se dispone de los medios humanos y materiales adecuados, y resulta de interés disponer de técnicas de evaluación de la calidad de la voz no invasivas y que resulten cómodas al locutor, por ejemplo para realizar el primer screenning en centros de atención primaria.
En la literatura han surgido diferentes estrategias para documentar la calidad de la voz o presencia de una disfonía. Una de las estrategias desarrolladas es realizar una descripción del estado de la voz indicando niveles predefinidos de anormalidad a partir de una valoración acústica perceptual, esto es, se pretende alcanzar una medida objetiva a partir de una valoración subjetiva. Por ejemplo:
Hirano, M.; Clinical Examination ofVoice. New York, Springer-Verlag, 1981) .
Otra de las estrategias presente en la literatura para cuantificar la calidad de la voz es la basada en medir la calidad de la voz por medio de medidas objetivas calculadas por medio de un sistema informática a partir de una grabación. Existen diferentes trabajos clínicos en los que se utilizan las medidas de calidad de la voz como herramientas para la evaluación de la voz frente a diferentes circunstancias como la aplicación de un determinado tratamiento o el sometimiento a una intervención quirúrgica, entre otras. Por ejemplo:
Rovirosa A.; Martínez-Celdrán E.; Ortega, A.; Ascaso, C.; Abellana, R.; Velasco M., Bonet M.; Herrera, C.; Casas, F.; Francisco, R.M.; Arenas, M.; Hernández, V.; Sánchez-Reyes, A.; León, C.; Traserra, J.; Biete, A.; "Acoustic Analysis after Radiotherapy in TI Vocal Cord Carcinoma: a New Approach to the Analysis of Voice Quality", International Journal of Radiation Oncology BioI. Phys. 2000; 47 (1) , 73-79.
Vélez Feijó, A.; Parence, ; Behlau, M.; Haussen, S.; De Vecino, M. C.; Castellar de Faria Martignago, B.; "Acoustic Analysis of Voice in Multiple Sclerosis Patients". Journal ofVoice. 2004; 18 (3) : 341-347.
Hartl, D. M.; Hans, S.; Vaissiere, J.; Riquet, M.; Brasnu, D.F.; "Objetive Vioce Analysis Before and After Onset of Unilateral Vocal Fold Paralysis". Journal of Voice. 2001; 15 (3) : 351-361.
Heman-Ackah, Y.D.; Michael, D.D.; Goding Jr., G.S.; "The Relationship Between Ceptral Peak Prominence and Selected Parameter of Dysphonia". Journal of Voice. 2002; 16 (1) : 20-27.
Rosique, M.; Ramón, J.L.; Canteras, M.; Rosique, L.; "Análisis Discriminante Aplicado a los Formantes de las Vocales Castellanas en la Fonación con Prótesis y Erigmofonía tras Laringuectomía Total". Acta OtorrinolaringoI. Esp. 2003; 54:361
366.
Núñez Batalla, F.; Corte Santos, P.; Señaris González, B.; Rodríguez Prado, N.; Suarez Nieto, C.; "Evaluación Espectral Cuantitativa de la Hipofunción Vocal". Acta otorrinolaringoI. Esp. 2004; 55:327-333.
Casado Morente, J.C.; Adrían Torres, J. A.; Conde Jiménez, M.; Piédrola Maroto, D.; Povedano Rodríguez, V.; Muñoz Gomariz, E.; Cantillo Baños, E.; Jurado Ramos, A.; "Estudio Objetivo de la Voz en Población Normal y en la Disfonía por Nódulos y Pólipos Vocales". Acta Otorrinolaringol Esp. 2001; 52:476-482.
Cannito, M.P.; Buder, E.H.; Chorna, L.B.; "Spectral Amplitude Measures of Adductor Spasmodic Dysphonic Speech". Journal ofVoice. 2005; 19 (3) : 391-410.
Tanner, K.; Roy, N.; Ash, A.; Buder, H.; "Spectral Moments of the Long-term Average Spectrum: Sensitive Indices ofVoice Change After Therapy?", Joumal of Voice. 2005; 19 (2) :221-222.
Damborenea; Tajada J.; Femández, L. R., Llorente Arenas, E.; Naya Gálvez, M. J.; Marín Garrido, C.; Rueda Gormedino, P.; Ortiz García, A.; " Efecto del Consumo de Tabaco en el análisis Acústico de la Voz" , Acta Otorrinolaring Esp; 1999; 50 (6) :448-452.
Preciado-López, J.A.; Calzada-Uriondo M.G.; Zabaleta-López, M.; García-Cano, F.J.; "Variabilidad en el análisis digital de la voz según vocal analizada, en pacientes normales y pacientes disfónicos", Acta Otorrinolaring Esp, 2000; 51 (7) :618-628.
-Núñez-Batalla, F.; Suarez-Nieto, C.; Maldonado-Femández, M.; Baragaño-Río, L.; Muñoz-Pinto, C.; "Aplicaciones del espectograma de banda estrecho en fonocirugía", Acta Otorrinolaring Esp, 2000; 51 (3) :243-245.
Nieto, A.; Cobeta, I.; Gamboa, F.J.; Montojo, J.; Vegas, A.; "La relación Armónico/ruido y el análisis espectrográfico en la patología de abuso vocal", Acta Otorrinolaring Esp, 1996; 47 (5) :370-376.
Selby, J.C.; Gilbert, H.R.; Lerman, J.W.; "Perceptual and Acoustic Evaluation of Individuals with Lar y ngophar y ngeal Reflux Pre-and Post-treatment", Joumal of Voice, 2003; 17 (4) : 557-570.
En la literatura también se estudian conjuntamente las medidas objetivas y las medias subjetivas, bien para encontrar una relación o bien para proponer protocolos mixtos. Por ejemplo:
Orlikoff, R.F.; Baken, R.J.; "Curing Diagnosis: Improving the Taxonomy of Phonator y Dysfunction", Sixth Conference on Advances in Quantitative Lar y ngology. Hamburg, Germany, Apri12003.
Nuñez-Batalla, F.; Corte-Santos, P.; Sequeiros-Santiago, G.; Señaris-González, B.; Suárez-Nieto, C.; "Evaluación Perceptual de la disfonía: Correlación con los Parámetros Acústicos y Fiabilidad", Acta Otorrinolaringol. Esp., 2004; 55:282-287.
Bhuta, T.; Patrick, L.; Gamett, J.D.; "Perceptual Evaluation ofVoice Quality and its Correlation with Acoustic Measurements", Joumal ofVoice, 2004; 18 (3) :299-304.
También se encuentran en la bibliografía trabajos sobre la interpretación de los valores de medidas objetivas. Por ejemplo:
J. González, T. Cervera, J. L. Miralles, "Análisis Acústico de la voz: Fiabilidad de un conjunto de parámetros multidimensionales", Acta Otorrinolaringol. Esp; 2002; 53:256-268.
Por último, la patente ES 2364401 hace referencia a un método y sistema de cómputo para el registro y análisis de la voz, que permite calcular una serie de parámetros de la fonación. Estos transportan información relevante sobre influencias causadas por trastornos orgánicos (que afectan a la fisiología de la laringe) o neurológicos (que afectan a los centros cerebrales del habla) .
Sin embargo los diferentes procedimientos de evaluación acústica basados en la percepción de la calidad de la voz presentan el inconveniente de su naturaleza subjetiva y por tanto, no garantizan la unicidad de las valoraciones obtenidas de diferentes evaluadores. Surge por tanto, como medio de objetivar estas medidas de valoración acústicas, las distintas estrategias que se basan en la estimación de medidas objetivas que cuantifican numéricamente y de forma automática la calidad de la voz a partir de una grabación de audio. Sin embargo no existe un método que permita extraer de forma clara y sencilla información clínicamente relevante en lo referente a una interpretación de los valores numéricos.
Frente a esta situación, en la presente solicitud de patente se propone un método de evaluación de la calidad clínica de la voz que evalúa de forma objetiva una grabación de la fonación sostenida de una vocal por medio de un sistema informático. Este protocolo mide, de forma objetiva, cuatro aspectos de la calidad de la voz: la estabilidad de la voz, la riqueza espectral, la presencia de ruido y las irregularidades en las masas. Para ello asigna el valor de una determinada medida a cada una de los diferentes aspectos que caracterizan la calidad de la voz, donde además se han identificado los rangos de normalidad.
Sumario de la invención La presente invención...
Reivindicaciones:
1. Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas a través de una evaluación acústica de la calidad de la voz que comprende:
- Realizar una única de grabación correspondiente a la fonación de la vocal a, no superior a cinco segundos, de forma sostenida y no susurrada, por parte del paciente a analizar;
-Almacenar las grabaciones en formato de audio digital en un sistema informático;
-Dividir cada fonación en tramas de duración 3 To (siendo To el periodo fundamental de la fonación) o 30 milisegundos;
-Calcular el promedio de cada uno de los cuatro parámetros fisiológicos calculados para cada trama sobre el total de las tramas en las que se divide la fonación, donde quedará determinada la existencia de una patología, asociado con la fonación de un locutor patológico, en función al menos un valor anormal de los cuatros parámetros fisiológicos cuantificados por dichos valores promedios.
2. Método para la evaluación clínica del sistema fonador de pacientes con patologías laríngeas según reivindicación 1, que comprende estimar los siguientes parámetros físicos sobre las diferentes tramas de la fonación:
-Cociente de perturbación de amplitud
-Valor promedio del primer pico cepstral de los cepstrum derivados espacialmente
-Promedio de la relación sub-armónico armónica
-Promedio del área inferior del índice de bicoherencia integrado
Patentes similares o relacionadas:
Sistema y procedimiento de registro de audio inteligente para dispositivos móviles, del 2 de Noviembre de 2018, de QUALCOMM INCORPORATED: Un procedimiento para un dispositivo móvil, comprendiendo el procedimiento: mientras el dispositivo móvil está en una modalidad de reposo, capturar una señal […]
Dispositivo de montaje sobre la cabeza para percepción de realidad aumentada, del 30 de Octubre de 2017, de UNIVERSIDAD DE MALAGA: Dispositivo de montaje sobre la cabeza para percepción de realidad aumentada. La invención refiere un dispositivo que comprende medios de montaje sobre la […]
Procedimiento para verificar la identidad de un orador y medio legible por ordenador y ordenador relacionados, del 12 de Octubre de 2016, de AGNITIO, S.L.: Procedimiento para verificar la identidad de un orador en base a la voz de oradores, que comprende las etapas de: a) recibir una expresión de voz de una palabra o una […]
Procedimiento y dispositivo para la clasificación de interlocutores, del 18 de Marzo de 2015, de DEUTSCHE TELEKOM AG: Procedimiento para la clasificación automática de un interlocutor gracias a un sistema numérico, en el que se aplican, como mínimo, dos procedimientos distintos […]
Tarjeta inteligente con micrófono, del 7 de Enero de 2015, de VODAFONE HOLDING GMBH: Una tarjeta inteligente, que comprende un micrófono para capturar una señal de audio, y al menos un medio (104; 110; 111i) de procesamiento para procesar […]
Detección de falsificación por cortar y pegar por alineamiento temporal dinámico, del 27 de Noviembre de 2013, de AGNITIO, S.L.: Procedimiento para comparar expresiones de voz, comprendiendo el procedimiento las etapas de: extraer una pluralidad de rasgos de una primera expresión […]
Segmentación de señales de audio en eventos auditivos, del 11 de Abril de 2013, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para dividir cada uno de los múltiples canales de señales de audio digital en eventos auditivos, quecomprende: detectar cambios en el contenido […]
MÉTODO Y SISTEMA PARA LA ESTIMACIÓN DE PARÁMETROS FISIOLÓGICOS DE LA FONACIÓN, del 23 de Diciembre de 2011, de UNIVERSIDAD POLITECNICA DE MADRID: La invención consiste en un método y sistema de cómputo para el registro y análisis de la voz, que permite calcular una serie de parámetros de la fonación. Estos transportan […]