Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio.

Método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio,

con respecto a una señal de referencia, en el que la señal de referencia y la señal de salida son tratadas y comparadas, y el tratamiento incluye dividir la señal de referencia y la señal de salida en tramas de tiempo mutuamente correspondientes, en el que el tratamiento comprende además:

- escalar la señal de referencia hacia un nivel de intensidad fijo;

- seleccionar tramas de tiempo de la señal de salida basado en mediciones realizadas sobre la señal de referencia escalada;

- calcular un parámetro de contraste de ruido basado en las tramas de tiempo seleccionadas de la señal de salida, siendo el parámetro de contraste de ruido una medida del contraste de ruido dentro de la señal;

- aplicar una supresión de ruido en al menos una de la señal de referencia y de la señal de salida en el dominio de sonoridad perceptiva basado en el parámetro de contraste de ruido;

- sustraer perceptivamente las señales de referencia y la señal de salida para formar una señal diferencia;

- derivar el indicador de calidad desde la señal de diferencia;

- caracterizado por que la operación de calcular el parámetro de contraste de ruido comprende:

- determinar una fracción dividiendo el valor de intensidad de una primera trama de tiempo seleccionada dentro de la señal de salida por el valor de intensidad de una segunda trama de tiempo seleccionada dentro de la señal de salida;

- comprimir la fracción utilizando una ley de energía con un coeficiente de compresión predeterminado de modo que se obtenga el parámetro de contraste de ruido.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/061538.

Solicitante: KONINKLIJKE KPN N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: MAANPLEIN 55 2516 CK THE HAGUE PAISES BAJOS.

Inventor/es: BEERENDS,JOHN, VAN VUGT,JEROEN.

Fecha de Publicación: 8 de Octubre de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
G10L21/0208 G10L 21/00 […] › Filtración del ruido.
G10L25/69 G10L […] › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal, H03G 3/34). › para evaluar señales de voz sintéticas o decodificadas.
H04M3/22 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04M COMUNICACIONES TELEFONICAS (circuitos para el control de otros aparatos vía cable telefónico y que no implican aparatos de conmutación telefónica G08). › H04M 3/00 Centrales automáticas o semiautomáticas. › Disposiciones de supervisión, de control o de ensayo.

PDF original: ES-2526126_T3.pdf

Fragmento de la descripción:

Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio CAMPO DEL INVENTO

El invento se refiere a un método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio, con respecto a una señal de referencia. El invento se refiere además a un producto de programa informático que comprende un código ejecutable por ordenador, por ejemplo almacenado en un medio legible por ordenador, adaptado para realizar, cuando es ejecutado por un procesador, tal método. Finalmente el invento se refiere a un sistema para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un sistema de audio con respecto a una señal de entrada del sistema de audio que sirve como una señal de referencia.

ANTECEDENTES DEL INVENTO

La calidad de un dispositivo de audio puede ser determinada bien subjetiva o bien objetivamente. Los ensayos subjetivos consumen tiempo, son caros, y difíciles de reproducir. Por ello, se han desarrollado varios métodos para medir la calidad de una señal de salida, en particular una señal de voz, de un dispositivo de audio de un modo objetivo. En tales métodos, la calidad de voz de una señal de salida como es recibida desde un sistema de tratamiento de señal de voz es determinada por comparación con una señal de referencia.

Un método corriente que es ampliamente utilizado para este propósito es el método descrito en la Recomendación P.862 de ITU-T titulada "Evaluación perceptiva de calidad de voz (PESQ) : Un método objetivo para evaluación de la calidad de voz de final a final de redes telefónicas de banda estrecha y codec de voz". En la recomendación P.862 de ITU-T, la calidad de una señal de salida procedente de un sistema de tratamiento de señal de voz, cuya señal es generalmente distorsionada, ha de ser determinada. La señal de salida y una señal de referencia, por ejemplo la señal de entrada del sistema de tratamiento de señal, son hechas corresponder con señales de representación de acuerdo con un modelo de percepción psicofísico del sistema auditivo humano. Basado en estas señales, se determina una señal diferencial que es representativa de una distorsión dentro de la señal de salida cuando es comparada a la señal de referencia. La señal diferencial es tratada a continuación de acuerdo con un modelo cognitivo, en el que ciertas propiedades de percepción de audición humada basadas en ensayos han sido modeladas, para obtener una señal de calidad que es una medida de la calidad de la percepción auditiva de la señal de salida.

Generalmente, los dispositivos de medición objetivos como el PESQ interpretan el ruido en términos de una disminución de calidad. Sin embargo, esta interpretación es demasiado simplista. En los sistemas de telecomunicaciones actuales, en particular en sistemas que utilizan Voz-Sobre-IP (VOIP) y tecnologías similares, el impacto del ruido en la calidad de la voz varía dependiendo del nivel de señal local. Consecuentemente, el PESQ frecuentemente no proporciona predicciones óptimas de la percepción de las señales de voz tratadas en tales sistemas de telecomunicaciones, que están resultando crecientemente populares.

En la publicación "Descomposición Degradación de la Calidad Percibida de Señales de Voz sobre la Base de una Aproximación de Modelado Perceptivo", J. Audio, Eng. Soc, Vol. 55, Nº 12, págs. 1059-1076 (Diciembre de 2007) los autores describen el modo en cómo percibimos la calidad de una señal de voz y cómo diferentes degradaciones tales como el ruido y las distorsiones de respuesta de frecuencia contribuyen a la calidad de voz percibida total (audición) .

RESUMEN DEL INVENTO

Se desea tener un método de determinación de la calidad de transmisión de un sistema de audio que proporcione una correlación mejorada entre la calidad de voz cuando es determinada por medición objetiva y la calidad de voz cuando es determinada en ensayos subjetivos. Con este propósito, una realización del invento se refiere a un método para determinar un indicador de calidad que represente una calidad percibida de una señal de salida de un dispositivo de audio de acuerdo a la reivindicación 1. El indicador de calidad proporciona una indicación objetiva de la calidad de transmisión de un sistema de audio que puede ser utilizada para comparar diferentes sistemas de audio entre sí.

El contraste de ruido se refiere a la variación del nivel de ruido, preferiblemente medida a lo largo del tiempo. El valor absoluto del nivel de ruido y la variancia del ruido han de ser tenidos en cuenta. La variación del nivel de ruido a lo largo del tiempo puede desempeñar un papel relevante en la determinación del parámetro de contraste de ruido. Las figs. 6A6F muestran gráficos esquemáticos del nivel de ruido en función del tiempo para explicar adicionalmente el concepto de contraste de ruido.

La fig. 6A muestra un gráfico ejemplar del nivel de ruido en función del tiempo que demuestra el concepto de contraste de ruido. En este ejemplo, el nivel de ruido medio reside generalmente alrededor de un cierto nivel de base, por ejemplo, durante el período de tiempo T2, y ocasionalmente tiene un nivel de ruido más elevado, por ejemplo durante el período de tiempo T1. El contraste de ruido de la señal en la fig. 6A se refiere a la diferencia entre el nivel de ruido elevado cuando está presente durante el período T1 y el nivel de ruido regular cuando está presente durante el período T2. El contraste de ruido es de influencia sobre la calidad percibida de la señal de salida de un dispositivo de audio. Si tal señal de salida

comprendiera un diseño de ruido como se ha mostrado en la fig. 6A, la presencia de las partes del nivel de ruido más elevado que excede de los niveles de ruido normales puede ser experimentada como muy perturbadora por un oyente o persona que escucha. En particular un cambio en el nivel de ruido focaliza al oyente sobre el ruido. Así los niveles de ruido cambiantes son generalmente experimentados como más perturbadores que los niveles de ruido constantes.

El contraste de ruido puede ser determinado comparando diferentes partes de la señal entre sí. Cada parte puede tener una cierta longitud. La influencia sobre la longitud del intervalo de tiempo de partes de señal utilizadas en la evaluación del contraste de ruido es demostrada con referencia a los gráficos mostrados en las figs. 6B, 6C.

Las figs. 6B, 6C muestran el nivel de ruido de dos señales. Para ambas señales, el ruido está distribuido normalmente. Los niveles de ruido de las señales tienen el mismo nivel de ruido medio, sin embargo, la varianza del ruido es diferente. El intervalo de confianza de 3Ï del ruido en la fig. 6B es mayor que el intervalo de confianza de 3Ï mostrado en la fig. 6C. Obsérvese que la variación del nivel de ruido regular mostrada dentro del intervalo de confianza no es probable que ocurra en la realidad y es simplemente utilizado para mostrar que la señal puede variar ampliamente dentro del intervalo de confianza.

En las figs. 6B, 6C, si las partes de señal utilizadas para evaluar el contraste de ruido son suficientemente grandes, por ejemplo un período de tiempo T3, el valor de nivel de ruido promedio dentro de estas partes de señal es igual al valor medio del nivel de ruido. Este valor será encontrado para todas las partes de señal que dan como resultado un contraste de ruido igual a cero.

Sin embargo, si el período de tiempo de partes utilizadas para evaluar el contraste de ruido es relativamente corto, por ejemplo una longitud T4 mostrada en las figs. 6A, 6B, el valor promedio del nivel de ruido dentro de cada parte puede diferir bien del valor del nivel de ruido medio a largo plazo, y de otras partes. El contraste de ruido será así entonces distinto de cero. En tal caso, la varianza del nivel de ruido puede tener una influencia significativa sobre el contraste de ruido. La varianza de ruido de la señal en la fig. 6B es mayor que la varianza de ruido de la señal en la fig. 6C. Debido a la dispersión más amplia de los valores de nivel de ruido en la señal de la fig. 6B, la diferencia entre el nivel de ruido promedio dentro de un período de tiempo corto seleccionado y el nivel de ruido medio a un plazo mayor será generalmente mayor que tal diferencia obtenida durante una evaluación similar de la señal mostrada en la fig. 6C. Consecuentemente, el contraste de ruido de la señal en la fig. 6B será mayor que el contraste de ruido de la señal en la fig. 6C si se utilizan períodos cortos de tiempo. El contraste de ruido como se ha descrito con referencia a las figs. 6B, 6C es menos indicativo para la perturbación experimentada... [Seguir leyendo]

Reivindicaciones:

1. Método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio, con respecto a una señal de referencia, en el que la señal de referencia y la señal de salida son tratadas y comparadas, y el tratamiento incluye dividir la señal de referencia y la señal de salida en tramas de tiempo mutuamente correspondientes, en el que el tratamiento comprende además:

ï? escalar la señal de referencia hacia un nivel de intensidad fijo;

ï? seleccionar tramas de tiempo de la señal de salida basado en mediciones realizadas sobre la señal de referencia escalada;

ï? calcular un parámetro de contraste de ruido basado en las tramas de tiempo seleccionadas de la señal de 10 salida, siendo el parámetro de contraste de ruido una medida del contraste de ruido dentro de la señal;

ï? aplicar una supresión de ruido en al menos una de la señal de referencia y de la señal de salida en el dominio de sonoridad perceptiva basado en el parámetro de contraste de ruido;

ï? sustraer perceptivamente las señales de referencia y la señal de salida para formar una señal diferencia;

ï? derivar el indicador de calidad desde la señal de diferencia;

ï? caracterizado por que la operación de calcular el parámetro de contraste de ruido comprende:

ï? determinar una fracción dividiendo el valor de intensidad de una primera trama de tiempo seleccionada dentro de la señal de salida por el valor de intensidad de una segunda trama de tiempo seleccionada dentro de la señal de salida;

ï? comprimir la fracción utilizando una ley de energía con un coeficiente de compresión 20 predeterminado de modo que se obtenga el parámetro de contraste de ruido.

2. El método de la reivindicación 1, en el que el dispositivo de audio es un sistema de tratamiento de voz.

3. Método de la reivindicación 1, en el que el parámetro de contraste de ruido es establecido a un valor fijo predeterminado si la fracción comprimida está por debajo del valor fijo predeterminado.

4. Método de cualquiera de las reivindicaciones precedentes, en el que aplicar la supresión de ruido sobre la señal de 25 referencia comprende:

ï? calcular una densidad espectral de ruido promedio a lo largo de un número de tramas de tiempo que tiene un nivel de intensidad detectado por debajo de un valor de umbral;

ï? determinar un factor de supresión de ruido de referencia basado en una correlación optimizada entre información de evaluación de calidad objetiva y subjetiva; y ï? calcular un nivel de ruido deseado basado en el factor de supresión de ruido de referencia y en la densidad espectral de ruido promedio de referencia.

5. Método de cualquiera de las reivindicaciones precedentes, en el que aplicar la supresión de ruido sobre la señal de salida comprende:

ï? calcular una densidad espectral de ruido de salida promedio a lo largo de un número de tramas del tiempo 35 correspondientes a tramas del tiempo dentro de la señal de referencia que tienen un nivel de intensidad detectado por debajo de un valor de umbral;

ï? determinar una constante del nivel de ruido bajo basado en una correlación optimizada entre información de evaluación de calidad objetiva y subjetiva;

ï? determinar un factor de supresión de ruido de salida basado en una correlación optimizada entre información de 40 evaluación de calidad objetiva y subjetiva; y ï? calcular un nivel de ruido representativo de perturbación en la señal de salida utilizando la constante del nivel de ruido bajo, el factor de supresión de ruido de salida y la densidad espectral de ruido de salida promedio.

6. Método de cualquiera de las reivindicaciones precedentes, en el que el tratamiento comprende además:

ï? transformar la señal de referencia y la señal de salida desde el dominio del tiempo hacia el dominio de tiempo45 frecuencia;

ï? derivar una función de densidad de energía de tono de referencia a partir de la señal de referencia y derivar una función de densidad de energía de tono de salida a partir de la señal de salida;

ï? escalar localmente la función de densidad de energía de tono de referencia para obtener una función de densidad de energía de tono de referencia escalada localmente;

ï? compensar parcialmente o bien la función de densidad de energía de tono de salida o bien la función de densidad de energía de tono de referencia escalada localmente con respecto a la frecuencia; y ï? derivar una función de densidad de sonoridad de referencia y una función de densidad de sonoridad de salida.

7. Método de la reivindicación 6, en el que el tratamiento comprende además:

ï? escalar la intensidad de la función de densidad de energía de tono de referencia a partir del nivel de intensidad fijo hacia un nivel de intensidad relacionado a la función de densidad de energía de tono de salida para obtener una diferencia de nivel de intensidad entre las funciones de densidad de energía de tono que permiten la cuantificación del impacto del nivel de intensidad sobre la calidad percibida;

ï? escalar la sonoridad de la función de densidad de sonoridad de salida hacia un nivel de sonoridad fijo en el dominio de sonoridad perceptivo; y ï? escalar la sonoridad de la función de densidad de sonoridad de referencia a partir de un nivel de sonoridad correspondiente al nivel de intensidad relacionado con la salida hacia un nivel de sonoridad relacionado con el nivel de sonoridad de la función de densidad de sonoridad de salida en el dominio de sonoridad perceptivo, para obtener una diferencia de nivel de sonoridad entre la función de densidad de sonoridad de referencia y la función de densidad de sonoridad de salida que permita la cuantificación del impacto de sonoridad sobre la calidad percibida de la señal de salida.

8. Método de cualquiera de las reivindicaciones precedentes, en el que seleccionar las tramas de tiempo comprende seleccionar tramas de tiempo de la señal de salida correspondientes a tramas de tiempo de la señal de referencia escalada que satisfacen una condición predeterminada.

9. Método de la reivindicación 8, en el que dicha condición predeterminada incluye que la trama de tiempo de la señal de 25 referencia escalada, una trama de silencio, tiene un valor del nivel de intensidad por debajo del valor de umbral.

10. Método de la reivindicación 9, en el que dicha condición predeterminada incluye además que la trama de tiempo de la señal de referencia escalada es parte de una serie de tramas de silencio consecutivas, un intervalo de silencio.

11. Producto de programa informático que comprende un código ejecutable por ordenador, por ejemplo almacenado en

un medio legible por ordenador, adaptado para realizar, cuando es ejecutado por un procesador, el método según ha 30 sido definido por cualquiera de las reivindicaciones 1-10.

12. Sistema (20) para determinar un indicador de calidad que representa una calidad percibida de una señal de salida Y (t) de un sistema de audio (10) , por ejemplo un dispositivo de tratamiento de voz, con respecto a una señal de entrada X (t) del sistema de audio que sirve como una señal referencia, comprendiendo el sistema:

ï? un dispositivo (30) de tratamiento previo para tratar previamente la señal de referencia y la señal de salida;

ï? un primer dispositivo de tratamiento (40a) para tratar la señal de referencia, y un segundo dispositivo de tratamiento (40b) para tratar la señal de salida para obtener señales de representación R (X) , R (Y) para la señal de referencia y la señal de salida respectivamente;

ï? un dispositivo de diferenciación (50) para combinar las señales de representación de la señal de referencia y de la señal de salida de modo que se obtenga una señal diferencial D; y ï? un dispositivo de modelado (60) para tratar la señal diferencial para obtener una señal de calidad Q que representa una estimación de la calidad efectiva del sistema de tratamiento de voz;

en el que el dispositivo de tratamiento previo, el primer dispositivo de tratamiento, y el segundo dispositivo de tratamiento forman un sistema de tratamiento para realizar el método de cualquiera de las reivindicaciones 1-10.

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]