Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio.

Método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio

, con respecto a una señal de referencia, en el que la señal de referencia y la señal de salida son tratadas y comparadas, y el tratamiento incluye dividir la señal de referencia y la señal de salida en tramas de tiempo mutuamente correspondientes, en el que el tratamiento comprende además:

- escalar la señal de referencia hacia un nivel de intensidad fijo;

- seleccionar tramas de tiempo de la señal de salida basado en mediciones realizadas sobre la señal de referencia escalada;

- calcular un parámetro de contraste de ruido basado en las tramas de tiempo seleccionadas de la señal de salida, siendo el parámetro de contraste de ruido una medida del contraste de ruido dentro de la señal;

- aplicar una supresión de ruido en al menos una de la señal de referencia y de la señal de salida en el dominio de sonoridad perceptiva basado en el parámetro de contraste de ruido;

- sustraer perceptivamente las señales de referencia y la señal de salida para formar una señal diferencia;

- derivar el indicador de calidad desde la señal de diferencia;

- caracterizado por que la operación de calcular el parámetro de contraste de ruido comprende:

- determinar una fracción dividiendo el valor de intensidad de una primera trama de tiempo seleccionada dentro de la señal de salida por el valor de intensidad de una segunda trama de tiempo seleccionada dentro de la señal de salida;

- comprimir la fracción utilizando una ley de energía con un coeficiente de compresión predeterminado de modo que se obtenga el parámetro de contraste de ruido.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/061538.

Solicitante: KONINKLIJKE KPN N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: MAANPLEIN 55 2516 CK THE HAGUE PAISES BAJOS.

Inventor/es: BEERENDS,JOHN, VAN VUGT,JEROEN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/02 (Mejora de la inteligibilidad de la voz, p.ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > COMUNICACIONES TELEFONICAS (circuitos para el control... > Centrales automáticas o semiautomáticas > H04M3/22 (Disposiciones de supervisión, de control o de ensayo)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis del habla o voz no restringidos... > G10L25/69 (para evaluar señales de voz sintéticas o decodificadas)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/0208 (Filtración del ruido)

PDF original: ES-2526126_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio CAMPO DEL INVENTO

El invento se refiere a un método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio, con respecto a una señal de referencia. El invento se refiere además a un producto de programa informático que comprende un código ejecutable por ordenador, por ejemplo almacenado en un medio legible por ordenador, adaptado para realizar, cuando es ejecutado por un procesador, tal método. Finalmente el invento se refiere a un sistema para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un sistema de audio con respecto a una señal de entrada del sistema de audio que sirve como una señal de referencia.

ANTECEDENTES DEL INVENTO

La calidad de un dispositivo de audio puede ser determinada bien subjetiva o bien objetivamente. Los ensayos subjetivos consumen tiempo, son caros, y difíciles de reproducir. Por ello, se han desarrollado varios métodos para medir la calidad de una señal de salida, en particular una señal de voz, de un dispositivo de audio de un modo objetivo. En tales métodos, la calidad de voz de una señal de salida como es recibida desde un sistema de tratamiento de señal de voz es determinada por comparación con una señal de referencia.

Un método corriente que es ampliamente utilizado para este propósito es el método descrito en la Recomendación P.862 de ITU-T titulada "Evaluación perceptiva de calidad de voz (PESQ) : Un método objetivo para evaluación de la calidad de voz de final a final de redes telefónicas de banda estrecha y codec de voz". En la recomendación P.862 de ITU-T, la calidad de una señal de salida procedente de un sistema de tratamiento de señal de voz, cuya señal es generalmente distorsionada, ha de ser determinada. La señal de salida y una señal de referencia, por ejemplo la señal de entrada del sistema de tratamiento de señal, son hechas corresponder con señales de representación de acuerdo con un modelo de percepción psicofísico del sistema auditivo humano. Basado en estas señales, se determina una señal diferencial que es representativa de una distorsión dentro de la señal de salida cuando es comparada a la señal de referencia. La señal diferencial es tratada a continuación de acuerdo con un modelo cognitivo, en el que ciertas propiedades de percepción de audición humada basadas en ensayos han sido modeladas, para obtener una señal de calidad que es una medida de la calidad de la percepción auditiva de la señal de salida.

Generalmente, los dispositivos de medición objetivos como el PESQ interpretan el ruido en términos de una disminución de calidad. Sin embargo, esta interpretación es demasiado simplista. En los sistemas de telecomunicaciones actuales, en particular en sistemas que utilizan Voz-Sobre-IP (VOIP) y tecnologías similares, el impacto del ruido en la calidad de la voz varía dependiendo del nivel de señal local. Consecuentemente, el PESQ frecuentemente no proporciona predicciones óptimas de la percepción de las señales de voz tratadas en tales sistemas de telecomunicaciones, que están resultando crecientemente populares.

En la publicación "Descomposición Degradación de la Calidad Percibida de Señales de Voz sobre la Base de una Aproximación de Modelado Perceptivo", J. Audio, Eng. Soc, Vol. 55, Nº 12, págs. 1059-1076 (Diciembre de 2007) los autores describen el modo en cómo percibimos la calidad de una señal de voz y cómo diferentes degradaciones tales como el ruido y las distorsiones de respuesta de frecuencia contribuyen a la calidad de voz percibida total (audición) .

RESUMEN DEL INVENTO

Se desea tener un método de determinación de la calidad de transmisión de un sistema de audio que proporcione una correlación mejorada entre la calidad de voz cuando es determinada por medición objetiva y la calidad de voz cuando es determinada en ensayos subjetivos. Con este propósito, una realización del invento se refiere a un método para determinar un indicador de calidad que represente una calidad percibida de una señal de salida de un dispositivo de audio de acuerdo a la reivindicación 1. El indicador de calidad proporciona una indicación objetiva de la calidad de transmisión de un sistema de audio que puede ser utilizada para comparar diferentes sistemas de audio entre sí.

El contraste de ruido se refiere a la variación del nivel de ruido, preferiblemente medida a lo largo del tiempo. El valor absoluto del nivel de ruido y la variancia del ruido han de ser tenidos en cuenta. La variación del nivel de ruido a lo largo del tiempo puede desempeñar un papel relevante en la determinación del parámetro de contraste de ruido. Las figs. 6A6F muestran gráficos esquemáticos del nivel de ruido en función del tiempo para explicar adicionalmente el concepto de contraste de ruido.

La fig. 6A muestra un gráfico ejemplar del nivel de ruido en función del tiempo que demuestra el concepto de contraste de ruido. En este ejemplo, el nivel de ruido medio reside generalmente alrededor de un cierto nivel de base, por ejemplo, durante el período de tiempo T2, y ocasionalmente tiene un nivel de ruido más elevado, por ejemplo durante el período de tiempo T1. El contraste de ruido de la señal en la fig. 6A se refiere a la diferencia entre el nivel de ruido elevado cuando está presente durante el período T1 y el nivel de ruido regular cuando está presente durante el período T2. El contraste de ruido es de influencia sobre la calidad percibida de la señal de salida de un dispositivo de audio. Si tal señal de salida

comprendiera un diseño de ruido como se ha mostrado en la fig. 6A, la presencia de las partes del nivel de ruido más elevado que excede de los niveles de ruido normales puede ser experimentada como muy perturbadora por un oyente o persona que escucha. En particular un cambio en el nivel de ruido focaliza al oyente sobre el ruido. Así los niveles de ruido cambiantes son generalmente experimentados como más perturbadores que los niveles de ruido constantes.

El contraste de ruido puede ser determinado comparando diferentes partes de la señal entre sí. Cada parte puede tener una cierta longitud. La influencia sobre la longitud del intervalo de tiempo de partes de señal utilizadas en la evaluación del contraste de ruido es demostrada con referencia a los gráficos mostrados en las figs. 6B, 6C.

Las figs. 6B, 6C muestran el nivel de ruido de dos señales. Para ambas señales, el ruido está distribuido normalmente. Los niveles de ruido de las señales tienen el mismo nivel de ruido medio, sin embargo, la varianza del ruido es diferente. El intervalo de confianza de 3Ï del ruido en la fig. 6B es mayor que el intervalo de confianza de 3Ï mostrado en la fig. 6C. Obsérvese que la variación del nivel de ruido regular mostrada dentro del intervalo de confianza no es probable que ocurra en la realidad y es simplemente utilizado para mostrar que la señal puede variar ampliamente dentro del intervalo de confianza.

En las figs. 6B, 6C, si las partes de señal utilizadas para evaluar el contraste de ruido son suficientemente grandes, por ejemplo un período de tiempo T3, el valor de nivel de ruido promedio dentro de estas partes de señal es igual al valor medio del nivel de ruido. Este valor será encontrado para todas las partes de señal que dan como resultado un contraste de ruido igual a cero.

Sin embargo, si el período de tiempo de partes utilizadas para evaluar el contraste de ruido es relativamente corto, por ejemplo una longitud T4 mostrada en las figs. 6A, 6B, el valor promedio del nivel de ruido dentro de cada parte puede diferir bien del valor del... [Seguir leyendo]

 


Reivindicaciones:

1. Método para determinar un indicador de calidad que representa una calidad percibida de una señal de salida de un dispositivo de audio, con respecto a una señal de referencia, en el que la señal de referencia y la señal de salida son tratadas y comparadas, y el tratamiento incluye dividir la señal de referencia y la señal de salida en tramas de tiempo mutuamente correspondientes, en el que el tratamiento comprende además:

ï?­ escalar la señal de referencia hacia un nivel de intensidad fijo;

ï?­ seleccionar tramas de tiempo de la señal de salida basado en mediciones realizadas sobre la señal de referencia escalada;

ï?­ calcular un parámetro de contraste de ruido basado en las tramas de tiempo seleccionadas de la señal de 10 salida, siendo el parámetro de contraste de ruido una medida del contraste de ruido dentro de la señal;

ï?­ aplicar una supresión de ruido en al menos una de la señal de referencia y de la señal de salida en el dominio de sonoridad perceptiva basado en el parámetro de contraste de ruido;

ï?­ sustraer perceptivamente las señales de referencia y la señal de salida para formar una señal diferencia;

ï?­ derivar el indicador de calidad desde la señal de diferencia;

ï?­ caracterizado por que la operación de calcular el parámetro de contraste de ruido comprende:

ï?­ determinar una fracción dividiendo el valor de intensidad de una primera trama de tiempo seleccionada dentro de la señal de salida por el valor de intensidad de una segunda trama de tiempo seleccionada dentro de la señal de salida;

ï?­ comprimir la fracción utilizando una ley de energía con un coeficiente de compresión 20 predeterminado de modo que se obtenga el parámetro de contraste de ruido.

2. El método de la reivindicación 1, en el que el dispositivo de audio es un sistema de tratamiento de voz.

3. Método de la reivindicación 1, en el que el parámetro de contraste de ruido es establecido a un valor fijo predeterminado si la fracción comprimida está por debajo del valor fijo predeterminado.

4. Método de cualquiera de las reivindicaciones precedentes, en el que aplicar la supresión de ruido sobre la señal de 25 referencia comprende:

ï?­ calcular una densidad espectral de ruido promedio a lo largo de un número de tramas de tiempo que tiene un nivel de intensidad detectado por debajo de un valor de umbral;

ï?­ determinar un factor de supresión de ruido de referencia basado en una correlación optimizada entre información de evaluación de calidad objetiva y subjetiva; y ï?­ calcular un nivel de ruido deseado basado en el factor de supresión de ruido de referencia y en la densidad espectral de ruido promedio de referencia.

5. Método de cualquiera de las reivindicaciones precedentes, en el que aplicar la supresión de ruido sobre la señal de salida comprende:

ï?­ calcular una densidad espectral de ruido de salida promedio a lo largo de un número de tramas del tiempo 35 correspondientes a tramas del tiempo dentro de la señal de referencia que tienen un nivel de intensidad detectado por debajo de un valor de umbral;

ï?­ determinar una constante del nivel de ruido bajo basado en una correlación optimizada entre información de evaluación de calidad objetiva y subjetiva;

ï?­ determinar un factor de supresión de ruido de salida basado en una correlación optimizada entre información de 40 evaluación de calidad objetiva y subjetiva; y ï?­ calcular un nivel de ruido representativo de perturbación en la señal de salida utilizando la constante del nivel de ruido bajo, el factor de supresión de ruido de salida y la densidad espectral de ruido de salida promedio.

6. Método de cualquiera de las reivindicaciones precedentes, en el que el tratamiento comprende además:

ï?­ transformar la señal de referencia y la señal de salida desde el dominio del tiempo hacia el dominio de tiempo45 frecuencia;

ï?­ derivar una función de densidad de energía de tono de referencia a partir de la señal de referencia y derivar una función de densidad de energía de tono de salida a partir de la señal de salida;

ï?­ escalar localmente la función de densidad de energía de tono de referencia para obtener una función de densidad de energía de tono de referencia escalada localmente;

ï?­ compensar parcialmente o bien la función de densidad de energía de tono de salida o bien la función de densidad de energía de tono de referencia escalada localmente con respecto a la frecuencia; y ï?­ derivar una función de densidad de sonoridad de referencia y una función de densidad de sonoridad de salida.

7. Método de la reivindicación 6, en el que el tratamiento comprende además:

ï?­ escalar la intensidad de la función de densidad de energía de tono de referencia a partir del nivel de intensidad fijo hacia un nivel de intensidad relacionado a la función de densidad de energía de tono de salida para obtener una diferencia de nivel de intensidad entre las funciones de densidad de energía de tono que permiten la cuantificación del impacto del nivel de intensidad sobre la calidad percibida;

ï?­ escalar la sonoridad de la función de densidad de sonoridad de salida hacia un nivel de sonoridad fijo en el dominio de sonoridad perceptivo; y ï?­ escalar la sonoridad de la función de densidad de sonoridad de referencia a partir de un nivel de sonoridad correspondiente al nivel de intensidad relacionado con la salida hacia un nivel de sonoridad relacionado con el nivel de sonoridad de la función de densidad de sonoridad de salida en el dominio de sonoridad perceptivo, para obtener una diferencia de nivel de sonoridad entre la función de densidad de sonoridad de referencia y la función de densidad de sonoridad de salida que permita la cuantificación del impacto de sonoridad sobre la calidad percibida de la señal de salida.

8. Método de cualquiera de las reivindicaciones precedentes, en el que seleccionar las tramas de tiempo comprende seleccionar tramas de tiempo de la señal de salida correspondientes a tramas de tiempo de la señal de referencia escalada que satisfacen una condición predeterminada.

9. Método de la reivindicación 8, en el que dicha condición predeterminada incluye que la trama de tiempo de la señal de 25 referencia escalada, una trama de silencio, tiene un valor del nivel de intensidad por debajo del valor de umbral.

10. Método de la reivindicación 9, en el que dicha condición predeterminada incluye además que la trama de tiempo de la señal de referencia escalada es parte de una serie de tramas de silencio consecutivas, un intervalo de silencio.

11. Producto de programa informático que comprende un código ejecutable por ordenador, por ejemplo almacenado en

un medio legible por ordenador, adaptado para realizar, cuando es ejecutado por un procesador, el método según ha 30 sido definido por cualquiera de las reivindicaciones 1-10.

12. Sistema (20) para determinar un indicador de calidad que representa una calidad percibida de una señal de salida Y (t) de un sistema de audio (10) , por ejemplo un dispositivo de tratamiento de voz, con respecto a una señal de entrada X (t) del sistema de audio que sirve como una señal referencia, comprendiendo el sistema:

ï?­ un dispositivo (30) de tratamiento previo para tratar previamente la señal de referencia y la señal de salida;

ï?­ un primer dispositivo de tratamiento (40a) para tratar la señal de referencia, y un segundo dispositivo de tratamiento (40b) para tratar la señal de salida para obtener señales de representación R (X) , R (Y) para la señal de referencia y la señal de salida respectivamente;

ï?­ un dispositivo de diferenciación (50) para combinar las señales de representación de la señal de referencia y de la señal de salida de modo que se obtenga una señal diferencial D; y ï?­ un dispositivo de modelado (60) para tratar la señal diferencial para obtener una señal de calidad Q que representa una estimación de la calidad efectiva del sistema de tratamiento de voz;

en el que el dispositivo de tratamiento previo, el primer dispositivo de tratamiento, y el segundo dispositivo de tratamiento forman un sistema de tratamiento para realizar el método de cualquiera de las reivindicaciones 1-10.