Modelo de calidad de audio paramétrico para servicios IPTV.

1. Método para la estimación de la calidad de la percepción de una señal de audio decodificada,

siendo decodificadaa partir de una señal de audio codificada, o a partir de una señal de audio cifrada, o a partir de una señal de audiocodificada y cifrada, comprendiendo el método la etapa de:

a) estimación del impacto en la calidad de la compresión IcodA debido a la compresión de audio;

y caracterizado por la etapa de:

b) estimación del impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio,usando el impacto en la calidad de la compresión IcodA estimado, en el que la etapa de estimación del impactoen la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida detramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamenteμ; y en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA se realiza deacuerdo con la ecuación**Fórmula**

en la que b0, b1 y b2 son coeficientes; y

c) estimación de la calidad de la percepción QA de la señal de audio decodificada usando las estimacionesobtenidas en las etapas precedentes.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12166644.

Solicitante: DEUTSCHE TELEKOM AG.

Nacionalidad solicitante: Alemania.

Dirección: FRIEDRICH-EBERT-ALLEE 140 53113 BONN ALEMANIA.

Inventor/es: ARGYROPOULOS,SAVVAS, FEITEN,BERNHARD, GARCIA,MARIE-NEIGE, LIST,PETER, RAAKE,ALEXANDER, WÜSTENHAGEN,ULF.

Fecha de Publicación: 16 de Octubre de 2013.

Clasificación Internacional de Patentes:

G10L25/69 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p. ej. detectar cuando no hay ninguna señal, H03G 3/34). › para evaluar señales de voz sintéticas o decodificadas.
H04L29/06 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04L TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION TELEGRAFICA (disposiciones comunes a las comunicaciones telegráficas y telefónicas H04M). › H04L 29/00 Disposiciones, aparatos, circuitos o sistemas no cubiertos por uno solo de los grupos H04L 1/00 - H04L 27/00. › caracterizadas por un protocolo.

PDF original: ES-2435673_T3.pdf

Fragmento de la descripción:

Modelo de calidad de audio paramétrico para servicios IPTV

La presente invención se refiere a un método y un aparato para evaluar la calidad de una señal de audio y, en particular, para evaluar la calidad de una señal de audio transmitida usando métodos de codificación y/o métodos de compresión y/o métodos de cifrado.

Entre los numerosos servicios de distribución de TV, el IPTV (protocolo de TV de Internet) se está convirtiendo en uno de creciente importancia y ha sustituido a métodos de transmisión analógicos o no basados en paquetes. Es una responsabilidad fundamental del proveedor de la emisión tanto hacia el proveedor de los contenidos como al cliente mantener la calidad de sus servicios. En grandes redes IPTV solamente sondeos de supervisión de la calidad completamente automatizados pueden satisfacer este requisito.

Para conseguir un alto grado de satisfacción del usuario para los servicios multimedia basados en IP, como el IPTV, se necesita estimar la calidad de audio, video y audio-video percibida. Esto se puede conseguir realizando ensayos de percepción. Sin embargo, es bien conocido que los ensayos de percepción consumen tiempo y no son aplicables para casos de funcionamiento del servicio en tiempo real. En consecuencia, se prefieren frecuentemente métodos instrumentales. Esos métodos pueden, por ejemplo, obtener el grado de similitud entre el video recibido en el lado del usuario y el video original no degradado. Adicionalmente, en el documento EP 2 413 604 A1, se ha proporcionado un método y un aparato para la evaluación de la calidad de una señal de video. La presente invención, sin embargo, se enfoca en las mediciones de la calidad de una señal de audio.

Rix et ál. proporcionan en la Referencia [1] una visión general de las mediciones de calidad de audio y voz. Se cubren tanto métodos intrusivos como no intrusivos así como modelos basados en la señal y en parámetros. En el contexto de la presente invención, el acceso a la transmisión continua de bits codificados cifrados está disponible antes de que entre en el decodificador, es decir antes de que la señal se decodifique. La referencia (no degradada) y la señal de audio decodificada no están disponibles. Más aún, la complejidad del modelo debe mantenerse reducida. Por ello, la presente invención se enfoca en mediciones de la calidad de audio paramétricas no intrusivas.

La mayor parte de los modelos paramétricos representados en la literatura (Referencias [2], [3] y [4]) están dedicados a enlaces vocales. Sin embargo, estos enfoques así como aquellos relacionados con la parametrización del efecto de la pérdida de paquetes en la Voz sobre IP (VoIP) [5, 6] se pueden usar asimismo en el contexto de los enlaces de audio. Por ejemplo, Graubner et ál. hacen uso en la Referencia [7] del enfoque basado en el factor de impedimento del modelo E para la predicción de la calidad de audio del Audio Emitido sobre IP con un modelo de referencia completo.

Un modelo de calidad de audio paramétrico no intrusivo es el modelo propuesto por Egi et al. en la Referencia [8]. Este modelo es adecuado tanto para aplicaciones de baja como alta tasa de bits, como MobileTV e IPTV. Toma como entrada parámetros de la tasa de bits de audio, el tipo de códec, la tasa de muestreo, la longitud de la trama, la frecuencia de pérdida de paquetes (el número de eventos de pérdida) y la longitud de la ráfaga promedio. El tipo de códec, la tasa de muestreo y la longitud de la trama están predeterminados. Este modelo muestra una alta correlación de los resultados con los resultados de ensayos subjetivos. Sin embargo, ha sido estudiado solamente sobre un códec (AAC-LC) . Más aún, como se hace notar por los autores, la interacción entre la tasa de bits de audio 45 y la tasa de pérdida de paquetes no se considera.

Como consecuencia, hay aún una necesidad de un método basado en un modelo de calidad de audio paramétrico para servicios IPTV para los diversos códecs usados normalmente en IPTV, y un aparato que permita el uso de este método.

El objetivo de la presente invención es por lo tanto proporcionar un método basado en un modelo de calidad de audio paramétrico para servicios IPTV para los diversos códecs usados normalmente en IPTV, y un aparato que permita el uso de este método.

Este objetivo se consigue mediante el método y el aparato con las características que se describen en las reivindicaciones presentadas en el presente documento.

La invención se puede resumir como sigue:

El método de acuerdo con la presente invención emplea un modelo de calidad de audio paramétrico para servicios IPTV. El método es aplicable a planificación de red y supervisión de la calidad en la capa de paquetes del audio cifrado. Las degradaciones consideradas son la compresión de audio (MPEG-I Layer II & III, MPEG-2 AAC LC, MPEG-4 HE-AACv2, y AC-3) y las pérdidas de tramas para varios patrones de pérdida de tramas. Los ensayos de percepción de audio han mostrado que los códecs HE-AAC y AAC trabajan mejor que el MPEG-I Layer II & III tanto 65 en los casos libres de pérdidas como con pérdidas. Se ha observado también que para estos dos códecs antiguos, la señal de audio que contiene voz conduce a una calidad percibida diferente de la señal libre de voz. La localización de la pérdida no parece que influencie la calidad percibida mientras que la longitud de la ráfaga lo hace para tasas bajas de pérdida de paquetes. El método inventado toma como parámetros de entrada el códec de audio, la tasa de bits, la tasa de pérdida de tramas y la longitud de la ráfaga y muestra una correlación del 95 % con los índices subjetivos.

Se dará ahora una descripción del modelo de audio paramétrico en el que se basa la invención:

En lo que sigue, se supone que el impedimento perceptual vinculado con ciertas clases de degradaciones se puede considerar como aditivo en una escala de evaluación perceptual. Basándose en esta suposición, se calcula la 10 puntuación de opinión media (MOS del inglés, “Mean Opinion Score”) por condición sobre todos los sujetos, transformándola en la escala del modelo de 100 puntos (R) usando la conversión definida en la Recomendación ITU-T G.107 Apéndice I [2], y descompone el modelo de calidad de audio como sigue (véanse las Referencias [13] y

[14] para detalles sobre el modelo) :

QA = QoA – IcodA – ItraA , (1)

en la que QA es la calidad de audio predicha (en lo que sigue también denominada “calidad de la percepción”) y QoA es el nivel de calidad base (en lo que sigue también denominado simplemente como “calidad base”) que puede alcanzar la señal de audio transmitida para el respectivo servicio objetivo. En este documento, QoA se fija en la 20 valoración de calidad máxima transformada obtenida en los ensayos subjetivos de audio. IcodA es el impacto en la calidad debido a la compresión de audio (en lo que sigue también denominada como “impacto en la calidad de la compresión”) , e ItraA es el impacto en la calidad debido a las pérdidas de tramas de audio (en lo que sigue también denominada “impacto en la de calidad de las pérdidas de trama”) . IcodA se deduce de los ensayos subjetivos para condiciones libres de error como sigue: IcodA = QoA – QA. Usando todas las condiciones, obtenemos ItraA calculando ItraA = QoA – IcodA – QA.

En un procedimiento de ajuste de curvas por mínimos cuadrados usando los resultados del ensayo de audio (se describe a continuación un ejemplo de un ensayo de audio correspondiente con ayuda de las figuras) como valores objetivo, obtenemos para el caso libre de pérdidas de tramas:

IcodA = a1 • exp (a2 • tasa-de-bits) + a3 , (2)

en la que a1, a2, y a3 son coeficientes de ajuste de la curva que dependen del códec usado.

Siguiendo el mismo procedimiento de mínimos cuadrados, se obtiene en el caso de pérdidas de trama:

Pfl

ItraA = (b0 – IcodA) ·, (3)

( (b1⋅μ + b2) + Pfl)

En este caso, b0, b1 y b2 son coeficientes de ajuste de la curva. Los parámetros Pfl y μ son, respectivamente, la tasa de pérdida de tramas promedio (preferiblemente en porcentaje) y el número promedio de tramas perdidas consecutivamente.

La calidad base se establece preferiblemente en QoA = 100. Sin embargo, dado que este valor se puede elegir en principio arbitrariamente, dependiendo solamente de la escala usada para la medición de la calidad de la percepción 45 QA, se pueden usar también diferentes valores para la calidad base (así como para la calidad de la percepción máxima QA) , por ejemplo QoA = 1. Naturalmente, el conjunto de parámetros... [Seguir leyendo]

Reivindicaciones:

1. Método para la estimación de la calidad de la percepción de una señal de audio decodificada, siendo decodificada a partir de una señal de audio codificada, o a partir de una señal de audio cifrada, o a partir de una señal de audio 5 codificada y cifrada, comprendiendo el método la etapa de:

a) estimación del impacto en la calidad de la compresión IcodA debido a la compresión de audio; y caracterizado por la etapa de: b) estimación del impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio,

usando el impacto en la calidad de la compresión IcodA estimado, en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida de tramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamente μ; y en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA se realiza de acuerdo con la ecuación Pfl

ItraA = (b0 – IcodA) · ,

( (b1⋅μ+ b2) + Pfl)

en la que b0, b1 y b2 son coeficientes; y c) estimación de la calidad de la percepción QA de la señal de audio decodificada usando las estimaciones 20 obtenidas en las etapas precedentes.

2. El método de la reivindicación 1, en el que la etapa a) de estimación del impacto en la calidad de la compresión IcodA usa uno o más coeficientes o la tasa de bits o uno o más coeficientes y la tasa de bits, en el que los uno o más coeficientes dependen del tipo de la señal de audio codificada, o señal de audio cifrada, o señal de audio codificada y cifrada.

3. El método de la reivindicación 2, en el que la etapa a) de estimación del impacto en la calidad de la compresión IcodA se realiza de acuerdo con la ecuación IcodA = a1 • exp (a2 • tasa-de-bits) + a3 ,

en la que a1, a2, y a3 son coeficientes que dependen de al menos uno de: el tipo de la señal de audio codificada, el tipo de la señal de audio comprimida, el tipo de la señal de audio cifrada, y en la que tasa-de-bits indica la tasa de bits.

4. El método de cualquiera de las reivindicaciones 1 a 3, en el que la etapa b) se realiza usando la ecuación QA = QoA – IcodA ,

en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

5. El método de cualquiera de las reivindicaciones 1 a 4, en el que la etapa c) se realiza usando una de las ecuaciones 45 QA = f (QoA, IcodA, ItraA)

con una función f adecuada; o QA = QoA – α IcodA – β ItraA 50 con 0 ≤α, β≤ 1 , o QA = QoA – IcodA – ItraA ,

en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

6. El método de cualquiera de las reivindicaciones 1 a 5, en el que los coeficientes se obtienen aplicando un procedimiento de ajuste de curvas por mínimos cuadrados usando las tasas de los ensayos de percepción como valores objetivo.

7. El método de cualquiera de las reivindicaciones anteriores, en el que la señal de audio se codifica/decodifica o cifra/descifra, o codifica/decodifica y cifra/descifra de acuerdo con uno de los tipos de códec siguientes: MPEG-1 Layer II (mp2) , MPEG-1 Layer III (mp3) , MPEG-2 AAC LC (aac) , MPEG-4 HE-AACv2 (heaac) y AC-3 (ac3) .

8. El método de cualquiera de las reivindicaciones anteriores, en el que la señal de audio es al menos una parte de una transmisión continua de datos no interactiva, preferiblemente una transmisión continua de audio o audiovisual no interactiva, o al menos una parte de una transmisión continua de datos interactiva, preferiblemente una transmisión continua de audio o audiovisual interactiva.

9. El método de cualquiera de las reivindicaciones anteriores, en el que al menos una parte de los coeficientes dependen adicionalmente del contenido de la señal de audio.

10. El método de cualquiera de las reivindicaciones anteriores, en el que se calcula al menos uno de lo siguiente, a

partir de la información de la cabecera del paquete extraída de la transmisión continua de bits de la señal de audio y/o deducida a partir de información lateral: al menos una parte de los coeficientes, la tasa de bits, la tasa de pérdida de tramas Pfl promedio, el número promedio de tramas perdidas consecutivamente μ.

11. El método de cualquiera de las reivindicaciones anteriores, en donde el método se combina con uno o más de otros métodos para la estimación del impacto sobre la calidad por otros impedimentos que codifican o cifran, o codifican y cifran una señal de audio, en el que los uno o más de los otros métodos comprenden cada uno al menos una etapa de estimación de una calidad de la percepción de la señal de audio decodificada.

12. El método de la reivindicación 11, en el que la combinación del método de las reivindicaciones 1 a 10 y los uno o 20 más otros métodos es una función lineal de estos métodos o una función multiplicativa de estos métodos.

13. El método de cualquiera de las reivindicaciones anteriores, en donde el método se combina con un método para la estimación de la calidad de la percepción de una señal de video decodificada, que es decodificada a partir de una señal de video codificada o una cifrada, o una codificada y cifrada.

14. Método para la supervisión de la calidad de una señal de audio transmitida con las etapas:

A) transmisión de la señal de audio desde un servidor al cliente; B) ejecución en el lado del cliente del método para la estimación de la calidad de la percepción de la señal de

audio transmitida de acuerdo con cualquiera de las reivindicaciones 1 a 13; C) transferencia del resultado de la estimación de la etapa B) al servidor; D) supervisión en el lado del servidor de la calidad de la señal de audio transmitida.

15. El método para la supervisión de la calidad de una señal de audio transmitida de acuerdo con la reivindicación 35 14 con las etapas adicionales:

E) análisis de la calidad supervisada de la señal de audio transmitida, preferiblemente dependiendo de los parámetros de transmisión; y, opcionalmente F) cambio de los parámetros de transmisión basado en el análisis de la etapa E) para incrementar la calidad de la señal de audio transmitida.

16. Aparato para la estimación de la calidad de la percepción de una señal de audio decodificada que es decodificada partir de una señal de audio codificada, una señal de audio cifrada, o una señal de audio codificada y cifrada, comprendiendo el aparato:

un estimador de la calidad de compresión configurado para estimar el impacto en la calidad de la compresión IcodA debido a la compresión de audio; y caracterizado por:

estar configurado el estimador de la calidad de compresión para estimar el impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio, usando el impacto en la calidad de la compresión IcodA estimado, en el que la estimación del impacto en la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida de tramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamente μ; y en el que la estimación del

impacto en la calidad de la pérdida de tramas ItraA se realiza de acuerdo con la ecuación Pfl

ItraA = (b0 – IcodA) · ,

( (b1⋅μ+ b2) + Pfl)

en la que b0, b1 y b2 son coeficientes; y 60 un ajustador configurado para el ajuste de la calidad de la percepción QA de la señal de audio decodificada.

17. El aparato de la reivindicación 16, en el que el estimador de la calidad de compresión se configura para estimar la calidad de compresión mediante el uso de la ecuación IcodA = a1 • exp (a2 • tasa-de-bits) + a3 ,

18. El aparato de la reivindicación 16 o 17, en el que el ajustador se configura para ajustar la calidad de la percepción QA de la señal de audio decodificada usando la ecuación QA = QoA – IcodA – ItraA ; en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

19. Aparato para la estimación de la calidad de la percepción de una señal de audio decodificada que es decodificada a partir de una señal de audio codificada y/o cifrada, comprendiendo el aparato un ordenador o microchip configurados para realizar el método de acuerdo con las reivindicaciones 1 a 15.

20. Aparato decodificador conectable a un receptor para la recepción de una señal de audio codificada y/o cifrada,

en donde el aparato decodificador comprende el aparato de acuerdo con cualquiera de las reivindicaciones 16 a 18. 20

Patentes similares o relacionadas:

Procedimiento y dispositivo para el procesamiento de una solicitud de servicio, del 29 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un procedimiento para el procesamiento de una solicitud de servicio, comprendiendo el procedimiento: recibir (S201), mediante un nodo de consenso, una solicitud […]

Procedimiento y dispositivo para su uso en la gestión de riesgos de información de aplicación, del 22 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un procedimiento para la gestión de riesgos de información de aplicación en un dispositivo de red, comprendiendo el procedimiento: recibir información […]

Gestión de memoria intermedia recomendada de red de una aplicación de servicio en un dispositivo de radio, del 22 de Julio de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método llevado a cabo por un nodo de red en una red de comunicación por radio , comprendiendo el método: obtener (S1) una predicción del ancho […]

Método, servidor y sistema de inicio de sesión de confianza, del 22 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un método de inicio de sesión de confianza implementado por computadora aplicado a un sistema de inicio de sesión de confianza que comprende un primer sistema de aplicación […]

Método y aparato para configurar un identificador de dispositivo móvil, del 22 de Julio de 2020, de Advanced New Technologies Co., Ltd: Un método implementado por servidor para configurar un identificador de dispositivo móvil, que comprende: obtener una lista de aplicaciones, APP, […]

Método para un nivel mejorado de autenticación relacionado con una aplicación de cliente de software en un dispositivo informático de cliente que comprende una entidad de módulo de identidad de abonado con un kit de herramientas de módulo de identidad de abonado así como una miniaplicación de módulo de identidad de abonado, sistema, dispositivo informático de cliente y entidad de módulo de identidad de abonado para un nivel mejorado de autenticación relacionado con una aplicación de cliente de software en el dispositivo informático de cliente, programa que comprende un código de programa legible por ordenador y producto de programa informático, del 22 de Julio de 2020, de DEUTSCHE TELEKOM AG: Un método para un nivel mejorado de autenticación relacionado con una aplicación de cliente de software en un dispositivo informático […]

Método para atender solicitudes de acceso a información de ubicación, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: al menos un procesador; y al menos una memoria que incluye un código de programa informático para uno o más programas, […]

Sincronización de una aplicación en un dispositivo auxiliar, del 22 de Julio de 2020, de OPENTV, INC.: Un método que comprende, mediante un dispositivo de medios: acceder, utilizando un módulo de recepción, un flujo de datos que incluye contenido […]