Modelo de calidad de audio paramétrico para servicios IPTV.

1. Método para la estimación de la calidad de la percepción de una señal de audio decodificada,

siendo decodificadaa partir de una señal de audio codificada, o a partir de una señal de audio cifrada, o a partir de una señal de audiocodificada y cifrada, comprendiendo el método la etapa de:

a) estimación del impacto en la calidad de la compresión IcodA debido a la compresión de audio;

y caracterizado por la etapa de:

b) estimación del impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio,usando el impacto en la calidad de la compresión IcodA estimado, en el que la etapa de estimación del impactoen la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida detramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamenteμ; y en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA se realiza deacuerdo con la ecuación**Fórmula**

en la que b0, b1 y b2 son coeficientes; y

c) estimación de la calidad de la percepción QA de la señal de audio decodificada usando las estimacionesobtenidas en las etapas precedentes.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12166644.

Solicitante: DEUTSCHE TELEKOM AG.

Nacionalidad solicitante: Alemania.

Dirección: FRIEDRICH-EBERT-ALLEE 140 53113 BONN ALEMANIA.

Inventor/es: ARGYROPOULOS,SAVVAS, FEITEN,BERNHARD, GARCIA,MARIE-NEIGE, LIST,PETER, RAAKE,ALEXANDER, WÜSTENHAGEN,ULF.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L25/69 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 25/00 Técnicas de análisis del habla o voz no restringidos a un solo de los grupos G10L 15/00 - G10L 21/00 (silenciar los amplificadores basados en semiconductores, cuando algunas de las características especiales de una señal son detectadas por un detector de voz, p.ej. detectar cuando no hay ninguna señal,  H03G 3/34). › para evaluar señales de voz sintéticas o decodificadas.
  • H04L29/06 SECCION H — ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04L TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION TELEGRAFICA (disposiciones comunes a las comunicaciones telegráficas y telefónicas H04M; selección H04Q). › H04L 29/00 Disposiciones, aparatos, circuitos o sistemas no cubiertos por uno solo de los grupos H04L 1/00 - H04L 27/00. › caracterizadas por un protocolo.

PDF original: ES-2435673_T3.pdf

 


Fragmento de la descripción:

Modelo de calidad de audio paramétrico para servicios IPTV

La presente invención se refiere a un método y un aparato para evaluar la calidad de una señal de audio y, en particular, para evaluar la calidad de una señal de audio transmitida usando métodos de codificación y/o métodos de compresión y/o métodos de cifrado.

Entre los numerosos servicios de distribución de TV, el IPTV (protocolo de TV de Internet) se está convirtiendo en uno de creciente importancia y ha sustituido a métodos de transmisión analógicos o no basados en paquetes. Es una responsabilidad fundamental del proveedor de la emisión tanto hacia el proveedor de los contenidos como al cliente mantener la calidad de sus servicios. En grandes redes IPTV solamente sondeos de supervisión de la calidad completamente automatizados pueden satisfacer este requisito.

Para conseguir un alto grado de satisfacción del usuario para los servicios multimedia basados en IP, como el IPTV, se necesita estimar la calidad de audio, video y audio-video percibida. Esto se puede conseguir realizando ensayos de percepción. Sin embargo, es bien conocido que los ensayos de percepción consumen tiempo y no son aplicables para casos de funcionamiento del servicio en tiempo real. En consecuencia, se prefieren frecuentemente métodos instrumentales. Esos métodos pueden, por ejemplo, obtener el grado de similitud entre el video recibido en el lado del usuario y el video original no degradado. Adicionalmente, en el documento EP 2 413 604 A1, se ha proporcionado un método y un aparato para la evaluación de la calidad de una señal de video. La presente invención, sin embargo, se enfoca en las mediciones de la calidad de una señal de audio.

Rix et ál. proporcionan en la Referencia [1] una visión general de las mediciones de calidad de audio y voz. Se cubren tanto métodos intrusivos como no intrusivos así como modelos basados en la señal y en parámetros. En el contexto de la presente invención, el acceso a la transmisión continua de bits codificados cifrados está disponible antes de que entre en el decodificador, es decir antes de que la señal se decodifique. La referencia (no degradada) y la señal de audio decodificada no están disponibles. Más aún, la complejidad del modelo debe mantenerse reducida. Por ello, la presente invención se enfoca en mediciones de la calidad de audio paramétricas no intrusivas.

La mayor parte de los modelos paramétricos representados en la literatura (Referencias [2], [3] y [4]) están dedicados a enlaces vocales. Sin embargo, estos enfoques así como aquellos relacionados con la parametrización del efecto de la pérdida de paquetes en la Voz sobre IP (VoIP) [5, 6] se pueden usar asimismo en el contexto de los enlaces de audio. Por ejemplo, Graubner et ál. hacen uso en la Referencia [7] del enfoque basado en el factor de impedimento del modelo E para la predicción de la calidad de audio del Audio Emitido sobre IP con un modelo de referencia completo.

Un modelo de calidad de audio paramétrico no intrusivo es el modelo propuesto por Egi et al. en la Referencia [8]. Este modelo es adecuado tanto para aplicaciones de baja como alta tasa de bits, como MobileTV e IPTV. Toma como entrada parámetros de la tasa de bits de audio, el tipo de códec, la tasa de muestreo, la longitud de la trama, la frecuencia de pérdida de paquetes (el número de eventos de pérdida) y la longitud de la ráfaga promedio. El tipo de códec, la tasa de muestreo y la longitud de la trama están predeterminados. Este modelo muestra una alta correlación de los resultados con los resultados de ensayos subjetivos. Sin embargo, ha sido estudiado solamente sobre un códec (AAC-LC) . Más aún, como se hace notar por los autores, la interacción entre la tasa de bits de audio 45 y la tasa de pérdida de paquetes no se considera.

Como consecuencia, hay aún una necesidad de un método basado en un modelo de calidad de audio paramétrico para servicios IPTV para los diversos códecs usados normalmente en IPTV, y un aparato que permita el uso de este método.

El objetivo de la presente invención es por lo tanto proporcionar un método basado en un modelo de calidad de audio paramétrico para servicios IPTV para los diversos códecs usados normalmente en IPTV, y un aparato que permita el uso de este método.

Este objetivo se consigue mediante el método y el aparato con las características que se describen en las reivindicaciones presentadas en el presente documento.

La invención se puede resumir como sigue:

El método de acuerdo con la presente invención emplea un modelo de calidad de audio paramétrico para servicios IPTV. El método es aplicable a planificación de red y supervisión de la calidad en la capa de paquetes del audio cifrado. Las degradaciones consideradas son la compresión de audio (MPEG-I Layer II & III, MPEG-2 AAC LC, MPEG-4 HE-AACv2, y AC-3) y las pérdidas de tramas para varios patrones de pérdida de tramas. Los ensayos de percepción de audio han mostrado que los códecs HE-AAC y AAC trabajan mejor que el MPEG-I Layer II & III tanto 65 en los casos libres de pérdidas como con pérdidas. Se ha observado también que para estos dos códecs antiguos, la señal de audio que contiene voz conduce a una calidad percibida diferente de la señal libre de voz. La localización de la pérdida no parece que influencie la calidad percibida mientras que la longitud de la ráfaga lo hace para tasas bajas de pérdida de paquetes. El método inventado toma como parámetros de entrada el códec de audio, la tasa de bits, la tasa de pérdida de tramas y la longitud de la ráfaga y muestra una correlación del 95 % con los índices subjetivos.

Se dará ahora una descripción del modelo de audio paramétrico en el que se basa la invención:

En lo que sigue, se supone que el impedimento perceptual vinculado con ciertas clases de degradaciones se puede considerar como aditivo en una escala de evaluación perceptual. Basándose en esta suposición, se calcula la 10 puntuación de opinión media (MOS del inglés, “Mean Opinion Score”) por condición sobre todos los sujetos, transformándola en la escala del modelo de 100 puntos (R) usando la conversión definida en la Recomendación ITU-T G.107 Apéndice I [2], y descompone el modelo de calidad de audio como sigue (véanse las Referencias [13] y

[14] para detalles sobre el modelo) :

QA = QoA – IcodA – ItraA , (1)

en la que QA es la calidad de audio predicha (en lo que sigue también denominada “calidad de la percepción”) y QoA es el nivel de calidad base (en lo que sigue también denominado simplemente como “calidad base”) que puede alcanzar la señal de audio transmitida para el respectivo servicio objetivo. En este documento, QoA se fija en la 20 valoración de calidad máxima transformada obtenida en los ensayos subjetivos de audio. IcodA es el impacto en la calidad debido a la compresión de audio (en lo que sigue también denominada como “impacto en la calidad de la compresión”) , e ItraA es el impacto en la calidad debido a las pérdidas de tramas de audio (en lo que sigue también denominada “impacto en la de calidad de las pérdidas de trama”) . IcodA se deduce de los ensayos subjetivos para condiciones libres de error como sigue: IcodA = QoA – QA. Usando todas las condiciones, obtenemos ItraA calculando ItraA = QoA – IcodA – QA.

En un procedimiento de ajuste de curvas por mínimos cuadrados usando los resultados del ensayo de audio (se describe a continuación un ejemplo de un ensayo de audio correspondiente con ayuda de las figuras) como valores objetivo, obtenemos para el caso libre de pérdidas de tramas:

IcodA = a1 • exp (a2 • tasa-de-bits) + a3 , (2)

en la que a1, a2, y a3 son coeficientes de ajuste de la curva que dependen del códec usado.

Siguiendo el mismo procedimiento de mínimos cuadrados, se obtiene en el caso de pérdidas de trama:

Pfl

ItraA = (b0 – IcodA) ·, (3)

( (b1⋅μ + b2) + Pfl)

En este caso, b0, b1 y b2 son coeficientes de ajuste de la curva. Los parámetros Pfl y μ son, respectivamente, la tasa de pérdida de tramas promedio (preferiblemente en porcentaje) y el número promedio de tramas perdidas consecutivamente.

La calidad base se establece preferiblemente en QoA = 100. Sin embargo, dado que este valor se puede elegir en principio arbitrariamente, dependiendo solamente de la escala usada para la medición de la calidad de la percepción 45 QA, se pueden usar también diferentes valores para la calidad base (así como para la calidad de la percepción máxima QA) , por ejemplo QoA = 1. Naturalmente, el conjunto de parámetros... [Seguir leyendo]

 


Reivindicaciones:

1. Método para la estimación de la calidad de la percepción de una señal de audio decodificada, siendo decodificada a partir de una señal de audio codificada, o a partir de una señal de audio cifrada, o a partir de una señal de audio 5 codificada y cifrada, comprendiendo el método la etapa de:

a) estimación del impacto en la calidad de la compresión IcodA debido a la compresión de audio; y caracterizado por la etapa de: b) estimación del impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio,

usando el impacto en la calidad de la compresión IcodA estimado, en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida de tramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamente μ; y en el que la etapa de estimación del impacto en la calidad de la pérdida de tramas ItraA se realiza de acuerdo con la ecuación Pfl

ItraA = (b0 – IcodA) · ,

( (b1⋅μ+ b2) + Pfl)

en la que b0, b1 y b2 son coeficientes; y c) estimación de la calidad de la percepción QA de la señal de audio decodificada usando las estimaciones 20 obtenidas en las etapas precedentes.

2. El método de la reivindicación 1, en el que la etapa a) de estimación del impacto en la calidad de la compresión IcodA usa uno o más coeficientes o la tasa de bits o uno o más coeficientes y la tasa de bits, en el que los uno o más coeficientes dependen del tipo de la señal de audio codificada, o señal de audio cifrada, o señal de audio codificada y cifrada.

3. El método de la reivindicación 2, en el que la etapa a) de estimación del impacto en la calidad de la compresión IcodA se realiza de acuerdo con la ecuación IcodA = a1 • exp (a2 • tasa-de-bits) + a3 ,

en la que a1, a2, y a3 son coeficientes que dependen de al menos uno de: el tipo de la señal de audio codificada, el tipo de la señal de audio comprimida, el tipo de la señal de audio cifrada, y en la que tasa-de-bits indica la tasa de bits.

4. El método de cualquiera de las reivindicaciones 1 a 3, en el que la etapa b) se realiza usando la ecuación QA = QoA – IcodA ,

en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

5. El método de cualquiera de las reivindicaciones 1 a 4, en el que la etapa c) se realiza usando una de las ecuaciones 45 QA = f (QoA, IcodA, ItraA)

con una función f adecuada; o QA = QoA – α IcodA – β ItraA 50 con 0 ≤α, β≤ 1 , o QA = QoA – IcodA – ItraA ,

en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

6. El método de cualquiera de las reivindicaciones 1 a 5, en el que los coeficientes se obtienen aplicando un procedimiento de ajuste de curvas por mínimos cuadrados usando las tasas de los ensayos de percepción como valores objetivo.

7. El método de cualquiera de las reivindicaciones anteriores, en el que la señal de audio se codifica/decodifica o cifra/descifra, o codifica/decodifica y cifra/descifra de acuerdo con uno de los tipos de códec siguientes: MPEG-1 Layer II (mp2) , MPEG-1 Layer III (mp3) , MPEG-2 AAC LC (aac) , MPEG-4 HE-AACv2 (heaac) y AC-3 (ac3) .

8. El método de cualquiera de las reivindicaciones anteriores, en el que la señal de audio es al menos una parte de una transmisión continua de datos no interactiva, preferiblemente una transmisión continua de audio o audiovisual no interactiva, o al menos una parte de una transmisión continua de datos interactiva, preferiblemente una transmisión continua de audio o audiovisual interactiva.

9. El método de cualquiera de las reivindicaciones anteriores, en el que al menos una parte de los coeficientes dependen adicionalmente del contenido de la señal de audio.

10. El método de cualquiera de las reivindicaciones anteriores, en el que se calcula al menos uno de lo siguiente, a

partir de la información de la cabecera del paquete extraída de la transmisión continua de bits de la señal de audio y/o deducida a partir de información lateral: al menos una parte de los coeficientes, la tasa de bits, la tasa de pérdida de tramas Pfl promedio, el número promedio de tramas perdidas consecutivamente μ.

11. El método de cualquiera de las reivindicaciones anteriores, en donde el método se combina con uno o más de otros métodos para la estimación del impacto sobre la calidad por otros impedimentos que codifican o cifran, o codifican y cifran una señal de audio, en el que los uno o más de los otros métodos comprenden cada uno al menos una etapa de estimación de una calidad de la percepción de la señal de audio decodificada.

12. El método de la reivindicación 11, en el que la combinación del método de las reivindicaciones 1 a 10 y los uno o 20 más otros métodos es una función lineal de estos métodos o una función multiplicativa de estos métodos.

13. El método de cualquiera de las reivindicaciones anteriores, en donde el método se combina con un método para la estimación de la calidad de la percepción de una señal de video decodificada, que es decodificada a partir de una señal de video codificada o una cifrada, o una codificada y cifrada.

14. Método para la supervisión de la calidad de una señal de audio transmitida con las etapas:

A) transmisión de la señal de audio desde un servidor al cliente; B) ejecución en el lado del cliente del método para la estimación de la calidad de la percepción de la señal de

audio transmitida de acuerdo con cualquiera de las reivindicaciones 1 a 13; C) transferencia del resultado de la estimación de la etapa B) al servidor; D) supervisión en el lado del servidor de la calidad de la señal de audio transmitida.

15. El método para la supervisión de la calidad de una señal de audio transmitida de acuerdo con la reivindicación 35 14 con las etapas adicionales:

E) análisis de la calidad supervisada de la señal de audio transmitida, preferiblemente dependiendo de los parámetros de transmisión; y, opcionalmente F) cambio de los parámetros de transmisión basado en el análisis de la etapa E) para incrementar la calidad de la señal de audio transmitida.

16. Aparato para la estimación de la calidad de la percepción de una señal de audio decodificada que es decodificada partir de una señal de audio codificada, una señal de audio cifrada, o una señal de audio codificada y cifrada, comprendiendo el aparato:

un estimador de la calidad de compresión configurado para estimar el impacto en la calidad de la compresión IcodA debido a la compresión de audio; y caracterizado por:

estar configurado el estimador de la calidad de compresión para estimar el impacto en la calidad de la pérdida de tramas ItraA debido a la pérdida de tramas de audio, usando el impacto en la calidad de la compresión IcodA estimado, en el que la estimación del impacto en la calidad de la pérdida de tramas ItraA usa al menos uno de: uno o más coeficientes, la tasa de pérdida de tramas Pfl promedio, preferiblemente en porcentaje, el número promedio de tramas perdidas consecutivamente μ; y en el que la estimación del

impacto en la calidad de la pérdida de tramas ItraA se realiza de acuerdo con la ecuación Pfl

ItraA = (b0 – IcodA) · ,

( (b1⋅μ+ b2) + Pfl)

en la que b0, b1 y b2 son coeficientes; y 60 un ajustador configurado para el ajuste de la calidad de la percepción QA de la señal de audio decodificada.

17. El aparato de la reivindicación 16, en el que el estimador de la calidad de compresión se configura para estimar la calidad de compresión mediante el uso de la ecuación IcodA = a1 • exp (a2 • tasa-de-bits) + a3 ,

en la que a1, a2, y a3 son coeficientes que dependen de al menos uno de: el tipo de la señal de audio codificada, el tipo de la señal de audio comprimida, el tipo de la señal de audio cifrada, y en el que tasa-de-bits indica la tasa de 5 bits.

18. El aparato de la reivindicación 16 o 17, en el que el ajustador se configura para ajustar la calidad de la percepción QA de la señal de audio decodificada usando la ecuación QA = QoA – IcodA – ItraA ; en la que QoA indica una calidad base establecida, y en la que preferiblemente QoA = 100.

19. Aparato para la estimación de la calidad de la percepción de una señal de audio decodificada que es decodificada a partir de una señal de audio codificada y/o cifrada, comprendiendo el aparato un ordenador o microchip configurados para realizar el método de acuerdo con las reivindicaciones 1 a 15.

20. Aparato decodificador conectable a un receptor para la recepción de una señal de audio codificada y/o cifrada,

en donde el aparato decodificador comprende el aparato de acuerdo con cualquiera de las reivindicaciones 16 a 18. 20


 

Patentes similares o relacionadas:

Dispositivo de interconexión paritaria dinámica, del 8 de Mayo de 2019, de Ingenico Group: Sistema de interconexión paritaria dinámica entre un primer periférico con posibilidad de dialogar con una tarjeta de memoria y un segundo periférico […]

Método y aparatos para utilizar conexiones no IMS en sesiones IMS, del 8 de Mayo de 2019, de BlackBerry Limited: Un método para la reserva de recursos del sistema multimedia de Protocolo de Internet 'IP' 'IMS', comprendiendo el método: transmitir desde un primer […]

Método, dispositivo y sistema para datos de contenido multimedia en directo, del 8 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un servidor proxy en directo, OTT de libre transmisión, , que comprende: una unidad de asignación de recursos de multidifusión , configurada […]

Método de establecimiento de grupos seguros de contactos de confianza con derechos de acceso en un sistema de comunicación segura, del 8 de Mayo de 2019, de Cellcrypt Inc: Un método de establecimiento de grupos seguros de contactos de confianza con derechos de acceso en un sistema de comunicación segura, que comprende las etapas […]

Transmisión segura, del 8 de Mayo de 2019, de Y R Free Labs Limited: Un método para proporcionar datos probatorios, que comprende en un dispositivo móvil: establecer uno o más primeros testigos secretos con un servidor; […]

Método de comunicación móvil y sistema de comunicación móvil para anclaje de medios de comunicaciones ESRVCC, del 8 de Mayo de 2019, de NEC CORPORATION: Un método de comunicación para una estación móvil en un sistema de comunicación móvil para continuidad de llamada de voz de radio única, SRVCC, […]

Procesamiento de servidor en el suministro de mensajes para un dispositivo inalámbrico que se conecta a un servidor, del 6 de Mayo de 2019, de QUALCOMM INCORPORATED: Un procedimiento para procesar un mensaje de destino para mostrar en un dispositivo inalámbrico que se comunica con un servidor de descarga de […]

Autorización de transferencia de sesión de elementos entre usuarios, del 6 de Mayo de 2019, de INTERDIGITAL PATENT HOLDINGS, INC: Un procedimiento que comprende: un servidor de aplicación de continuidad y de servicio centralizado, SCC AS, que establece un control de sesión colaborativa […]

Otras patentes de DEUTSCHE TELEKOM AG