Agregación de trama adaptativa de señal de fuente.

Un método de procesamiento de una señal para transmisión, estando el método caracterizado por:

determinar una calidad de una primera porción de la señal

, y

si la calidad satisface un criterio de umbral, agregar entonces una representación de la primera porción de la señal con una representación de una porción subsiguiente de la señal.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/060592.

Solicitante: TELEFONAKTIEBOLAGET L M ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: 164 83 STOCKHOLM SUECIA.

Inventor/es: BRUHN, STEFAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • H04L12/56
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION... > H04L1/00 (Disposiciones para detectar o evitar errores en la información recibida)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > REDES DE COMUNICACION INALAMBRICAS > Tráfico de red o gestión de recursos > H04W28/06 (Optimización, p. ej. compresión de cabeceras o dimensionado de la información)

PDF original: ES-2539858_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Agregación de trama adaptativa de señal de fuente Campo técnico La presente solicitud se refiere a un método de procesamiento de una señal para transmisión; a un aparato para procesamiento de una señal para transmisión; y a un medio legible con ordenador.

Antecedentes La familia de códec Multi-Tasa Adaptativa (AMR) se utiliza como códec obligatorio en ambos sistemas GSM y WCDMA. La AMR está disponible en ambas formas de banda estrecha (AMR-NB) y de banda ancha (AMR-WB) Los estándares comprenden un número de especificaciones técnicas de múltiples componentes y funciones, por ejemplo códec de Habla (AMR-NB, AMR-WB) , Detector de Actividad de Voz (VAD) , sistema de Transmisión Discontinua (DTX) , Ruido de Confort (CN) , Adaptación de Enlace (LA) , etc. Todas esas funciones están definidas y descritas en las especificaciones serie 3GPP TS 26. Además, se ha proporcionado una descripción del códec de AMR-NB en "El Codificador de Habla Multi-Tasa Adaptativa", IEEE Taller de Codificación de Habla, Porvoo, Finlandia, p.117-119, 1999, del que son autores Ekudden, E., Hagen, R., Johansson, I., Svedberg, J. Más aún, las descripciones del VAD han sido proporcionadas en "Detección de actividad de voz para el Códec Multi-Tasa Adaptativa de GSM", IEEE Taller de Codificación de Habla, Porvoo, Finlandia, p. 55-57, 1999, del que son autores Vähätalo, A. y Johansson, I.

Los codecs de habla de AMR-NB y AMR-WB tienen un número de modos operativos que hacen que sea posible implementar el códec a diferentes tasas de bits, por ejemplo correspondientes a un rendimiento de calidad de habla subjetiva diferente. El códec de AMR-NB puede operar a 8 tasas de bits diferentes comprendidas en la gama de 4, 75 kbps hasta 12, 2 kbps según se describe en la Tabla 1 que sigue. A través de este documento, "bps" define bits por segundo. Durante períodos de silencio de habla, según sean detectados por el VAD, el sistema genera Ruido de Confort (CN) conformado espectralmente. El CN se describe con 35 bits y una transmisión continua dada de estos parámetros de una vez por trama, siendo la tasa de bits para el CN de 1, 75 kbps. En la práctica, la actualización real del sistema se hace normalmente una vez cada 8ª trama, de modo que la tasa de bits para el CN es un octavo de ese valor, de hecho 218, 75 bps.

Tabla 1: Tasas de bits de códec de fuente para el códec de AMR-NB

Modo de códec Tasa de bits de códec de fuente

AMR_12.20 12, 20 kbps

AMR_10.20 10, 20 kbps

AMR_7.95 7, 95 kbps

AMR_7.40 7, 40 kbps

AMR_6.70 6, 70 kbps

AMR_5.90 5, 90 kbps

AMR_5.15 5, 15 kbps

AMR_4.75 4, 75 kbps

AMR_SID 1, 75 kbps (218, 75 bps)

Normalmente, el sistema se configura también usando un sistema de transmisión discontinua (DTX) que incluye un Detector de Actividad de Voz (VAD) y un generador de Confort de Ruido (CN) . Estos operan de modo que detectan habla activa y transmiten la señal de habla durante la actividad de voz, y también detectan inactividad de habla a efectos de inhibir la transmisión de señal de habla y activar por el contrario la generación de ruido de confort. La proporción de actividad de voz se denomina Factor de Actividad de Voz (VAF) . La combinación de las funciones de DTX, VAD y CN se mencionará como "sistema DTX/VAD/CN" de aquí en adelante.

La capacidad total de sistema de un sistema de comunicación celular que hace uso de un estándar tal como GSM y WCDMA está relacionada con el factor de actividad de voz (VAF) . Un sistema de comunicación celular tiene por lo general dos enlaces de transmisión, enlace ascendente (UL) y enlace descendente (DL) , desde y respectivamente hasta el terminal móvil. El sistema de AMR normalmente empleado utiliza el mismo "sistema DTX/VAD/CN" tanto en UL como en DL.

La transmisión de habla con operación DTX puede ser mencionada como método de codificación de tasa de bits variable controlada de fuente simple, donde la tasa puede hacerse variar entre dos niveles, uno para habla activa y el otro para inactividad (y transmisión de ruido de confort) . Sin embargo, el término operación de tasa de bits variable de tasa controlada de fuente (SCR VBR) se refiere típicamente a un método en el que la tasa de bits durante el habla activa puede hacerse variar según las necesidades de la señal de fuente, por ejemplo a efectos de mantener un nivel de calidad constante. La codificación SCR VBR persigue por lo tanto un objetivo similar como transmisión de habla con DTX pero puede hacer variar adicionalmente la tasa de bits incluso durante el habla activa. Ejemplos de codecs de habla y de audio con SCR VBR son el códec de 3GPP2 VMR-WB, el Códec 3GPP2 de Tasa Variable Potenciada (EVRC) y el Códec de Audio Avanzado (AAC) de MPEG.

La codificación por desviación de trama variable (VFO) ha sido descrita en el documento US20070147314 A1. Éste es un método que suspende la transmisión de aquellos segmentos de habla que el descodificador de habla puede extrapolar apropiadamente a partir del habla recibida. La idea básica consiste en operar un códec de longitud de trama fija de tal manera que una trama de codificación ya no esté limitada a empezar inmediatamente después del final de la trama de codificación anterior. La ganancia proporcionada mediante este método consiste en que la tasa de trama efectiva del códec se reduce a pesar de que la longitud de trama de códec se mantiene constante. Puesto que la tasa de bits de codificación está asociada a cada trama de códec transmitida, la tasa media de bits se reduce. El sistema opera por lo tanto como un códec de tasa variable, incluso cuando se utiliza una tasa de bits de codificación constante.

La transmisión conmutada por paquetes en tiempo real de datos de habla y de audio para aplicaciones de Voz sobre Protocolo de Internet (VoIP) hace uso generalmente del Protocolo de Transmisión en Tiempo Real (RTP) de IETF (según se ha descrito en RFC 3650) . Este protocolo proporciona un campo de sello de tiempo que indica el instante de muestreo del primer instante de muestra de la primera muestra codificada para el primer bloque de trama en el paquete. Con servicios de VoIP de forma inalámbrica, sigue siendo importante reducir la tasa de bits a través de los enlaces inalámbricos como en las transmisiones de circuito conmutado. La tasa de bits puede reducirse usando transmisión de habla con DTX, otra operación de SCR VBR, o codificación de VFO según se ha descrito anteriormente. Un método adicional de reducción de tasa de bits consiste en reducir la sobrecarga de los paquetes transmitidos. Un método de ese tipo consiste en compresión de cabecera tal como Compresión de Cabecera Robusta (ROHC) . La ROHC ha sido descrita con mayor detalle en IETF RFC3095, RFC3843, y RFC4019.

El objetivo general de las tecnologías descritas en lo que antecede consiste en reducir temporalmente los recursos de transmisión utilizados mientras se mantiene la calidad. Los párrafos que siguen discuten algunos problemas relacionados con esas técnicas.

Aunque la codificación de SCR VBR está capacitada para reducir la tasa de bits media de codificación de fuente, no es siempre deseable utilizar esta característica en cada sistema de comunicación. En el sistema de LTE, por ejemplo, un cambio de tasa de bits de codificación de fuente incluye señalización extra que a su vez puede costar recursos de transmisión adicionales o retardo de la transmisión. Véase 3GPP tdoc S4-100438: Sobre la idoneidad de una codificación de tasa variable para VoIP sobre LTE, para más información. Un problema adicional de la codificación de SCR VBR consiste en que solamente reduce la tasa de bits neta del códec. La sobrecarga relacionada con las transmisiones conmutadas de paquetes como las cabeceras de paquete, podría permanecer sin cambio... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de procesamiento de una señal para transmisión, estando el método caracterizado por:

determinar una calidad de una primera porción de la señal, y si la calidad satisface un criterio de umbral, agregar entonces una representación de la primera porción de la señal con una representación de una porción subsiguiente de la señal.

2. El método de la reivindicación 1, en donde la determinación de una calidad de una primera porción de la señal 10 comprende realizar una comparación entre una primera porción de la señal y una estimación de una primera porción de la señal.

3. El método de la reivindicación 2, en donde la estimación de una primera porción de la señal es una estimación basada en al menos una porción previa de la señal.

4. El método de cualquier reivindicación anterior, en donde una representación de una porción particular de la señal comprende los parámetros de codificación de la porción particular de la señal, comprendiendo además el método:

codificar la primera porción de la señal, y 20 codificar la porción subsiguiente de la señal.

5. El método de la reivindicación 4, en donde la tasa de codificación de una porción de la señal se determina según al menos uno de:

la calidad determinada, el número de representaciones de porciones de la señal que están agregadas entre sí, y la tasa de codificación de otra porción de la señal.

6. El método de cualquier reivindicación anterior, en donde son agregadas una pluralidad de representaciones de 30 porciones de la señal, y la agregación se detiene cuando la representación más recientemente agregada de una porción de la señal:

satisface un número máximo de umbral de porciones de la señal que pueden ser agregadas y paquetizadas en un solo paquete agregado, o bien, 35 tiene una calidad que no satisface los criterios de umbral.

7. El método de cualquier reivindicación anterior, comprendiendo además el método:

paquetizar las representaciones agregadas de porciones de la señal en un paquete agregado.

8. El método de cualquier reivindicación anterior, que comprende además transmitir las representaciones agregadas de porciones de la señal en un paquete agregado.

9. El método de cualquier reivindicación anterior, en donde una representación de la primera porción de la señal se 45 agrega con una representación de una porción subsiguiente de la señal si se determina que la primera porción está dentro de un período de residuo.

10. Un aparato para procesar una señal para transmisión, estando el aparato caracterizado por:

un analizador de señal dispuesto para determinar una calidad de una primera porción de la señal, y un agregador dispuesto para agregar una representación de la primera porción de la señal con una representación de una porción subsiguiente de la señal si la calidad satisface un criterio de umbral.

11. El aparato de la reivindicación 10, que comprende además:

un codificador dispuesto para codificar porciones de la señal para generar representaciones respectivas de las porciones de la señal.

12. El aparato de la reivindicación 10 u 11, que comprende además:

un paquetizador dispuesto para paquetizar las representaciones agregadas de porciones de la señal en un paquete agregado.

13. El aparato de la reivindicación 10, 11 ò 12, en donde el agregador está dispuesto para agregar una pluralidad de 65 representaciones de porciones de la señal, y las representaciones de las porciones son paquetizadas por medio de 11

un paquetizador cuando la porción más reciente de la señal:

satisface un número máximo de umbral de porciones de la señal que pueden ser agregadas en un único paquete agregado, o bien, 5 tiene una calidad que no satisface el criterio de umbral.

14. El aparato de cualquiera de las reivindicaciones 10 a 13, que comprende además un transmisor dispuesto para transmitir el paquete agregado.

15. El aparato de cualquiera de las reivindicaciones 10 a 14, en donde la primera porción de la señal es agregada con una porción subsiguiente de la señal si se determina que la primera porción está dentro de un período de residuo.

16. Un medio legible con ordenador, portador de instrucciones, el cual, cuando se ejecuta mediante lógica de ordenador, provoca que dicha lógica de ordenador lleve a cabo cualquiera de los métodos definidos mediante las reivindicaciones 1 a 9.