CONTROL DE ESCALADO EN EL TIEMPO DE UNA SEÑAL DE AUDIO.

Un procedimiento, que comprende:

detectar un cambio en un retardo de tramas que se reciben a través de una red de conmutación de paquetes,

perteneciendo las tramas a una secuencia de tramas en la que se distribuye una señal de audio;

determinar la cantidad de escalado en el tiempo que se requiere aplicar a las tramas recibidas para compensar dicho cambio detectado;

determinar un tipo de dicho cambio evaluando al menos un cambio en la cantidad de tramas retardadas; y

determinar una longitud de una ventana de tiempo dentro de la cual va a completarse un escalado en el tiempo de dicha cantidad requerida dependiendo de dicho tipo determinado de dicho cambio

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2007/050368.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4,00045 ESPOO.

Inventor/es: OJALA, PASI, LAKANIEMI, ARI.

Fecha de Publicación: 4 de Junio de 2010.

Fecha Concesión Europea: 31 de Marzo de 2010.

Clasificación Internacional de Patentes:

G10L21/04 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Compresión o expansión temporales.

Clasificación PCT:

G10L21/04 G10L 21/00 […] › Compresión o expansión temporales.
H04J3/06 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04J COMUNICACIONES MULTIPLEX (peculiar de la transmisión de información digital H04L 5/00; sistemas para transmitir las señales de televisión simultánea o secuencialmente H04N 7/08; en las centrales H04Q 11/00). › H04J 3/00 Time-division multiplex systems (H04J 14/08 takes precedence). › Disposiciones de sincronización.

CONTROL DE ESCALADO EN EL TIEMPO DE UNA SEÑAL DE AUDIO.

Fragmento de la descripción:

Control del escalado en el tiempo de una señal de audio.

Campo de la invención

La invención se refiere a un procedimiento para controlar un escalado en el tiempo de una señal de audio. La invención se refiere además a un conjunto de chips, a un receptor de audio, a un dispositivo electrónico y a un sistema que permite un control de un escalado en el tiempo de una señal de audio. La invención se refiere además a un producto de programa de software que almacena un código de software para controlar un escalado en el tiempo de una señal de audio.

Antecedentes de la invención

El escalado en el tiempo de una señal de audio puede habilitarse, por ejemplo, en un receptor de audio que sea adecuado para recibir señales de audio codificadas en paquetes a través de una red de conmutación de paquetes, tal como Internet, para descodificar las señales de audio codificadas y para reproducir la señal de audio descodificada para un usuario.

La naturaleza de las comunicaciones de conmutación de paquetes introduce normalmente variaciones en los tiempos de transmisión de los paquetes, conocidas como fluctuaciones, lo cual se observa en el receptor como paquetes que llegan a intervalos irregulares. Además de las condiciones de pérdida de paquetes, las fluctuaciones de red suponen un obstáculo importante especialmente para servicios de voz conversacionales proporcionados por las redes de conmutación de paquetes.

Más específicamente, un componente de reproducción de audio de un receptor de audio que funciona en tiempo real requiere una entrada de datos constante para mantener una buena calidad de sonido. Incluso las interrupciones cortas deben evitarse. Por lo tanto, si algunos paquetes que comprenden tramas de audio llegan solamente después de las tramas de audio necesarias para la descodificación y un procesamiento adicional, estos paquetes y las tramas de audio incluidas se consideran como perdidos. El descodificador de audio ocultará los errores para compensar la señal de audio transportada en las tramas perdidas. Obviamente, un ocultamiento de errores excesivo reducirá la calidad del sonido.

Por lo tanto, una memoria intermedia de fluctuación se utiliza normalmente para ocultar los intervalos irregulares de llegada de paquetes y para proporcionar una entrada de datos continua al descodificador y a un componente de reproducción de audio posterior. La memoria intermedia de fluctuación almacena con este fin tramas de audio entrantes durante una cantidad de tiempo predeterminada. Este tiempo puede especificarse, por ejemplo, tras la recepción del primer paquete de un flujo de paquetes. Sin embargo, una memoria intermedia de fluctuación introduce un componente de retardo adicional ya que los paquetes recibidos se almacenan antes de un procesamiento adicional. Esto incrementa el retardo de extremo a extremo. Una memoria intermedia de fluctuación puede caracterizarse por el retardo medio de almacenamiento en memoria intermedia y por la proporción resultante de tramas retardadas entre todas las tramas recibidas.

Una memoria intermedia de fluctuación que utilice un retardo fijo es inevitablemente un compromiso entre un bajo retardo de extremo a extremo y un número bajo de tramas retardadas, y encontrar un equilibrio óptimo no es una tarea sencilla. Aunque puede haber entornos y aplicaciones especiales donde puede estimarse que la cantidad de fluctuación esperada permanece dentro de límites predeterminados, en general la fluctuación puede variar de cero a cientos de milisegundos (incluso dentro de la misma sesión). La utilización de un retardo fijo que esté fijado a un valor lo suficientemente grande como para cubrir la fluctuación según el peor caso de escenario esperado mantendría controlado el número de tramas retardadas, pero al mismo tiempo existe el riesgo de introducir un retardo de extremo a extremo que sea lo bastante largo como para permitir una conversación natural. Por lo tanto, la aplicación de un almacenamiento fijo en memoria intermedia no es la elección óptima en la mayoría de aplicaciones de transmisión de audio que funcionen a través de una red de conmutación de paquetes.

Una memoria intermedia adaptativa de fluctuación puede utilizarse para controlar dinámicamente el equilibrio entre un retardo suficientemente corto y un número suficientemente bajo de tramas retardadas. En este enfoque, el flujo de paquetes entrantes se supervisa constantemente, y el retardo de almacenamiento en memoria intermedia se ajusta según los cambios observados en el comportamiento de retardo del flujo de paquetes entrantes. En caso de que parezca que el retardo de transmisión aumenta o que la fluctuación esté empeorando, el retardo de almacenamiento en memoria intermedia se incrementa para satisfacer las condiciones de red. En una situación opuesta, el retardo de almacenamiento en memoria intermedia puede reducirse y, por lo tanto, el retardo global de extremo a extremo se minimiza.

Puesto que el componente de reproducción de audio necesita una entrada de datos regular, el ajuste de la memoria intermedia no es del todo sencillo. Surge el problema de que si se reduce el retardo de almacenamiento en memoria intermedia, es necesario que la señal de audio que se proporciona al componente de reproducción se acorte para compensar el retardo acortado de almacenamiento en memoria intermedia y, por otro lado, si se aumenta el retardo de almacenamiento en memoria intermedia, la señal de audio tiene que alargarse para compensar el retardo aumentado de almacenamiento en memoria intermedia.

Para aplicaciones de voz sobre IP (VoIP), se conoce modificar la señal en caso de un mayor o un menor retardo de almacenamiento en memoria intermedia descartando o repitiendo una parte de la señal de ruido aceptable entre periodos de voz activa cuando la transmisión discontinua (DTX) está habilitada. Sin embargo, un enfoque de este tipo no es siempre posible. Por ejemplo, la funcionalidad DTX no podría utilizarse o la DTX no podría conmutar a un ruido aceptable debido a condiciones de ruido de fondo difíciles, tales como escuchar de fondo a otro hablante.

En una solución más avanzada que controle un retardo variable de memoria intermedia, se utiliza un escalado en el tiempo de señales para modificar la longitud de las tramas de audio de salida que se reenvían al componente de reproducción. El escalado en el tiempo de señales puede realizarse o bien en el descodificador o bien en una unidad de postprocesamiento después del descodificador. En este enfoque, el descodificador lee con más frecuencia las tramas de la memoria intermedia de fluctuación cuando disminuye el retardo que durante el funcionamiento normal, mientras que un mayor retardo reduce la velocidad de salida de trama desde la memoria intermedia de fluctuación.

En un receptor de audio que esté equipado con una memoria intermedia adaptativa de fluctuación y con una funcionalidad de escalado en el tiempo, el estado de la red y el estado de la memoria intermedia se supervisan constantemente. En función del estado de la memoria intermedia y de la red, se realizan modificaciones de escalado en el tiempo en una señal de audio, añadiendo o eliminando uno o más segmentos de la señal de audio, para compensar cualquier cambio en el retardo de memoria intermedia.

La solicitud de patente WO 2005/117366 presenta un procedimiento, un aparato y un programa para impedir que una memoria intermedia de recepción se quede vacía: almacenando los paquetes recibidos en la memoria intermedia de recepción; detectando la mayor fluctuación de retardo de llegada de los paquetes y el nivel de memoria intermedia de la memoria intermedia de recepción mediante una parte de detección de estado; obteniendo un nivel óptimo de memoria intermedia para la mayor fluctuación de retardo utilizando una tabla predeterminada mediante una parte de control; determinando, en función del nivel detectado de memoria intermedia y del nivel óptimo de memoria intermedia, el nivel de urgencia referente a la necesidad de ajustar el nivel de la memoria intermedia; expandiendo o reduciendo la forma de onda de un flujo de datos de audio descodificados de la trama actual descodificada a partir de un paquete leído de la memoria intermedia de recepción mediante una parte de ajuste de consumo que ajusta el consumo de tramas de reproducción en función del nivel de urgencia, el nivel detectado de memoria intermedia y el nivel óptimo de memoria intermedia.

El reto a la hora de realizar modificaciones de escalado en el tiempo en partes activas de la señal de audio es mantener la calidad de audio percibida en un nivel suficientemente alto.

Resumen...

Reivindicaciones:

1. Un procedimiento, que comprende:

detectar un cambio en un retardo de tramas que se reciben a través de una red de conmutación de paquetes, perteneciendo las tramas a una secuencia de tramas en la que se distribuye una señal de audio;
determinar la cantidad de escalado en el tiempo que se requiere aplicar a las tramas recibidas para compensar dicho cambio detectado;
determinar un tipo de dicho cambio evaluando al menos un cambio en la cantidad de tramas retardadas; y
determinar una longitud de una ventana de tiempo dentro de la cual va a completarse un escalado en el tiempo de dicha cantidad requerida dependiendo de dicho tipo determinado de dicho cambio.

2. El procedimiento según la reivindicación 1, en el que un tipo determinado de dicho cambio es o bien un cambio que requiere una ventana de tiempo más corta para una cantidad determinada de escalado en el tiempo o bien un tipo que permite una ventana de tiempo más larga para una cantidad determinada de escalado en el tiempo.

3. El procedimiento según la reivindicación 2, en el que se determina que sea dado un tipo de un cambio que requiere una ventana de tiempo más corta al menos en caso de que se detecte uno de entre un cambio de retardo, cambio que supere un valor predeterminado, y un valor de pico de retardo.

4. El procedimiento según la reivindicación 2 ó 3, en el que las tramas recibidas se almacenan en una memoria intermedia variable tras su recepción y en el que se determina que sea dado un tipo de un cambio que permita una ventana de tiempo más larga al menos en caso de que se detecte un cambio gradual de ocupación de memoria intermedia.

5. El procedimiento según una de las reivindicaciones 2 a 4, en el que se determina que sea dado un tipo de un cambio que permite una ventana de tiempo más larga al menos en caso de que se detecte un cambio en la cantidad de tramas retardadas.

6. El procedimiento según una de las reivindicaciones anteriores, que comprende una etapa posterior en la que las tramas recibidas se escalan en el tiempo en dicha cantidad determinada dentro de una ventana de tiempo de dicha longitud determinada.

7. El procedimiento según la reivindicación 6, que comprende además determinar un tipo de contenido de dichas tramas dentro de dicha ventana de tiempo y evitar un escalado en el tiempo de esas tramas dentro de dicha ventana de tiempo, tramas que presentan un contenido de un tipo predeterminado.

8. El procedimiento según una de las reivindicaciones 6 a 7, en el que las tramas recibidas se almacenan una memoria intermedia variable tras su recepción y se recuperan de dicha memoria intermedia variable para su descodificación, y en el que las tramas que están sometidas a dicho escalado en el tiempo son tramas que incluyen una señal de excitación de filtro de síntesis de predicción lineal generada en dicha descodificación.

9. Un aparato que comprende un componente de control de escalado en el tiempo para controlar un escalado en el tiempo de una señal de audio, señal de audio que se distribuye en una secuencia de tramas que se reciben a través de una red de conmutación de paquetes,

estando adaptado dicho componente de control de escalado en el tiempo para detectar un cambio en un retardo de tramas recibidas;

estando adaptado dicho componente de control de escalado en el tiempo para determinar la cantidad de escalado en el tiempo que se requiere aplicar a las tramas recibidas para compensar un cambio detectado;

estando adaptado dicho componente de control de escalado en el tiempo para determinar un tipo de un cambio detectado evaluando al menos un cambio en la cantidad de tramas retardadas; y

estando adaptado dicho componente de control de escalado en el tiempo para determinar una longitud de una ventana de tiempo dentro de la cual va a completarse un escalado en el tiempo de dicha cantidad requerida dependiendo de dicho tipo determinado de dicho cambio.

10. El aparato según la reivindicación 9, en el que un tipo determinado de dicho cambio es o bien un tipo que requiere una ventana de tiempo más corta para una cantidad determinada de escalado en el tiempo o bien un tipo que permite una ventana de tiempo más larga para una cantidad determinada de escalado en el tiempo.

11. El aparato según la reivindicación 10, en el que dicho componente de control de escalado en el tiempo está adaptado para determinar que sea dado un tipo de un cambio que requiera una ventana de tiempo más corta al menos en caso de que se detecte uno de entre un cambio de retardo, cambio que supere un valor predeterminado, y un valor de pico de retardo.

12. El aparato según la reivindicación 10 u 11, que comprende una memoria intermedia variable adaptada para almacenar tramas recibidas tras la recepción y en el que dicho componente de control de escalado en el tiempo está adaptado para determinar que sea dado un tipo de un cambio que permita una ventana de tiempo más larga al menos en caso de que se detecte un cambio gradual de ocupación de memoria intermedia.

13. El aparato según una de las reivindicaciones 10 a 12, en el que dicho componente de control de escalado en el tiempo está adaptado para determinar que sea dado un tipo de un cambio que permita una ventana de tiempo más larga al menos en caso de que se detecte un cambio en la cantidad de tramas retardadas.

14. El aparato según una de las reivindicaciones 9 a 13, que comprende un componente de escalado en el tiempo adaptado para que las tramas recibidas se escalen en el tiempo en una cantidad determinada dentro de una ventana de tiempo de una longitud determinada.

15. El aparato según la reivindicación 14, en el que dicho componente de escalado en el tiempo está adaptado para determinar un tipo de contenido de tramas dentro de dicha ventana de tiempo y para evitar un escalado en el tiempo de esas tramas dentro de dicha ventana de tiempo, tramas que presentan un contenido de un tipo predeterminado.

16. Un aparato según una de las reivindicaciones 9 a 15, en el que dicho aparato es uno de entre un conjunto de chips con al menos un chip, un receptor de audio y un dispositivo electrónico.

17. Un código de software adaptado para llevar a cabo las siguientes etapas cuando se ejecuta por un procesador:

detectar un cambio en un retardo de tramas recibidas que se reciben a través de una red de conmutación de paquetes, perteneciendo las tramas a una secuencia de tramas en la que se distribuye una señal de audio;
determinar la cantidad de escalado en el tiempo que se requiere aplicar a las tramas recibidas para compensar dicho cambio detectado;
determinar un tipo de dicho cambio evaluando al menos un cambio en la cantidad de tramas retardadas; y
determinar una longitud de una ventana de tiempo dentro de la cual va a completarse un escalado en el tiempo de dicha cantidad requerida dependiendo de dicho tipo determinado de dicho cambio.

18. El código de software según la reivindicación 17, en el que un tipo determinado de dicho cambio es o bien un tipo que requiere una ventana de tiempo más corta para una cantidad determinada de escalado en el tiempo o bien un tipo que permite una ventana de tiempo más larga para una cantidad determinada de escalado de tiempo.

19. El código de software según la reivindicación 17 o 18, que cuando se ejecuta por un procesador, dicho código de software realiza una etapa posterior en la que las tramas recibidas se escalan en el tiempo en dicha cantidad predeterminada dentro de una ventana de tiempo de dicha longitud determinada, las tramas recibidas.

20. Un producto de programa de software en el que está almacenado un código de software según una de las reivindicaciones 17 a 19.

Patentes similares o relacionadas:

Dispositivo y método para manipular una señal de audio que tiene un evento transitorio, del 24 de Julio de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para manipular una señal de audio que tiene un evento transitorio que comprende: un procesador de señal para procesar una señal de audio reducida […]

Escalador de tiempo, decodificador de audio, procedimiento y programa informático mediante el uso de un control de calidad, del 29 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un escalador de tiempo para la provisión de una versión de escala de tiempo de una señal de audio de entrada (210; […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Dispositivo y método para manipular una señal de audio que tiene un evento transitorio, del 22 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para manipular una señal de audio que comprende un evento transitorio que comprende: un procesador de señal para procesar una señal de […]

Dispositivo y método para manipular una señal de audio que tiene un evento transitorio, del 1 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para manipular una señal de audio que comprende un evento transitorio en una primera porción de tiempo de la señal de audio, comprendiendo el […]

Transposición armónica basada en bloque de subbanda mejorado de producto cruzado, del 12 de Febrero de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal extendida en tiempo y/o transpuesta en frecuencia a partir de una señal de entrada, el sistema que comprende: un banco […]

Escalador de tiempo, decodificador de audio, procedimiento y programa informático mediante el uso de un control de calidad, del 31 de Enero de 2018, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un escalador de tiempo para la provisión de una versión de escala de tiempo de una señal de audio de […]

Transposición armónica mejorada, del 26 de Julio de 2017, de DOLBY INTERNATIONAL AB: Un sistema para transponer una señal de audio de entrada según un factor de transposición T, comprendiendo el sistema: - medios para extraer una trama […]