Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión.

Un método para un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio, que comprende:

- identificar

(201) regiones espectrales para ser atenuadas,

- agrupar (202) subsiguientes regiones espectrales identificadas para formar una región espectral continua,

- determinar (203) un ancho de la región espectral continua, y

- aplicar (204) una atenuación de la región espectral continua adaptativa al ancho de tal manera que un mayor ancho disminuye la atenuación de la región espectral continua.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/072963.

Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: 164 83 STOCKHOLM SUECIA.

Inventor/es: GRANCHAROV,VOLODYA, NÄSLUND,SEBASTIAN, NORVELL,ERIK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/02 (Mejora de la inteligibilidad de la voz, p.ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)

PDF original: ES-2540051_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión Sector técnico Las realizaciones de la presente invención se refieren a un decodificador, a un codificador para señales de audio y a métodos para los mismos. Las señales de audio pueden comprender conversación en diferentes condiciones, música y conversación mezclada con contenidos musicales. En particular, las realizaciones se refieren a la atenuación de regiones espectrales que están reconstruidas con baja calidad. Esto puede aplicar, por ejemplo, a regiones que están codificadas con un número bajo de bits o sin bits asignados.

Antecedentes Tradicionalmente, las redes móviles están diseñadas para manejar señales de conversación a tasas de bits bajas. Esto se ha realizado mediante el uso de códecs de conversación designados que muestran un buen rendimiento para señales de conversación a tasas de bit bajas, pero que tienen un rendimiento malo para contenidos de música y mezclados. Existe cada vez más demanda de que las redes manejen también estas señales, por ejemplo, para música en espera y tonos de devolución de llamada. Las aplicaciones de internet para móviles crean asimismo la necesidad de codificación de audio de tasa de bits baja para aplicaciones de transmisión en tiempo real. Los códecs de audio normalmente operan a una tasa de bits mayor que los códecs de conversación. Cuando se limita la cantidad de bits para el códec de audio, ciertas regiones espectrales de la señal pueden codificarse con un número de bits bajo, y la calidad de objetivo deseada de la señal reconstruida puede, por lo tanto, no estar garantizada. Las regiones espectrales se refieren a regiones del dominio de la frecuencia, por ejemplo, ciertas subbandas del bloque de señales transformadas en frecuencia. Para simplificar, "regiones espectrales" se utilizará en toda la memoria con el significado de "parte de los espectros de señal de corta duración".

Además, para tasas de bits bajas y moderadas existirán regiones espectrales sin bits asignados. Tales regiones espectrales tienen que ser reconstruidas en el decodificador, reutilizando información de las regiones espectrales codificadas disponibles (por ejemplo, rellenadas con ruido o de ancho de banda extendido) . En todos estos casos algo de atenuación de la energía de las regiones reconstruidas con baja precisión resulta deseable para evitar distorsiones en una señal fuerte.

Las regiones de señal codificadas con un número insuficiente de bits o sin bits asignados serán reconstruidas con baja precisión y por consiguiente resulta deseable atenuar estas regiones espectrales. En esta memoria, el número insuficiente de bits se define como un número de bits que es demasiado bajo para poder representar la región espectral con una calidad perceptualmente plausible. Debe observarse que este número dependerá de la sensibilidad de la percepción del audio para esa región, así como de la complejidad de la región de señal a mano.

No obstante, la atenuación de regiones espectrales codificadas con baja precisión no es un problema trivial. Por un lado, una atenuación fuerte resulta deseable para enmascarar una distorsión no deseada. Por otro lado, tal atenuación podría ser percibida por los oyentes como pérdida de potencia en la señal reconstruida, cambio en las características de la frecuencia o cambio en la dinámica de la señal; por ejemplo, un algoritmo de codificación en el tiempo puede seleccionar diferentes regiones de señal para rellenar con ruido. Por estas razones los sistemas de codificación de audio convencionales aplican una atenuación muy conservadora, es decir, limitada, que obtiene un cierto equilibrio medio entre diferentes tipos de las distorsiones enumeradas anteriormente.

La solicitud de patente internacional WO03/107328 A1 describe un método para regiones con rellenado de huecos en el espectro que no han sido codificadas. Se proponen varios métodos de escalado que implican la aplicación de una envolvente uniforme, filtración espectral, filtrado de los coeficientes de la transformada, enmascaramiento de la percepción, planicidad espectral y escalado temporal.

La solicitud de patente internacional WO2009/029036 A1 describe un método para el rellenado con ruido basado en una envolvente espectral transmitida para la conformación de la región rellenada.

Compendio Las realizaciones de la presente invención mejoran los esquemas de atenuación convencionales remplazando la atenuación constante con un esquema de atenuación adaptativa que permite una atenuación más agresiva, sin introducir cambios audibles en las características de frecuencia de la señal.

De acuerdo con un primer aspecto se proporciona un método para un decodificador para la determinación de una atenuación para aplicar a una señal de audio. En el método, se identifican las regiones espectrales para ser atenuadas, se agrupan subsiguientes regiones espectrales identificadas para formar una región espectral continua, se determina un ancho de la región espectral continua y se aplica una atenuación a la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un segundo aspecto, se proporciona un controlador de atenuación de un decodificador para la determinación de una atenuación para aplicar a una señal de audio. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un tercer aspecto, se proporciona un terminal móvil. El terminal móvil comprende un decodificador con un controlador de atenuación. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un cuarto aspecto, se proporciona un nodo de red. El nodo de red comprende un decodificador con un controlador de atenuación. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

Una ventaja con las realizaciones de la presente invención es que la atenuación adaptativa... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio, que comprende:

- identificar (201) regiones espectrales para ser atenuadas, -agrupar (202) subsiguientes regiones espectrales identificadas para formar una región espectral continua, -determinar (203) un ancho de la región espectral continua, y -aplicar (204) una atenuación de la región espectral continua adaptativa al ancho de tal manera que un mayor ancho disminuye la atenuación de la región espectral continua.

2. El método de acuerdo con la reivindicación 1, en el que las regiones espectrales para ser atenuadas están codificadas con un número bajo de bits o sin ningún bit asignado.

3. El método de acuerdo con la reivindicación 2, en el que la etapa de identificar (201) regiones espectrales para ser atenuadas comprende examinar (201a) subvectores reconstruidos.

4. El método de acuerdo con la reivindicación 3, en el que una región espectral se dice que está representada con baja precisión cuando el número de bits asignados al citado subvector reconstruido está por debajo de un umbral predeterminado.

5. El método de acuerdo con la reivindicación 3, en el que se emplea un esquema de codificación de impulsos para la codificación de subvectores espectrales, y una región espectral se dice que está representada con baja precisión si consiste en uno o más subvectores consecutivos en los que el número de impulsos P (b) está por debajo de un umbral predeterminado.

6. El método de acuerdo con cualquiera de las reivindicaciones 2 - 5, en el que se identifican las regiones espectrales que están codificadas sin ningún bit asignado.

7. El método de acuerdo con cualquiera de las reivindicaciones 2 - 5, en el que se identifican las regiones espectrales que están codificadas con un número bajo de bits.

8. El método de acuerdo con cualquiera de las reivindicaciones 1 - 7, en el que el espectro reconstruido incluye también una región que está reconstruida utilizando un algoritmo de extensión de ancho de banda.

9. El método de acuerdo con la reivindicación 1 u 8, en el que las regiones espectrales para ser atenuadas están identificadas sobre la base de un análisis recibido desde el codificador, en el que una medida de distancia entre una señal de síntesis reconstruida y una señal de objetivo de entrada son utilizadas por el codificador, si la medida de distancia en cierta región de frecuencia está por encima de un cierto umbral, la región espectral es una candidata potencial a la atenuación.

10. Un controlador de atenuación (300) de un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio, que comprende una unidad de identificación (703) configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento (704) configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua, una unidad de determinación (705) configurada para la determinación de un ancho de la región espectral continua y una unidad de aplicación (706) configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

11. El controlador de atenuación (300) de acuerdo con la reivindicación 10, en el que las regiones espectrales para ser atenuadas están codificadas con un número bajo de bits o sin ningún bit asignado.

12. El controlador de atenuación (300) de acuerdo con la reivindicación 11, en el que la unidad de identificación

(703) configurada para identificar las regiones espectrales para ser atenuadas está además configurada para examinar los subvectores reconstruidos.

13. El controlador de atenuación (300) de acuerdo con la reivindicación 12, en el que una región espectral se dice que está representada con baja precisión cuando el número de bits asignados para el citado subvector reconstruido está por debajo de un umbral predeterminado.

14. El controlador de atenuación (300) de acuerdo con la reivindicación 12, en el que un esquema de codificación de impulsos se emplea para codificar los subvectores espectrales, y una región espectral se dice que está representada con baja precisión si consiste en uno o más subvectores consecutivos donde el número de impulsos P (b) está por debajo de un umbral predeterminado.

15. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicaciones 11 - 14, en el que se identifican las regiones espectrales que están codificadas sin ningún bit asignado

16. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicaciones 11 - 14, en el que se identifican las regiones espectrales que están codificadas con un número bajo de bits.

17. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicacione.

10. 16, en el que el espectro reconstruido incluye también una región que está reconstruida utilizando un algoritmo de extensión de ancho de banda.

18. El controlador de atenuación (300) de acuerdo con la reivindicación 10 o 17, en el que comprende una unidad de entrada (710) configurada para la recepción de un análisis desde el codificador y en el que la unidad de identificación (703) está además configurada para identificar las regiones espectrales para ser atenuadas sobre la base del análisis recibido, en el que una medida de distancia entre una señal de síntesis reconstruida y una señal de objetivo de entrada son utilizadas por el decodificador, si la medida de distancia en cierta región de frecuencia está por encima de un cierto umbral, la región espectral es una candidata potencial a la atenuación.

19. Un terminal móvil que comprende un controlador de atenuación (300) de un decodificador de acuerdo con la 15 reivindicación 10.

20. Un nodo de red que comprende un controlador de atenuación (300) de un decodificador de acuerdo con la reivindicación 10.