Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión.

Un método para un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio,

que comprende:

- identificar (201) regiones espectrales para ser atenuadas,

- agrupar (202) subsiguientes regiones espectrales identificadas para formar una región espectral continua,

- determinar (203) un ancho de la región espectral continua, y

- aplicar (204) una atenuación de la región espectral continua adaptativa al ancho de tal manera que un mayor ancho disminuye la atenuación de la región espectral continua.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/072963.

Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: 164 83 STOCKHOLM SUECIA.

Inventor/es: GRANCHAROV,VOLODYA, NÄSLUND,SEBASTIAN, NORVELL,ERIK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
  • G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2540051_T3.pdf

 


Fragmento de la descripción:

Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión Sector técnico Las realizaciones de la presente invención se refieren a un decodificador, a un codificador para señales de audio y a métodos para los mismos. Las señales de audio pueden comprender conversación en diferentes condiciones, música y conversación mezclada con contenidos musicales. En particular, las realizaciones se refieren a la atenuación de regiones espectrales que están reconstruidas con baja calidad. Esto puede aplicar, por ejemplo, a regiones que están codificadas con un número bajo de bits o sin bits asignados.

Antecedentes Tradicionalmente, las redes móviles están diseñadas para manejar señales de conversación a tasas de bits bajas. Esto se ha realizado mediante el uso de códecs de conversación designados que muestran un buen rendimiento para señales de conversación a tasas de bit bajas, pero que tienen un rendimiento malo para contenidos de música y mezclados. Existe cada vez más demanda de que las redes manejen también estas señales, por ejemplo, para música en espera y tonos de devolución de llamada. Las aplicaciones de internet para móviles crean asimismo la necesidad de codificación de audio de tasa de bits baja para aplicaciones de transmisión en tiempo real. Los códecs de audio normalmente operan a una tasa de bits mayor que los códecs de conversación. Cuando se limita la cantidad de bits para el códec de audio, ciertas regiones espectrales de la señal pueden codificarse con un número de bits bajo, y la calidad de objetivo deseada de la señal reconstruida puede, por lo tanto, no estar garantizada. Las regiones espectrales se refieren a regiones del dominio de la frecuencia, por ejemplo, ciertas subbandas del bloque de señales transformadas en frecuencia. Para simplificar, "regiones espectrales" se utilizará en toda la memoria con el significado de "parte de los espectros de señal de corta duración".

Además, para tasas de bits bajas y moderadas existirán regiones espectrales sin bits asignados. Tales regiones espectrales tienen que ser reconstruidas en el decodificador, reutilizando información de las regiones espectrales codificadas disponibles (por ejemplo, rellenadas con ruido o de ancho de banda extendido) . En todos estos casos algo de atenuación de la energía de las regiones reconstruidas con baja precisión resulta deseable para evitar distorsiones en una señal fuerte.

Las regiones de señal codificadas con un número insuficiente de bits o sin bits asignados serán reconstruidas con baja precisión y por consiguiente resulta deseable atenuar estas regiones espectrales. En esta memoria, el número insuficiente de bits se define como un número de bits que es demasiado bajo para poder representar la región espectral con una calidad perceptualmente plausible. Debe observarse que este número dependerá de la sensibilidad de la percepción del audio para esa región, así como de la complejidad de la región de señal a mano.

No obstante, la atenuación de regiones espectrales codificadas con baja precisión no es un problema trivial. Por un lado, una atenuación fuerte resulta deseable para enmascarar una distorsión no deseada. Por otro lado, tal atenuación podría ser percibida por los oyentes como pérdida de potencia en la señal reconstruida, cambio en las características de la frecuencia o cambio en la dinámica de la señal; por ejemplo, un algoritmo de codificación en el tiempo puede seleccionar diferentes regiones de señal para rellenar con ruido. Por estas razones los sistemas de codificación de audio convencionales aplican una atenuación muy conservadora, es decir, limitada, que obtiene un cierto equilibrio medio entre diferentes tipos de las distorsiones enumeradas anteriormente.

La solicitud de patente internacional WO03/107328 A1 describe un método para regiones con rellenado de huecos en el espectro que no han sido codificadas. Se proponen varios métodos de escalado que implican la aplicación de una envolvente uniforme, filtración espectral, filtrado de los coeficientes de la transformada, enmascaramiento de la percepción, planicidad espectral y escalado temporal.

La solicitud de patente internacional WO2009/029036 A1 describe un método para el rellenado con ruido basado en una envolvente espectral transmitida para la conformación de la región rellenada.

Compendio Las realizaciones de la presente invención mejoran los esquemas de atenuación convencionales remplazando la atenuación constante con un esquema de atenuación adaptativa que permite una atenuación más agresiva, sin introducir cambios audibles en las características de frecuencia de la señal.

De acuerdo con un primer aspecto se proporciona un método para un decodificador para la determinación de una atenuación para aplicar a una señal de audio. En el método, se identifican las regiones espectrales para ser atenuadas, se agrupan subsiguientes regiones espectrales identificadas para formar una región espectral continua, se determina un ancho de la región espectral continua y se aplica una atenuación a la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un segundo aspecto, se proporciona un controlador de atenuación de un decodificador para la determinación de una atenuación para aplicar a una señal de audio. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un tercer aspecto, se proporciona un terminal móvil. El terminal móvil comprende un decodificador con un controlador de atenuación. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

De acuerdo con un cuarto aspecto, se proporciona un nodo de red. El nodo de red comprende un decodificador con un controlador de atenuación. El controlador de atenuación comprende una unidad de identificación configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua y una unidad de determinación configurada para la determinación de un ancho de la región espectral continua. Además, se proporciona una unidad de aplicación, en la que la unidad de aplicación está configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

Una ventaja con las realizaciones de la presente invención es que la atenuación adaptativa propuesta permite una significativa reducción del ruido audible en la señal de audio reconstruida en comparación con los sistemas convencionales, que tienen una atenuación constante restringida.

Breve descripción de los dibujos La Fig. 1 ilustra esquemáticamente una vista general de un sistema de un codificador y de un decodificador basado en transformada MDCT.

La Fig. 2 es un diagrama de flujo de un método de acuerdo con una realización de la presente invención.

Las Figs. 3a y 3b ilustran vistas generales de un decodificador que contiene un control de atenuación de acuerdo con realizaciones de la presente invención.

La Fig. 4 muestra una función de limitación de atenuación que puede ser utilizada por las realizaciones y la modificación de ganancia resultante cuando se aplica la función de limitación de atenuación.

La Fig. 5a muestra un ejemplo de 16 subvectores con asignación de impulso, en los que se identifican regiones... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio, que comprende:

- identificar (201) regiones espectrales para ser atenuadas, -agrupar (202) subsiguientes regiones espectrales identificadas para formar una región espectral continua, -determinar (203) un ancho de la región espectral continua, y -aplicar (204) una atenuación de la región espectral continua adaptativa al ancho de tal manera que un mayor ancho disminuye la atenuación de la región espectral continua.

2. El método de acuerdo con la reivindicación 1, en el que las regiones espectrales para ser atenuadas están codificadas con un número bajo de bits o sin ningún bit asignado.

3. El método de acuerdo con la reivindicación 2, en el que la etapa de identificar (201) regiones espectrales para ser atenuadas comprende examinar (201a) subvectores reconstruidos.

4. El método de acuerdo con la reivindicación 3, en el que una región espectral se dice que está representada con baja precisión cuando el número de bits asignados al citado subvector reconstruido está por debajo de un umbral predeterminado.

5. El método de acuerdo con la reivindicación 3, en el que se emplea un esquema de codificación de impulsos para la codificación de subvectores espectrales, y una región espectral se dice que está representada con baja precisión si consiste en uno o más subvectores consecutivos en los que el número de impulsos P (b) está por debajo de un umbral predeterminado.

6. El método de acuerdo con cualquiera de las reivindicaciones 2 - 5, en el que se identifican las regiones espectrales que están codificadas sin ningún bit asignado.

7. El método de acuerdo con cualquiera de las reivindicaciones 2 - 5, en el que se identifican las regiones espectrales que están codificadas con un número bajo de bits.

8. El método de acuerdo con cualquiera de las reivindicaciones 1 - 7, en el que el espectro reconstruido incluye también una región que está reconstruida utilizando un algoritmo de extensión de ancho de banda.

9. El método de acuerdo con la reivindicación 1 u 8, en el que las regiones espectrales para ser atenuadas están identificadas sobre la base de un análisis recibido desde el codificador, en el que una medida de distancia entre una señal de síntesis reconstruida y una señal de objetivo de entrada son utilizadas por el codificador, si la medida de distancia en cierta región de frecuencia está por encima de un cierto umbral, la región espectral es una candidata potencial a la atenuación.

10. Un controlador de atenuación (300) de un decodificador para la determinación de una atenuación para ser aplicada a una señal de audio, que comprende una unidad de identificación (703) configurada para identificar regiones espectrales para ser atenuadas, una unidad de agrupamiento (704) configurada para agrupar subsiguientes regiones espectrales identificadas para formar una región espectral continua, una unidad de determinación (705) configurada para la determinación de un ancho de la región espectral continua y una unidad de aplicación (706) configurada para aplicar una atenuación de la región espectral continua adaptativa al ancho, de manera que un mayor ancho disminuye la atenuación de la región espectral continua.

11. El controlador de atenuación (300) de acuerdo con la reivindicación 10, en el que las regiones espectrales para ser atenuadas están codificadas con un número bajo de bits o sin ningún bit asignado.

12. El controlador de atenuación (300) de acuerdo con la reivindicación 11, en el que la unidad de identificación

(703) configurada para identificar las regiones espectrales para ser atenuadas está además configurada para examinar los subvectores reconstruidos.

13. El controlador de atenuación (300) de acuerdo con la reivindicación 12, en el que una región espectral se dice que está representada con baja precisión cuando el número de bits asignados para el citado subvector reconstruido está por debajo de un umbral predeterminado.

14. El controlador de atenuación (300) de acuerdo con la reivindicación 12, en el que un esquema de codificación de impulsos se emplea para codificar los subvectores espectrales, y una región espectral se dice que está representada con baja precisión si consiste en uno o más subvectores consecutivos donde el número de impulsos P (b) está por debajo de un umbral predeterminado.

15. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicaciones 11 - 14, en el que se identifican las regiones espectrales que están codificadas sin ningún bit asignado

16. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicaciones 11 - 14, en el que se identifican las regiones espectrales que están codificadas con un número bajo de bits.

17. El controlador de atenuación (300) de acuerdo con cualquiera de las reivindicacione.

10. 16, en el que el espectro reconstruido incluye también una región que está reconstruida utilizando un algoritmo de extensión de ancho de banda.

18. El controlador de atenuación (300) de acuerdo con la reivindicación 10 o 17, en el que comprende una unidad de entrada (710) configurada para la recepción de un análisis desde el codificador y en el que la unidad de identificación (703) está además configurada para identificar las regiones espectrales para ser atenuadas sobre la base del análisis recibido, en el que una medida de distancia entre una señal de síntesis reconstruida y una señal de objetivo de entrada son utilizadas por el decodificador, si la medida de distancia en cierta región de frecuencia está por encima de un cierto umbral, la región espectral es una candidata potencial a la atenuación.

19. Un terminal móvil que comprende un controlador de atenuación (300) de un decodificador de acuerdo con la 15 reivindicación 10.

20. Un nodo de red que comprende un controlador de atenuación (300) de un decodificador de acuerdo con la reivindicación 10.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .