MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN DE RUIDO.

Procedimiento de decodificación de una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento (201) de codificación predefinido,

comprendiendo el procedimiento las etapas de: - decodificar dicha señal (b1) de código en una primera señal (x1') de audio usando un procedimiento (203) de decodificación correspondiente a dicho procedimiento (201) de codificación predefinido, - generar a partir de dichos parámetros (b2) de transformación una señal (r2') de ruido que tiene características espectro-temporales sustancialmente similares a dicha señal de audio, y estando caracterizado el procedimiento porque comprende las etapas de: - generar una segunda señal (x2') de audio eliminando de la señal (r2') de ruido partes espectro-temporales de la señal de audio que ya están contenidas en la primera señal (x1') de audio, determinándose las partes espectro-temporales mediante una comparación de la primera señal (x1') de audio y las características de la señal (r2') de ruido, y - generar la señal de audio (x') sumando (211) la primera señal (x1') de audio y la segunda señal (x2') de audio

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2004/051010.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: DEN BRINKER, ALBERTUS, C., MYBURG,FRANCOIS,P.

Fecha de Publicación: .

Fecha Solicitud PCT: 25 de Junio de 2004.

Clasificación Internacional de Patentes:

  • G10L21/02A4E

Clasificación PCT:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Clasificación antigua:

  • G10L21/02 G10L 21/00 […] › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre.

MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN DE RUIDO.

Fragmento de la descripción:

La presente invención se refiere a un procedimiento de decodificación de una señal de audio. La invención se refiere además a un dispositivo para decodificar una señal de audio.

Un modo de codificación es modelar partes de audio o señales de voz mediante ruido sintético, al tiempo que se mantiene una calidad buena o aceptable y, por ejemplo, herramientas de extensión de ancho de banda se basan en este concepto. En herramientas de extensión de ancho de banda para voz y audio, las bandas de frecuencia más altas normalmente se eliminan en el codificador en caso de tasas de transmisión de bits bajas y se recuperan o bien mediante una descripción paramétrica de las envolventes temporales y espectrales de las bandas que faltan o bien la banda que falta se genera de algún modo a partir de la señal de audio recibida. En cualquier caso, es necesario conocer la(s) banda(s) que falta(n) (al menos la ubicación) para generar la señal de ruido complementaria.

Ejemplos de sistema de extensión de ancho de banda se dan a conocer en las publicaciones de solicitud de patente WO2003/083834 y WO1998/057436.

Una técnica adicional para tratar el problema de los huecos espectrales se da a conocer en la publicación de solicitud de patente FR 2 821 501.

Este principio se lleva a cabo creando un primer flujo de bits mediante un primer codificador dada una tasa de transmisión de bits objetivo. El requisito de la tasa de transmisión de bits induce una cierta limitación de ancho de banda en el primer codificador. Esta limitación de ancho de banda se usa como elemento conocido en un segundo codificador. Un flujo de bits adicional (extensión de ancho de banda) se crea entonces mediante el segundo codificador, que cubre la descripción de la señal en cuanto a características de ruido de la banda que falta. En un primer decodificador, el primer flujo de bits se usa para reconstruir la señal de audio limitada en banda, y una señal de ruido adicional se genera mediante el segundo decodificador y se añade a la señal de audio limitada en banda, con lo cual se obtiene la señal decodificada completa.

Un problema de lo anterior es que el emisor o el receptor no siempre conocen qué información se descarta en la rama cubierta por el primer codificador y el primer decodificador. Por ejemplo, si el primer codificador produce un flujo de bits en capas y las capas se eliminan durante la transmisión a través de una red, entonces ni el emisor o el primer codificador ni el receptor o el primer decodificador conocen este hecho. La información eliminada puede ser, por ejemplo, información de subbanda de las bandas más altas de un codificador de subbanda. Otra posibilidad sucede en codificación sinusoidal: en codificadores sinusoidales ajustables a escala, pueden crearse flujos de bits en capas, y pueden clasificarse datos sinusoidales en capas según su relevancia perceptiva. La eliminación de capas durante la transmisión sin editar adicionalmente las capas restantes para indicar lo que se ha eliminado normalmente produce huecos espectrales en la señal sinusoidal decodificada.

El problema básico en esta configuración es que ni el primer codificador ni el primer decodificador tienen información sobre qué adaptación se ha hecho en la rama desde el primer codificador hasta el primer decodificador. El codificador carece de este conocimiento, porque la adaptación puede tener lugar durante la transmisión (es decir, tras la codificación), mientras que el decodificador simplemente recibe un flujo de bits permitido.

El ajuste a escala de la tasa de transmisión de bits, también llamado codificación incrustada, es la capacidad del codificador de audio para producir un flujo de bits ajustable a escala. Un flujo de bits ajustable a escala contiene varias capas (o planos), que pueden eliminarse, disminuyendo, como resultado, la tasa de transmisión de bits y la calidad. La primera (y más importante) capa se denomina habitualmente la “capa base,” mientras que las capas restantes se denominan “capas de refinamiento” y normalmente tienen un orden de importancia predefinido. El decodificador debería poder decodificar partes predefinidas (las capas) del flujo de bits ajustable a escala.

En codificación de audio paramétrica con tasa de transmisión de bits ajustable a escala es una práctica general añadir los objetos de audio (sinusoides, transitorios y ruido) en orden de importancia perceptiva al flujo de bits. Las sinusoides individuales en una trama particular se ordenan según su relevancia perceptiva, de modo que las sinusoides más relevantes se colocan en la capa base. Las sinusoides restantes se distribuyen entre las capas de refinamiento, según su relevancia perceptiva. Las pistas completas pueden clasificarse según su relevancia perceptiva y distribuirse por las capas, yendo las pistas más relevantes a la capa base. Para conseguir esta ordenación perceptiva de las sinusoides individuales y completar las pistas, se usan modelos psicoacústicos.

Se conoce colocar los parámetros de componente de ruido más importantes en la capa base, mientras que los parámetros de ruido restantes se distribuyen entre las capas de refinamiento. Esto se ha descrito en el documento con el título Error Protection and Concealment for HILN MPEG-4 Parametric Audio Coding. H. Pumhagen, B. Edler, y N. Meine. Audio Engineering Society (AES) 110th Convention, Preprint 5300, Amsterdam (NL), 12 a 15 de mayo de 2001.

La componente de ruido global también puede añadirse a la segunda capa de refinamiento. Los transitorios se consideran la componente de señal menos importante. Por tanto, normalmente se colocan en una de las capas de refinamiento más altas. Esto se describe en el documento con el título A 6kbps to 85kbps Scalable Audio Coder.

T.S. Verma y T.H.Y. Meng. 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2000). págs. 877--880. 5 a 9 de junio de 2000.

El problema de un flujo de bits en capas construido de la manera descrita anteriormente es la calidad de audio resultante de cada capa: La retirada de sinusoides mediante la eliminación de capas de refinamiento del flujo de bits da como resultado “huecos” espectrales en la señal decodificada. Estos huecos no se llenan con la componente de ruido (o cualquier otra componente de señal), puesto que el ruido se deriva habitualmente en el codificador dada la componente sinusoidal completa. Además, sin la componente (completa) de ruido, se introducen artefactos adicionales. Estos procedimientos de producción de un flujo de bits ajustable a escala dan como resultado una degradación en la calidad de audio sin armonía ni naturalidad.

Un objeto de la presente invención es proporcionar una solución a los problemas mencionados anteriormente.

Un procedimiento de codificación a modo de ejemplo de una señal de audio, en el que se genera una señal de código a partir de la señal de audio según un procedimiento de codificación predefinido, comprende las etapas de:

- transformar la señal de audio en un conjunto de parámetros de transformación que definen al menos una parte de la información espectro-temporal en dicha señal de audio, permitiendo dichos parámetros de transformación la generación de una señal de ruido que tiene características espectro-temporales sustancialmente similares a dicha señal de audio, y

- representar dicha señal de audio mediante dicha señal de código y dichos parámetros de transformación.

De este modo se obtiene una doble descripción de la señal que comprende dos etapas de codificación, una primera codificación estándar y una segunda codificación adicional. La segunda codificación puede dar una descripción aproximada de la señal, de modo que pueda realizarse una realización estocástica y puedan añadirse partes apropiadas a la señal decodificada a partir de la primera decodificación. La descripción requerida del segundo codificador para hacer posible la realización de una señal estocástica requiere una tasa de transmisión de bits pequeña, mientras que otras descripciones dobles/múltiples requerirían mucha más tasa de transmisión de bits. Los parámetros de transformación pueden ser, por ejemplo, coeficientes de filtro que describen la envolvente espectral de la señal de audio y coeficientes que describen la envolvente de amplitud o energía temporal. Los parámetros pueden ser alternativamente información adicional que consiste en datos psicoacústicos tal como la curva de enmascaramiento, los patrones de excitación...

 


Reivindicaciones:

1. Procedimiento de decodificación de una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento (201) de codificación predefinido, comprendiendo el procedimiento las etapas de:

- decodificar dicha señal (b1) de código en una primera señal (x1') de audio usando un procedimiento (203) de decodificación correspondiente a dicho procedimiento (201) de codificación predefinido,

- generar a partir de dichos parámetros (b2) de transformación una señal (r2') de ruido que tiene características espectro-temporales sustancialmente similares a dicha señal de audio,

y estando caracterizado el procedimiento porque comprende las etapas de:

- generar una segunda señal (x2') de audio eliminando de la señal (r2') de ruido partes espectro-temporales de la señal de audio que ya están contenidas en la primera señal (x1') de audio, determinándose las partes espectro-temporales mediante una comparación de la primera señal (x1') de audio y las características de la señal (r2') de ruido, y

- generar la señal de audio (x') sumando (211) la primera señal (x1') de audio y la segunda señal (x2') de audio.

2. Procedimiento según la reivindicación 1, en el que dicha etapa de generar la segunda señal (x2') de audio comprende:

- derivar una respuesta de frecuencia comparando un espectro de la primera señal (x1') de audio con un espectro de la señal (r2') de ruido, y

- filtrar la señal (r2') de ruido según dicha respuesta de frecuencia.

3. Procedimiento según la reivindicación 1, en el que dicha etapa de generar la segunda señal (x2') de audio comprende:

- generar una primera señal (r1) residual aplanando espectralmente la primera señal (x1') de audio dependiendo de los datos espectrales en los parámetros (b2) de transformación,

- generar una segunda señal (r2) residual conformando temporalmente una secuencia de ruido dependiendo de los datos temporales en los parámetros (b2) de transformación,

- derivar una respuesta de frecuencia comparando un espectro de la primera señal (r1) residual con un espectro de la segunda señal (r2) residual, y

- filtrar la señal (r2') de ruido según dicha respuesta de frecuencia.

4. Procedimiento según la reivindicación 1, en el que dicha etapa de generar la segunda señal (x2') de audio comprende:

- generar una primera señal (r1) residual aplanando espectralmente la primera señal (x1') de audio dependiendo de los datos espectrales en los parámetros (b2) de transformación,

- generar una segunda señal (r2) residual conformando temporalmente una secuencia de ruido dependiendo de los datos temporales en los parámetros (b2) de transformación,

- sumar la primera señal (r1) residual y la segunda señal (r2) residual dando lugar a una señal (sk) suma,

- derivar una respuesta de frecuencia para aplanar espectralmente la señal (sk) suma,

- actualizar la segunda señal (r2) residual filtrando la segunda señal (r2) residual según dicha respuesta de frecuencia,

- repetir dicha etapas de sumar, derivar y actualizar hasta que un espectro de la señal (sk) suma sea sustancialmente plano, y

- filtrar la señal (r2') de ruido según todas las respuestas de frecuencia derivadas.

5. Dispositivo (107) para decodificar una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento (201) de codificación predefinido, comprendiendo el dispositivo:

- un primer decodificador (203) para decodificar dicha señal (b1) de código en una primera señal (x1') de audio usando un procedimiento de decodificación correspondiente a dicho procedimiento (201) de codificación predefinido,

- un segundo decodificador (209) para generar a partir de dichos parámetros (b2) de transformación una señal (r2') de ruido que tiene características espectro-temporales sustancialmente similares a dicha señal de audio,

y caracterizado por que comprende además: - primeros medios (305,307) de procesamiento para generar una segunda señal (x2') de audio eliminando de la señal (r2') de ruido partes espectro-temporales de la señal de audio que ya están contenidas en la primera señal (x1') de audio, determinándose las partes espectro-temporales mediante una comparación de la primera señal (x1') de audio y las características de la señal (r2') de ruido, y

- medios (211) de suma para generar la señal (x') de audio sumando la primera señal (x1') de audio y la 10 segunda señal (x2') de audio.


 

Patentes similares o relacionadas:

APARATO Y MÉTODO PARA CALCULAR DATOS DE AMPLIACIÓN DE ANCHO DE BANDA UTILIZANDO UN ENCUADRE CONTROLADO POR PENDIENTE ESPECTRAL, del 13 de Enero de 2012, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda […]

Imagen de 'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA…'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA UNA SEÑAL DE VOZ, del 7 de Junio de 2010, de QUALCOMM INCORPORATED: Un aparato, que comprende: un banco (A110) de filtros, que contiene A) una trayectoria de procesamiento de banda baja configurada para recibir una señal de voz de banda […]

Imagen de 'METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION…'METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION DE BANDA ESPECTRAL E INTERPOLACION DE FACTORES DE ESCALA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por […]

Imagen de 'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA…'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA SEÑAL RECONSTRUIDA DE ALTA FRECUENCIA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación […]

Imagen de 'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA…'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA DEL ANCHO DE BANDA, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para expandir las señales de voz de banda estrecha a señales de voz de banda ancha, comprendiendo el procedimiento: determinar la información del tipo […]

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .