Codificador de audio con estimación de ruido de fondo durante fases activas.

Un codificador de audio que comprende

un estimador de ruido de fondo (12) configurado para actualizar continuamente una estimación de ruido de fondo paramétrica durante una fase inactiva

(24) basado en una señal de audio de entrada;

un codificador (14) para codificar la señal de audio de entrada en una secuencia de datos durante la fase activa; y

un detector (16) configurado para detectar la entrada de una fase inactiva (28) a continuación de la fase activa (24) basado en la señal de audio de entrada,

en donde el codificador de audio está configurado para, al detectar la entrada de la fase inactiva, codificar en la secuencia de datos la estimación de ruido de fondo paramétrica como es actualizada continuamente durante la fase activa a la cual sucede la fase inactiva detectada.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2012/052462.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: WILDE,STEPHAN, SCHMIDT,KONSTANTIN, SETIAWAN,PANJI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/012 (Codificación del ruido de confort o el silencio)

PDF original: ES-2535609_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Codificador de audio con estimación de ruido de fondo durante fases activas [0001] La presente invención concierne a un codificador de audio que soporta síntesis de ruido durante fases inactivas.

En la técnica se conoce la posibilidad de reducir el ancho de banda de transmisión aprovechando los períodos inactivos de voz o de otras fuentes de ruido. Tales esquemas generalmente usan alguna forma de detección para distinguir entre fases inactivas (de silencio) y activas (de no silencio) . Durante fases inactivas, se logra una menor frecuencia de bits parando la transmisión de la secuencia de datos ordinaria codificando precisamente la señal grabada, y enviando en cambio sólo actualizaciones de descripción de inserción de silencio (SID) . Las actualizaciones de SID pueden ser transmitidas a intervalos regulares o cuando se detectan cambios en las características del ruido de fondo. Entonces se pueden usar los cuadros de SID en el lado de decodificación para generar un ruido de fondo con características similares al ruido de fondo durante las fases activas de modo que el freno de la transmisión de la secuencia de datos ordinaria que codifica la señal grabada no conduce a una transición desagradable desde la fase activa a la fase inactiva en el lado del receptor, ver por ejemplo US 5 960 389 A.

Sin embargo, todavía hay una necesidad de reducir más el ritmo de transmisión. Un creciente número de consumidores de cantidad de bits transmitidos (bitrate) , tal como un creciente número de teléfonos móviles, y un creciente número de aplicaciones que hacen uso más o menos intensivo en cuando a cantidad de bits transmitidos, requieren una permanente reducción de la cantidad de bits transmitidos consumidos.

Por el otro lado, el ruido sintetizado debe emular estrechamente el ruido real de modo que la síntesis sea transparente para los usuarios.

Consiguientemente, es un objetivo de la presente invención proveer un codificador de audio que soporta generación de ruido durante fases inactivas, el cual permite reducir la cantidad de bits transmitidos de transmisión mientras se mantiene la calidad de generación alcanzable.

Este objetivo se alcanza mediante la materia de las reivindicaciones independientes.

La idea básica de la presente invención es que se puede ahorrar valiosa cantidad de bits transmitidos manteniendo la calidad de generación de ruido dentro de las fases inactivas, si se actualiza continuamente una estimación de ruido de fondo paramétrico durante una fase activa de modo que la generación de ruido puede ser iniciada inmediatamente luego de la entrada de la fase inactiva que sigue a la fase activa. Por ejemplo, la actualización continua puede ser realizada en el lado de decodificación, y no hay necesidad de proveer en forma preliminar el lado de decodificación, con una representación codificada del ruido de fondo durante una fase de calentamiento inmediatamente a continuación de la detección de la fase inactiva cuya provisión consumiría valiosa cantidad de bits transmitidos, ya que el lado de decodificación tiene la estimación de ruido de fondo paramétrica continuamente actualizada durante la fase activa y por ende, está preparada en todo momento para entrar inmediatamente a la fase activa con una generación de ruido apropiada. De manera similar se puede evitar una fase de calentamiento así si la estimación de ruido de fondo paramétrica se hace en el lado de codificación. En lugar de continuar en forma preliminar con proveer al lado de decodificación una representación convencionalmente codificada del ruido de fondo al detectar la entrada de la fase inactiva para aprender el ruido de fondo e informar consiguientemente al lado de decodificación después de la fase de aprendizaje, el codificador puede proveer al decodificador la necesaria estimación de ruido de fondo paramétrica inmediatamente al detectar la entrada de la fase inactiva recurriendo a la estimación de ruido ambiente paramétrica continuamente actualizada durante la fase activa parada, evitando de ese modo la prosecución adicional preliminar que consume cantidad de bits transmitidos de la muy trabajosa codificación del ruido de fondo.

De acuerdo con realizaciones específicas de la presente invención, se alcanza una generación de ruido más realista con moderado factor que rebaja el rendimiento en términos de, por ejemplo, cantidad de bits transmitidos y complejidad computacional. En particular, de acuerdo con estas realizaciones, se usa el dominio espectral para parametrizar el ruido de fondo produciendo de ese modo una síntesis de ruido de fondo que es más realista y por ende conduce a una más transparente conmutación de fase activa a inactiva. Asimismo, se ha descubierto que parametrizar el ruido de fondo en el dominio espectral permite separar ruido de la señal útil y por consiguiente, parametrizar el ruido de fondo en el dominio espectral tiene ventaja cuando se combina con la actualización continua mencionada antes de la estimación de ruido de fondo paramétrica durante las fases activas ya que se puede lograr una mejor separación entre ruido y señal útil en el dominio espectral de modo que no es necesaria transición adicional desde un dominio a otro cuando se combinan ambos aspectos ventajosos de la presente solicitud.

Otros detalles ventajosos de realizaciones de la presente invención son tema de las reivindicaciones dependientes.

[00010] Abajo se describen realizaciones preferidas de la presente solicitud con respecto a las Figuras entre las cuales:

la Figura 1 muestra un diagrama de bloques de un codificador de audio, de acuerdo con una realización;

la Figura 2 muestra una implementación posible del motor de codificación 14;

la Figura 3 muestra un diagrama de bloques de un decodificador de audio;

la Figura 4 muestra una posible implementación del motor de decodificación de la Figura 3;

la Figura 5 muestra un diagrama de bloques de un codificador de audio de acuerdo con otra descripción más detallada de la realización;

la Figura 6 muestra un diagrama de bloques de un decodificador que podría ser usado en conexión con el codificador de la Figura 5;

la Figura 7 muestra un diagrama de bloques de un decodificador de audio de acuerdo con otra descripción más detallada;

la Figura 8 muestra un diagrama de bloques de una parte de extensión de ancho de banda espectral de un codificador de audio de acuerdo con una realización;

la Figura 9 muestra una implementación del codificador de extensión de ancho de banda espectral CNG de la Figura 8 de acuerdo con una realización;

la Figura 10 muestra un diagrama de bloques de un decodificador de audio de acuerdo con un ejemplo que usa extensión de ancho de banda espectral;

la Figura 11 muestra un diagrama de bloques de una posible descripción más detallada de un decodificador de audio que usa replicación de ancho espectral;

la Figura 12 muestra un diagrama de bloques de un codificador de audio de acuerdo con otra realización que usa extensión de ancho de banda espectral; y la Figura 13 muestra un diagrama de bloque de otro decodificador de audio.

[00011] La Figura 1 ilustra un codificador de audio 100 de acuerdo con una realización de la presente invención. El codificador de audio de la Figura 1 comprende un estimador de ruido de fondo 12, un motor de codificación 14, un detector 16, una entrada de señal de audio 18 y una salida de secuencia de datos 20. El proveedor 12, el motor de codificación 14 y el detector 16 tienen una entrada conectada a la entrada de señal de audio 18, respectivamente. Las salidas del estimador 12 y del motor de codificación 14 están respectivamente conectadas a la salida de secuencia de datos 20 a través de un... [Seguir leyendo]

 


Reivindicaciones:

1. Un codificador de audio que comprende un estimador de ruido de fondo (12) configurado para actualizar continuamente una estimación de ruido de 5 fondo paramétrica durante una fase inactiva (24) basado en una señal de audio de entrada; un codificador (14) para codificar la señal de audio de entrada en una secuencia de datos durante la fase activa; y un detector (16) configurado para detectar la entrada de una fase inactiva (28) a continuación de la fase activa (24) basado en la señal de audio de entrada, en donde el codificador de audio está configurado para, al detectar la entrada de la fase inactiva, codificar en la secuencia de datos la estimación de ruido de fondo paramétrica como es actualizada continuamente durante la fase activa a la cual sucede la fase inactiva detectada.

2. Un codificador de audio de acuerdo con la reivindicación 1, en donde el estimador de ruido de fondo (12)

está configurado para, al actualizar continuamente la estimación de ruido de fondo paramétrica, distinguir entre un componente de ruido y un componente de señal útil dentro de la señal de audio de entrada y determinar la estimación de ruido de fondo paramétrica meramente del componente de ruido.

3. Un codificador de audio de acuerdo con una cualquiera de las reivindicaciones 1 o 2, en donde el decodificador (14) está configurado para, al codificar la señal de audio de entrada, codificar predictivamente la señal de audio de entrada en coeficientes de predicción lineal y un señal de excitación, y codificar por transformada la señal de excitación y codificar los coeficientes de predicción lineal en la secuencia de datos (30) .

4. Un codificador de audio de acuerdo con la reivindicación 3, en donde el estimador de ruido de fondo (12)

está configurado para actualizar la estimación de ruido de fondo paramétrica usando la señal de excitación durante la fase activa.

5. Un codificador de audio de acuerdo con una de las reivindicaciones 3 o 4, en donde el estimador de ruido de fondo está configurado para, al actualizar la estimación de ruido de fondo paramétrica, identificar mínimos locales en la señal de excitación y para realizar análisis estadístico de la señal de excitación en los mínimos locales con el fin de derivar la estimación de ruido de fondo paramétrica.

6. Un codificador de audio de acuerdo con una cualquiera de las reivindicaciones previas, en donde el codificador está configurado para, al codificar la señal de entrada, usar codificación predictiva y/o por transformación para codificar una porción de frecuencia más baja de la señal de audio de entrada, y para usar codificación paramétrica para codificar una envolvente espectral de una porción de más alta frecuencia de la señal de audio de entrada.

7. Un codificador de audio de acuerdo con una cualquiera de las reivindicaciones previas, en donde el codificador está configurado para, al codificar la señal de entrada, usar codificación predictiva y/o por transformación para codificar una porción de frecuencia más baja de la señal de audio de entrada, y para elegir entre usar codificación paramétrica para codificar una envolvente espectral de una porción de más alta frecuencia de la señal de audio de entrada o dejar sin codificar la porción de frecuencia más alta de la señal de audio de entrada.

8. Un codificador de audio de acuerdo con una de las reivindicaciones 6 o 7, en donde el codificador está configurado para interrumpir la codificación predictiva y/o por transformación y la codificación paramétrica en fases inactivas o para interrumpir la codificación predictiva y/o por transformación y realizar la codificación paramétrica de la envolvente espectral de la porción de frecuencia más alta de la señal de audio de entrada en una resolución de tiempo/frecuencia más baja comparada con el uso de codificación paramétrica en la fase activa.

9. Un codificador de audio de acuerdo con una de las reivindicaciones 6, 7 u 8, en donde el codificador usa un banco de filtros para descomponer espectralmente la señal de audio de entrada en un conjunto de sub-bandas que forman la porción de frecuencia más baja, y un conjunto de sub-bandas que forman la porción de frecuencia más alta.

10. Un codificador de audio de acuerdo con la reivindicación 9, en donde el estimador de ruido de fondo está configurado para actualizar la estimación de ruido de fondo paramétrica en la fase activa basado en las porciones de frecuencia más baja y más alta de la señal de audio de entrada.

11. Un codificador de audio de acuerdo con la reivindicación 10, en donde el estimador de ruido de fondo está configurado para, al actualizar la estimación de ruido de fondo paramétrica, identificar mínimos locales en las porciones de frecuencia más baja y más alta de la señal de audio de entrada y para realizar análisis estadístico de las porciones de frecuencia más baja y más alta de la señal de audio de entrada en los mínimos locales con el fin de derivar la estimación de ruido de fondo paramétrica.

12. Un codificador de audio de acuerdo con una cualquiera de las reivindicaciones precedentes, en donde el estimador de ruido está configurado para continuar actualizando continuamente la estimación de ruido de fondo incluso durante la fase inactiva, en donde el codificador de audio están configurado para codificar intermitentemente actualizaciones de la estimación de ruido de fondo paramétrica conforme es continuamente actualizada durante la fase inactiva.

13. Un codificador de audio de acuerdo con la reivindicación 12, en donde el codificador de audio está configurado para codificar intermitentemente las actualizaciones de la estimación de ruido de fondo paramétrica en un intervalo de tiempo fijo o variable.

14. Un método de codificación de audio que comprende actualizar continuamente una estimación de ruido de fondo paramétrica durante una fase activa (24) basado en una señal de audio de entrada; codificar la señal de audio de entrada en una secuencia de datos durante la fase activa; 15 detectar la entrada de una fase inactiva (28) a continuación de la fase activa (24) basándose en la señal de audio de entrada; y al detectar la entrada de la fase inactiva, codificar en la secuencia de datos la estimación de ruido de fondo paramétrica como es actualizada continuamente durante la fase activa a la cual sucede la fase inactiva detectada.

15. Un programa de ordenador que tiene un código de programa adaptado para implementar, cuando se ejecuta en un ordenador, un método de acuerdo con la reivindicación 14.