METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION DE BANDA ESPECTRAL E INTERPOLACION DE FACTORES DE ESCALA.

Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación de fuente de una señal original,

teniendo la señal original una parte de banda baja y una parte de banda alta, incluyendo la señal codificada la parte de banda baja de la señal original y no incluyendo la parte de banda alta de la señal original, en el que la señal decodificada se usa para reconstrucción de alta frecuencia para obtener una señal reconstruida de alta frecuencia que incluye una parte de banda alta reconstruida de la señal original, que comprende:

un interpolador (907) para interpolar datos de envolvente espectral, incluyendo los datos de envolvente espectral un factor de escala para un grupo de canales de banco de filtros, teniendo el grupo una pluralidad de canales de banco de filtros, para obtener un factor de escala interpolado para cada canal de banco de filtros en el grupo de canales de banco de filtros;

un transposicionador (905) para generar la señal reconstruida de alta frecuencia usando la señal decodificada;

un analizador (908) para analizar la señal reconstruida de alta frecuencia para obtener un factor de escala para cada canal de banco de filtros en el grupo de canales de banco de filtros;

un calculador de factor de amplificación para calcular un factor de amplificación para cada canal de banco de filtros en el grupo usando los factores de escala y los factores de escala interpolados; y

un ajustador para ajustar una envolvente espectral de la señal reconstruida de alta frecuencia usando los factores de amplificación para los canales en el grupo

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08000694.

Solicitante: CODING TECHNOLOGIES AB.

Nacionalidad solicitante: Suecia.

Dirección: GAVLEGATAN 12 A,113 30 STOCKHOLM.

Inventor/es: EKSTRAND, PER, LILJERYD, LARS, HENN, FREDRIK, KJOERLING,KRISTOFER.

Fecha de Publicación: .

Fecha Solicitud PCT: 26 de Enero de 2000.

Fecha Concesión Europea: 18 de Noviembre de 2009.

Clasificación Internacional de Patentes:

  • G10L21/02A4E

Clasificación PCT:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Finlandia, Chipre.

METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION DE BANDA ESPECTRAL E INTERPOLACION DE FACTORES DE ESCALA.

Fragmento de la descripción:

Método y aparato para decodificar una señal usando replicación de banda espectral e interpolación de factores de escala.

Campo técnico

La presente invención se refiere a sistemas de codificación de fuente que utilizan reconstrucción de alta frecuencia (HFR), tal como replicación de banda espectral, SBR [WO 98/57436] o métodos relacionados. Mejora el rendimiento tanto de métodos de alta calidad (SBR), como de métodos de copiado de baja calidad [patente estadounidense 5.127.054]. Es aplicable a sistemas tanto de codificación de habla como de codificación de audio natural. Además, la invención puede usarse de manera beneficiosa con códecs de audio natural con o sin reconstrucción de alta frecuencia, para reducir el efecto audible de bandas de frecuencia cortadas que se producen habitualmente en condiciones de baja tasa de bits, aplicando adición de piso de ruido adaptativo.

Antecedentes de la invención

La presencia de componentes de señal estocástica es una propiedad importante de muchos instrumentos musicales, así como de la voz humana. La reproducción de estas componentes de ruido, que habitualmente se mezclan con otras componentes de señal, es crucial si la señal debe percibirse como sonido natural. En la reconstrucción de alta frecuencia es imperativo, en determinadas condiciones, añadir ruido a la banda alta reconstruida con el fin de conseguir contenido de ruido similar al original. Esta necesidad se origina del hecho de que la mayor parte de sonidos armónicos, por ejemplo de instrumentos de lengüeta o arco, tienen un nivel de ruido relativamente superior en la región de alta frecuencia en comparación con la región de baja frecuencia. Además, los sonidos armónicos en ocasiones se producen junto con un ruido de alta frecuencia dando como resultado una señal sin similitud entre niveles de ruido de la banda alta y la banda baja. En cualquier caso, una transposición de frecuencia, es decir SBR de alta calidad, así como cualquier proceso de copiado de baja calidad, padecerá en ocasiones una falta de ruido en la banda alta replicada. Es más, un proceso de reconstrucción de alta frecuencia normalmente comprende algún tipo de ajuste de envolvente, en el que es deseable evitar sustitución de ruido no deseado para armónicos. Por tanto, es esencial poder añadir y controlar niveles de ruido en la regeneración de alta frecuencia en el decodificador.

En condiciones de baja tasa de bits, los códecs de audio natural normalmente presentan graves cortes de bandas de frecuencia. Esto se realiza por tramas dando como resultado huecos espectrales que pueden aparecer de manera arbitraria por todo el intervalo de frecuencias codificado. Esto puede provocar artefactos audibles. El efecto de esto puede paliarse mediante adición de piso de ruido adaptativo.

Algunos sistemas de codificación de audio de la técnica anterior incluyen medios para recrear componentes de ruido en el decodificador. Esto permite al codificador omitir componentes de ruido en el proceso de codificación, haciéndolo así más eficaz. Sin embargo, para que tales métodos tengan éxito, el ruido excluido en el proceso de codificación por el codificador no debe contener otras componentes de señal. Este esquema de codificación de ruido basado en decisión rígida da como resultado un ciclo de trabajo relativamente bajo, ya que la mayor parte de componentes normalmente están mezcladas, en tiempo y/o en frecuencia, con otras componentes de señal. Además, no soluciona en absoluto el problema de contenido de ruido insuficiente en bandas de alta frecuencia reconstruidas.

Sumario de la invención

La presente invención trata el problema de contenido de ruido insuficiente en una banda alta regenerada y huecos espectrales debido a bandas de frecuencia cortadas en condiciones de baja tasa de bits, añadiendo de manera adaptativa un piso de ruido. También evita la sustitución de ruido no deseada para armónicos.

La invención se define mediante un método según la reivindicación 4 y un aparato según la reivindicación 1.

Breve descripción de los dibujos

La presente invención se describirá a continuación a modo de ejemplos ilustrativos, que no limitan el alcance o espíritu de la invención, con referencia a los dibujos adjuntos, en los que:

la figura 1 ilustra el seguidor de picos máximos y mínimos aplicado a un espectro de resolución alta y media, y la correlación del piso de ruido con bandas de frecuencia, según la presente invención;

la figura 2 ilustra el piso de ruido con suavizado en tiempo y frecuencia, según la presente invención;

la figura 3 ilustra el espectro de una señal de entrada original;

la figura 4 ilustra el espectro de la señal de salida de un proceso SBR sin adición de piso de ruido adaptativo;

la figura 5 ilustra el espectro de la señal de salida con SBR y adición de piso de ruido adaptativo, según la presente invención;

la figura 6 ilustra los factores de amplificación para el banco de filtros de ajuste de envolvente espectral, según la presente invención;

la figura 7 ilustra el suavizado de factores de amplificación en el banco de filtros de ajuste de envolvente espectral, según la presente invención;

la figura 8 ilustra una posible implementación de la presente invención, en un sistema de codificación de fuente en el lado del codificador;

la figura 9 ilustra una posible implementación de la presente invención, en un sistema de codificación de fuente en el lado del decodificador;

Descripción de realizaciones preferidas

Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención para mejorar sistemas de reconstrucción de alta frecuencia. Se entiende que serán evidentes para otros expertos en la técnica modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento. Por tanto, sólo pretende quedar limitada por el alcance de las reivindicaciones de patente adjuntas y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones del presente documento.

Estimación de nivel de piso de ruido

Al analizar un espectro de señal de audio con suficiente resolución de frecuencia, los formantes, sinusoides sencillas, etc. son claramente visibles, esto se denomina en lo sucesivo como envolvente espectral estructurada fina. Sin embargo, si se usa una baja resolución, no pueden observarse detalles precisos, esto se denomina en lo sucesivo como la envolvente espectral estructurada basta. No obstante, el nivel del piso de ruido, que no es necesariamente ruido por definición, según se usa a lo largo de la presente invención, se refiere a la relación entre una envolvente espectral estructurada basta interpolada a lo largo de los puntos mínimos locales en el espectro de alta resolución, y una envolvente espectral estructurada basta interpolada a lo largo de los puntos máximos locales en el espectro de alta resolución. Esta medición se obtiene calculando una FFT de alta resolución para el segmento de señal, y aplicando un seguidor de picos máximos y mínimos, figura 1. El nivel de piso de ruido se calcula entonces como la diferencia entre el seguidor de picos máximos y mínimos. Con un suavizado apropiado de esta señal en tiempo y frecuencia, se obtiene una medición de nivel de piso de ruido. La función de seguidor de picos máximos y la función de seguidor de picos mínimos pueden describirse según la ecuación 1 y 2.


donde T es el factor de disminución, y X(k) es el valor absoluto logarítmico del espectro en la línea k. La pareja se calcula para dos tamaños de FFT diferentes, una alta resolución y una resolución media, con el fin de obtener una buena estimación durante vibratos y sonidos casi estacionarios. Los seguidores de picos máximos y mínimos aplicados a la FFT de alta resolución se filtran paso bajo con el fin de descartar valores extremos. Una vez obtenidas las dos estimaciones de piso de ruido, se elige la mayor. En una implementación de la presente invención, los valores de nivel de piso de ruido se correlacionan con múltiples bandas de frecuencia, aunque también podrían usarse otras correlaciones, por ejemplo polinomios de ajuste de curva o coeficientes LPC. Ha de señalarse que podrían usarse varios enfoques diferentes al determinar el contenido de ruido en una señal de audio. Sin embargo, como se ha...

 


Reivindicaciones:

1. Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación de fuente de una señal original, teniendo la señal original una parte de banda baja y una parte de banda alta, incluyendo la señal codificada la parte de banda baja de la señal original y no incluyendo la parte de banda alta de la señal original, en el que la señal decodificada se usa para reconstrucción de alta frecuencia para obtener una señal reconstruida de alta frecuencia que incluye una parte de banda alta reconstruida de la señal original, que comprende:

un interpolador (907) para interpolar datos de envolvente espectral, incluyendo los datos de envolvente espectral un factor de escala para un grupo de canales de banco de filtros, teniendo el grupo una pluralidad de canales de banco de filtros, para obtener un factor de escala interpolado para cada canal de banco de filtros en el grupo de canales de banco de filtros;
    un transposicionador (905) para generar la señal reconstruida de alta frecuencia usando la señal decodificada;
      un analizador (908) para analizar la señal reconstruida de alta frecuencia para obtener un factor de escala para cada canal de banco de filtros en el grupo de canales de banco de filtros;
        un calculador de factor de amplificación para calcular un factor de amplificación para cada canal de banco de filtros en el grupo usando los factores de escala y los factores de escala interpolados; y
          un ajustador para ajustar una envolvente espectral de la señal reconstruida de alta frecuencia usando los factores de amplificación para los canales en el grupo.

            2. Aparato según la reivindicación 1, en el que el interpolador (907) es operativo para asignar el factor de escala para un grupo de canales a cada canal en el grupo.

            3. Aparato según la reivindicación 1 ó 2, en el que el ajustador es operativo para limitar o suavizar factores de amplificación calculados.

            4. Método para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación de fuente de una señal original, teniendo la señal original una parte de banda baja y una parte de banda alta, incluyendo la señal codificada la parte de banda baja de la señal original y no incluyendo la parte de banda alta de la señal original, en el que la señal decodificada se usa para reconstrucción de alta frecuencia para obtener una señal reconstruida de alta frecuencia que incluye una parte de banda alta reconstruida de la señal original, que comprende:

            interpolar (907) datos de envolvente espectral, incluyendo los datos de envolvente espectral un factor de escala para un grupo de canales de banco de filtros, teniendo el grupo una pluralidad de canales de banco de filtros, para obtener un factor de escala interpolado para cada canal de banco de filtros en el grupo de canales de banco de filtros;
              generar (905) la señal reconstruida de alta frecuencia usando la señal decodificada;
                analizar (908) la señal reconstruida de alta frecuencia para obtener un factor de escala para cada canal de banco de filtros en el grupo de canales de banco de filtros;
                  calcular un factor de amplificación para cada canal de banco de filtros en el grupo usando los factores de escala y los factores de escala interpolados; y
                    ajustar una envolvente espectral de la señal reconstruida de alta frecuencia usando los factores de amplificación para los canales en el grupo.

                       

                      Patentes similares o relacionadas:

                      APARATO Y MÉTODO PARA CALCULAR DATOS DE AMPLIACIÓN DE ANCHO DE BANDA UTILIZANDO UN ENCUADRE CONTROLADO POR PENDIENTE ESPECTRAL, del 13 de Enero de 2012, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda […]

                      Imagen de 'MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN…'MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN DE RUIDO, del 14 de Marzo de 2011, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento de decodificación de una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento […]

                      Imagen de 'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA…'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA UNA SEÑAL DE VOZ, del 7 de Junio de 2010, de QUALCOMM INCORPORATED: Un aparato, que comprende: un banco (A110) de filtros, que contiene A) una trayectoria de procesamiento de banda baja configurada para recibir una señal de voz de banda […]

                      Imagen de 'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA…'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA SEÑAL RECONSTRUIDA DE ALTA FRECUENCIA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación […]

                      Imagen de 'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA…'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA DEL ANCHO DE BANDA, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para expandir las señales de voz de banda estrecha a señales de voz de banda ancha, comprendiendo el procedimiento: determinar la información del tipo […]

                      SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

                      Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

                      Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

                      Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .