Aparato y procedimiento para generar una señal de ancho de banda ampliado.

Un aparato (100; 300; 400; 700; 800; 900) para generar una señal de ancho de banda ampliado

(122) desde una señal de entrada (102), donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el aparato:

un generador de parches (110) configurado para generar un primer parche (112) desde la primera banda de la señal de entrada (102) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche (114) desde la primera banda de la señal de entrada (102) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche (114) generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche (112) generado de acuerdo con el primer algoritmo de implementación de parches; y

un combinador (120) configurado para combinar el primer parche (112), el segundo parche (114) y la primera banda de la señal de entrada (102) para obtener la señal ampliada del ancho de banda (122), donde el aparato para generar una señal de ancho de banda ampliado está configurado para

ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el primer parche (112) y el segundo parche (114) o para escalar el primer parche (112) y el segundo parche (114), o

para escalar solamente uno de los parches primero o segundo para obtener un parche escalado, para combinar entonces, por el combinador (120) el parche escalado y el parche no escalado de los parches primero y segundo para obtener parches combinados, y para entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada,

para que la señal de ancho de banda ampliado (122) cumpla con un criterio de envolvente espectral.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/004603.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: KRAMER, ULRICH, GAYER,MARC, RETTELBACH,NIKOLAUS, DISCH,SASCHA, LOHWASSER,MARKUS, NEUENDORF,Max, NAGEL,Frederik, BAYER,Stefan.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/038 (utilizando técnicas de extensión de banda)

PDF original: ES-2461141_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Aparato y procedimiento para generar una señal de ancho de banda ampliado [0001] Las formas de realización de acuerdo con la invención se relacionan con el procesamiento de señales de audio y, en particular con un aparato y un procedimiento para generar una señal de ancho de banda ampliado desde una señal de entrada, un aparato y un procedimiento para proveer una señal reducida de ancho de banda basada en una señal de entrada y una señal de audio.

La codificación de señales codificadas perceptivamente adaptadas, que proveen una reducción substancial de tasa de datos para un eficiente almacenamiento y transmisión de estas señales, ha ganado una gran aceptación en muchos campos. Se conocen muchos algoritmos de codificación, por ejemplo, MPEG ½ Capa 3 (“MP3”) o MPEG 4 AAC (Codificación de Audio Avanzada) . Sin embargo, la codificación utilizada para esto, en particular cuando operan en tasas de bits muy bajas, puede conducir a una reducción subjetiva de la calidad de audio causada a menudo por una limitación inducida del lado del codificador del ancho de banda de la señal de audio a transmitir.

WO 98 57436 somete la señal de audio a una limitación de banda en dicha situación del lado del codificador y codifica sólo una banda inferior de la señal de audio por medio de un codificador de audio de alta calidad

(“codificador de núcleo”) . La banda superior, sin embargo, es caracterizada en forma basta, es decir, por medio de un grupo de parámetros que reproduce la envolvente espectral de la banda superior. Del lado del decodificador, la banda superior es luego sintetizada. Para este fin, se propone una transposición de armónicos donde la banda inferior de la señal de audio decodificada es suministrada a un banco de filtro. Los canales del banco de filtro de la banda inferior se conectan a los canales del banco de filtro de la banda superior, o son “sujetos a parches”, y cada señal de paso de banda sujeta a un parche es sometida a un ajuste de envolvente. El banco de filtro de síntesis que pertenece a un banco de filtro de análisis especial recibe señales de paso de banda de la banda inferior que están sujetas a parches en forma armónica en la banda superior. La señal de salida del banco de filtro de síntesis es una señal de audio que se extiende con respecto a su ancho de banda original transmitida desde el lado del codificador hacia el lado del decodificador por el codificador de núcleo que opera a una tasa de datos muy baja. En particular, los cálculos del banco de filtro y la implementación de parches (patching) en el dominio del banco de filtro pueden requerir de un gran esfuerzo informático.

Los procedimientos que minimizan la complejidad de la ampliación del ancho de banda de las señales de audio con banda limitada utilizan en cambio una función de copia de las porciones de señal de baja frecuencia (BF) en el rango de frecuencia alta (FA) con el fin de aproximar la información ausente debido a la limitación de banda. Dichos procedimientos se describen en M. Dietz, L. Liljer y d, K. Kjörling y O. Kunz, “Replicación de Banda Espectral”, un nuevo enfoque en la codificación de audio”, en la 112º Convención AES de Munich, Mayo de 2002; S. Meltzer, R. Böhm y F. Henn, “Codificadores de audio SBR ampliados para la difusión digital como “Mundial de Radio Digital”

(DRM, por su sigla en inglés) , 112º Convención AES de Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M.

Lutzky, “Ampliación de mp3 con SBR: Rasgos y Capacidades del nuevo algoritmo mp3PRO”, en 112º Convención AES de Munich, Mayo de 2002; Norma Internacional ISO/IEC 1449-3:2001/FPDAM 1, “Ampliación de Ancho de Banda”, ISO/IEC 2002, o “Procedimiento y aparato de ampliación de ancho de banda de voz”, Vau Iyengar et al.

Patente de EEUU Nº 5.455.888.

En estos procedimientos, no se realiza una transposición de armónicos, pero se introducen señales de paso de banda sucesivas desde la banda inferior en sucesivos canales del banco de filtro de la banda superior. Por medio de este procedimiento, se logra una aproximación basta de la banda superior de la señal de audio. En otro paso, esta aproximación basta de la señal es luego asimilada con respecto a la original mediante un post procesamiento utilizando información de control obtenida de la señal original. En este caso, por ejemplo, los factores de ajuste a escala sirven para adaptar la envolvente espectral, un filtrado inverso, y el agregado de un piso de ruido para adaptar la tonalidad y una suplementación de las pociones de señal sinusoidal para armónicos ausentes, como se describe también en la norma de Codificación de Audio Avanzada de Alta Eficiencia MPEG-4 (HE-AAC, por su sigla en inglés) .

Por otro lado, otros procedimientos utilizan un codificador de fase operado por voz para la ampliación de ancho de banda. Al aplicar el codificador de fase operado por voz para la expansión espectral, las líneas de frecuencia se alejan entre sí. Si existe un espacio en el espectro, por ejemplo, por cuantización, el mismo se incrementa por la expansión. En una adaptación, de energía, las líneas que permanecen en el espectro reciben demasiada energía en comparación con las líneas respectivas en la señal original.

La Fig. 13 muestra una ilustración esquemática de una ampliación de banda 1300 que utiliza un codificador de fase operado por voz. En este ejemplo, se agregan dos parches (patches) 1312, 1314 a una banda de baja frecuencia 1302 de una señal. La frecuencia de corte superior 1320 de la señal, también llamada frecuencia X (frecuencia de cruce) es la frecuencia del extremo inferior del parche vecino 1312 y el doble de la frecuencia de cruce es la frecuencia de corte superior del parche vecino 1312 y la frecuencia de corte inferior del próximo parche 1314. El codificador de fase operado por voz duplica la frecuencia de las líneas de frecuencia de la banda de frecuencia baja 1302 de la señal para obtener el parche vecino 1312 y triplica las frecuencias de las líneas de frecuencia de la banda de frecuencia baja 1302 de la señal para obtener el próximo parche 1314. Por lo tanto, la densidad espectral del parche vecino 1312 es sólo la mitad de la densidad espectral de la banda de frecuencia baja 1302 de la señal y la densidad espectral del próximo parche 1314 es sólo un tercio de la densidad espectral de la banda de frecuencia baja 1302 de la señal.

Mediante la concentración de la energía en bandas (parches) en sólo pocas líneas de frecuencia, se produce un cambio substancial en el timbre el cual difiere del original. La energía de más bandas anteriores (líneas de frecuencia) se suma a las pocas que restan.

Algunos ejemplos, para los codificadores de fase operados por voz y sus aplicaciones se presentan en “Frederik Nagel y Sascha Disch, Un procedimiento de armónicos para la ampliación de ancho de banda para codificadores de audio”, ICASSP´09 y “M. Puckette. Codificador de fase-bloqueada operado por voz. IEEE ASSP Conferencia sobre Aplicaciones del Procesamiento de Señal a Audio y Acústica, Mohonk 1995”. Röbel, A: Detección y preservación transitoria en el codificador de fase operado por voz; citesee, ist.psu.edu/679246, HTML”, “Laroche L., Dolson M, : Modificación de audio mejorada en ajuste a escala de tiempo del codificador de fase operado por voz “, IEEE Procesamiento de Audio y Voz Trans., Vol 7, Nº 3, pp. 323-332” y Patente de EEUU 6549884.

Un procedimiento para llenar los espacios se muestra en WO 00/45379. La misma contiene un procedimiento y un aparato para la ampliación de sistemas de codificación de fuente que utilizan la reconstrucción... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato (100; 300; 400; 700; 800; 900) para generar una señal de ancho de banda ampliado (122) desde una señal de entrada (102) , donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el aparato:

un generador de parches (110) configurado para generar un primer parche (112) desde la primera banda de la señal de entrada (102) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche (114) desde la primera banda de la señal de entrada (102) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche (114) generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche (112) generado de acuerdo con el primer algoritmo de implementación de parches; y

un combinador (120) configurado para combinar el primer parche (112) , el segundo parche (114) y la primera banda de la señal de entrada (102) para obtener la señal ampliada del ancho de banda (122) , donde el aparato para generar una señal de ancho de banda ampliado está configurado para ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el primer parche (112) y el segundo parche (114) o para escalar el primer parche (112) y el segundo parche (114) , o para escalar solamente uno de los parches primero o segundo para obtener un parche escalado, para combinar entonces, por el combinador (120) el parche escalado y el parche no escalado de los parches primero y segundo para obtener parches combinados, y para entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada,

para que la señal de ancho de banda ampliado (122) cumpla con un criterio de envolvente espectral.

2. Un aparato de acuerdo con la reivindicación 1, donde el primer algoritmo de implementación de parches es un algoritmo de implementación de parches de armonía y el generador de parche (110) está configurado para generar el primer parche (112) para que sólo las frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102) estén contenidas por el primer parche (112) .

3. Un aparato de acuerdo con la reivindicación 1 ó 2, donde el segundo algoritmo de implementación de parches es un algoritmo remezcla y el generador de parches (110) está configurado para generar un segundo parche (114) para que el segundo parche (114) contenga frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102) y contenga frecuencias que no son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102) .

4. Un aparato de acuerdo con una de las reivindicaciones 1 a 3, donde una frecuencia de corte inferior del primer parche (112) es igual a la frecuencia de corte inferior del segundo parche (114) y una frecuencia de corte superior del primer parche (112) es igual a la frecuencia de corte superior del segundo parche (114) .

5. Un aparato de acuerdo con una de las reivindicaciones 1 a 4, que comprende un codificador de fase operado por voz (310) para generar el primer parche (112) de acuerdo con un primer algoritmo de implementación de parches.

6. Un aparato de acuerdo con una de las reivindicaciones 1 a 5, que comprende un recortador de amplitud (320) configurado para generar el segundo parche (114) de acuerdo con el segundo algoritmo de implementación de parches recortando la primera banda de la señal de entrada (102) .

7. Un aparato de acuerdo con una de las reivindicaciones 1 a 6, que comprende un selector de línea espectral (410) configurado para seleccionar una pluralidad de líneas de frecuencia del segundo parche (114) para obtener un segundo parche modificado (414) donde se selecciona una línea de frecuencia, si se pierde una línea de frecuencia correspondiente al primer parche (112) , donde el combinador (120) está configurado para combinar el primer parche (112) , el segundo parche modificado (414) y la primera banda de la señal de entrada (102) .

8. Un aparato de acuerdo con una de las reivindicaciones 1 a 7, que comprende un controlador de potencia (710) , configurado para controlar el ajuste a escala de la señal de entrada (102) de acuerdo con el primer y segundo algoritmo de implementación de parches o configurado para controlar el ajuste a escala de el primer parche (112) , el segundo parche (114) , donde el controlador de potencia (710) , controla el ajuste a escala teniendo en cuenta los datos de envolvente espectral contenidos en la señal de entrada (102) y teniendo en cuenta al menos un parámetro

de control del ajuste a escala almacenado o datos de control del ajuste a escala del parche contenidos por la señal de entrada (102) .

9. Un aparato de acuerdo con la reivindicación 8, que comprende, un primer medio de ajuste de potencia (720) configurado para ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches o para ajustar a escala el primer parche (112) , y comprende un segundo medio de ajuste de potencia (730) configurado para ajustar a escala la señal de entrada (102) de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el segundo parche (114) , donde el controlador de potencia (710) está configurado para controlar el primer medio de ajuste de potencia (720) y el segundo medio de ajuste de potencia (730) .

10. Un aparato de acuerdo con la reivindicación 8 ó 9, que comprende un sumador de ruido (910) está configurado para generar un parche de ruido (912) basado en datos de ruido contenidos por señal de entrada, donde el sumador de armonía perdida (920) , está configurado para generar un parche de armónicos ausentes (922) basado en los datos de armónicos ausentes contenidos en la señal de entrada (102) , donde el controlador de potencia (710) está configurado para controlar el ajuste a escala del parche de ruido (912) y el parche de armónicos ausentes (922) teniendo en cuenta los datos de envolvente espectral, donde el combinador (120) está configurado para combinar el primer parche (112) , y el segundo parche (114) , la primera banda de la señal de entrada (102) , el parche de ruido

(912) y el parche de armónicos ausentes (922) para obtener la señal de ancho de banda ampliado (122) , donde el controlador de potencia (710) controla el ajuste a escala del primer parche (112) , el segundo parche (114) , el parche de ruido (912) y el parche de armónicos ausentes (922) teniendo en cuenta los datos de envolvente espectral, para que el criterio de envolvente espectral pueda ser cumplido.

11. Un aparato (1000) para proveer una señal de ancho de banda reducido (1032) teniendo en cuenta una señal de entrada (1002) que comprende,

un determinador de datos de envolvente espectral (1010) configurado para determinar datos de envolvente espectral (1012) teniendo en cuenta una banda de frecuencia alta de la señal de entrada (1002) ;

un generador de datos de control de ajuste a escala del parche (1020) configurado para generar datos de control de ajuste a escala del parche (1022) para ajustar a escala la señal reducida de ancho de banda (1032) en un decodificador o para ajustar a escala un primer parche y un segundo parche, por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral, donde el criterio de se basa en datos de envolvente espectral (1012) donde el primer parche es generado desde una primera banda de la señal reducida de ancho de banda (1032) de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal reducida de ancho de banda (1032) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches;

una interfaz de salida (1030) configurada para combinar una banda de frecuencia baja de la señal de entrada (1002) , los datos de envolvente espectral (1012) y datos de control de ajuste a escala del parche (1022) para obtener la señal reducida de ancho de banda (1032) y configurada para proveer la señal reducida de ancho de banda (1032) para su transmisión o almacenamiento.

12. Un aparato de acuerdo con la reivindicación 11, donde el generador de datos de control de ajuste a escala del parche comprende:

el generador de parche está configurado para generar un primer parche desde la banda de baja frecuencia de la señal de entrada (1002) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche desde la banda de baja frecuencia de la señal de entrada (1002) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches; y

un comparador configurado para comparar el primer parche, el segundo parche y la banda de frecuencia alta de la señal de entrada (1002) para obtener los datos de control de ajuste a escala del parche (1022) .

13. Un aparato de acuerdo con la reivindicación 11, que comprende una memoria para parámetros de control de ajuste a escala del parche para almacenar y proveer una pluralidad de parámetros de control de ajuste a escala del parche donde el generador de datos de control de ajuste a escala del parche (1020) está configurado para analizar la señal de entrada (1002) y configurado para generar los datos de control de ajuste a escala del parche (1022) teniendo en cuenta los parámetros de control de ajuste a escala del parche seleccionados basados en el análisis de la señal de entrada (1002) .

14. Un procedimiento (1100) para generar una señal de ancho de banda ampliado desde una señal de entrada, donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el procedimiento:

la generación (1110) de un primer parche desde la primera banda de la señal de entrada de acuerdo con un primer algoritmo de implementación de parches;

la generación (1120) de un segundo parche desde la primera banda de la señal de entrada de acuerdo con un segundo algoritmo de implementación de parches para reconstruir la segunda banda de la eñal de entrada, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches;

El ajuste a escala (1130) de la señal de entrada de acuerdo con el primer algoritmo de implementación de parches antes de generar el primer parche y escalar la señal de entrada (102) de acuerdo con el segundo algoritmo de implementación de parches antes de generar el segundo parche o escalar (1130) el primer parche y el segundo parche, o escalar solamente uno de entre el primero y el segundo parche para obtener un parche escalado, y combinar, mediante una etapa de combinación (114) los parches escalado y no escalado a partir de los parches primero y segundo para obtener parches combinados, y entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada, para que la señal de ancho de banda ampliado cumpla con un criterio de envolvente espectral basado en los datos de envolvente espectral; y

La combinación (1140) del primer parche, segundo parche y primera banda de la señal de entrada para obtener la señal de ancho de banda ampliado.

15. Un procedimiento (1200) para proveer una señal reducida de ancho de banda basada en una señal de entrada, que comprende:

la determinación (1210) de datos de envolvente espectral basados en una banda de alta frecuencia de la señal de entrada;

la generación (1220) de datos de control de ajuste a escala del parche para ajustar a escala la señal reducida de ancho de banda en un decodificador o para ajustar a escala un primer parche y segundo parche por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral, donde el criterio de envolvente espectral se basa en los datos de envolvente espectral, donde el primer parche es generado desde una primera banda de la señal reducida de ancho de banda de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal reducida de ancho de banda de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches.

la combinación (1230) de la banda de baja frecuencia de la señal de entrada, datos de envolvente espectral y datos de control de ajuste a escala del parche para obtener la señal reducida de ancho de banda;

la provisión (1240) de la señal de ancho de banda reducido para u transmisión o almacenamiento.

16. Un programa de ordenador con un código de programa para desarrollar el procedimiento de acuerdo con la reivindicación 14 ó 15, cuando el programa de ordenador se ejecuta en una computadora o micro-controlador.