Procesador de señal y procedimiento para procesar una señal.

Un procesador de señal (150) para proporcionar una versión procesada (112) de una señal de entrada

(110) en dependencia de la señal de entrada, comprendiendo el procesador de señal comprende:

un proveedor de ventana (120) configurado para enmarcar una porción de la señal de entrada (110) o de una versión pre-procesada de la misma (110'), en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada (112) de la señal de entrada; y

un proveedor de ventana (180) para proporcionar los valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t) en dependencia de uno o más parámetros de forma de ventana (ck), en donde el proveedor de ventana (180) se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana (t) sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal (wc(t)), en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana (ck); en donde el proveedor de ventana se configura para proporcionar los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t de acuerdo con**Fórmula**

en donde K≥1;

en donde ck' son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y

en donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/053484.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: GEIGER, RALF, Helmrich,Christian.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/022 (Bloqueo, p. ej. agrupación de muestras en el tiempo; Elección de las ventanas de análisis; Factorización de interferencias)

PDF original: ES-2526774_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Procesador de señal y procedimiento para procesar una señal CAMPO TÉCNICO

[1] Las modalidades de acuerdo con la invención se refieren a un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada y a un procedimiento para el procesamiento de una señal.

[2] Una modalidad de acuerdo con la invención se refiere a un aparato para codificar o decodificar una señal de audio o de video usando funciones de ventana variables. Otra modalidad de acuerdo con la invención se refiere a un procedimiento para codificar o decodificar una señal de audio o de video usando funciones de ventana variables.

[3] Las modalidades de acuerdo con la presente invención generalmente se refieren a un análisis de señal y procedimientos de procesamiento, tales como aquellos que pueden utilizarse en sistemas de codificación de audio o de video.

ANTECEDENTES DE LA INVENCIÓN

[4] La filtración de respuesta de impulsos finitos (FIR) de señales discretas, particularmente en el contexto de bancos de filtro, se emplea ampliamente en análisis espectral, procesamiento, síntesis y compresión de datos de medios, entre otras aplicaciones. Es bien sabido que la finitud temporal (o espacial) de un filtro de FIR y por lo tanto la finitud del intervalo de señal que puede procesarse en un instante en el tiempo o espacio, puede conducir a un fenómeno conocido como derivación o fuga. Cuando se modifica el intervalo filtrado, por ejemplo, al variar cambios de ganancia o cuantificación, puede ocurrir el bloqueo o resonancia de artefactos después de la inversión de la operación de filtración. Se ha encontrado que la causa de estos artefactos puede atribuirse a discontinuidades entre los puntos terminales de la forma de onda de señal del intervalo procesado (referido en lo sucesivo como segmento), así como también aquellos de sus diferenciales. Se ha encontrado que con objeto de reducir tales efectos indeseados de fuga, es por lo tanto útil o incluso necesario el reducir las discontinuidades en el segmento y algunos de sus diferenciales. Esto puede lograrse al multiplicar cada muestra s(n), n=, 1,..., N-1, del segmento de longltud-N con un cierto peso w(n) antes de la filtración y, en el caso de manipulación de señal en el dominio filtrado, también después de la filtración inversa, de tal manera que los puntos terminales del segmento y de sus diferenciales se gradúen a cero. Un enfoque equivalente es aplicar los pesos a cada filtro de base del banco de filtro (Ver, por ejemplo, referencia [2]). Ya que los factores de ponderación se describen con frecuencia mediante una expresión analítica, un conjunto de factores es comúnmente conocido como una función de ponderación o función de ventana.

[5] En sistemas típicos de codificación de audio y video, una forma de onda de origen se segmenta como arriba y cada segmento se cuantifica en una representación más gruesa a fin de llevar a cabo una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits necesaria para almacenar o transmitir la señal. En un intento por obtener ganancia de codificación por medio de compactación de energía en menos de N muestras (o, en otras palabras, por incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones del banco de filtro de los segmentos previo a la cuantificación. Los sistemas recientemente desarrollados usan transformación ortogonal solapada de tiempo-respecto-a-frecuencia en la forma de la transformación de coseno, discreta, modificada (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras permiten aún el muestreo crítico. Para un desempeño mejorado, las operaciones de MDCT, de avance e inversas, se combinan con la ponderación de cada segmento: en el lado central, se aplica una ventana de análisis wa(n) antes de la MDCT de avance y en el lado receptor, se aplica una ventana de síntesis ws(n) después de la MDCT inversa. Desafortunadamente, no todas las funciones de ponderación son adecuadas para utilizarse con la MDCT. Suponiendo ventanas predeterminadas (no variantes en tiempo/espacio), se ha encontrado que con objeto de que la arquitectura completa produzca una perfecta reconstrucción de entrada en la ausencia de errores de cuantificación o de transmisión, la wa(n) y ws(n) deben seleccionarse como sigue:

wa(n)-ws(n) + wa(N/2+nyws(N/2+ri) =1, n = ,1,NI2-1. (1)

[6] Si Wa(n) y ws(n) son idénticas, es decir, wa(n)= ws(n)=w(n), la ecuación (1) se reduce a la condicionante mejor conocida

w(n)2 + w(N/2+nf = 1, n = , 1,..NI2-1, (2)

publicada en la referencia [7], Para mejor compactación de energía, se adopta normalmente w(n) que es simétrica alrededor de n=N/2-1/2, es decir

w(N-l-n) = w(n), n = , 1,N/2-1, (3)

En la norma de Codificación Avanzada de Audio (AAC) (referencia [8]), se encuentran disponibles dos funciones de ventana. Una es la ventana de seno, dada por

=sen(7r-(tt+1 i2)/N), n = , I,..N-1 , (4)

la otra es una ventana derivada de Kaiser-Bessel (KBD) descrita en las patentes de Fielder y Davidson, titulada Codificador, decodificador y codificador/decodificador de transformación de baja velocidad de transmisión de bits para audio de elevada calidad, patentes de E.U. 519417 y 5142656. La última ventana también se utiliza en la norma de codificación AC-3 (Dolby Digital) (ATSC, Inc., Norma de Compresión de Audio Digital (AC-3, E-AC-3), Revisión B, documento A/52B, Junio 25), regla no escrita en una configuración diferente (<x=5). La especificación Vorbis (referencia [9]) define la ventana

wWítW =sen(7tf2-senz(ir(n+l/2)M), « = , I, MTJ AM. (5)

[7] La Fig. 5 muestra las respuestas de frecuencia de la AAC y funciones de ventana Vorbis, obtenidas a través de transformación Fourier, de acuerdo con la referencia [4]. Puede observarse que la ventana de seno tiene una selectividad de frecuencia exacta relativamente elevada (lóbulo principal angosto) y rechazo de banda de detención relativamente bajo (atenuación de lóbulo lateral bajo). La ventana de KBD, por el contrario, tiene una elevada atenuación de banda de detención y baja selectividad de frecuencia exacta. La ventana Vorbis yace aproximadamente a la mitad entre las primeras dos ventanas.

[8] Se ha encontrado que para ciertas aplicaciones, puede ser deseable ejercer un control más fino sobre la selectividad de banda de paso y el rechazo de la banda de detención de una ecuación (2) que satisface la función de ponderación. Más específicamente, se ha encontrado que para mejorar la eficiencia de codificación, puede ser necesario un parámetro de ventana a fin de adaptar continuamente las características de la ventana a aquellas del espectro de entrada. De las tres funciones arriba discutidas, solo la función de KBD ofrece tal parámetro, a, que puede variar para lograr diferentes relaciones de selectividad/atenuación. Sin embargo, esta función incorpora matemática computacionalmente costosa (función Bessel, seno hiperbólico, raíz cuadrada y división), prohibiendo potencialmente su re-cálculo para cada segmento de señal en dispositivos de baja potencia o en sistemas de tiempo real. Lo mismo aplica a la clase de funciones de ventana presentadas en el artículo de Sinha y Ferreira, titulado Una Nueva Clase de Ventanas Complementarias de Potencia Uniforme y su Aplicación a Procesamiento de Señales de Audio, AES 119 Convención, Octubre 25, documento 664, que requiere de operaciones de valor complejo, factorización espectral y transformación Fourier. También se ha encontrado que la interpolación entre dos funciones (por ejemplo, KBD y seno), más eficientemente por suma ponderada, puede utilizarse para controlar... [Seguir leyendo]

 


Reivindicaciones:

1. Un procesador de señal (15) para proporcionar una versión procesada (112) de una señal de entrada (11) en dependencia de la señal de entrada, comprendiendo el procesador de señal comprende:

un proveedor de ventana (12) configurado para enmarcar una porción de la señal de entrada (11) o de una versión pre-procesada de la misma (11), en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada (112) de la señal de entrada; y

un proveedor de ventana (18) para proporcionar los valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t) en dependencia de uno o más parámetros de forma de ventana (Ck), en donde el proveedor de ventana (18) se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana (t) sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal (wc(t)), en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana (ck); en donde el proveedor de ventana se configura para proporcionar los valores de ventana de procesamiento de señal Wc(t) para una pluralidad de valores índice de valor de ventana t de acuerdo con

K

Wc.(t)= Y. ct'sen((2k+ l))Ty) ,

4- L

en donde K>1;

en donde Ck son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y en donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.

2. Un procesador de señal (2) para proporcionar una versión procesada (212) de una señal de entrada (21) en dependencia de la señal de entrada (21), comprendiendo el procesador de señal:

un proveedor de ventana (22) configurado para enmarcar una porción de la señal de entrada, o una versión preprocesada (21) de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada de la señal de entrada,

en donde los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno que representan los valores índice de valor de ventana sobre valores de función correspondientes;

en donde los valores de ventana de procesamiento de señal wc(t) se definen de acuerdo con

K

W

c

(=X Vsen((2k+l)*|

L

en donde t toma valores entre y L/2 para una Inclinación de ventana (163), y en donde K>1; donde Ck son valores de parámetro de forma de ventana determinados por los parámetros de forma de ventana; y donde L indica la longitud de la

ventana; y

donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de Imagen.

3. Un procedimiento para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, comprendiendo el procedimiento:

enmarcado de una porción de la señal de entrada o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada; y proporcionar los valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana en dependencia de uno o más parámetros de forma de ventana,

en donde se calcula una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno para obtener los valores de ventana de procesamiento de señal,

en donde las funciones de configuración de tipo seno representan valores índice de valor de ventana sobre valores de función correspondientes, y en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana;

en donde los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t se proporcionan de acuerdo con

K

]T <y'sen((2k + 1) 7r y)

en donde K>1;

en donde Ck son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y donde L Indica la longitud de la ventana; y

donde la señal de entrada es una señal de audlo, una señal de habla, una señal de video o una señal de Imagen.

4. Un procedimiento para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, comprendiendo el procedimiento:

enmarcado de una porción de la señal de entrada, o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada, en donde los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de fundones de configuración de tipo seno, que representan valores índice de valor de ventana sobre valores de función correspondientes;

en donde los valores de ventana de procesamiento de señal wc(t) se definen de acuerdo con

K

wc(t)= Y ck'sen ((2k+ 1 )ffy)

Á' L

en donde t toma valores entre y L/2 para una inclinación de ventana (163) y en donde K>1;

en donde Ck son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y

en donde la señal de entrada es una señal de audio, una señal de habla, una señal de vídeo o una señal de imagen.

5. Un programa de computadora para llevar a cabo los procedimientos según una de las reivindicaciones 3 a 4 cuando el programa de computadora se ejecuta en una computadora.