Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio.

Un aparato (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches ("patching") (119;

1155), donde el aparato (100; 200; 700; 800; 1100) comprende:

un primer convertidor (110; 1130) para convertir una porción de tiempo (107-1; 107-2; 1125) de una señal de audio (105; 1101) en una representación espectral (115: 1135-1);

un generador de parches en el dominio espectral (120; 1141) para ejecutar una pluralidad (117-1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parches genera una representación espectral modificada (125; 1149) que comprende componentes espectrales en una banda de frecuencia superior (220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101), y donde el generador de parches en el dominio espectral (120; 1141) está configurado para seleccionar un primer algoritmo de parches en el dominio espectral (117-2) de la pluralidad (117-1) de algoritmos de parches para una primera porción de tiempo (107-1) y un segundo algoritmo de parches en el dominio espectral (117-3) de la pluralidad (117-1) de algoritmos de parches para una segunda porción de tiempo diferente (119; 1155) para obtener la representación espectral modificada (125; 1149);

un manipulador de reconstrucción de alta frecuencia (130) para manipular la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y un combinador (140) para combinar la señal de audio (105; 1101) que tiene componentes espectrales en la banda de frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/054434.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: HILPERT, JOHANNES, MULTRUS,MARKUS, NAGEL,Frederik, FUCHS,Guillaume, LECOMTE,Jérémie, BAYER,Stefan, ROBILLIARD,JULIEN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/14
  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2396686_T3.pdf

 


Fragmento de la descripción:

Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una señal de audio

La presente invención se relaciona con el procesamiento de señales de audio y, en particular, con un aparato y un procedimiento para generar una señal de audio de síntesis, un aparato y un procedimiento para codificar una señal de audio y una señal de audio codificada.

El almacenamiento o transmisión de señales de audio con frecuencia es objeto de rigurosas restricciones de velocidad de transmisión de bits. Estas restricciones con frecuencia se superan mediante la codificación intermedia de la señal. En el pasado, se forzaba a los codificadores a reducir drásticamente el ancho de banda del audio transmitido cuando sólo se disponía de una velocidad de transmisión de bits muy baja. Los códecs (codificador– decodificador) de audio modernos pueden codificar las señales de banda ancha utilizando procedimientos de extensión del ancho de banda (BWE) , de acuerdo con lo descripto por M Dietz, L. Liljer y d, K. Kjörling y O. Kunz, en “Spectral Band Replication, a novel approach in audio coding” en la 112a Convención de AES, Munich, Mayo de 2002; S. Meltzer, R. Böhm y F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM) , ” en la 112a Convención de AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm, ” en la 112a Convención de AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496–3:2001/FPDAM 1, “Bandwidth Extension, ” ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al. Patente de Estados Unidos 5.455.888; E. Larsen, R. M. Aarts, y M. Danessis. Efficient high–frequency bandwidth extension of music and speech. en la 112a Convención de AES, Munich, Alemania, Mayo de 2002; R.M. Aarts, E. Larsen, y O. Ouweltjes. A unified approach to low–and high frequency bandwidth extension. En la 115a Convención de AES, New York, Estados Unidos, Octubre de 2003; K. Käyhkö. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laborator y of Acoustics and Audio Signal Processing, 2001; E. Larsen and R.M. Aarts. Audio Bandwidth Extension – Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004; E. Larsen, R.M. Aarts y M. Danessis. Efficient high–frequency bandwidth extension of music and speech. En la 112a Convención de AES, Munich, Alemania, Mayo de 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions of Audio and Electroacoustics, AU– 21 (3) , Junio de 1973; Solicitud de patente de los Estados Unidos 08/951, 029, Ohmori, et al. Audio band width extending system and method; Patente de Estados Unidos 6895375, Malah, D & Cox, R.V.: System for bandwidth extension of Narrow–band speech y Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs, ” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, Abril de 2009.

Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF) . Esta representación se genera desde la parte de baja frecuencia (LF) de la señal decodificada por medio de la transposición a la región espectral de HF (“patching”) y la aplicación de un post procesamiento impulsado por los parámetros.

En la técnica, se utilizan procedimientos de extensión del ancho de banda tales como replicación de la banda espectral (SBR) como procedimiento eficiente para generar señales de alta frecuencia en un códec basado en HFR (reconstrucción de alta frecuencia) .

La replicación de la banda espectral (SBR) , según lo descripto por M Dietz, L. Liljer y d, K. Kjörling y O. Kunz,

“Spectral Band Replication, a novel approach in audio coding” en la 112a Convención de AES, Munich, mayo de 2002, utiliza un banco de filtros espejo en cuadratura (QMF) para generar la información de HF (alta frecuencia) .

Con el denominado “patching”, las señales de banda QMF más altas se copian en bandas QMF más altas, lo que lleva a la replicación de la información de la parte de LF en la parte de HF. La parte de HF generada se adapta posteriormente a la parte original de HF con la ayuda de parámetros que ajustan la envolvente espectral y la tonalidad.

En la SBR (replicación de la banda espectral) , normalizada en HE–AAC, todas las operaciones, que incluyen la introducción de parches por medio de simple copiado, se llevan a cabo frecuentemente dentro del dominio de QMF. Sin embargo, se pueden ejecutar otros procedimientos diferentes de introducción de parches en diferentes dominios, tales como el dominio FFT o el dominio del tiempo. Uno se podría imaginar la habilitación de la SBR para elegir alternativamente un algoritmo de parches que funcione en el dominio FFT o en el dominio del tiempo y necesite una transformación adicional para alimentar el paso de análisis de QMF.

En la SBR básica, sólo se dispone de un algoritmo de emparche que no toma en cuenta ni las necesidades de hardware ni software especial ni las características de la señal. Por ende, la SBR no puede adaptar el algoritmo de parches. Uno se podría imaginar simplemente la elección entre dos algoritmos diferenciados de introducción de parches ("patching") . Dado que los dos procedimientos de introducción de parches ("patching") funcionan en diferentes dominios, las áreas de transición son proclives a producir artefactos de bloqueo, lo que prácticamente imposibilita la conmutación de grano fino entre ambos procedimientos.

WO 98/57436 describe procedimientos de transposición utilizados en la replicación de la banda espectral, que se combinan con el ajuste de la envoltura espectral.

WO 02/052545 plantea que las señales se pueden clasificar en forma de tren de pulsos o en forma no de tren de pulsos y basándose en esta clasificación se propone un transpositor. El transpositor de conmutación ejecuta dos algoritmos de introducción de parche en paralelo y la unidad mezcladora combina ambas señales emparchadas dependiendo de la clasificación (tren de pulsos o no tren de pulsos) . La conmutación real entre los transpositores o su mezcla se ejecuta en un banco de filtros de ajuste de la envolvente en respuesta a los datos de envolvente y control. Más aun, en el caso de las señales en forma de tren de pulsos, la señal base se transforma en un dominio de banco de filtros, se ejecuta una operación de traslado de frecuencias y se ejecuta un ajuste a la envolvente del resultado de la traslación de frecuencias. Este es un procedimiento combinado de introducción de parche/procesamiento adicional. En el caso de las señales que no tienen forma de tren de pulsos, se incluye un transpositor de domino de la frecuencia (transpositor FD) y el resultado del transpositor al dominio de la frecuencia se transforma entonces en el dominio de bancos de filtro, en el cual se ejecuta el ajuste de la envolvente. Por consiguiente, la implementación y flexibilidad de este procedimiento, que, en una alternativa, presenta una estrategia de parche/procesamiento adicional y que, en la otra alternativa, incluye un transpositor del domino de la frecuencia que está situado fuera del banco de filtros en el cual tiene lugar el ajuste de la envolvente, son problemáticas con respecto a las posibilidades de flexibilidad e implementación.

En el estado de la técnica, los siguientes documentos describen soluciones para realizar un patching de componentes espectrales que faltan: WO 02/052545 A1, US 2002/016698 A1 y WO 03/107329 A1.

Es un objetivo de la presente invención dar a conocer un concepto para generar una señal de audio de síntesis que dé lugar a una calidad mejorada y permita una implementación eficiente.

Este objetivo se logra mediante un aparato para generar una señal de audio de síntesis de acuerdo con la reivindicación 1, un aparato para codificar una señal de audio de acuerdo con la reivindicación 10, un procedimiento para generar de acuerdo con la reivindicación 12, un procedimiento para codificar de acuerdo con la reivindicación 13, una señal de audio codificada de acuerdo con la reivindicación 14 o un programa de computación de acuerdo con la reivindicación 15.

La presente invención se basa en la idea básica de que se puede obtener la calidad mejorada recién mencionada y/o una implementación eficiente cuando una porción de tiempo de una señal de audio se convierte a una representación espectral... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches ("patching") (119; 1155) , donde el aparato (100; 200; 700; 800; 1100) comprende:

un primer convertidor (110; 1130) para convertir una porción de tiempo (107–1; 107–2; 1125) de una señal de audio (105; 1101) en una representación espectral (115: 1135–1) ;

un generador de parches en el dominio espectral (120; 1141) para ejecutar una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parches genera una representación espectral modificada (125; 1149) que comprende componentes espectrales en una banda de frecuencia superior

(220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101) , y donde el generador de parches en el dominio espectral (120; 1141) está configurado para seleccionar un primer algoritmo de parches en el dominio espectral (117–2) de la pluralidad (117–1) de algoritmos de parches para una primera porción de tiempo (107–1) y un segundo algoritmo de parches en el dominio espectral (117–3) de la pluralidad (117–1) de algoritmos de parches para una segunda porción de tiempo diferente (119; 1155) para obtener la representación espectral modificada (125; 1149) ;

un manipulador de reconstrucción de alta frecuencia (130) para manipular la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y

un combinador (140) para combinar la señal de audio (105; 1101) que tiene componentes espectrales en la banda de frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145) .

2. El aparato (100; 200; 700; 800; 1100) de acuerdo con la reivindicación 1, en el cual el generador de parches en el dominio espectral (120; 1141) es implementado de manera que sea operativo en un domino espectral y no en un dominio del tiempo.

3. El aparato (200) de acuerdo con la reivindicación 1 o 2, en el cual el generador de parches en el dominio espectral

(120) está configurado para ejecutar por lo menos dos algoritmos de parche diferentes en el dominio espectral de un grupo (203) de algoritmos de parche en el dominio espectral, donde el grupo (203) de algoritmos de parches comprende un primer algoritmo de parches (205–1) que comprende una transposición armónica basada en un vocodificador de fase única y funcionalidades de replicación de la banda espectral con copiado no armónico, un segundo algoritmo de parches (205–2) que comprende una transposición armónica basada en un vocodificador de fases múltiples, un tercer algoritmo de parches (205–3) que comprende funcionalidades de replicación de la banda espectral con copiado no armónico y un cuarto algoritmo de parches (205–4) que comprende una distorsión no lineal, donde el aparato (200) está adaptado para ejecutar una extensión del ancho de banda, por lo que la señal de ancho de banda extendido (135) comprende la banda de frecuencia superior (220) que tiene una frecuencia máxima (225; fmax) de por lo menos cuatro veces la frecuencia de cruce (215; fx) en la frecuencia del núcleo (210) .

4. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el primer algoritmo de parches (205–1) , el primer algoritmo de parches (205–1) que comprende una transposición armónica basada en un vocodificador de fase única (305) que comprende un factor de extensión del ancho de banda (σ) de dos que controlan una transformación de una banda de frecuencia de origen (310) extraída de la banda de frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (310’) , donde las fases de los componentes espectrales de la banda de frecuencia de origen (310) se multiplican por el factor de extensión del ancho de banda (σ) por lo que la primera banda de frecuencia objetivo (310) tiene frecuencias en el rango comprendido desde la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx) , donde el primer algoritmo de parches (205–1) comprende además funcionalidades de replicación de la banda espectral por copiado no armónico (315) para transformar los componentes espectrales comprendidos en la primera banda de frecuencia objetivo (310’) en una segunda banda de frecuencia objetivo (320’) mediante un primer copiado, de manera tal que la segunda banda de frecuencia objetivo (320’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) y para transformar además los componentes espectrales de la segunda banda de frecuencia objetivo (320’) en una tercera banda de frecuencia objetivo (330’) mediante un segundo copiado, por lo que la tercera banda de frecuencia objetivo (330’) tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluidas en la banda de frecuencia superior (220) , donde la banda de frecuencia superior (220) comprende la primera (310’) , segunda (320’) y tercera (330’) bandas de frecuencia objetivo.

5. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el segundo algoritmo de parches (205–2) , segundo algoritmo de parches (205–2) que comprende una transposición armónica basada en un vocodificador de fases múltiples (405) que comprende un primer factor de extensión del ancho de banda (σ1) de dos que controlan una transformación de una primera banda de frecuencia (410) extraída de la banda de frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (410’) , donde las fases de los componentes espectrales de la primera banda de frecuencia de origen (410) se multiplican por el primer factor de extensión del ancho de banda (σ1) de tal manera que la primera banda de frecuencia objetivo (410’) tiene frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx) , donde el segundo algoritmo de parches (205–2) comprende además un segundo factor de extensión del ancho de banda (σ2) de los tres que controlan una transformación de una segunda banda de frecuencia de origen (420–1, 420–2) extraída de la banda de frecuencia del núcleo (210) en una segunda banda de frecuencia objetivo (420’, 420’’) , donde las fases de los componentes espectrales de la segunda banda de frecuencia de origen (420–1, 420–2) se multiplican por el segundo factor de extensión del ancho de banda (σ2) por lo que la segunda banda de frecuencia objetivo (420’, 420’’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) o en el rango de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) , donde el segundo algoritmo de parches (205–2) comprende además un tercer factor de extensión del ancho de banda (σ3) de cuatro que controlan una transformación de una tercera banda de frecuencia de origen (430–1, 430–2) extraída de la banda de frecuencia del núcleo (210) en una tercera banda de frecuencia objetivo (430’, 430’’) , donde las fases de los componentes espectrales de la tercera banda de frecuencia de origen (430’, 430’’) se multiplican por el tercer factor de extensión del ancho de banda (σ3) por lo que la tercera banda de frecuencia objetivo (430’, 430’’) tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) o en el rango comprendido desde la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluida en la banda de frecuencia superior

(220) , donde la frecuencia superior (220) comprende la primera (410’) , segunda (420’, 420’’) y tercera (430’, 430’’)

bandas de frecuencia objetivo.

6. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el tercer algoritmo de parches (205–3) , donde el tercer algoritmo de parches (205–3) comprende funcionalidades de replicación de la banda espectral por copiado no armónico (505) para transformar los componentes espectrales de una banda de frecuencia de origen (510) que es la banda de frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (510’) mediante un primer copiado, de tal manera que la primera banda de frecuencia objetivo (510’) tiene frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx) , para transformar, a su vez, los componentes espectrales de la primera banda de frecuencia objetivo (510’) en una segunda banda de frecuencia objetivo (520’) mediante un segundo copiado, por lo que la segunda banda de frecuencia objetivo (520’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) y para transformar además los componentes espectrales de la segunda banda de frecuencia objetivo (520’) en una tercera banda de frecuencia objetivo (530’) mediante un tercer copiado, por lo que la tercera banda de frecuencia objetivo (530’) tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluida en la banda de frecuencia superior (220) , donde la banda de frecuencia superior (220) comprende la primera (510’) , segunda (520’) y tercera (530’) bandas de frecuencia objetivo.

7. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el cuarto algoritmo de parches (205–4) , cuarto algoritmo de parches (205–4) que comprende una distorsión no lineal para generar los componentes espectrales de la banda de frecuencia superior (220) que tienen frecuencias en el rango comprendido desde la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) .

8. El aparato (700) de acuerdo con una de las reivindicaciones anteriores, donde el aparato (700) no comprende un transformador de tiempo/ frecuencia (710) para transformar una señal en el dominio del tiempo (705) derivada de la representación espectral modificada (125) al dominio espectral.

9. El aparato (800) de acuerdo con una de las reivindicaciones anteriores, donde el aparato (800) comprende además un segundo convertidor (810) para convertir la representación espectral modificada (125) al dominio del tiempo, donde el segundo convertidor (810) está adaptado para aplicar una síntesis que coincide con un análisis aplicado por el primer convertidor (110) , donde el primer convertidor (110) está configurado para ejecutar una conversión que tiene una primera longitud de conversión (111) , y donde el segundo convertidor (810) está configurado para ejecutar una conversión que tiene una segunda longitud de conversión, donde la segunda longitud de conversión depende de una característica de extensión del ancho de banda por el hecho de que se toma en cuenta la relación de la frecuencia máxima (fmax) de la banda de frecuencia superior (220) y la frecuencia de cruce (fx) de la banda de la frecuencia del núcleo (210) y la primera longitud de conversión (111) .

10. Un aparato (900; 1000) para codificar una señal de audio (105) , donde la señal de audio (105) comprende una banda de frecuencia del núcleo (210) y una banda de frecuencia superior (220) , donde el aparato (900; 1000) comprende:

un codificador del núcleo (910) para codificar la señal de audio (105) dentro de la banda de la frecuencia del núcleo (210) ;

un extractor de parámetros (920) para extraer una señal de control de parches (119) de la señal de audio (105) , donde la señal de control de parches (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde el algoritmo de parches seleccionado se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda y

una calculadora de parámetros (930) para calcular un parámetro de replicación de la banda espectral (127) de la banda de frecuencia superior (220) .

11. El aparato (1000) para codificar de acuerdo con la reivindicación 10, en el cual el extractor de parámetros (920) está configurado para determinar, de la pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, el algoritmo de parches seleccionado, donde el algoritmo de parches seleccionado se basa en una comparación de la señal de audio (105) o una señal derivada de la señal de audio (105) con una pluralidad (1005) de señales de ancho de banda extendido que han sido obtenidas mediante la ejecución de la pluralidad (117–1) de algoritmos de parche en el dominio espectral y la manipulación de una representación espectral modificada (125) de una porción de tiempo de la señal de audio (105) .

12. Un procedimiento (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches (190; 1155) , procedimiento (100; 200; 700; 800; 1100) que comprende:

convertir (110; 1130) una porción de tiempo (107–1; 107–2; 1125) de una señal de audio (105; 1101) en una representación espectral (115; 1135–1) ;

ejecutar (120; 1141) una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parche genera una representación espectral modificada (125; 1149) que comprende componentes espectrales de una banda de frecuencia superior (220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101) , y seleccionar (120; 1141) un primer algoritmo de parches en el dominio espectral (117–2) de la pluralidad (117–1) de algoritmos de parches para una primera porción de tiempo (107–1) y un segundo algoritmo de parches en el dominio espectral (117–3) de la pluralidad (117–1) de algoritmos de parches para una segunda porción de tiempo diferente (107–2) de acuerdo con la señal de control de parches (119; 1155) para obtener la representación espectral modificada (125; 1149) ;

manipular (130) la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y

combinar (140) la señal de audio (105; 1101) que tiene componentes espectrales en la banda de la frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145) .

13. Un procedimiento (900; 1000) para codificar una señal de audio (105) , donde la señal de audio (105) comprende una banda de frecuencia del núcleo (210) y una banda de frecuencia superior (220) , procedimiento (900; 1000) que comprende:

codificar (910) la señal de audio (105) dentro de la banda de la frecuencia del núcleo (210) ;

extraer (920) una señal de control de parches (119) de la señal de audio (105) , donde la señal de control de parches (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde el algoritmo de parches seleccionado se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda y

calcular (930) un parámetro de replicación de la banda espectral (127) de la banda de frecuencia superior (220) .

14. Una señal de audio codificada (935) que comprende:

una señal de audio codificada (915) codificada dentro de una banda de frecuencia del núcleo (210) ;

una señal de control de parches (119) , donde la señal de control de parches (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, algoritmo de parches seleccionado que se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis (145) en un decodificador de extensión de ancho de banda y

un parámetro de replicación de la banda espectral (127) calculado a partir de una banda de frecuencia superior (220) de la señal de audio (105) .

15. Un programa de computación que consta de un código de programa para poner en práctica el procedimiento de acuerdo con la reivindicación 12 o 13, al ejecutarse el programa de computación en una computadora.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .