Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.

Un aparato (600) para modificar una señal de audio, que comprende:

un elemento de determinación de modelado de envolvente

(610) configurado para determinar coeficientes de modelado de envolvente (612) en base a una señal de audio del dominio de la frecuencia (602) que representa una señal de audio de entrada del dominio del tiempo;

un procesador de banco de filtros (620) configurado para generar una pluralidad de señales pasabanda (622) en un dominio subbanda en base a la señal de audio del dominio de la frecuencia (602);

un procesador de señal (630) configurado para modificar una señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda en base a un blanco de modificación predefinido;

un combinador (640) configurado para combinar por lo menos un subconjunto de la pluralidad de señales pasabanda del dominio subbanda para obtener una señal de audio del dominio del tiempo (642); y

un modelador de envolvente (650) configurado para modelar una envolvente de la señal de audio del dominio del tiempo (642) en base a los coeficientes de modelado de envolvente (612), para modelar una envolvente de la pluralidad de señales pasabanda del dominio subbanda que contienen la señal pasabanda del dominio subbanda modificada en base a los coeficientes de modelado de envolvente (612) o para modelar una envolvente de la pluralidad de señales pasabanda del dominio subbanda en base a los coeficientes de modelado de envolvente (612) antes que una señal pasabanda de dominio subbanda sea modificada por el procesador de señal (630) para obtener una señal de audio modelada (652);

caracterizado por el hecho de que el elemento de determinación de modelado de envolvente (610) se configura para determinar los coeficientes de modelado de envolvente (612) en base a una predicción sobre la frecuencia de la señal de audio de dominio de la frecuencia (602).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/052838.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Inventor/es: DISCH,SASCHA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > INSTRUMENTOS DE MUSICA ELECTROFONICOS; INSTRUMENTOS... > Elementos de instrumentos de música electrofónicos... > G10H1/08 (combinando sonidos (G10H 1/14, G10H 1/16 tienen prioridad; acorde G10H 1/38; análisis o síntesis de la voz G10L))

PDF original: ES-2523800_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.
Ilustración 2 de Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.
Ilustración 3 de Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.
Ilustración 4 de Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.
Ver la galería de la patente con 12 ilustraciones.
Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente.

Fragmento de la descripción:

Aparato y procedimiento para modificar una señal de audio usando modelado de envolvente

[1] Las realizaciones de acuerdo con el invento se refieren a procesamiento de audio y particularmente a un aparato y un procedimiento para modificar una señal de audio.

[2] Hay una creciente demanda de técnicas de procesamiento de señal digital que apunta a la necesidad de manipulaciones de señal extremas para adecuar señales de audio pre-grabadas, por ejemplo, tomadas de una base de datos, a un nuevo contexto musical. Para hacerlo, es necesario adaptar propiedades semánticas de la señal de alto nivel tal como tono, clave musical y modo de escala. Todas estas manipulaciones tienen en común que apuntan a alterar substancialmente las propiedades musicales del material de audio original mientras que conservan lo mejor posible la calidad de sonido subjetiva. En otras palabras, estos editores cambian fuertemente el contenido musical de material de audio pero, no obstante, se requiere que conserven la naturaleza de la muestra de audio procesada y que por ende mantengan la credibilidad. Idealmente esto requiere procedimientos de procesamiento de señal que sean ampliamente aplicables a diferentes clases de señales incluyendo contenido de música polifónica mezclada.

[3] Hoy en día se conocen muchos conceptos para modificar señales de audio. Algunos de estos conceptos se basan en vocoders.

[4] Por ejemplo, en el documento de S. Disch y B. Edler, "Un vocoder de modulación de amplitud y de frecuencia para procesamiento de señal de audio" ("An amplitude- and frequency modulation vocoder for audio signaI Processing1') Acta, de la Conf. Intern. sobre Efectos de Audio Digital (DAFx), 28, en el documento de S. Disch y B. Edler, "Análisis, procesamiento y Síntesis de modulación perceptual multibanda, de señales de audio" ("Multiband perceptual modulation analysis, processing and Synthesis of audio signáis") Acta de IEEE-ICASSP, 29, o en el documento de S. Disch y B. Edler, "Un algoritmo de segmentación iterativa para espectro de señal de audio dependiendo de centros de gravedad locales estimados" ("An iterative segmentation algorithm for audio signa! spectra depending on estimated local centers of gravity") 12° Conferencia Internacional sobre Efectos de Audio Digital (DAFx-9), 29., se presentó el concepto de vocoder de modulación (MODVOC) y se destacó su capacidad general de realizar una significativa transposición selectiva sobre contenido de música polifónica. Esto posibilita aplicaciones que apuntan a cambiar el modo clave de muestras de música PCM pre-grabadas (ver por ejemplo, Disch y B. Edler, "Multiband perceptual modulation analysis, processing and Synthesis of audio signáis," ("Análisis, procesamiento y Síntesis de modulación perceptual multibanda, de señales de audio") Proc. de IEEE-ICASSP, 29 ). También está disponible comercial mente un primer software que puede manejar una tarea así de manipulación polifónica (editor Melodyne de Celemony). El software implementa una tecnología que se denomina y se comercializa mediante el término acceso directo a nota (direct note access) (DNA). Hace poco se ha publicado una solicitud de patente (EP29924, P. Neubácker, "Method for acoustic object-oriented analysis and note object- oriented processing of polyphonic sound recordings," ("Procedimiento para análisis acústico orientado a objeto, de grabaciones de sonido polifónico") septiembre de 29.) que presumiblemente cubre y por ende revela la funcionalidad esencial del DNA. Independientemente del procedimiento usado para modificar una señal de audio, se desea obtener una señal de audio con alta calidad perceptual.

[5] Es un objetivo del presente invento proveer un concepto mejorado para modificar una señal de audio, el cual permite aumentar la calidad perceptual de la señal de audio modificada.

[6] Este objetivo se resuelve mediante un aparato de acuerdo con la reivindicación 1, un procedimiento de acuerdo con la reivindicación 13 o un programa de computadora de acuerdo con la reivindicación 14.

[7] Una realización del invento provee un aparato para modificar una señal de audio que comprende un procesador de banco de filtros, un elemento de determinación de fundamental, un elemento de determinación de sobretono, un procesador de señal y un combinador. El procesador de banco de filtros está configurado para generar una pluralidad de señales pasabanda en base a una señal de audio. Además, el elemento de determinación de fundamental está configurado para seleccionar una señal pasabanda de la pluralidad de señales pasabanda para obtener una señal pasabanda fundamental. El elemento de determinación de sobretono está configurado para identificar una señal pasabanda de la pluralidad de señales pasabanda que cumplen un criterio de sobretono con relación a la señal pasabanda fundamental seleccionada para obtener una señal pasabanda de sobretono asociada a la señal pasabanda fundamental seleccionada. Además, el procesador de señal está configurado para modificar la señal pasabanda fundamental seleccionada en base a un blanco de modificación predefinido. Adicionalmente, el procesador de señal está configurado para modificar una señal pasabanda de sobretono identificada asociada a la señal pasabanda fundamental seleccionada dependiendo de la modificación de la señal pasabanda fundamental seleccionada. Además, el combinador está configurado para combinar la pluralidad de señales pasabanda para obtener una señal de audio modificada.

[8] Identificando sobretonos de frecuencias fundamentales y modificando los sobretonos de la misma manera que las correspondientes fundamentales, se puede evitar una modificación diferente de las fundamentales y sus sobretonos, de modo que se puede conservar más exactamente el timbre de una señal de audio modificada en comparación con la señal de audio original. De esta manera se puede mejorar significativamente la calidad perceptual de la señal de audio modificada. Por ejemplo, si se desea una transposición de tono (por ejemplo, alterar el modo clave de C mayor a C menor de una dada señal de música), la modificación de una señal pasabanda de sobretono identificada está correlacionada con la modificación de la señal pasabanda fundamental. En comparación, los procedimientos conocidos modifican la región de frecuencia de la señal pasabanda que representa sobretonos de manera diferente de la señal pasabanda fundamental. En otras palabras, una señal pasabanda de sobretono identificada es ligada a la señal pasabanda fundamental usando el concepto descrito.

[9] En algunas realizaciones del invento, una señal pasabanda de sobretono puede ser identificada comparando frecuencias de la señal pasabanda fundamental y señales pasabanda de la pluralidad de señales pasabanda, comparando un contenido de energía de la señal pasabanda fundamental y una señal pasabanda de la pluralidad de señales pasabanda y/o evaluando una correlación de una envolvente temporal de la señal pasabanda fundamental y una envolvente temporal de una señal pasabanda de la pluralidad de señales pasabanda. De esta manera se puede definir uno o más criterios de sobretono para minimizar la Identificación de sobretonos erróneos.

[1] Algunas realizaciones de acuerdo con el invento se refieren a una determinación iterativa de señales pasabanda fundamentales e identificación de señales pasabanda de sobretono entre la pluralidad de señales pasabanda. Las señales pasabanda fundamentales ya seleccionadas y las señales pasabanda de sobretono ya identificadas pueden ser retiradas del espacio de búsqueda o, en otras palabras, pueden no ser consideradas para la determinación de una señal pasabanda fundamental adicional o una señal pasabanda de sobretono adicional. De esta manera, cada señal pasabanda de... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato (6) para modificar una señal de audio, que comprende:

un elemento de determinación de modelado de envolvente (61) configurado para determinar coeficientes de modelado de envolvente (612) en base a una señal de audio del dominio de la frecuencia (62) que representa una señal de audio de entrada del dominio del tiempo;

un procesador de banco de filtros (62) configurado para generar una pluralidad de señales pasabanda (622) en un dominio subbanda en base a la señal de audio del dominio de la frecuencia (62);

un procesador de señal (63) configurado para modificar una señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda en base a un blanco de modificación predefinido;

un combinador (64) configurado para combinar por lo menos un subconjunto de la pluralidad de señales pasabanda del dominio subbanda para obtener una señal de audio del dominio del tiempo (642); y

un modelador de envolvente (65) configurado para modelar una envolvente de la señal de audio del dominio del tiempo (642) en base a los coeficientes de modelado de envolvente (612), para modelar una envolvente de la pluralidad de señales pasabanda del dominio subbanda que contienen la señal pasabanda del dominio subbanda modificada en base a los coeficientes de modelado de envolvente (612) o para modelar una envolvente de la pluralidad de señales pasabanda del dominio subbanda en base a los coeficientes de modelado de envolvente (612) antes que una señal pasabanda de dominio subbanda sea modificada por el procesador de señal (63) para obtener una señal de audio modelada (652);

caracterizado por el hecho de que el elemento de determinación de modelado de envolvente (61) se configura para determinar los coeficientes de modelado de envolvente (612) en base a una predicción sobre la frecuencia de la señal de audio de dominio de la frecuencia (62).

2. Un aparato de acuerdo con la reivindicación 1, en donde el modelador de envolvente (65) comprende un conversor de coeficientes (81) y un multiplicador (82), en donde el conversor de coeficientes (81) está configurado para convertir los coeficientes de modelado de envolvente (612) al dominio del tiempo, en donde el multiplicador (82) está configurado para multiplicar la señal de audio del dominio del tiempo (642) con los coeficientes de modelado de envolvente (612) convertidos.

3. Un aparato de acuerdo con una de las reivindicaciones 1 a 2, en donde el procesador de banco de filtros (62) comprende un filtro de predicción (71), un sustractor de señal (72) y un banco de filtros (73), en donde el filtro de predicción (71) está configurado para generar una señal de audio de predicción (712) en base a la señal de audio del dominio de la frecuencia (62) y los coeficientes de modelado de envolvente (612), en donde el sustractor de señal (72) está configurado para sustraer la señal de audio de predicción (712) de la señal de audio del dominio de la frecuencia (62) para obtener una señal de audio residual (722), en donde el banco de filtros (73) está configurado para generar señales pasabanda para obtener la pluralidad de señales pasabanda en base a la señal de audio residual (722).

4. Un aparato de acuerdo con la reivindicación 3, en donde el modelador de envolvente (65) está configurado para determinar un cociente de energía de un contenido de energía de la señal de audio del dominio de la frecuencia (62) y un contenido de energía de la señal de audio residual (722), en donde el modelador de envolvente (65) está configurado para interrumpir el modelado de la envolvente de la señal de audio del dominio del tiempo (642), si el cociente de energía es menor que un umbral de energía predefinido.

5. Un aparato de acuerdo con la reivindicación 3 o 4, en donde el procesador de banco de filtros (62) comprende un conversor de señal (93) configurado para convertir las señales pasabanda generadas por el banco de filtros (73) al dominio subbanda para obtener la pluralidad de señales pasabanda.

6. Un aparato de acuerdo con una de las reivindicaciones 1 a 5, en donde el procesador de señal (63) está configurado para modificar una segunda señal pasabanda del dominio subbanda de la pluralidad de señales pasabanda del dominio subbanda en base a un segundo blanco de modificación predefinido, en donde el blanco de modificación predefinido y el segundo blanco de modificación predefinido son diferentes.

7. Un aparato de acuerdo con una de las reivindicaciones 1 a 6, en donde el procesador de señal (63) está configurado para generar una señal de modulación de amplitud (AM) y una señal de modulación de frecuencia (FM) para cada señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda, en donde el procesador de señal (63) está configurado para modificar la

señal de modulación de amplitud (AM) o la señal de modulación de frecuencia (FM) de la señal pasabanda del dominio subbanda (622) a ser modificada en base al blanco de modificación predefinido.

8. Un aparato de acuerdo con una de las reivindicaciones 1 a 7, que comprende un elemento de determinación de frecuencias de la portadora (92) configurado para determinar una pluralidad de frecuencias de la portadora en base a la señal de audio del dominio de la frecuencia (62), en donde el procesador de banco de filtros (62) está configurado para generar señales pasabanda, de modo que cada señal pasabanda comprende un rango de frecuencia que contiene una frecuencia de la portadora diferente de la pluralidad de frecuencias de la portadora para obtener una señal pasabanda asociada a cada frecuencia de la portadora de la pluralidad de frecuencias de la portadora.

9. Un aparato de acuerdo con una de las reivindicaciones 1 a 8, que comprende un filtro pasa alto/pasa bajo (66) configurado para filtrar pasa alto la señal de audio de entrada del dominio del tiempo o la señal de audio del dominio de la frecuencia que representa la señal de audio de entrada del dominio del tiempo, en donde el filtro pasa alto/pasa bajo (66) está configurado para filtrar pasa bajo la señal de audio de entrada del dominio del tiempo o la señal de audio del dominio de la frecuencia que representa la señal de audio de entrada del dominio del tiempo para obtener una señal de audio pasa bajo (662), en donde el elemento de determinación de modelado de envolvente (61) está configurado para determinar los coeficientes de modelado de envolvente (612) en base a la señal de audio del dominio de la frecuencia (62) de pasa alto, en donde el procesador de banco de filtros (62) está configurado para generar la pluralidad de señales pasabanda (622) en un dominio subbanda en base a la señal de audio del dominio de la frecuencia (62) de pasa alto y la señal de audio de pasa bajo (622), en donde el procesador de señal (63) está configurado para modificar una señal pasabanda del dominio de la subbanda asociada a la señal de audio de dominio de frecuencia de pasa alto (62) o la señal de audio de pasa bajo (622), en donde el combinador (64) está configurado para combinar la señal pasabanda del dominio subbanda correspondiente a la señal de audio del dominio de la frecuencia (62) de pasa alto para obtener la señal de audio del dominio del tiempo (642) o para combinar la señal pasabanda del dominio subbanda correspondiente a la señal de audio del dominio de la frecuencia (62) de pasa alto y la señal pasabanda del dominio subbanda (622) correspondiente a la señal de audio de pasa bajo (662) para obtener la señal de audio del dominio del tiempo (642).

1. Un aparato de acuerdo con una de las reivindicaciones 1 a 9, que comprende un filtro pasa alto/pasa bajo (66) configurado para filtrar pasa alto la señal de audio de entrada del dominio del tiempo o la señal de audio de dominio de la frecuencia que representa la señal de audio de entrada del dominio del tiempo de modo que el elemento de determinación de modelado de envolvente (61) determina los coeficientes de modelado de envolvente (612) en base a la señal de audio del dominio de la frecuencia (62) de pasa alto y el procesador de banco de filtros (62) genera la pluralidad de señales pasabanda (622) en un dominio subbanda en base a la señal de audio del dominio de la frecuencia (62) de pasa alto, en donde el filtro pasa alto/pasa bajo (66) está configurado para filtrar por pasa bajo la señal de audio de entrada del dominio del tiempo o la señal de audio del dominio de la frecuencia que representan la señal de audio de entrada del dominio del tiempo para obtener una señal de audio de pasa bajo, en donde el combinador (64) está configurado para combinar la pluralidad de señales pasabanda del dominio subbanda que contienen la señal pasabanda de dominio de subbanda modificada y la señal de audio de pasa bajo para obtener una señal de audio del dominio del tiempo (642) o un proveedor de señal de banda completa (67) está configurado para combinar la señal de audio modelada (652) y la señal de audio de pasa bajo para obtener una señal de audio de banda completa.

11. Un aparato de acuerdo con una de las reivindicaciones 1 a 1, que comprende un elemento de determinación de fundamental y un elemento de determinación de sobretono, en donde el elemento de determinación de fundamental está configurado para seleccionar una señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda para obtener una señal pasabanda de la fundamental, en donde el elemento de determinación de sobretono está configurado para identificar una señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda que cumplen un criterio de sobretono con relación a la señal pasabanda de la fundamental seleccionada para obtener una señal pasabanda de sobretono asociada a la señal pasabanda de la fundamental seleccionada, en donde el procesador de señal (63) está configurado para modificar la señal pasabanda de la fundamental seleccionada en base a un blanco de modificación predefinido y configurado para modificar la señal pasabanda de sobretono identificada asociada con la señal pasabanda de la fundamental seleccionada dependiendo de la modificación de la señal pasabanda de la fundamental seleccionada.

12. Un aparato de acuerdo con la reivindicación 11, en donde cada señal pasabanda del dominio subbanda (622) comprende una frecuencia de la portadora, en donde el elemento de determinación de sobretono está configurado para comparar la frecuencia de la portadora de una señal pasabanda del dominio subbanda (622) de la pluralidad de señales pasabanda del dominio subbanda con la frecuencia de la portadora de la señal pasabanda de la fundamental seleccionada, en donde se cumple un criterio de sobretono, si la frecuencia de la portadora de la señal pasabanda del dominio subbanda (622) es un múltiplo de la frecuencia de la portadora de la señal pasabanda de la fundamental seleccionada con una tolerancia de frecuencia de la portadora predefinida.

13. Un procedimiento (11) para modificar una señal de audio, que comprende:

determinar (111) coeficientes de modelado de envolvente en base a una señal de audio del dominio de la frecuencia (62) que representa una señal de audio de entrada del dominio del tiempo;

generar (112) una pluralidad de señales pasabanda en un dominio subbanda en base a la señal de audio del dominio de la frecuencia;

modificar (113) una señal pasabanda del dominio subbanda de la pluralidad de señales pasabanda del dominio subbanda en base a un blanco de modificación predefinido;

combinar (114) por lo menos un subconjunto de la pluralidad de señales pasabanda del dominio subbanda para obtener una señal de audio del dominio del tiempo; y

modelar (115) una envolvente de la señal de audio del dominio del tiempo en base a los coeficientes de modelado de envolvente, modelar (115) una envolvente de la pluralidad de señales pasabanda del dominio subbanda que contiene la señal pasabanda del dominio subbanda modificada en base a los coeficientes de modelado de envolvente o moldear (115) una envolvente de la pluralidad de señales pasabanda del dominio subbanda en base los coeficientes de modelado de envolvente antes que la señal pasabanda de dominio subbanda sea modificada por el procesador de señal para obtener una señal de audio moldeada;

caracterizado por el hecho de que los coeficientes de modelado de envolvente (612) se determinan en base a una predicción sobre la frecuencia de la señal de audio del dominio de la frecuencia (62).

14. Un programa de computadora con un código de programa para ejecutar el procedimiento de acuerdo con la reivindicación 13, cuando el programa de computadora corre sobre un procesador de señal digital, una computadora o un microcontrolador.