Aparato, procedimiento y programa de ordenador para procesar una señal de audio.

Un aparato para procesar una señal de audio, que comprende:

un banco de filtros de análisis para g 5 enerar señales de subbanda de la señal de audio;



un manipulador de tiempo para manipular el tiempo individualmente de una pluralidad de señales de subbanda querepresentan la señal de audio, el manipulador de tiempo comprende:

una etapa de traslapar-agregar para superponer y adicionar bloques de al menos una de la pluralidad de señales desubbanda al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado paraextraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda;

un detector de transitorios para detectar un proceso transitorio en la señal de audio o la al menos una señal desubbanda de la pluralidad de señales de subbanda,

donde la etapa de traslapar-agregar se configura para reducir una influencia de un proceso transitorio detectado opara no usar los procesos transitorios detectados en una manera individual mediante subbanda al añadir mediante laetapa de traslapar-agregar; y

un circuito sumador de transitorios para adicionar un proceso transitorio detectado a la al menos una señal desubbanda generada por la etapa de traslapar-agregar en una manera individual mediante subbanda.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/053303.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: DISCH,SASCHA, NAGEL,Frederik, WILDE,STEPHAN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
  • G10L19/025 G10L 19/00 […] › Detección de transitorios o accesos para la conmutación de la resolución de tiempo y frecuencia.
  • G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
  • G10L21/038 G10L 21/00 […] › utilizando técnicas de extensión de banda.
  • G10L21/04 G10L 21/00 […] › Compresión o expansión temporales.

PDF original: ES-2449476_T3.pdf

 

Aparato, procedimiento y programa de ordenador para procesar una señal de audio.

Fragmento de la descripción:

Aparato, procedimiento y programa de ordenador para procesar una señal de audio Descripción de la Invención [0001] La velocidad de la repetición de señales de audio puede cambiarse al mantener el tono, por ejemplo con la ayuda de un codificador de señales vocales en fases (ver por ejemplo J. L. Flanagan y R. M. Golden, “The Bell System Technical Journal”, Noviembre 1966, páginas 1394 a1509; Patente Estadounidense Núm. 6, 549, 884 Laroche, J. & Dolson, M.: “Phase-vocoder pitch-shifting”; Jean Laroche y Mark Dolson, “New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing And Other Exotic Effects", Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, Nueva York, 17-20 de octubre, 1999) . Del mismo modo, con tal transposición de procedimientos de la señal puede llevarse a cabo al mantener la duración de la repeticiónoriginal. Éste se obtiene al volver a jugar la señal estirada acelerada por el factor del estiramiento del tiempo. Representación de la señal a tiempo individual, esto corresponde al submuestreo de la señal por el factor que se estira al mantener la frecuencia de muestreo. Convencionalmente, esta vez el estiramiento ocurre en el dominio temporal. Alternativamente, lo mismo también puede ocurrir dentro de un banco de filtros, como un banco de filtros del espejo de la pseudocuadratura (pQMF, por sus siglas en inglés) . El banco de filtros del espejo de la pseudocuadratura (pQMF) es a veces también llamado un banco de filtros QMF.

Los desafíos específicos en el estiramiento son episodios transitorios que "se enturbian" a tiempo durante la etapa que procesa del estiramiento del tiempo. Esto ocurre porque los procedimientos, como el codificador de señales vocales en fases, afectan las llamadas propiedades de la coherencia verticales (en cuanto a una representación del espectrograma de frecuencia del período de tiempo) de la señal.

Algunos procedimientos actuales estiran el período de tiempo más alrededor de los procesos transitorios, a fin de no tener que llevar a cabo cualquier o sólo poco estiramiento del tiempo durante la duración del proceso transitorio. Esto se ha descrito, por ejemplo, en:

-Laroche L., Dolson M.: Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332

-Emmanuel Ravelli, Mark Sandler y Juan P. Bello: Fast implementation for non-linear time-scaling of stereo audio; Proc. of the 8th Int. Conference on Digital Audio Effects (DAFx’05) , Madrid, España, Septiembre 20-22, 2005

-Duxbur y , C., M. Davies, y M. Sandler (2001, Diciembre) . Separation of transient information in musical audio using multi resolution analysis techniques. In Proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX01) , Limerick, Irlanda.

Otro documento sobre el tema se escribió por Röbel, A.: A NEW APPROACH TO TRANSIENT PROCESSING IN THE PHASE VOCODER ; Proc. of the 6a Int. Conference on Digital Audio Effects (DAFx-03) , Londres, RU, 8-11 de septiembre, 2003.

En el estiramiento del tiempo de señales de audio por codificadores de señales vocales en fases, las porciones de la señal transitorias son "enturbiadas" por dispersiones, ya que la llamada coherencia vertical en la vista del espectrograma de la señal se afecta. Los procedimientos que funcionan con el llamado traslapo - adicionan que los procedimientos pueden generar falso pre resuena y los ecos postales de los episodios de sonido de transitorios. Estos problemas pueden manejarse al cambiar el estiramiento del tiempo en el ambiente de procesos transitorios, ningún estiramiento durante los procesos transitorios actuales y estiramiento más concentrado en rodear. Si, sin embargo, la transposición es que ocurren, el factor de transposición ya no será constante en el ambiente de los procesos transitorios, es decir el tono de sobrepuesto (posiblemente tonal) cambios de porciones de la señal de una manera falsamente audible. Cuando el estiramiento del tiempo ocurre dentro de un banco de filtros, como el pQMF, los problemas similares ocurren.

El campo de esta solicitud se relaciona con un procedimiento para el manejo perceptivamente motivado de episodios de sonido de transitorios dentro de tal proceso. En términos particulares, los episodios de sonido de transitorios pueden retirarse durante la manipulación de la señal del estiramiento del tiempo. Posteriormente, una adición que se ajusta exactamente puede llevarse a cabo de la porción de la señal transitoria no procesada a la señal (estirada) cambiada bajo la consideración del estiramiento.

NAGEL FREDERIK ET AL: "A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs", 126th AES CONVENTION, May 2009, describe un procedimiento de extension de ancho de banda llevado por un codificador de voz de fase en el que se realizan un único recorte de transitorio y una operación de grabación para toda la señal de audio.

WO 2009/112141 A1 (FRAUNHOFER GES FORSCHUNG [DE]; DISCH SASCHA [DE]; NAGEL FREDRIK [DE]) , 17 Septiembre 2009 (2009-09-17) , también describe un esquema de codificador de voz para una modificación de escala de tiempo/ extensión de ancho de banda mediante el cual también se detectan transitorios y se eliminan de toda la señal de audio antes de una etapa de procesamiento de señal de frecuencia selectiva. Entonces se realiza una reinserción de transitorio en toda la señal de audio procesada tras el procesamiento de frecuencia selectiva.

Según la invención, se proporcionan un aparato, un procedimiento y un programa de ordenador en las reivindicaciones 1, 15 y 16 respectivamente.

Según modalidades relacionadas, el aparato puede comprender además un eliminador para diezmar la señal de audio o la pluralidad de señales de audio. El manipulador de tiempo puede configurarse para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.

Según otra modalidad, el detector de transitorios puede configurarse para marcar bloques detectados conforme comprenden un proceso transitorio; y donde la pluralidad de etapas de traslapar-agregar se configura para ignorar los bloques marcados.

Según otra modalidad, la pluralidad de etapas de traslapar-agregar puede configurarse para aplicar un superponer-valor-agregado que es mayor que un valor de extracción del bloque para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.

Según otra modalidad, el manipulador de tiempo puede comprender además un extractor del bloque, un ajustador de fase/intervalo de tiempo y una calculadora de fases para calcular una fase, basada en que el ajustador de fase/intervalo de tiempo lleva a cabo el ajuste de un bloque extraído.

Según otra modalidad, el circuito sumador de transitorios puede configurarse adicionalmente para insertar una porción de la señal de subbanda que tiene al proceso transitorio, donde la longitud de la porción se selecciona de longitud suficiente, tal que una atenuación cruzada de la salida de la señal de la porción que tiene al proceso transitorio a la salida del traslapo-adición-procesamiento es posible.

Según una modalidad relacionada, el circuito sumador de transitorios puede configurarse para llevar a cabo la operación de atenuación cruzada.

Según otra modalidad, el detector de transitorios puede configurarse para detectar bloques extraídos por un extractor del bloque de la señal de subbanda que tiene una característica transitoria. La etapa de traslapar-agregar puede configurarse adicionalmente para reducir una influencia de los bloques detectados o para no usar los bloques detectados al añadir.

Según otra modalidad, el detector de transitorios puede configurarse para llevar a cabo un cálculo del movimiento del centro de gravedad de la energía a través de un período de tiempo predeterminado de una señal para introducirse en un banco de filtros de análisis o una señal de subbanda.

La determinación exacta de la posición del proceso transitorio para la selección de una sección apropiada, puede llevarse a cabo, por ejemplo, con la ayuda de un cálculo del centroide móvil de la energía a través de un período del tiempo adecuado. La determinación En términos particulares, transitoria puede llevarse a cabo en una manera selectiva por la frecuencia dentro de un banco de filtros. Además, el período de tiempo de la sección puede seleccionarse como un valor constante o en una manera variable basada en la información de la determinación transitoria.

Según otra modalidad, el aparato puede comprender además una delmación configurada en un lado del ingreso o un lado de salida del... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato para procesar una señal de audio, que comprende:

un banco de filtros de análisis para generar señales de subbanda de la señal de audio; un manipulador de tiempo para manipular el tiempo individualmente de una pluralidad de señales de subbanda que representan la señal de audio, el manipulador de tiempo comprende:

una etapa de traslapar-agregar para superponer y adicionar bloques de al menos una de la pluralidad de señales de subbanda al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda; un detector de transitorios para detectar un proceso transitorio en la señal de audio o la al menos una señal de subbanda de la pluralidad de señales de subbanda, donde la etapa de traslapar-agregar se configura para reducir una influencia de un proceso transitorio detectado o para no usar los procesos transitorios detectados en una manera individual mediante subbanda al añadir mediante la etapa de traslapar-agregar; y un circuito sumador de transitorios para adicionar un proceso transitorio detectado a la al menos una señal de subbanda generada por la etapa de traslapar-agregar en una manera individual mediante subbanda.

2. Un aparato según la reivindicación 1, que comprende además una delmación para diezmar la señal de audio o la pluralidad de señales de subbanda, donde el manipulador de tiempo se configura para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.

3. Un aparato según la reivindicación 1, donde el detector de transitorios se configura para marcar bloques detectados conforme comprenden un proceso transitorio en una manera individual mediante subbanda; y donde la etapa de traslapar-agregar se configura para ignorar los bloques marcados.

4. Un aparato según una de las reivindicaciones precedentes, donde la etapa de traslapar-agregar se configura para aplicar un valor de traslapo-agregar-avance que es mayor que un valor del bloque-extracción-avance para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.

5. Un aparato según una de las reivindicaciones precedentes, donde el manipulador de tiempo comprende además:

un extractor del bloque; un ajustador de fase/intervalo de tiempo; y una calculadora de fases para calcular una fase, basado en que el ajustador de fase/intervalo de tiempo lleva a cabo el ajuste de la fase de un bloque extraído.

6. Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para determinar una longitud de una porción de la señal de subbanda que contiene al proceso transitorio, la longitud iguala la longitud de la señal a insertarse mediante el circuito sumador de transitorios.

7. Un aparato según una de las reivindicaciones precedentes, donde el circuito sumador de transitorios se configura para insertar una porción de la señal de subbanda que tiene al proceso transitorio, donde la longitud de la porción se selecciona de longitud suficiente, tal que sea posible una atenuación cruzada de la salida de la señal del traslapoadición-procesamiento a la porción que tiene al proceso transitorio o de la porción que tiene al proceso transitorio a la salida del traslapo-adición-procesamiento.

8. Un aparato según la reivindicación 7, donde el circuito sumador de transitorios se configura para llevar a cabo la operación de atenuación cruzada.

9. Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para detectar bloques extraídos por un extractor del bloque de la señal de subbanda que tiene una característica transitoria.

10. Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para llevar a cabo un cálculo del movimiento del centro de gravedad de una energía a través de un período de tiempo predeterminado de una señal para introducirse en un banco de filtros de análisis o una señal de subbanda.

11. Un aparato según la reivindicación 1, que comprende además una delmación configurada en un lado del ingreso

o a un lado de la salida del banco de filtros de análisis, donde el manipulador de tiempo se configura para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.

12. El aparato según una de las reivindicaciones 1 a 9, que comprende además:

un segundo banco de filtros de análisis; un remuestreo río arriba del segundo banco de filtros de análisis; y una pluralidad de codificadores de señales vocales en fases para una segunda pluralidad de la salida de señales de subbanda por el segundo banco de filtros de análisis, la pluralidad de codificadores de señales vocales en fases tiene un factor de extensión de la anchura de banda mayor que uno, donde una salida del codificador de señales vocales en fases se proporciona a la etapa de traslapar-agregar.

13. Un aparato según la reivindicación 12, que comprende además una etapa de conexión entre el primer banco de filtros de análisis y la pluralidad de codificadores de señales vocales en un lado del ingreso de la etapa de conexión y la etapa de traslapar-agregar en un lado de salida de la etapa de conexión, la etapa de conexión que se configura para controlar una condición de los bloques de la correspondiente una pluralidad de señales de subbanda y codificador de señales de bloques procesados por sintetizado vocal en fases por la pluralidad de codificadores de señales vocales en fases a la etapa de traslapar-agregar.

14. Un aparato según una de las reivindicaciones precedentes, que comprende además: una corrección de amplitud configurada para compensar efectos de afectación de amplitud de diversos bloques incluye el contexto de la etapa de traslapar-agregar.

15. Procedimiento para procesar una señal de audio, que comprende:

generar una pluralidad de señales de subbanda de la señal de audio; superponer y adicionar bloques de la correspondiente pluralidad de señales de subbanda que representan la señal de audio al usar un valor de traslapo-agregar-avance diferente de un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda; detectar un proceso transitorio en la al menos una señal de subbanda de la pluralidad de señales de subbanda; ya sea reducir una influencia o desechar un proceso transitorio detectado al superponerse y añadir en una manera individual mediante subbanda; adicionar un proceso transitorio detectado a la al menos una señal de subbanda generada por la acción de traslapo y adición en una manera individual mediante subbanda.

16. Un programa informático para llevar a cabo un procedimiento para procesar una señal de audio cuando el programa informático se ejecute en una computadora, el procedimiento comprende:

generar una pluralidad de señales de subbanda de la señal de audio; superponer y adicionar bloques correspondientes de la pluralidad de señales de subbanda que representan la señal de audio al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de entre la pluralidad de señales de subbanda; detectar un proceso transitorio en la al menos una señal de subbanda de la pluralidad de señales de subbanda; ya sea reducir una influencia o desechar un proceso transitorio detectado al superponerse y añadir de manera individual mediante subbanda; adicionar un proceso transitorio detectado, a la al menos una señal de subbanda generada mediante la acción de traslapo y adición de una manera individual mediante subbanda.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .