DISPOSITIVO Y MÉTODO PARA MANIPULAR UNA SEÑAL DE AUDIO.

Aparato para manipular una señal (100) de audio, que comprende:

un divisor (102) en ventanas para generar una pluralidad (111; 811) de bloques consecutivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques consecutivos al menos un bloque (103; 803; 141-1; 902) rellenado de muestras de audio, teniendo el bloque (103; 803; 141-1; 902) rellenado valores rellenados y valores de señal de audio; un primer convertidor (104) para convertir el bloque (103; 803; 141-1; 902) rellenado en una representación (105) espectral que tiene valores espectrales; un modificador (106) de fase para modificar fases de los valores espectrales para obtener una representación (107) espectral modificada; y un segundo convertidor (108) para convertir la representación (107) espectral modificada en una señal (109) de audio en el dominio del tiempo modificada, estando configurado el aparato para ejecutar un algoritmo de extensión de ancho de banda, comprendiendo el algoritmo de extensión de ancho de banda un factor de extensión de ancho de banda (σ), controlando el factor de extensión de ancho de banda (σ) un desplazamiento de frecuencia entre una banda (113-1, 113-2, 113-3, ....) de la señal (100) de audio y una banda (125-1, 125-2, 125-3, ...) de frecuencia objetivo, estando configurado el modificador (106) de fase para ajustar a escala las fases de valores espectrales de la banda (113-1, 113-2, 113-3, ...) de la señal (100) de audio por el factor de extensión de ancho de banda (σ), de modo que al menos una muestra de un bloque consecutivo de muestras de audio se convoluciona cíclicamente en el bloque, y comprendiendo el aparato adicionalmente un detector (134) de transitorios para determinar un evento (700, 701, 702, 703, 705, 707) transitorio en la señal (100) de audio, estando configurado el primer convertidor (104) para convertir el bloque (103; 803; 141-1; 902) rellenado, cuando el transitorio (134) detecta el evento (700, 701, 702, 703, 705, 707) transitorio en un bloque (133-1; 135-1) de la señal (100) de audio correspondiente al bloque (103; 803; 141-1; 902) rellenado, y estando configurado el primer convertidor (104) para convertir un bloque (133-2; 135-2; 141-2; 930) no rellenado que tiene sólo valores de señal de audio, correspondiendo el bloque (133-2; 135-2; 141-2; 930) no rellenado al bloque de la señal (100) de audio, cuando el transitorio (700, 701, 702, 703, 705, 707) no se detecta en el bloque

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09013051.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: DISCH,SASCHA, NEUENDORF,Max, NAGEL,Frederik, Helmrich,Christian, Zorn,Dominik.

Fecha de Publicación: .

Fecha Solicitud PCT: 15 de Octubre de 2009.

Clasificación PCT:

  • G10L19/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
  • G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2374486_T3.pdf

 


Fragmento de la descripción:

La presente invención se refiere a un esquema para manipular una señal de audio modificando fases de valores espectrales de la señal de audio tal como dentro de un esquema de extensión de ancho de banda (BWE). 5 En Faller, C. et al.: Efficient Representation of Spatial Audio Using Perceptual Parametrization, Applications of Signal Processing to Audio and Acoustics, 2001 IEEE Workshop del 21-24 de octubre del 2001, Piscataway, N.J., USA, págs. 199-202, XP010566909, se describe un esquema para la colocación simultánea de varias fuentes en el espacio auditivo. El esquema se basa en una suposición acerca de la relevancia de indicaciones de ubicación en diferentes bandas críticas. Dada la señal de suma de varias fuentes, es decir una señal monofónica, y un conjunto de parámetros 10 (información secundaria) el esquema puede generar una señal binaural colocando en el espacio las fuentes contenidas en la señal monofónica. Potenciales aplicaciones para el esquema son la realización de conferencias de sobremesa con múltiples hablantes y la codificación de audio. El documento WO 2007/016107 A2 da a conocer un método de codificación de audio en el que un codificador recibe una pluralidad de canales de entrada y genera uno o más canales de salida de audio y uno o más parámetros que 15 describen las relaciones espaciales deseadas entre una pluralidad de canales de audio que pueden derivarse del uno o más canales de salida de audio. El método comprende detectar cambios en características de señal con respecto al tiempo en uno o más de la pluralidad de canales de entrada de audio, identificar como límites de evento auditivo cambios en características de señal con respecto al tiempo en el uno o más de la pluralidad de canales de entrada de audio, un segmento de audio entre límites consecutivos que constituyen un evento auditivo en el canal o canales, y 20 generar todos o algunos de los uno o más parámetros al menos parcialmente en respuesta a los eventos auditivos y/o al grado de cambio en las características de señal asociadas con los límites de evento auditivo. También se da a conocer un método de mezclado ascendente o mezclador ascendente de audio sensible al evento auditivo. El documento US 6.549.884 B1 da a conocer un sistema para la modulación de tono de una señal de audio en el que se realiza un nuevo muestreo en el dominio de frecuencia. El sistema incluye un método para la modulación de tono de una 25 señal convirtiendo la señal a una representación del dominio de frecuencia e identificando entonces una región específica en la representación del dominio de frecuencia. La región está ubicada en una primera ubicación de frecuencia. A continuación, la región se desplaza a una segunda ubicación de frecuencia para formar una representación del dominio de frecuencia ajustada. Finalmente, la representación del dominio de frecuencia ajustada se transforma a una señal en el dominio del tiempo que representa la señal de entrada con tono modulado. 30 En Disch, S. et al.: An Amplitude- and Frequency- Modulation Vocoder for Audio Signal Processing, Proc. 11th International Conference on Digital Audio Effects (DAFX-08), 1 de septiembre del 2008, págs. 1-7, XP002574848, se describe un método de análisis/síntesis que proporciona medios apropiados para reducir las diferencias entre procesamiento de audio de forma de onda y paramétrico posibilitando una transición sin interrupción entre ambos enfoques. 35 Con frecuencia el almacenamiento o transmisión de señales de audio se somete a restricciones estrictas de tasa de bits. En el pasado, se forzó a los codificadores a reducir drásticamente el ancho de banda de audio transmitido cuando estaba disponible sólo una tasa de bits muy baja. En la actualidad, códecs de audio de módem pueden codificar señales de banda ancha usando métodos de extensión de ancho de banda, tal como se describe en M. Dietz, L. Liljeryd, K. Kjörling y O. Kunz, Spectral Band Replication, a novel approach in audio coding, en 112th AES Convention, Munich, mayo del 2002; S. Meltzer, R. Böhm y F. Henn, SBR enhanced audio codecs for digital broadcasting such as Digital 40 Radio Mondiale (DRM), en 112th AES Convention, Munich, mayo del 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm, en 112th AES Convention, Munich, mayo del 2002; International Standard ISO/IEC 14496-3:2001/FPDAM 1, Bandwidth extension, ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al.; E. Larsen, R. M. Aarts, y M. Danessis. Efficient high-frequency bandwidth extension of music and speech. En AES 112th Convention, Munich, Alemania, mayo del 2002; 45 R. M. Aarts, E. Larsen y O. Ouweltjes. A unified approach to low-and high frequency bandwidth extension. En AES 115th Convention, Nueva York, Estados Unidos, octubre del 2003; K. Käyhkö. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001; E. Larsen y R. M. Aarts. Audio Bandwidth Extension- Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004; E. Larsen, R. M. Aarts y M. Danessis. Efficient 50 high-frequency bandwidth extension of music and speech. En AES 112th Convention, Munich, Alemania, mayo del 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU- 21(3), junio de 1973; solicitud de patente estadounidense 08/951.029, Ohmori, et al. Audio band width extending system and method y patente estadounidense 6895375, Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech. Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF), que se 55 genera a partir de la parte de baja frecuencia (LF) codificada de forma de onda de la señal decodificada por medio de transposición en la región espectral de HF (parcheado) y aplicación de un posprocesamiento controlado por parámetros. Recientemente, un nuevo algoritmo que emplea vocodificador de fase como se describe, por ejemplo, en M. Puckette. 2 Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995., Röbel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html; Laroche L., Dolson M.: Improved phase vocoder timescale modification of audio, IEEE Trans. Speech and Audio Processing, vol. 7, n.º 3, págs. 323-332 y la patente estadounidense 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting for the patch generation, se ha presentado en Frederik Nagel, Sascha Disch, A harmonic bandwidth extension method 5 for audio codecs, ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwán, abril del 2009. Sin embargo, este método denominado harmonic bandwidth extension (HBE) es propenso a degradaciones de calidad de transitorios contenidos en la señal de audio, tal como se describe en Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs, 126th AES Convention, Munich, Alemania, mayo del 2009, puesto que no se garantiza que la 10 coherencia vertical sobre subbandas se conserve en el algoritmo de vocodificador de fase convencional y, además, el nuevo cálculo de las fases de transformada discreta de Fourier (DFT) debe realizarse en bloques de tiempo aislados de una transformación que supone implícitamente periodicidad circular. Se conoce que pueden observarse específicamente dos clases de artefactos debido al procesamiento de vocodificador de fase basado en bloque. Éstas, en particular, son la dispersión de la forma de onda y el solapamiento (aliasing) 15 temporal debido a efectos de convolución cíclica temporales de la señal debido a la aplicación de fases nuevamente calculadas. En otras palabras, debido a la aplicación de una modificación de fase en los valores espectrales de la señal de audio en el algoritmo de BWE, un transitorio contenido en un bloque de la señal de audio puede envolverse alrededor del bloque, 20 es decir convolucionarse cíclicamente de vuelta al bloque. Esto da como resultado solapamiento temporal y, por consiguiente, lleva a una degradación de la señal de audio. Por tanto, deben emplearse métodos para un tratamiento especial para partes de señal que contienen transitorios. Sin embargo, puesto que especialmente se ejecuta el algoritmo de BWE en el lado de decodificador de una cadena de códec, la complejidad computacional es un tema importante. Por consiguiente, las medidas contra la degradación de señal de audio recién mencionadas no deben realizarse a costa de una complejidad computacional muy aumentada. El objeto de... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato para manipular una señal (100) de audio, que comprende: un divisor (102) en ventanas para generar una pluralidad (111; 811) de bloques consecutivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques consecutivos al menos un bloque (103; 803; 141-1; 902) rellenado de muestras de audio, teniendo el bloque (103; 803; 141-1; 902) rellenado valores rellenados y valores de señal de audio; un primer convertidor (104) para convertir el bloque (103; 803; 141-1; 902) rellenado en una representación (105) espectral que tiene valores espectrales; un modificador (106) de fase para modificar fases de los valores espectrales para obtener una representación (107) espectral modificada; y un segundo convertidor (108) para convertir la representación (107) espectral modificada en una señal (109) de audio en el dominio del tiempo modificada, estando configurado el aparato para ejecutar un algoritmo de extensión de ancho de banda, comprendiendo el algoritmo de extensión de ancho de banda un factor de extensión de ancho de banda (), controlando el factor de extensión de ancho de banda () un desplazamiento de frecuencia entre una banda (113-1, 113-2, 113-3, ....) de la señal (100) de audio y una banda (125-1, 125-2, 125-3, ...) de frecuencia objetivo, estando configurado el modificador (106) de fase para ajustar a escala las fases de valores espectrales de la banda (113-1, 113-2, 113-3, ...) de la señal (100) de audio por el factor de extensión de ancho de banda (), de modo que al menos una muestra de un bloque consecutivo de muestras de audio se convoluciona cíclicamente en el bloque, y comprendiendo el aparato adicionalmente un detector (134) de transitorios para determinar un evento (700, 701, 702, 703, 705, 707) transitorio en la señal (100) de audio, estando configurado el primer convertidor (104) para convertir el bloque (103; 803; 141-1; 902) rellenado, cuando el transitorio (134) detecta el evento (700, 701, 702, 703, 705, 707) transitorio en un bloque (133-1; 135-1) de la señal (100) de audio correspondiente al bloque (103; 803; 141-1; 902) rellenado, y estando configurado el primer convertidor (104) para convertir un bloque (133-2; 135-2; 141-2; 930) no rellenado que tiene sólo valores de señal de audio, correspondiendo el bloque (133-2; 135-2; 141-2; 930) no rellenado al bloque de la señal (100) de audio, cuando el transitorio (700, 701, 702, 703, 705, 707) no se detecta en el bloque. 2. Aparato según la reivindicación 1, que comprende además: un diezmador (120) para diezmar la señal (109) de audio en el dominio del tiempo modificada o bloques sumados por solapamiento de muestras de audio en el dominio del tiempo modificadas para obtener una señal (121) en el dominio del tiempo diezmada, en el que una característica de diezmado depende de una característica de modificación de fase aplicada por el modificador (106) de fase. 3. Aparato según la reivindicación 2, que está adaptado para realizar una extensión de ancho de banda usando la señal (100) de audio, que comprende además: un filtro (114) paso banda para extraer una señal (113) paso banda de la representación (105) espectral o de la señal (100) de audio, en el que se selecciona una característica paso banda del filtro (114) paso banda dependiendo de una característica de modificación de fase aplicada por el modificador (106) de fase, de modo que la señal (113) paso banda se transforma mediante un procesamiento posterior a un intervalo (125-1, 125-2, 125-3) de frecuencia objetivo no incluido en la señal (100) de audio. 4. Aparato según la reivindicación 2, que comprende además: un sumador (124) por solapamiento para sumar bloques (121-1, 121-2, 121-3) en solapamiento de muestras de audio diezmadas o muestras de audio en el dominio del tiempo modificadas para obtener una señal (125) en un intervalo (125-1, 125-2, 125-3) de frecuencia objetivo de un algoritmo de extensión de ancho de banda. 5. Aparato según la reivindicación 4, que comprende además: un ajustador (116) a escala para ajustar a escala los valores espectrales por un factor, dependiendo el factor de una característica de suma por solapamiento en la medida en que se tiene en cuenta una relación entre la primera distancia de tiempo (a) para una suma por solapamiento aplicada por el divisor (102) en ventanas y una distancia de tiempo (b) diferente aplicada por el sumador (124) por solapamiento y las características de ventana. 14   6. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas comprende: un procesador (110; 102-1, 102-2; 140) de ventana de análisis para generar una pluralidad (111; 811) de bloques consecutivos que tienen el mismo tamaño; y un rellenador (112; 102-3) para rellenar un bloque (133-1; 135-1) de la pluralidad (111; 811) de bloques consecutivos de muestras de audio para obtener el bloque (103; 803; 141-1; 902) rellenado insertando valores rellenados en posiciones temporales específicas antes de una primera muestra (708) de un bloque (133-1; 135- 1; 704) consecutivo de muestras de audio o después de una última muestra (710) del bloque (133-1; 135-1; 704) consecutivo de muestras de audio. 7. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas está configurado para insertar valores rellenados en posiciones temporales específicas antes de una primera muestra (708) de un bloque (133-1; 135-1; 704) consecutivo de muestras de audio o después de una última muestra (710) del bloque (133- 1; 135-1; 704) consecutivo de muestras de audio, comprendiendo el aparato adicionalmente: un eliminador (118) de relleno para eliminar muestras en posiciones temporales de la señal (109) de audio en el dominio del tiempo modificada, correspondiendo las posiciones temporales a las posiciones temporales especificadas aplicadas por el divisor (102) en ventanas. 8. Aparato según la reivindicación 1 ó 2, que comprende además: un divisor (122) en ventanas de síntesis para dividir en ventanas la señal (121) en el dominio del tiempo diezmada o la señal (109) de audio en el dominio del tiempo modificada que tiene una función de ventana de síntesis coincidente con una función de análisis aplicada por el divisor (102) en ventanas. 9. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas está configurado para insertar valores rellenados en posiciones temporales específicas antes de una primera muestra (708) de un bloque (133-1; 135-1; 704) consecutivo de muestras de audio o después de una última muestra (710) del bloque (133- 1; 135-1; 704) consecutivo de muestras de audio, en el que una suma de varios valores rellenados y varios valores en el bloque (133-1; 135-1; 704) consecutivo de muestras de audio es al menos 1,4 veces el número de valores en el bloque (133-1; 135-1; 704) consecutivo de muestras de audio. 10. Aparato según la reivindicación 7, en el que el divisor (102) en ventanas está configurado para insertar simétricamente los valores rellenados antes de la primera muestra (708) del bloque (133-1; 135-1; 704) consecutivo de muestras de audio y después de la última muestra (710) del bloque (133-1; 135-1; 704) consecutivo centrado de muestras de audio, de modo que el bloque (103; 803; 141-1; 902) rellenado está adaptado para una conversión por el primer convertidor (104) y el segundo convertidor (108). 11. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas está configurado para aplicar una función (709; 902) de ventana que tiene al menos una zona (712, 714; 910, 920; 940, 950) de guarda en la posición (718; 901) inicial de la función (709; 902) de ventana o en la posición (720; 903) final de la función (709; 902) de ventana. 12. Aparato según la reivindicación 2, estando configurado el aparato para ejecutar un algoritmo de extensión de ancho de banda, comprendiendo el algoritmo de extensión de ancho de banda un factor de extensión de ancho de banda (), controlando el factor de extensión de ancho de banda () un desplazamiento de frecuencia entre una banda (113-1, 113,-2, 113-3, ...) de la señal (100) de audio y una banda (125-1, 125-2, 125-3, ...) de frecuencia objetivo, estando configurados el primer convertidor (104), el modificador (106) de fase, el segundo convertidor (108) y el diezmador (120) para operar usando diferentes factores de extensión de ancho de banda (), de modo que se obtienen diferentes señales (121-1, 121-2, 121-3, ...) de audio temporales modificadas que tienen diferentes bandas (125-1, 125-2, 125-3, ...) de frecuencia objetivo, comprendiendo además un sumador (124) por solapamiento para realizar una suma por solapamiento basándose en los diferentes factores de extensión de ancho de banda (), y un combinador (126) para combinar resultados (125-1, 125-2, 125-3, ...) de suma por solapamiento para obtener una señal (127) combinada que comprende las diferentes bandas (125-1, 125-2, 125-3) de frecuencia objetivo. 13. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas comprende: un rellenador (112; 102-3) para insertar valores rellenados en posiciones temporales específicas antes de una primera muestra (708) de un bloque (133-1; 135-1; 704) consecutivo de muestras de audio o después de una última muestra (710) del bloque (133-1; 135-1; 704) consecutivo de muestras de audio, comprendiendo el aparato adicionalmente:   un conmutador (136) que está controlado por el detector (134) de transitorios, estando configurado el conmutador (136) para controlar el rellenador (112; 102-3) de modo que se genera un bloque (103; 803) rellenado cuando se detecta un evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios, teniendo el bloque (103; 803) rellenado valores rellenados y valores de señal de audio, y para controlar el rellenador (112; 102-3), de modo que se genera un bloque (133-2; 135-2) no rellenado cuando no se detecta el evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios, teniendo el bloque (133-2; 135-2) no rellenado sólo valores de señal de audio, comprendiendo el primer convertidor (104) un primer subconvertidor (138-1) y un segundo subconvertidor (138- 2), estando configurado el conmutador (136) adicionalmente para alimentar el bloque (103; 803) rellenado al primer subconvertidor (138-1) para realizar una conversión que tiene una primera longitud de conversión cuando se detecta el evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios y para alimentar el bloque (133-2; 135-2) no rellenado al segundo subconvertidor (138-2) para realizar una conversión que tiene una segunda longitud más corta que la primera longitud cuando no se detecta el evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios. 14. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas comprende un procesador (110; 102-1, 102-2; 140) de ventana de análisis para aplicar una función de ventana de análisis a un bloque (139-1, 139-2) consecutivo de muestras de audio, pudiendo controlarse el procesador de ventana de análisis de modo que la función de ventana de análisis comprende una zona (712, 714; 910, 920; 940, 950) de guarda en una posición (718; 901) inicial de la función (709; 902) de ventana o una posición (720; 903) final de la función (709; 902) de ventana, comprendiendo el aparato adicionalmente: un conmutador (142) de ventana de guarda que está controlado por el detector (134) de transitorios, estando configurado el conmutador (142) de ventana de guarda para controlar el procesador (110; 102-1, 102-2; 140) de ventana de análisis, de modo que se genera un bloque (141-1; 902) rellenado de un bloque consecutivo de muestras de audio mediante el uso de la función de ventana de análisis que comprende la zona de guarda, teniendo el bloque (141-1; 902) rellenado valores rellenados y valores de señal de audio cuando se detecta un evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios, y para controlar el procesador (102-1, 102-2; 140) de ventana de análisis, de modo que se genera un bloque (141-2; 930) no rellenado, teniendo el bloque (141-2; 930) no rellenado sólo valores de señal de audio, cuando no se detecta el evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios, comprendiendo el primer convertidor (104) un primer subconvertidor (138-1) y un segundo subconvertidor (138- 2), estando configurado el conmutador (142) de ventana de guarda además para alimentar el bloque (141-1; 902) rellenado al primer subconvertidor (138-1) para realizar una conversión que tiene una primera longitud de conversión cuando se detecta un evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios y para alimentar el bloque (141-2; 930) no rellenado al segundo subconvertidor (138-2) para realizar una conversión que tiene una segunda longitud más corta que la primera longitud cuando no se detecta el evento (700, 701, 702, 703, 705, 707) transitorio por el detector (134) de transitorios. 15. Aparato según la reivindicación 4 ó 12, que comprende además: un ajustador (130) de envolvente para ajustar la envolvente de la señal (125) en un intervalo (125-1, 125-2, 125-3) de frecuencia objetivo o la señal (129) combinada basándose en parámetros (101) transmitidos para obtener una señal (129) corregida; y un combinador (132) adicional para combinar la señal (100; 102-1) de audio y la señal (129) corregida para obtener una señal (131) manipulada extendida en ancho de banda. 16. Aparato según la reivindicación 1, en el que el divisor (102) en ventanas está configurado para generar una pluralidad (111; 811) de bloques consecutivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques consecutivos al menos un primer par (145-1) de un bloque (133-2; 135-2; 141-2; 930) no rellenado y un bloque (103; 803; 141-1; 902) rellenado consecutivo y un segundo par (145-2) de un bloque (103; 803; 141-1; 902) rellenado y un bloque (133-2; 135-2; 141-2; 930) no rellenado consecutivo, comprendiendo el aparato adicionalmente: un diezmador (120) para diezmar las muestras de audio en el dominio del tiempo modificadas o bloques sumados por solapamiento de muestras de audio en el dominio del tiempo modificadas del primer par (145-1) para obtener las muestras (147-1) de audio diezmadas del primer par (145-1) o para diezmar las muestras de audio en el dominio del tiempo modificadas o bloques sumados por solapamiento de muestras de audio en el dominio del tiempo modificadas del segundo par (145-2) para obtener las muestras (147-2) de audio diezmadas del segundo par (145-2), y 16   un sumador (124) por solapamiento, estando configurado el sumador (124) por solapamiento para sumar bloques en solapamiento de las muestras (147-1, 147-2) de audio diezmadas o muestras de audio en el dominio del tiempo modificadas del primer par (145-1) o del segundo par (145-2), en el que para el primer par (145-1) la distancia de tiempo (b) entre una primera muestra (151) del bloque (133-2; 135-2; 141-2; 930) no rellenado y una primera muestra (153) de los valores de señal de audio del bloque (103; 803141-1; 902) rellenado se suministra mediante el sumador (124) por solapamiento, o en el que para el segundo par (145-2) una distancia de tiempo (b) entre una primera muestra (153) de los valores de señal de audio del bloque (103; 803; 141-1; 902) rellenado y una primera muestra (157) del bloque (133-2; 135-2; 141-2; 930) no rellenado se suministra mediante el sumador (124) por solapamiento, para obtener una señal en un intervalo de frecuencia objetivo del algoritmo de extensión de ancho de banda. 17. Método para manipular una señal de audio, que comprende: generar (102) una pluralidad (111; 811) de bloques consecutivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques consecutivos al menos un bloque (103; 803) rellenado de muestras de audio, teniendo el bloque (103; 803) rellenado valores rellenados y valores de señal de audio; convertir (104) el bloque (103; 803) rellenado en una representación espectral que tiene valores espectrales; modificar (106) fases de los valores espectrales para obtener una representación (107) espectral modificada; y convertir (108) la representación (107) espectral modificada en una señal (109) de audio en el dominio del tiempo (105) modificada, ejecutar un algoritmo de extensión de ancho de banda, comprendiendo el algoritmo de extensión de ancho de banda un factor de extensión de ancho de banda (), controlando el factor de extensión de ancho de banda () un desplazamiento de frecuencia entre una banda (113-1, 113-2, 113-3, ...) de la señal (100) de audio y una banda (125-1, 125-2, 125-3, ...) de frecuencia objetivo, en el que la etapa de modificación (106) comprende ajustar a escala fases de valores espectrales de la banda (113-1, 113-2, 113-3, ...) de la señal (100) de audio por el factor de extensión de ancho de banda (), de modo que al menos una muestra de un bloque consecutivo de muestras de audio se convoluciona cíclicamente en el bloque, y determinar un evento (700, 701, 702, 703, 705, 707) transitorio en la señal (100) de audio, comprendiendo la etapa de conversión (104) convertir el bloque (103; 803; 141-1; 902) rellenado, cuando el transitorio (134) detecta el evento (700, 701, 702, 703, 705, 707) transitorio en un bloque (133-1; 135-1) de la señal (100) de audio correspondiente al bloque (103; 803; 141-1; 902) rellenado, y comprendiendo la etapa de conversión (104) convertir un bloque (133-2; 135-2; 141-2; 930) no rellenado que tiene sólo valores de señal de audio, correspondiendo el bloque (133-2; 135-2; 141-2; 930) no rellenado al bloque de la señal (100) de audio, cuando no se detecta el transitorio (700, 701, 702, 703, 705, 707) en el bloque. 18. Programa informático que tiene un código de programa adaptado para realizar el método según la reivindicación 17, cuando el programa informático se ejecuta en un ordenador. 17   18   19     21   22   23   24     26   27   28   29     31

 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .