Dispositivo, procedimiento y programa de ordenador para manipular una señal de audio.

Aparato para manipular una señal de audio (100), que comprende:

un divisor en ventanas (102) destinado a generar una pluralidad (111; 811) de bloques sucesivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques sucesivos al menos un bloque lleno (103; 803; 141-1; 902) de muestras de audio presentando el bloque lleno (103; 803; 141-1; 902) valores llenos y valores de señal de audio; presentando un primer convertidor (104) destinado a convertir el bloque lleno (103; 803; 141-1; 902) en una representación espectral (105) unos valores espectrales; un modificador de fase (106) destinado a modificar las fases de los valores espectrales, para obtener una representación espectral modificada (107); y un segundo convertidor (108) destinado a convertir la representación espectral modificada (107) en una señal de audio en el ámbito temporal modificado (109), comprendiendo el aparato por otro lado un detector de transitorios (134) destinado a determinar un acontecimiento transitorio (700, 701, 702, 703, 705, 707) en la señal de audio (100), en el cual el primer convertidor (104) está configurado para convertir el bloque lleno (103; 803; 141-1; 902) cuando el detector de transitorios (134) detecta el acontecimiento transitorio (700, 701, 702, 703, 705, 707) en un bloque (133-1; 135-1) de la señal de audio (100) correspondiente al bloque lleno (103; 803; 141-1; 902), y en el cual el primer convertidor (104) está configurado para convertir un bloque no lleno (133-2; 135-2; 141-2; 930) que presenta únicamente valores de señal de audio, correspondiendo el bloque no lleno (133-2; 135-2; 141-2; 930) al bloque de la señal de audio (100), cuando el transitorio (700, 701, 702, 703, 705, 707) no se detecta en el bloque.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/053720.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: DISCH,SASCHA, NEUENDORF,Max, NAGEL,Frederik, Helmrich,Christian, Zorn,Dominik.

Fecha de Publicación: 21 de Mayo de 2014.

Clasificación Internacional de Patentes:

G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2478871_T3.pdf

Fragmento de la descripción:

Dispositivo, procedimiento y programa de ordenador para manipular una señal de audio

[1] El presente invento se refiere a un esquema para manipular una señal de audio modificando fases de valores espectrales de la señal de audio tal como adentro de un esquema de extensión de ancho de banda (BWE).

[2] En Faller, C. et al:Efficient Representation of Spatial Audio Using Perceptual Parametrization" Aplicaciones de Procesamiento de Señales de Audio y Acústica, 21 IEEE Workshop sobre 21 a 24 oct 21, Plscataway, NJ, EE.UU., pp 199-22, XP156699, se describe un esquema para la colocación simultánea de un número de fuentes en el espacio auditivo. El sistema se basa en una suposición acerca de la pertinencia de las señales de localización en diferentes bandas críticas. Dada la señal de suma de una serie de fuentes, es decir, una señal monofónica, y un conjunto de parámetros ( información lateral) el sistema es capaz de generar una señal binaural colocando espacialmente las fuentes contenidas en la señal monofónica. Las aplicaciones potenciales para el esquema son conferencias de escritorio multi-hablante y codificación de audio.

[3] El documento WO 27/1617 A2 da a conocer un método de codificación de audio en el que un codificador recibe una pluralidad de canales de entrada y genera uno o más canales de salida de audio y uno o más parámetros que describen relaciones espaciales deseadas entre una pluralidad de canales de audio que pueden derivarse a partir de los uno o más canales de salida de audio. El método comprende la detección de cambios en características de la señal con respecto al tiempo en una o más de la pluralidad de canales de entrada de audio, la identificación como límites de evento auditivo los cambios en características de la señal con respecto al tiempo en la uno o más de la pluralidad de canales de entrada de audio, constituyendo un segmento de audio entre límites consecutivos un evento auditivo en el canal o canales, y la generación de todos o algunos de los uno o más parámetros al menos en parte en respuesta a eventos auditivos y / o al grado de cambio en características de la señal asociados con los límites de evento auditivo. También se da a conocer un método mezclador ascendente de audio o de upmixing sensible al evento auditivo.

[4] US 6.549.884 B1 describe un sistema para desplazar una señal de audio en el que se realiza remuestreo en el dominio de la frecuencia. El sistema incluye un método para el desplazamiento de una señal mediante la conversión de la señal a una representación en el dominio de frecuencia y luego la identificación de una región específica en la representación en el dominio de frecuencia. La región se encuentra en una primera ubicación de frecuencia. A continuación, la región se desplaza a una segunda ubicación de frecuencia para formar una representación en el dominio de frecuencia ajustada. Por último, la representación en el dominio de frecuencia ajustada se transforma en una señal de dominio de tiempo que representa la señal de entrada desplazada.

[5] En Disch, S. y otros:. "An Amplltude- and Frequency-Modulation Vocoder for Audio Signal Processing", Proc. 11 a Conferencia Internacional sobre los Efectos de audio digital (DAFX-8) 1 de septiembre de 28, pp 1-7, XP2574848, se describe un método de análisis / síntesis que proporciona los medios adecuados para reducir la brecha entre procesamiento de audio paramétrico y de forma de onda, permitiendo una transición sin problemas entre ambos enfoques.

[6] El almacenamiento y la transmisión de señales de audio con frecuencia están sometidos a estrictas restricciones de cantidad de bits transmitidos. En el pasado, los codificadores eran forzados a reducir drásticamente el ancho de banda de audio transmitido cuando sólo se disponía de una muy baja cantidad de bits transmitidos. Los modernos codificadores-decodificadores de audio de hoy en día son capaces de codificar señales de banda ancha usando procedimientos de extensión de ancho de banda, como se describe en M. Dietz, L. Liljeryd, K. Kjórling y O. Kunz, Replicación de Banda Espectral, un enfoque novedoso en codificación de audio" ("Spectral Band Replicaron, a novel approach in audio coding") en la 112° Convención AES, Munich, mayo de 22; S. Meltzer, R. Bóhm y F. Henn, " Codificadores-decodificadores de audio mejorados con SBR para radiodifusión digital tal como "Digital Radio Mondiale" (DRM)" ("SBR enhanced audio codees for digital broadeasting such as "Digital Radio Mondiale" (DRM),") en la 112° Convención AES, Munich, mayo de 22; T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Mejoramiento de mp3 con SBR: Rasgos y Capacidades del nuevo Algoritmo mp3PRO" ("Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,") en la 112° Convención AES, Munich, mayo de 22; Norma Internacional ISO/IEC 14496-3: 21/FPDAM 1 "Extensión de Ancho de Banda" ISO/IEC, 22. (International Standard ISO/IEC 14496-3:21/FPDAM 1, "Bandwidth Extensión" ISO/IEC, 22.) "Procedimiento y Aparato de extensión de ancho de banda de voz" (Speech bandwidth extensión method and apparatus) Vasu lyengar et al.; Larsen, R. M. Aarts, y M. Danessis. "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high-frequeney bandwidth extensión of music and speech") en la convención 112° AES, Munich, Alemania, mayo de 22; R. M. Aarts, E. Larsen, y O. Ouweltjes. "Un enfoque unificado a la extensión de ancho de banda de baja y alta frecuencia" (A unified approach to low- and high frequeney bandwidth extensión). En la 115° Convención AES, New York, USA, octubre de 23; K. Káyhkó. "Un Mejoramiento de Banda Ancha Robusto para Señal de Voz de Banda angosta" (A Robust Wideband Enhancement for Narrowband Speech Signal). Informe de investigación, Universidad de Technología de Helsinki, Laboratorio de Acústica y Procesamiento de Señal de Audio (Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing), 21; E. Larsen y R. M. Aarts. "Extensión de Ancho de Banda de Audio - Aplicación a Psicoacústica, Procesamiento

de Señal y Diseño de Altavoz" (Audio Bandwldth Extensión - Application to psychoacoustics, Signal Processing and Loudspeaker Design). John Wiley & Sons, Ltd, 24; Larsen, R. M. Aarts, y M. Danessis "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high-frequency bandwidth extensión of music and speech") en la convención 112° AES, Munich, Alemania, mayo de 22; J. Makhoul. "Análisis Espectral de Voz mediante Predicción Lineal" (Spectral Analysis of Speech by Linear Prediction). IEEE "Transacciones de Audio y Electroacústica" (Transactions on Audio and Electroacoustics), AU-21(3), junio de 1973; Solicitud de Patente de Estados Unidos Número 8/951.29, Ohmori, et al. "Sistema y procedimiento de extensión de ancho de banda de audio" ("Audio band width extending system and method") y Patente de Estados Unidos N° 6895375, Malah, D & Cox, R. V.: "Sistema para extensión de ancho de banda de vos de banda angosta" (System for bandwidth extensión of Narrow-band speech). Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF), que es generado a partir de la parte de baja frecuencia (LF) codificada por forma de onda de la señal decodificada mediante una transposición dentro de la región espectral de HF ("parcheado") y aplicación de una post procesamiento impulsado por parámetros.

[7] Desde hace poco, se utiliza un nuevo algoritmo que emplea vocoderes de fase, como se describe, por ejemplo, en M. Puckette. Vocoder de fase sincronizada. Congreso IEEE ASSP sobre Aplicaciones de Procesamiento de Señales en Audio y Acústica. (Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics), Mohonk 1995.", A. Róbel, "Detección y preservación de componentes transitorios en el vocoder de fase." ("Transient detection and preservation in the phase vocoder,") citeseer.ist.psu.edu/679246.html; Laroche L., Dolson M.: "Modificación mejorada de escala de tiempo de vocoder de fase de audio ("Improved phase vocoder timescale modification of audio"), IEEE Trans, sobre procesamiento de voz y audio (IEEE Trans. Speech and Audio Processing), vol. 7, no. 3, pp. 323332 and Patente de Estados Unidos N° 6549884 Laroche, J. & Dolson, M.: Corrimiento de tono de vocoder de fase para la generación de parche. (Phase- vocoder pitchshifting for the patch generation), ha sido presentada en Frederik Nagel, Sascha Disch, "Un procedimiento de extensión de ancho de banda para codificadores-decodificadores de audio ("A harmonio bandwidth extensión method for audio codees"), ICASSP Congreso Internacional sobre Procesamiento de Acústica, Voz y Señal. (ICASSP International... [Seguir leyendo]

Reivindicaciones:

1. Aparato para manipular una señal de audio (1), que comprende: un divisor en ventanas (12) destinado a generar una pluralidad (111; 811) de bloques sucesivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques sucesivos al menos un bloque lleno (13; 83; 141-1; 92) de muestras de audio, presentando el bloque lleno (13; 83; 141-1; 92) valores llenos y valores de señal de audio; presentando un primer convertidor (14) destinado a convertir el bloque lleno (13; 83; 141-1; 92) en una representación espectral (15) unos valores espectrales; un modificador de fase (16) destinado a modificar las fases de los valores espectrales, para obtener una representación espectral modificada (17); y un segundo convertidor (18) destinado a convertir la representación espectral modificada (17) en una señal de audio en el ámbito temporal modificado (19), comprendiendo el aparato por otro lado un detector de transitorios (134) destinado a determinar un acontecimiento transitorio (7, 71, 72, 73, 75, 77) en la señal de audio (1), en el cual el primer convertidor (14) está configurado para convertir el bloque lleno (13; 83; 141-1; 92) cuando el detector de transitorios (134) detecta el acontecimiento transitorio (7, 71, 72, 73, 75, 77) en un bloque (133-1; 135-1) de la señal de audio (1) correspondiente al bloque lleno (13; 83; 141-1; 92), y en el cual el primer convertidor (14) está configurado para convertir un bloque no lleno (133-2; 135-2; 141-2; 93) que presenta únicamente valores de señal de audio, correspondiendo el bloque no lleno (133-2; 135-2; 141-2; 93) al bloque de la señal de audio (1), cuando el transitorio (7, 71, 72, 73, 75, 77) no se detecta en el bloque.

2. Aparato según la reivindicación 1, que comprende por otro lado: un diezmador (12) destinado a diezmar la señal de audio en el ámbito temporal modificado (19) o bloques sumados por recubrimiento de muestras de audio en el ámbito temporal modificados, para obtener una señal en el ámbito temporal diezmada(121), donde una característica de diezmado depende de una característica de modificación de fase aplicada por el modificador de

fase (16).

3. Aparato según la reivindicación 2, que está adaptado para realizar una extensión de anchura de banda con ayuda de la señal de audio (1), que comprende por otro lado: un filtro pasa-banda (114) destinado a extraer una señal pasa-banda (113) de la representación espectral (15) o de la señal de audio (1), donde una característica de banda pasante del filtro pasa- banda (114) se escoge en función de la característica de modificación de fase aplicada por el modificador de fase (16), de manera que la señal pasa-banda (113) se transforme por tratamiento ulterior en un rango de frecuencias diana (125-1, 125-2, 125-3) no Incluida en la señal de audio (1).

4. Aparato según la reivindicación 2, que comprende por otro lado: un sumador por recubrimiento (124) destinado a añadir por recubrimiento bloques (121-1, 121-2, 121-3) de muestras de audio diezmadas o de muestras de audio en el ámbito temporal modificadas, para obtener una señal (125) en un rango de frecuencias diana (125-1, 125-2, 125- 3) de un algoritmo de extensión de anchura de banda.

5. Aparato según la reivindicación 4, que comprende por otro lado: un escalonador (116) destinado a escalonar valores espectrales por un factor, donde el factor depende de una característica de adición por recubrimiento que tiene en cuenta una relación entre la primera distancia temporal (a) para una adición por recubrimiento aplicada por el divisor en ventanas (12) y una distancia temporal diferente (b) aplicada por el sumador por recubrimiento (124) y las características de ventana.

6. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) comprende: un procesador de ventanas de análisis (11; 12-1, 12-2; 14) destinado a generar una pluralidad (111; 811) de bloques sucesivos que tienen la misma dimensión; y un rellenador (112; 12-3) destinado a rellenar un bloque (133-1; 135-1) de la pluralidad (111; 811) de bloques sucesivos de muestras de audio, para obtener el bloque lleno (13; 83; 141-1; 92) insertando valores llenos en unas posiciones temporales especificadas antes de una primera muestra (78) de un bloque sucesivo (133-1; 135-1; 74) de muestras de audio o después de una última muestra (71) del bloque sucesivo (133-1; 135-1; 74) de muestras de audio.

7. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) está configurado para insertar des valores llenos en unas posiciones temporales especificadas antes de una primera muestra (78) de un bloque sucesivo (133-1; 135-1; 74) de muestras de audio o después de una última muestra (71) del bloque sucesivo (133-1; 135-1; 74) de muestras de audio, comprendiendo el aparato por otro lado: un eliminador de relleno (118) destinado a eliminar muestras en unas posiciones temporales de la señal de audio en el ámbito temporal modificado (19), correspondiendo las posiciones temporales a las posiciones temporales aplicadas por el divisor en ventanas (12).

8. Aparato según la reivindicación 1 ó la 2, que comprende por otro lado: un divisor en ventanas de síntesis (122) destinado a dividir en ventanas la señal en el ámbito temporal diezmada(121) o la señal de audio en el ámbito temporal modificado (19) y que tiene una función de ventana de síntesis coincidente con una función de análisis aplicada por el divisor en ventanas (12).

9. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) está configurado para insertar des valores llenos en unas posiciones temporales especificadas antes de una primera muestra (78) de un bloque

sucesivo (133-1; 135-1; 74) de muestras de audio o después de una última muestra (71) del bloque sucesivo (133-1; 135-1; 74) de muestras de audio, donde una suma de un número de valores llenos y de un número de valores en el bloque sucesivo (133-1; 135-1; 74) de muestras de audio es de al menos 1,4 veces el número de valores en el bloque sucesivo (133-1; 135-1; 74) de muestras de audio.

1. Aparato según la reivindicación 7, en el cual el divisor en ventanas (12) está configurado para Insertar simétricamente los valores llenos antes de la primera muestra (78) del bloque sucesivo (133-1; 135-1; 74) de muestras de audio y después de la última muestra (71) del bloque sucesivo centrado (133-1; 135-1; 74) de muestras de audio, de manera que el bloque lleno (13; 83; 141-1; 92) esté adaptado para una conversión por el primer convertidor (14) y el segundo convertidor (18).

11. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) está configurado para aplicar una función de ventana (79; 92) que presenta al menos una zona de guardia (712, 714; 91, 92; 94, 95) a la posición de partida (718; 91) de la función de ventana (79; 92) o a la posición de fin (72; 93) de la función de

ventana (79; 92).

12. Aparato según la reivindicación 2, estando el aparato configurado para realizar un algoritmo de extensión de anchura de banda, comprendiendo el algoritmo de extensión de anchura de banda un factor de extensión de anchura de banda (), controlando el factor de extensión de anchura de banda () una separación de frecuencia entre una banda (113-1, 113,-2, 113-3,...) de la señal de audio (1) y una banda de frecuencias diana (125-1, 125- 2, 125-3,...), en el cual el primer convertidor (14), el modificador de fase (16), el segundo convertidor (18) y el diezmador (12) están configurados para funcionar con ayuda de diferentes factores de extensión de banda (), de manera que se obtengan diferentes señales audio temporales modificadas (121-1, 121-2, 121-3,...) que presenta diferentes bandes de frecuencias diana (125-1, 125-2, 125-3,...), que comprende por otro lado un sumador por recubrimiento (124) para realizar una adición por recubrimiento basándose en los diferentes factores de extensión de anchura de banda (), y un combinador (126) destinado a combinar los resultados de adición por recubrimiento (125-1, 125-2, 125-3,...), para obtener una señal combinada (127) que comprende las diferentes bandas de frecuencias diana (125-1, 125-2, 125-3).

13. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) comprende: un rellenador (112; 12-3) destinado a insertar valores llenos en unas posiciones temporales especificadas antes de una primera muestra (78) de un bloque sucesivo (133-1; 135-1; 74) de muestras de audio o después de una última muestra (71) del bloque sucesivo (133-1; 135-1; 74) de muestras de audio, comprendiendo el aparato por otro lado: un conmutador (136) que está controlado por el detector de transitorios (134), donde el conmutador (136) está configurado para controlar el rellenador (112; 12-3) de manera que se genere un bloque lleno (13; 83) cuando se detecta un acontecimiento transitorio (7, 71, 72, 73, 75, 77) por el detector de transitorios (134), presentando el bloque lleno (13; 83) valores rellenos y valores de señal de audio, y para controlar el rellenador (112; 12-3) de manera que se genere un bloque no lleno (133-2; 135-2) cuando el acontecimiento transitorio (7, 71, 72, 73, 75, 77) no se detecta por el detector de transitorios (134), presentando el bloque no lleno (133-2; 135-2) únicamente valores de señal de audio, en el cual el primer convertidor (14) comprende un primer sub-convertldor (138-1) y un segundo subconvertidor (138-2), en el cual el conmutador (136) está por otro lado configurado para alimentar el bloque lleno (13; 83) hacia el primer sub-convertidor (138-1), para realizar una conversión que presenta una primera longitud de conversión cuando se detecta el acontecimiento transitorio (7, 71, 72, 73, 75, 77) por el detector de transitorios (134) y para alimentar el bloque no lleno (133-2; 135-2) hacia el segundo sub-convertldor (138-2), para realizar una conversión que presenta una segunda longitud más corta que la primera longitud cuando el acontecimiento transitorio (7, 71, 72, 73, 75, 77) no se detecta por el detector de transitorios (134).

14. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) comprende un procesador de ventanas de análisis (11; 12-1, 12-2; 14) destinado a aplicar una función de ventana de análisis a un bloque sucesivo (139-1, 139-2) de muestras de audio, siendo el procesador de ventanas de análisis regulable de manera que la función de ventana de análisis comprenda una zona de guardia (712, 714; 91, 92; 94, 95) en una posición de partida (718; 91) de la función de ventana (79; 92) o una posición de fin (72; 93) de la función de ventana (79; 92), comprendiendo el aparato por otro lado: un conmutador de ventana de guardia (142) que está controlado por el detector de transitorios (134), donde el conmutador de ventana de guardia (142) está configurado para controlar el procesador de ventana de análisis (11; 12-1, 12-2; 14) de manera que un bloque lleno (141-1; 92) se genere a partir de un bloque sucesivo de muestras de audio con ayuda de la función de ventanas de análisis que comprende la zona de guardia, presentando el bloque lleno (141-1; 92) valores llenos y valores de señal de audio cuando un acontecimiento transitorio (7, 71, 72, 73, 75, 77) se detecta por el detector de transitorios (134), y para controlar el procesador de ventanas de análisis (12-1, 12-2, 14) de manera que se genere un bloque no lleno (141-2; 93), presentando el bloque no lleno (141-2; 93) únicamente valores de señal de audio, cuando el acontecimiento transitorio (7, 71, 72, 73, 75, 77) no se detecta por el detector de transitorios (134), en el cual el primer convertidor (14) comprende un primer sub-convertidor (138-1) y un segundo sub-convertidor (138-2), en el cual el conmutador de ventana de guardia (142) está configurado por otro lado para alimentar el bloque lleno (141-1; 92) hacia el primer sub-convertidor (138-1), para realizar una conversión que presenta una primera longitud de conversión cuando un acontecimiento transitorio (7, 71, 72, 73, 75, 77) se detecta por el detector de transitorios (134) y para alimentar el bloque no lleno (141-2; 93) hacia el segundo sub-convertidor (138-2), para

realizar una conversión que presenta una segunda longitud más corta que la primera longitud cuando el acontecimiento transitorio (7, 71, 72, 73, 75, 77) no se detecta por el detector de transitorios (134).

15. Aparato según la reivindicación 4 o la 12, que comprende por otro lado: un ajustador de envoltura (13) destinado a ajustar la envoltura de la señal (125) en un rango de frecuencias diana (125-1, 125-2, 125-3) o la señal combinada (129) a partir de los parámetros transmitidos (11), para obtener una señal corregida (129); y otro combinador (132) destinado a combinar la señal de audio (1; 12-1) y la señal corregida (129), para obtener una señal manipulada (131) que se extiende en anchura de banda.

16. Aparato según la reivindicación 1, en el cual el divisor en ventanas (12) está configurado para generar una pluralidad (111; 811) de bloques sucesivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques sucesivos al menos un primer par (145-1) de bloques no rellenados (133-2; 135-2; 141-2; 93) y un bloque lleno sucesivo (13; 83; 141-1; 92) y un segundo par (145-2) de un bloque lleno (13; 83; 141-1; 92) y un bloque sucesivo no lleno (133-2; 135-2; 141-2; 93), comprendiendo el aparato por otro lado: un diezmador (12) destinado a diezmar las muestras audio en el ámbito temporal modificados o los bloques sumados por recubrimiento de muestras de audio en el ámbito temporal modificados del primer par (145-1), para obtener las muestras audio diezmadas (147-1) del primer par (145-1) o para diezmar las muestras audio en el ámbito temporal modificados o los bloques sumados por recubrimiento de muestras de audio en el ámbito temporal modificados del segundo par (145- 2), para obtener las muestras audio diezmadas (147-2) del segundo par (145-2), y un sumador por recubrimiento (124), donde el sumador de recubrimiento (124) está configurado para añadir los bloques que recubren a las muestras audio diezmadas (147-1,147-2) o las muestras audio en el ámbito temporal modificadas del primer par (145-1) o del segundo par (145-2), donde, para el primera par (145-1), la distancia temporal (b) entre una primera muestra (151) del bloque no lleno (133-2; 135-2; 141-2; 93) y una primera muestra (153) de los valores de señal de audio del bloque lleno (13; 83141-1; 92) se suministra por el sumador por recubrimiento (124), o en el cual, para el segundo par (145-2), una distancia temporal (b) entre una primera muestra (153) de los valores de señal de audio del bloque lleno (13; 83; 141-1; 92) y una primera muestra (157) del bloque no lleno (133-2; 135-2; 141-2; 93) se suministra por el sumador por recubrimiento (124), para obtener una señal en un rango de frecuencias diana del algoritmo de extensión de anchura de banda.

17. Procedimiento para manipular una señal de audio, que comprende:

generar (12) una pluralidad (111; 811) de bloques sucesivos de muestras de audio, comprendiendo la pluralidad (111; 811) de bloques sucesivos al menos un bloque lleno (13; 83) de muestras de audio, presentando el bloque lleno (13; 83) valores llenos y valores de señal de audio;

convertir (14) el bloque lleno (13; 83) en una representación espectral que presenta valores espectrales; modificar (16) las fases de los valores espectrales, para obtener una representación espectral modificada (17); convertir (18) la representación espectral modificada (17) en una señal de audio (19) en el ámbito temporal (15) modificado, y determinar un acontecimiento transitorio (7, 71, 72, 73, 75, 77) en la señal de audio (1) con ayuda de un detector de transitorios (134), en el cual la etapa de conversión (14) comprende convertir el bloque lleno (13; 83; 141-1; 92) cuando el detector de transitorios (134) detecta el acontecimiento transitorio (7, 71, 72, 73, 75, 77) en un bloque (133-1; 135-1) de la señal de audio (1) correspondiente al bloque lleno (13; 83; 141-1; 92), y en el cual la etapa de conversión (14) comprende convertir un bloque no lleno (133-2; 135-2; 141-2; 93) que presenta únicamente valores de señal de audio, correspondiendo el bloque no lleno (133-2; 135-2; 141-2; 93) al bloque de la señal de audio (1) cuando el transitorio (7, 71, 72, 73, 75, 77) no se detecta en el bloque.

18. Programa de ordenador que tiene un código de programa adaptado para realizar el procedimiento según la reivindicación 17 cuando el programa de ordenador se ejecuta en un ordenador.

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]