Re-muestreo de señales de salida de códecs de audio basados en QMF.
Un aparato para el re-muestreo de una señal de audio procesada (SA) que comprende:
un primer procesador de señales de audio configurable (110) para procesar una señal de audio (s0) según diferentes ajustes de configuración (conf) para obtener una señal de audio procesada (s1),
en el que el aparato está adaptado de modo que diferentes ajustes de configuración (conf) dan como resultado diferentes frecuencias de muestreo (sr1) de la señal de audio procesada (s1), un banco de filtros de análisis (120) que tiene un primer número (c1) de canales de banco de filtros de análisis,
un banco de filtros de síntesis (130) que tiene un segundo número (c2) de canales de banco de filtros de síntesis, un segundo procesador de audio (140) que está adaptado para recibir y procesar una señal de audio (s2) que tiene una frecuencia de muestreo predeterminada (sr2), y
un controlador (150) para controlar el primer número (c1) de canales de banco de filtros de análisis y el segundo número (c2) de canales de banco de filtros de síntesis de acuerdo con un ajuste de configuración (conf) proporcionado al primer procesador de señales de audio configurable (110),
de modo que una salida de señal de audio (s2) del banco de filtros de síntesis (130) tiene la frecuencia de muestreo predeterminada (sr2) o una frecuencia de muestreo (sr2') que es diferente de la frecuencia de muestreo predeterminada (sr2) y que es más cercana a la frecuencia de muestreo predeterminada (sr2) que una frecuencia de muestreo (sr1) de una señal de entrada del banco de filtros de análisis que es la señal de audio procesada (s1).
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2011/063848.
Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..
Nacionalidad solicitante: Alemania.
Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.
Inventor/es: GEIGER, RALF, SCHNELL,MARKUS, LOHWASSER,MARKUS, JANDER,Manuel, NEUENDORF,Max, HILDENBRAND,MATTHIAS, CHALUPKA,TOBIAS.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L19/02 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
- G10L19/022 G10L 19/00 […] › Bloqueo, p. ej. agrupación de muestras en el tiempo; Elección de las ventanas de análisis; Factorización de interferencias.
- G10L19/16 G10L 19/00 […] › Estructura de codificadores de voz.
- G10L21/00 G10L […] › Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad).
PDF original: ES-2501493_T3.pdf
Fragmento de la descripción:
Re-muestreo de señales de salida de codees de audio basados en QMF
[1] La presente invención se refiere al procesamiento de audio y, en particular, a un aparato y a un procedimiento para el re-muestreo de señales de salida de codees de audio basados en QMF.
[2] La mayoría de los productos electrónicos de consumo de audio de gama baja usan convertidores de digital a analógico con frecuencias de muestreo fijas debido a razones de coste. Pero cuando se requieren dispositivos multimedia habilitados para soportar diferentes tipos de fuentes de audio, el proceso de re-muestreo es inevitable, porque los archivos de medios pueden ser codificados utilizando diferentes frecuencias de muestreo, y también los codees de comunicación utilizan diferentes frecuencias de muestreo. La elección de diferentes frecuencias de muestreo es una cuestión importante en lo que respecta a los puntos de trabajo de diferentes codees de audio y procedimientos de procesado. Cuanto más diferentes son las frecuencias de muestreo que hay que soportar, más compleja es la adaptación de la frecuencia de muestra y la tarea de re-muestreo.
[3] Por ejemplo en el modelo de referencia actual MPEG-D USAC (USAC = Unified Speech and Audio Coding), se emplean algunas frecuencias de muestreo poco frecuentes (no un múltiplo entero de 16Hz o 225Hz). Estas frecuencias son el resultado de un compromiso entre dos aspectos: Primero, una frecuencia de muestreo nominal de la herramienta integrada codificación ACELP para la que fue específicamente diseñada y que, hasta cierto punto, dicta la frecuencia de muestreo global del sistema, y segundo, el deseo de aumentar la frecuencia de muestreo junto con una tasa de bits capaz de codificar un mayor ancho de banda de audio y/o para lograr escalabilidad.
[4] En parte, las frecuencias de muestreo poco comunes son también un legado del sistema AMR-WB+ system cuyas partes del modelo de referencia se han deducido de este. Además, como es habitual en la práctica de la codificación de audio de baja frecuencia de bits, la frecuencia de muestreo y por lo tanto el ancho de banda de audio se están reduciendo en gran medida en puntos de trabajo USAC a baja frecuencia de bits.
[5] A bajas frecuencias de muestreo USAC en particular las frecuencias de muestreo empleadas actualmente presentan los dos de los problemas antes mencionados. No son compatibles con convertidores D/A de hardware de bajo coste y requerirían una etapa adicional de re-muestreo. El ancho de banda de audio está limitado a la frecuencia de Nyqulst, que está muy por debajo del límite superior del rango audible humano.
[6] Para adaptar la tasa de muestreo de salida de una unidad de procesamiento de audio se utilizan módulos funcionales de re-muestreo adicional, lo que requiere una cantidad significativa de recursos computacionales adicionales. La tecnología utilizada para este propósito no ha cambiado en mucho tiempo, la cual consiste básicamente en un interpolador y unos módulos de muestreo hacia arriba y hacia abajo opcionales.
[7] Es un objeto de la presente invención proporcionar un concepto mejorado para el re-muestreo de señales de audio. El objeto de la presente invención se resuelve con un aparato según la reivindicación 1, un procedimiento según la reivindicación 13 y un programa de ordenador según la reivindicación 14.
[8] Según la presente invención, se proporciona un aparato para el re-muestreo de una señal de audio procesada. El aparato comprende un primer procesador de señales de audio configurable para procesar una señal de audio según diferentes ajustes de configuración para obtener la señal de audio procesada, en el que el aparato está adaptado de modo que diferentes ajustes de configuración dan como resultado diferentes frecuencias de muestreo de la señal de audio procesada. El aparato comprende además un banco de filtros de análisis que tiene un primer número de canales de banco de filtros de análisis, un banco de filtros de síntesis que tiene un segundo número de canales de banco de filtros de síntesis y un segundo procesador de audio que está adaptado para recibir y procesar una señal de audio que tiene una frecuencia de muestreo predeterminada.
[9] Además, el aparato comprende un controlador para controlar el primer número de canales de banco de filtros de análisis y el segundo número de canales de banco de filtros de síntesis de acuerdo con un ajuste de configuración proporcionado al primer procesador de señales de audio configurable, de modo que una salida de señal de audio del banco de filtros de síntesis tiene la frecuencia de muestreo predeterminada o una frecuencia de muestreo que es diferente de la frecuencia de muestreo predeterminada y que es más cercana a la frecuencia de muestreo predeterminada que una frecuencia de muestreo de una señal de entrada del banco de filtros de análisis.
[1] La presente invención se basa en el hallazgo de que mediante la variación del ancho de banda de la señal de representación en el dominio de frecuencia, la señal en el dominio de tiempo equivalente resultante tendrá una frecuencia de muestreo diferente como si no hubiera cambio de ancho de banda en el dominio de la frecuencia. La operación de cambio de ancho de banda es barata, ya que se puede lograr mediante la eliminación o la adición de datos de dominio de frecuencia.
[11] La etapa de conversión desde el dominio de la frecuencia de vuelta al dominio del tiempo debe ser modificada con el fin de ser capaz de manejar el ancho de banda diferente en el dominio de la frecuencia (longitud de transformación).
[12] La representación de la señal en el dominio frecuencial del ancho de banda modificada también se puede extender a todo el procedimiento de procesamiento de la señal en lugar de limitarse al banco de filtros, permitiendo así que todo el proceso se beneficie de las características reales de la señal de salida de destino.
[13] Incluso aunque no todas las fuentes de señal de audio pueden ser llevadas a una frecuencia de muestreo de salida única, reducir la cantidad de diferentes frecuencias de muestreo de salida ya ahorra una gran cantidad de recursos computacionales en un determinado dispositivo.
[14] La complejidad de un banco de filtros está directamente relacionada con su longitud. Si una transformada de síntesis de señal en el dominio del tiempo de un banco de filtros se modifica mediante un muestreo menor mediante la reducción de la longitud de transformación, su complejidad disminuirá. Si se utiliza para aumentar el muestreo mediante la ampliación de su longitud de transformación, su complejidad aumentará, pero aún muy lejos de la complejidad requerida para un re-muestreador adicional con características de distorsión de señal equivalentes. También la distorsión total de la señal será menor, ya que cualquier distorsión adicional de la señal causada por un re-muestreador adicional será eliminada.
[15] Según una realización, el banco de filtros de análisis está adaptado para transformar la señal de entrada del banco de filtros de análisis que se representa en un dominio del tiempo en una primera señal de audio en el dominio temporal-frecuencial que tiene una pluralidad de primeras señales sub-banda, en el que el número de primeras señales sub-banda es igual al primer número de canales de banco de filtros de análisis. Según esta realización, el aparato comprende además un ajustador de señal que está adaptado para generar una segunda señal de audio en el dominio temporal-frecuencial que tiene una pluralidad de segundas señales sub-banda de la primera señal de audio en el dominio tempora-frecuencial a partir del ajuste de configuración (conf), de modo que el número de segundas señales sub-banda de la segunda señal de audio en el dominio temporal-frecuencial es igual al número de canales de banco de filtros de síntesis. El número de segundas señales sub-banda de la segunda señal de audio en el dominio temporal-frecuencial es diferente del número de señales sub-banda del primer primera señal de audio en el dominio temporal-frecuencial. Además, el banco de filtros de síntesis está adaptado para transformar la segunda señal de audio en el dominio temporal-frecuencial en una señal de audio en el dominio del tiempo como la salida de señal de audio del banco de filtros de síntesis.
[16] En otra realización, el ajustador de señal puede estar adaptado para generar la segunda señal de audio en el dominio temporal-frecuencial mediante la generación de al menos una señal de sub-banda adicional. En otra realización adicional, el ajustador de señal está adaptado para generar al menos una señal de sub-banda adicional realizando una replicación de banda espectral para generar al menos una señal de sub-banda... [Seguir leyendo]
Reivindicaciones:
1. Un aparato para el re-muestreo de una señal de audlo procesada (SA) que comprende:
un primer procesador de señales de audlo configurable (11) para procesar una señal de audlo (so) según
diferentes ajustes de configuración (conf) para obtener una señal de audio procesada (si),
en el que el aparato está adaptado de modo que diferentes ajustes de configuración (conf) dan como
resultado diferentes frecuencias de muestreo (sn) de la señal de audio procesada (si),
un banco de filtros de análisis (12) que tiene un primer número (ci) de canales de banco de filtros de
análisis,
un banco de filtros de síntesis (13) que tiene un segundo número (c2) de canales de banco de filtros de síntesis, un segundo procesador de audio (14) que está adaptado para recibir y procesar una señal de audio (s2) que tiene una frecuencia de muestreo predeterminada (sr2), y
un controlador (15) para controlar el primer número (ci) de canales de banco de filtros de análisis y el segundo número (c2) de canales de banco de filtros de síntesis de acuerdo con un ajuste de configuración (conf) proporcionado al primer procesador de señales de audio configurable (11),
de modo que una salida de señal de audio (S2) del banco de filtros de síntesis (13) tiene la frecuencia de muestreo predeterminada (sr2) o una frecuencia de muestreo (sr2) que es diferente de la frecuencia de muestreo predeterminada (sr2) y que es más cercana a la frecuencia de muestreo predeterminada (sr2) que una frecuencia de muestreo (sn) de una señal de entrada del banco de filtros de análisis que es la señal de audio procesada (si).
2. Un aparato según la reivindicación 1, en el que el banco de filtros de análisis (12) está adaptado para transformar la señal de entrada del banco de filtros de análisis (si) que se representa en un dominio temporal en una primera señal de audio en el dominio temporal-frecuencial que tiene una pluralidad de primeras señales sub-banda, en el que el número de primeras señales sub-banda es igual al primer número (ci) de canales de banco de filtros de análisis, en el que el aparato comprende además un ajustador de señal (125) que está adaptado para generar una segunda señal de audio en el dominio temporal-frecuencial que tiene una pluralidad de segundas señales sub-banda de la primera señal de audio en el dominio temporal-frecuencial a partir del ajuste de configuración (conf), de modo que el número de segundas señales sub-banda de la segunda señal de audio en el dominio temporal-frecuencial es igual al número (C2) de canales de banco de filtros de síntesis, y en el que el número de segundas señales sub- banda de la segunda señal de audio en el dominio temporal-frecuencial es diferente del número de señales sub- banda de la primera señal de audio en el dominio temporal-frecuencial, y en el que el banco de filtros de síntesis (13) está adaptado para transformar la segunda señal de audio en el dominio temporal-frecuencial en una señal de audio en el dominio del tiempo como la salida de señal de audio (s2) del banco de filtros de síntesis (13).
3. Un aparato según la reivindicación 2, en el que el ajustador de señal (125) está adaptado para generar la segunda señal de audio en el dominio temporal-frecuencial mediante la generación de al menos una señal de sub-banda adicional.
4. Un aparato según la reivindicación 3, en el que el ajustador de señal (125) está adaptado para generar al menos una sub-banda adicional realizando una replicación de banda espectral para generar al menos una señal de sub- banda adicional.
5. Un aparato según la reivindicación 3 o la 4, en el que el ajustador de señal (125) está adaptado para generar una señal cero como señal de sub-banda adicional.
6. Un aparato según la reivindicación 1 o la 2, en el que el banco de filtros de análisis es un banco de filtros de análisis QMF y en el que el banco de filtros de síntesis es un banco de filtros de síntesis QMF.
7. Un aparato según la reivindicación 1 o la 2, en el que el banco de filtros de análisis es un banco de filtros de análisis MDCT y en el que el banco de filtros de síntesis es un banco de filtros de síntesis MDCT.
8. Un aparato según cualquiera de las reivindicaciones anteriores, en el que el aparato comprende además un re- muestreador adicional (17) que está adaptado para recibir una señal de salida de banco de filtros de síntesis (S2) que tiene una primera frecuencia de muestreo de síntesis, y en el que el re-muestreador adicional vuelve a muestrear la señal de salida de banco de filtros de síntesis para generar una señal de salida re-muestreada que tiene una segunda frecuencia de muestreo de síntesis.
9. Un aparato según cualquiera de las reivindicaciones 1 a 7, en el que el aparato está adaptado para alimentar una señal de salida de banco de filtros de síntesis que tiene una primera frecuencia de muestreo de síntesis a un banco de filtros de análisis como una señal de entrada del banco de filtros de análisis.
1. Un aparato según cualquiera de las reivindicaciones anteriores, en el que el controlador está adaptado para determinar el primer número (ci) de canales de banco de filtros de análisis o el segundo número (C2) de canales de banco de filtros de síntesis a partir de un error tolerable (e).
11. Un aparato según la reivindicación 1, en el que el controlador comprende un comparador de error (15) para comparar el error real (e) con un error tolerable (e).
12. Un aparato para realizar la mezcla ascendente de una señal envolvente que comprende:
un banco de filtros de análisis (91) para transformar una señal en el dominio del tiempo mezclada hacia abajo (s1) en el dominio temporal-frecuencial para generar una pluralidad de señales sub-banda mezcladas hacia abajo (su, S12, S13),
al menos dos unidades de mezclado ascendente (921, 922, 923) para realizar la mezcla ascendente de la pluralidad de señales sub-banda mezcladas hacia abajo para obtener una pluralidad de señales sub-banda envolventes, al menos dos unidades de ajuste de señal (931, 932, 933, 934, 935) para ajustar el número de señales sub-banda envolventes,
en el que las al menos dos unidades de ajuste de señal (931, 932, 933, 934, 935) están adaptadas para recibir una primera pluralidad de señales sub-banda envolventes de entrada, en el que las al menos dos unidades de ajuste de señal (931, 932, 933, 934, 935) están adaptadas para dar como salida una segunda pluralidad de señales sub-banda envolventes de salida, y
en el que el número de la primera pluralidad de señales sub-banda envolventes de entrada y el número de la segunda pluralidad de señales sub-banda envolventes de salida son diferentes, una pluralidad de unidades de banco de filtros de síntesis (941, 942, 943, 944, 945) para transformar una pluralidad de señales sub-banda envolventes de salida desde un dominio temporal-frecuencial a un dominio del tiempo para obtener señales de salida envolventes en el dominio del tiempo (S21, S22, S23, S24, S25), y un controlador (95) que está adaptado para recibir un ajuste de configuración (conf) y que está adaptado para controlar el número de canales del banco de filtros de análisis (91), para controlar el número de canales unidades de bancos de filtros de síntesis (941, 942, 943, 944, 945), para controlar el número de la primera pluralidad de señales sub-banda envolventes de entrada de las unidades de ajuste de señal (931, 932, 933, 934, 935), y para controlar el número de la segunda pluralidad de señales sub-banda envolventes de salida de las unidades de ajuste de señal (931, 932, 933, 934, 935) a partir del ajuste de configuración recibido (conf).
13. Un procedimiento para el re-muestreo de una señal de audio procesada, que comprende:
procesar una señal de audio según diferentes ajustes de configuración para obtener la señal de audio procesada, de modo que diferentes ajustes de configuración dan como resultado diferentes frecuencias de muestreo de la primera señal de audio procesada,
controlar un primer número de canales de banco de filtros de análisis de un banco de filtros de análisis y un segundo número de canales de banco de filtros de síntesis de un banco de filtros de síntesis de acuerdo con un ajuste de configuración, de modo que una salida de señal de audio por el banco de filtros de síntesis tiene la frecuencia de muestreo predeterminada o una frecuencia de muestreo que es diferente de la frecuencia de muestreo predeterminada y que es más cercana a la frecuencia de muestreo predeterminada que la frecuencia de muestreo de una señal de entrada en el banco de filtros de análisis que es la señal de audio procesada y procesar la salida de señal de audio que tiene la frecuencia de muestreo predeterminada.
14. Programa de ordenador para realizar el procedimiento según la reivindicación 13, cuando el programa de ordenador se ejecuta en un ordenador o procesador.
Patentes similares o relacionadas:
Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]
Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]
Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]
Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]
Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]
Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]
Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]
Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]