Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia.
Un banco de filtros de análisis para filtrar unapluralidad de cuadros de entrada de dominio de tiempo,
cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respecyivamente, que comprende:
un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana comprendiendo una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera superpuesta utilizando un valor por adelantado de la muestra,
en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2;
en donde el formador de ventanas está configurado para generar consecutivamente dos cuadros de ventana en base a dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y
en donde el formador de ventanas está configurado para generar la pluralidad de cuadros de ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, son desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra y
un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, un cuadro de salida siendo una representación espectral de un cuadro de ventana.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E11173652.
Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..
Nacionalidad solicitante: Alemania.
Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.
Inventor/es: GEIGER, RALF, SCHULLER, GERALD, GRILL, BERNHARD, SCHNELL,MARKUS.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
PDF original: ES-2531568_T3.pdf
Fragmento de la descripción:
Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia Antecedentes de la invención
[0001] La presente invención es concerniente con un banco de filtro de análisis, un banco de filtro de síntesis y sistemas que comprenden cualquiera de los bancos de filtros mencionados anteriormente que pueden por ejemplo ser implementados en el campo de codificación de audio moderna, descodificación de audio u otras aplicaciones relacionadas con la transmisión de audio. Además, la presente invención también es concerniente con un mezclador y un sistema de conferencia.
[0002] El procesamiento de audio digital moderno está basado comúnmente en esquemas de esquemas de codificación que permiten una reducción significativa en términos de velocidades de bits, anchos de banda de transmisión y espacio de almacenamiento, en comparación con la transmisión directa o almacenamiento de los respectivos datos de audio. Esto se obtiene al codificar los datos de audio en el sitio de remitente y descodificar los datos codificados en el sitio de receptor antes de por ejemplo proporcionar los datos de audio descodificados a un radioescucha.
[0003] Tales sistemas de procesamiento de audio digital pueden ser implementados con respecto a un amplio intervalo de parámetros que comprenden un espacio de almacenamiento típico para una corriente potencial mente estandarizada típica de datos de audio, velocidad de bits, complejidad computacional especialmente en términos de eficiencia de implementación, calidades obtenibles apropiadas para diferentes aplicaciones y en términos del retardo provocado tanto durante la codificación como de la descodificación de los datos de audio y los datos de audio codificados, respectivamente. En otras palabras, los sistemas de audio digitales pueden ser aplicados en muchos campos o aplicaciones diferentes que fluctúan desde una transmisión de ultra-baja calidad a una transmisión de extremo alto y almacenamiento de datos de audio (por ejemplo, para una experiencia de escuchar música de alta calidad).
[0004] Sin embargo, en muchos casos se tienen que tomar soluciones intermedias en términos de los diferentes parámetros tales como la velocidad de bits, la complejidad computacional, calidad y retardo. Por ejemplo, un sistema de audio digital que comprende un bajo retraso puede requerir una velocidad de bits más alta de un ancho de banda transmisión en comparación con un sistema de audio con un retardo más alto a un nivel de calidad comparable.
[0005] El documento WO 98/02971 A1 se refiere a un método para señales de codificación y decodificación de audio. El método de codificación de señales de audio de tiempo discreto comprende las etapas de ponderación de la señal de audio de tiempo discreto por medio de funciones de ventana que se solapan entre sí para formar bloques, las fundones de ventana produciendo bloques de una primera longitud para señales que varían débilmente con el tiempo y bloques de una segunda longitud para señales que varían fuertemente con el tiempo. Una secuencia ventana de ¡nido se selecciona para la transición de enventanado con bloques de la primera longitud a enventanado con bloques de la segunda longitud, mientras que se selecciona una secuencia de ventana única para la transición opuesta. La secuencia ventana de ¡nido se selecciona entre al menos dos secuencias de ventana de inicio diferentes que tienen diferentes longitudes, mientras que una secuencia de ventana de parada se selecciona de al menos dos secuencias de ventana de parada diferentes que tienen longitudes diferentes. El método de decodificación de bloques de señales de audio codificadas selecciona una transformación inversa adecuada, así como una ventana de síntesis adecuada como una reacción a información secundaria asociada con cada bloque.
[0006] El documento Recomendación UIT-T G. 729 divulga un codificador CELP que tiene ventanas de análisis que se solapan en más de un 50% para el procesamiento LPC.
Descripción de la invención
[0007] Una modalidad de un banco de filtros de análisis según la reivindicación 1 para filtrar una pluralidad de cuadros de entrada de dominio de tiempo, en donde un cuadro de entrada comprende un número de muestras de entrada ordenadas, comprende un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, en donde un cuadro de ventana comprende una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera traslapante utilizando un valor por adelantado de la muestra, en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada divididas por dos y un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, en donde un cuadro de salida es una representación espectral de un cuadro de ventana.
Breve descripción de las figuras
[0008] Las modalidades de la presente invención son descritas posteriormente en la presente haciendo referencia a las figuras adjuntas.
La Figura 1 muestra un diagrama de bloques de un banco de filtros de análisis;
La Figura 2 muestra una representación esquemática de cuadros de entrada siendo procesados por una modalidad de un banco de filtros de análisis;
La Figura 3 muestra un diagrama de bloques de una modalidad de un banco de filtros de síntesis;
La Figura 4 muestra una representación esquemática de cuadros de salida en el marco de ser procesado por una modalidad de un banco de filtros de síntesis;
La Figura 5 muestra una representación esquemática de una función de ventana de análisis y una función de ventana de síntesis de una modalidad de un banco de filtros de análisis y de un banco de filtros de síntesis;
La Figura 6 muestra una comparación de una función de ventana de análisis y una función de ventana de síntesis en comparación con una función de ventana de señal:
La Figura 7 muestra una comparación adicional de diferentes funciones de ventana;
La Figura 8 muestra una comparación del comportamiento de pre-eco para las tres funciones de ventana diferentes mostradas en la figura 7;
La Figura 9 muestra esquemáticamente la propiedad de enmascaramiento temporal general del oído humano;
La Figura 10 muestra una comparación de la respuesta de frecuencia de una ventana de señal y una ventana de bajo retardo;
La Figura 11 muestra una comparación de una respuesta de frecuencia de una ventana de seno y una ventana de traslape bajo;
La Figura 12 muestra una modalidad de un codificador;
La Figura 13 muestra una modalidad de un descodificador;
La Figura 14a muestra un sistema que comprende un codificador y un descodificador;
La Figura 14b muestra fuentes diferentes para retardos comprendidos en el sistema mostrado en la figura 14a;
La Figura 15 muestra una tabla que comprende una comparación de retardos;
La Figura 16 muestra una modalidad de un sistema de conferencia que comprende una modalidad de un mezclador; La Figura 17 muestra una modalidad adicional de un sistema de conferencia como un servidor o una unidad de control de medios;
La Figura 18 muestra un diagrama de bloques de una unidad de control de medios;
La Figura 19 muestra una modalidad de un banco de filtros de síntesis como una implementación eficiente;
La Figura 20 muestra una tabla que comprende una evaluación de la eficiencia computacional de una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis (codee AAC ELD);
La Figura 21 muestra una tabla que comprende una evaluación de la eficiencia computacional de un codee AAC LD; La Figura 22 muestra una tabla que comprende una evaluación de la complejidad computacional de un codee AAC
LC;
Las Figuras 23a y 23b muestran tablas que comprenden una comparación de la evaluación de eficiencia de memoria de RAM y ROM para tres codees diferentes; y
La Figura 24 muestra una tabla que comprende una lista de codee usados para una prueba de MUSHRA.
Descripción detallada de la invención
[0009] Las Figuras 1 a 24 muestran diagramas de bloques y diagramas adicionales que describen las propiedades funcionales y elementos de modalidades diferentes de un banco de filtros de análisis, un banco de filtros de síntesis, un codificador, un descodificador, un mezclador, un sistema de conferencia y otras modalidades de la presente invención. Sin embargo, antes de describir una modalidad de un banco de filtro de síntesis con respecto a las Figuras 1 y 2, una modalidad de... [Seguir leyendo]
Reivindicaciones:
1. Un banco de filtros de análisis para filtrar unapluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respecyivamente, que comprende:
un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana comprendiendo una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera superpuesta utilizando un valor por adelantado de la muestra,
en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2;
en donde el formador de ventanas está configurado para generar consecutivamente dos cuadros de ventana en base a dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y
en donde el formador de ventanas está configurado para generar la pluralidad de cuadros de ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, son desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra y
un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, un cuadro de salida siendo una representación espectral de un cuadro de ventana.
2. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para omitir por lo menos una última muestra de entrada de acuerdo con el orden de las muestras de entrada ordenadas o para ajustar por lo menos una última muestra de ventana correspondiente al orden de las muestras de entrada a cero o a por lo menos un valor en un intervalo predeterminado.
3. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para omitir o ajustar una pluralidad de muestras de entrada a cero o a por lo menos un valor en un Intervalo predeterminado, en donde la pluralidad de muestras de entrada comprende un subconjunto de muestras de entrada conectadas que comprenden la última muestra de entrada de acuerdo con el orden de las muestras de entrada ordenadas.
4. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado de tal manera que la ponderación del cuadro de entrada comprende multiplicar por lo menos una pluralidad de muestras de entrada del cuadro de entrada con un coeficiente de formación de ventanas específico de las muestra de entrada de la función de ventana.
5. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado de tal manera que la ponderación del cuadro de entrada comprende multiplicar cada muestra de entrada del cuadro de entrada con un coeficiente de formación de ventana específico de la muestra de entrada de la función de ventana.
6. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para generar una muestra de ventana Z¡,n en base a la expresión
Z¡,n = W(N-1-n) ' X'i.n
en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, en donde n = -N,..., N-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de salida de un cuadro de salida, en donde w(N- 1-n) es la función de ventana y en donde x'¡,n es una muestra de entrada con un índice de muestra n y el índice de cuadro i.
7. El banco de filtros de análisis segúnla reivindicación 1, caracterizado porque el formador de ventanas está configurado para generar una muestra de ventana Z¡,n en base a la expresión
Z¡,n = W(N-1-n) 1 X'i.n
en donde i es un número entero que indica un índice de cuadro o índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, en donde n = -N,..., 7N/8-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de salida de un cuadro de salida, en donde w(N- 1-n) es la fundón de ventana y en donde x'i,n es una muestra de entrada con un índice de muestra n y el índice de cuadro i.
8. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para ajustar una muestra de ventana a un valor en un intervalo predeterminado al ajustar la muestra de ventana correspondiente a un valor que comprende un valor absoluto menor que un umbral mínimo y/o a un valor que comprende un valor absoluto más de un umbral máximo.
9. El banco de filtros de análisis según la reivindicación 8, caracterizado porque el umbral mínimo y/o el umbral máximo es dado por 10s o 2S, en donde s es un número entero.
10. El banco de filtros de análisis según la reivindicación 8, caracterizado porque el umbral mínimo es determinado por un valor máximo absoluto representable por un bit menos significativo o una pluralidad de bits menos significativos y/o un umbral máximo es determinado por un valor mínimo absoluto representable por un bit más significativo o una pluralidad de bits más significativos en el caso de una representación binaria de las muestras de entrada y/o las muestras de ventana.
11. El banco de filtros de análisis según la reivindicación 2, caracterizado porque el formador de ventanas está configurado de tal manera que el número de muestras de entrada omitidas, el número de muestras de ventana ajustadas a cero o a por lo menos el valor en el intervalo predeterminado es mayor o igual al número de valores de salida de un cuadro de salida dividido por 16.
12. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar cuadros de salida que comprenden menos de la mitad del número de valores de salida en comparación con el número de muestras de entrada de un cuadro de entrada.
13. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar cuadros de salida que comprenden un número de valores de salida, que es igual al número de muestras de entrada de un cuadro de entrada dividido por un número entero mayor de 2.
14. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, que es igual al número de muestras de entrada de un cuadro de entrada dividido por 4.
15. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está basado en por lo menos una de una transformada de coseno discreta y una transformada de seno discreta.
16. El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar valores de salida X¡,k basados en una expresión
en donde i es un número entero que indica un índice de bloque o un índice de cuadro, en donde k es un número entero que indica un índice de coeficiente espectral, en donde n es un índice de muestra, en donde N es un número entero que indica dos veces el número de valores de salida de un cuadro de salida, en donde
es un valor desplazado, y en donde zi.n es una muestra de ventana correspondiente al coeficiente espectral k y el índice de cuadro i.
17. Método para filtrar una pluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respectivamente, que comprende: generar una pluralidad de cuadros de ventana mediante el procesamiento de la pluralidad de cuadros de entrada de manera traslapante utilizando un valor por adelantado de la muestra;
en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2,
en donde dos cuadros de ventana generados consecutivamente están basados en dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y
en donde la generación de la pluralidad de cuadros de ventana comprende generar la pluralidad de cuadros de
**(Ver fórmula)**para 0 < k < N/2 ,
ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, están desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra; y proporcionar una pluralidad de cuadros de salida que comprenden un número de valores de salida al efectuar una 5 conversión de tiempo/frecuencia, un cuadro de salida es una representación espectral de un cuadro de ventana.
18. Programa de computadora para efectuar, cuando se ejecuta en una computadora, el método de conformidad de la reivindicación 17.
Patentes similares o relacionadas:
Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]
Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]
Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]
Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]
Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]
Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]
Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]
Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]