Representación de señal de información utilizando transformada superpuesta.

Un reconstructor de señal de información configurado para reconstruir,

usando la cancelación del aliasing, una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para reconstruir la señal de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el reconstructor de señal de información comprende:

un retransformador (70) configurado para aplicar una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84), de modo de obtener una retransformada (96) para la región precedente (84), y aplicar una retransformación sobre la transformada de la versión de ventana de la región sucesora (86) de modo de obtener una retransformada (100) para la región sucesora (86), donde la retransformada (96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing (102) en el borde (82) entre las regiones precedente y sucesora;

un remuestreador (72) configurado para remuestrear, mediante la interpolación, la retransformación (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86) en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82); y

una combinadora (74) configurada para realizar la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas por el remuestreo en la porción de cancelación del 20 aliasing (102).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2012/052458.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: GEIGER, RALF, SCHNELL,MARKUS, RAVELLI,EMMANUEL, FOTOPOULOU,ELENI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/012 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación del ruido de confort o el silencio.

PDF original: ES-2458436_T3.pdf

 


Fragmento de la descripción:

Representación de señal de información utilizando transformada superpuesta.

La presente solicitud se refiere a la representación de señal de información usando transformadas superpuestas, y en particular, a la representación de una señal de información usando una representación de transformada superpuesta de la señal de información que requiere la cancelación del aliasing, tal como se usa, por ejemplo, en técnicas de compresión de audio.

La mayoría de las técnicas de compresión están diseñadas para un tipo específico de señal de información y condiciones de transmisión específicas de la corriente de datos comprimida, tal como el máximo retardo permitido y tasa de bits de transmisión disponible. Por ejemplo, en la compresión de audio, los códecs [codificadores– decodificadores] sobre la base de la transformada, tales como AAC [sigla en inglés de: codificación de audio avanzada], tienden a superar a los códecs de dominio de tiempo sobre la base de la predicción lineal, tales como ACELP [sigla en inglés de: Predicción Lineal excitada por código algebraico (algoritmo de codificación de discurso) ], en el caso de la mayor tasa de bits disponible y en el caso de la codificación de música en lugar de discurso. El códec USAC [sigla en inglés de: codificación de discurso y audio unificada], por ejemplo, busca cubrir una mayor variedad de escenarios de aplicaciones, mediante la unificación de diferentes principios de codificación de audio dentro de un códec. Sin embargo, sería favorable aumentar adicionalmente la capacidad de adaptación a diferentes condiciones de codificación, por ejemplo, variando la tasa de bits de transmisión disponible a fin de poder sacar ventaja de ella, de manera de lograr, por ejemplo, una mayor eficiencia de codificación, o características similares.

Se conoce a partir de la solicitud de patente EP2107556A1 una codificación de transformada de audio con la que obtener una representación procesada de una señal de audio que tiene una secuencia de tramas generadas por muestreo de la señal de audio dentro de unos marcos primero y segundo, donde el muestreo utiliza la información en un contorno de tono.

En consecuencia, un objetivo de la presente invención es proporcionar dicho concepto mediante la provisión de un esquema de representación de señal de información con transformada superpuesta, que permita la representación de una señal de información por medio de una representación de transformada superpuesta que requiera la cancelación del aliasing, de modo que sea posible adaptar la representación de transformada superpuesta a la necesidad real, a fin de proporcionar la posibilidad de lograr mayor eficiencia de codificación.

Este objetivo es logrado por el asunto de las reivindicaciones independientes pendientes.

Las principales creencias que condujeron a la presente invención son las siguientes. Las representaciones de transformada superpuesta de señales de información a menudo se usan con la finalidad de formar un preestado en la codificación eficiente de la señal de información en términos de, por ejemplo, el sentido de la relación de tasa/distorsión. Ejemplos de dichos códecs son AAC o TCX [sigla en inglés de: excitación codificada de transformada] o similares. Las representaciones de transformada superpuesta, sin embargo, pueden ser usadas además para realizar el remuestreo mediante la transformada y retransformada concatenadas con diferentes resoluciones espectrales. En general, las representaciones de transformada superpuesta que causan aliasing en las porciones de superposición de las retransformadas individuales de las transformadas de las versiones en ventana de regiones de tiempo consecutivas de la señal de información tienen una ventaja en términos de la menor cantidad de niveles de coeficientes de transformada por codificar, de modo de representar la representación de transformada superpuesta. En una forma extrema, las transformadas superpuestas son “críticamente muestreadas”. Es decir, no aumentan el número de coeficientes en la representación de transformada superpuesta, en comparación con el número de muestras de tiempo de la señal de información. Un ejemplo de representación de transformada superpuesta es un banco de filtro MDCT (sigla en inglés de: transformada de coseno discreta modificada) o QMF (sigla en inglés de: filtros espejo en cuadratura) . Por lo tanto, a menudo es favorable utilizar dicha representación de transformada superpuesta como un preestado en la codificación eficiente de señales de información. Sin embargo, sería además favorable poder permitir la tasa de muestra a la cual es representada la señal de información usando la representación de transformada superpuesta para cambiar en el tiempo, de modo de adaptarse, por ejemplo, a la tasa de bits de transmisión disponible o a otras condiciones ambientales. Imaginen una tasa de bits de transmisión disponible variable. Cada vez que la tasa de bits de transmisión disponible cae por debajo de algún umbral predeterminado, por ejemplo, puede ser favorable disminuir la tasa de muestra, y cuando la tasa de transmisión disponible se eleva nuevamente, será favorable poder aumentar la tasa de muestra a la cual la representación de transformada superpuesta representa la señal de información. Desafortunadamente, las porciones de aliasing de superposición de las retransformadas de la representación de transformada superpuesta parecen formar una barra contra dichos cambios de tasa de muestra, donde dicha barra parece ser superada solo mediante la interrupción completa de la representación de transformada superpuesta en los casos de cambios de tasa de muestra. No obstante, los inventores de la presente invención han hallado una solución al problema arriba mencionado, de modo de permitir un uso eficiente de representaciones de transformada superpuesta que involucran aliasing y la variación de tasa de muestra en cuestión. En particular, mediante la interpolación, la región precedente o siguiente de la señal de información es remuestreada en la porción de cancelación de aliasing de acuerdo con el cambio de tasa de muestra en el borde entre ambas regiones. Entonces, una combinadora puede efectuar la cancelación del aliasing en el borde entre las retransformadas para las regiones precedentes y siguientes obtenidas por el remuestreo en la porción de cancelación del aliasing. Con esta medida, los cambios en la tasa de muestreo son eficientemente atravesados, de modo de evitar cualquier discontinuidad de la representación de transformada superpuesta en los cambios o transiciones de tasa de muestra. Son viables también medidas similares del lado de la transformada, de manera de generar apropiadamente una transformada superpuesta.

Utilizando la idea arriba mencionada, es posible proporcionar técnicas de compresión de señal de información, tales como técnicas de compresión de audio, que tienen alta eficiencia de codificación sobre un amplio rango de condiciones de codificación ambientales, como el ancho de banda de transmisión disponible, mediante la adaptación de la tasa de muestra proporcionada, a estas condiciones, sin penalidad por los casos de cambios de tasa de muestra en sí mismos.

Los aspectos convenientes de la presente invención son el tema de las reivindicaciones dependientes del juego de reivindicaciones pendientes. Además, las realizaciones preferidas de la presente invención se describen a continuación con respecto a las figuras, donde:

la Fig. 1a muestra un diagrama de bloques de un codificador de información, donde las realizaciones de la presente invención podrían ser implementadas;

la Fig. 1b muestra un diagrama de bloques de un decodificador de señales de información donde podrían implementarse las realizaciones de la presente invención;

la Fig. 2a muestra un diagrama de bloques de una estructura interna posible del codificador núcleo de la Fig. 1a;

la Fig. 2b muestra un diagrama de bloques de una estructura interna posible del decodificador núcleo de la Fig. 1b;

la Fig. 3a muestra un diagrama de bloques de una implementación posible del remuestreador de la Fig. 1a;

la Fig. 3b muestra un diagrama de bloques de una estructura interna posible del remuestreador de la Fig. 1b;

la Fig. 4a muestra un diagrama de bloques de un codificador de señal de información donde podrían implementarse las realizaciones de la presente invención;

la Fig. 4b muestra un diagrama de bloques de un decodificador de señal de información donde podrían implementarse las realizaciones de la presente invención;

la Fig. 5 muestra un diagrama de bloques de un reconstructor de señal de información de acuerdo con una realización;... [Seguir leyendo]

 


Reivindicaciones:

1. Un reconstructor de señal de información configurado para reconstruir, usando la cancelación del aliasing, una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para reconstruir la señal de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el reconstructor de señal de información comprende:

un retransformador (70) configurado para aplicar una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84) , de modo de obtener una retransformada (96) para la región precedente (84) , y aplicar una retransformación sobre la transformada de la versión de ventana de la región sucesora (86) de modo de obtener una retransformada (100) para la región sucesora (86) , donde la retransformada (96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing (102) en el borde (82) entre las regiones precedente y sucesora;

un remuestreador (72) configurado para remuestrear, mediante la interpolación, la retransformación (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86) en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82) ; y

una combinadora (74) configurada para realizar la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas por el remuestreo en la porción de cancelación del aliasing (102) .

2. El reconstructor de señal de información de acuerdo con la reivindicación 1, donde el remuestreador está configurado para remuestrear la retransformada (96) para la región precedente en la porción de cancelación del aliasing de acuerdo con el cambio de tasa de muestra en el borde.

3. El reconstructor de señal de información de acuerdo con la reivindicación 1 o 2, donde una relación de una longitud de transformada de la retransformación aplicada a la transformada (94) de la versión de ventana de la región precedente (84) , a una longitud temporal de la región precedente (84) , difiere de una relación de una longitud de transformada de la retransformación aplicada a la versión de ventana de la región sucesora (86) , a una longitud temporal de la región sucesora (86) por un factor que corresponde al cambio de tasa de muestra.

4. El reconstructor de señal de información de acuerdo con la reivindicación 3, donde las longitudes temporales de las regiones precedente y sucesora (84, 86) son iguales entre sí, y el retransformador (70) está configurado para restringir la aplicación de la retransformación sobre la transformada de la versión de ventana de la región precedente

(84) a una porción de baja frecuencia de la transformada de la versión de ventana de la región precedente, y/o restringir la aplicación de la retransformación sobre la transformada de la versión de ventana de la región sucesora sobre una porción de baja frecuencia de la transformada de la versión de ventana de la región sucesora.

5. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 4, donde una longitud de transformada de la transformada de la versión de ventana de las regiones de la señal de información y una longitud temporal de las regiones de la señal de información son constantes, y el reconstructor de señal de información está configurado para localizar el borde (82) que responde a una señal de control (98) .

6. Un remuestreador compuesto por una concatenación de un banco de filtro (38) para proporcionar una representación de transformada superpuesta de una información de señal, y un banco de filtro inverso (42) que comprende un reconstructor de señal de información (80) configurado para reconstruir, usando la cancelación del aliasing, la señal de información a partir de la representación de transformada superpuesta de la señal de información de acuerdo con la reivindicación 5.

7. Un codificador de señal de información que comprende un remuestreador de acuerdo con la reivindicación 6 y una etapa de compresión (16) configurada para comprimir la señal de información reconstruida, donde el codificador de señal de información además comprende un control de tasa de muestra configurado para controlar la señal de control (98) de acuerdo con una información externa en tasa de bits de transmisión disponible.

8. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 4, donde la longitud de transformada de la transformada de la versión de ventana de las regiones de la señal de información varía, mientras que una longitud temporal de las regiones de la señal de información es constante, donde el reconstructor de señal de información está configurado para localizar el borde (82) mediante la detección de un cambio en la longitud de transformada de la versión de ventana de las regiones de la señal de información.

9. El reconstructor de señal de información de acuerdo con la reivindicación 8, donde el retransformador está configurado para adaptar una longitud de transformada de la retransformación aplicada sobre la transformada de la

versión de ventana de las regiones precedente y sucesora, a la longitud de transformada de la transformada de la versión de ventana de las regiones precedente y sucesora.

10. Un reconstructor de señal de información que comprende un descompresor (34) configurado para reconstruir una representación de transformada superpuesta de una señal de información de una corriente de datos, y un reconstructor de señal de información de acuerdo con la reivindicación 9, configurado para reconstruir, using la cancelación del aliasing, la señal de información a partir de la representación de transformada superpuesta.

11. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8 y 9, donde la transformada superpuesta es críticamente muestreada tal como una MDCT.

12. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8 y 9, donde la representación de transformada superpuesta es un banco de filtro de valor complejo.

13. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8, 9, 11 y 12, donde el remuestreador está configurado para usar una interpolación lineal o flexible para la interpolación.

14. El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8, 9, 11 y 12, donde la tasa de muestra disminuye en el borde (82) , y el retransformador (70) está configurado para, en la aplicación de la retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84) , atenuar, o establecer en cero, frecuencias más altas de la transformada (94) de la versión de ventana de la región precedente (84) .

15. Un transformador de señal de información configurado para generar una representación de transformada superpuesta de una señal de información usando una transformada superpuesta causante de aliasing, que comprende:

una entrada (105) , para recibir la señal de información en la forma de una secuencia de muestras;

un capturador (106) , configurado para capturar regiones de superposición consecutivas de la señal de información;

un remuestreador (107) , configurado para aplicar, mediante la interpolación, un remuestreado sobre por lo menos un subgrupo de las regiones de superposición consecutivas de las señales de información, de modo que cada una de las porciones de superposición consecutivas tiene una tasa de muestra constante respectiva, si bien la tasa de muestra constante respectiva varía entre las regiones de superposición consecutivas;

un ventaneador (108) , configurado para la aplicación de un ventaneado sobre las regiones de superposición consecutivas, de la señal de información; y un transformador (109) , configurado para aplicar, individualmente, una transformada sobre las regiones ventaneadas.

16. El transformador de señal de información de acuerdo con la reivindicación 15, donde el capturador (106) está configurado para realizar la captura de las regiones de superposición consecutivas de la señal de información, de modo que las regiones de superposición consecutivas de la señal de información tienen una longitud de tiempo constante.

17. El transformador de señal de información de acuerdo con la reivindicación 15 o 16, donde el capturador (106) está configurado para efectuar la captura de las regiones de superposición consecutivas de la señal de información, de modo que las regiones de superposición consecutivas de la señal de información tienen una compensación de tiempo constante.

18. El transformador de señal de información de acuerdo con la reivindicación 16 o 17, donde la secuencia de muestras tiene una tasa de muestra variable que cambia de una primera tasa de muestra a una segunda tasa de muestra en un instante de tiempo predeterminado (113) , donde el remuestreador (107) está configurado para aplicar el remuestreado sobre las regiones de superposición consecutivas (114b, c) que se superponen con el instante de tiempo predeterminado, de manera que su tasa de muestra constante cambia solamente una vez de la primera tasa de muestra a la segunda tasa de muestra.

19. El transformador de señal de información de acuerdo con la reivindicación 18, donde el transformador está configurado para adaptar una longitud de transformada de la transformada de cada región ventaneada, a un número de muestras de la respectiva región ventaneada.

20. Un procedimiento para la reconstrucción, usando la cancelación del aliasing, de una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para la reconstrucción de la señal

de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el procedimiento comprende:

la aplicación de una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84) , de modo de obtener una retransformada (96) para la región precedente (84) , y la aplicación de una retransformación sobre la transformada de la versión de ventana de la región sucesora (86) , de modo de obtener una retransformada (100) para la región sucesora (86) , donde la retransformada (96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing

(102) en el borde (82) entre las regiones precedente y sucesora;

el remuestreado, mediante la interpolación, de la retransformada (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86) , en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82) ; y

la realización de la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas mediante el remuestreado en la porción de cancelación del aliasing (102) .

21. Un procedimiento para la generación de una representación de transformada superpuesta de una señal de información usando una transformada superpuesta causante de aliasing, que comprende:

la recepción de la señal de información en forma de una secuencia de muestras;

la captura de regiones de superposición consecutivas, de la señal de información;

la aplicación, mediante la interpolación, de un remuestreado sobre por lo menos un subgrupo de las regiones de superposición consecutivas de las señales de información, de modo que cada una de las porciones de superposición consecutivas tiene una respectiva tasa de muestra constante, si bien la respectiva tasa de muestra constante varía entre las regiones de superposición consecutivas;

la aplicación de un ventaneado sobre las regiones de superposición consecutivas de la señal de información; y la aplicación individual de una transformación sobre las regiones ventaneadas.

22. Un programa para computadora que tiene un código de programa para la realización, cuando es ejecutado en una computadora, de un procedimiento de acuerdo con la reivindicación 20 o 21.


 

Patentes similares o relacionadas:

Imagen de 'Método, dispositivo y sistema de transmisión de datos multimedia'Método, dispositivo y sistema de transmisión de datos multimedia, del 24 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de señales de audio que comprende: en un caso en el cual una manera de codificación de una trama previa de una trama actualmente ingresada […]

Aparato y método de selección de modo de generación de ruido de confort, del 6 de Mayo de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para codificar información de audio, que comprende: un selector para seleccionar un modo de generación de ruido de confort […]

Método de generación y procesado de señal de ruido, codificador/decodificador y sistema de codificación/decodificación, del 22 de Abril de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de procesado de señal de ruido basado en predicción lineal, en donde el método comprende: adquirir (S51) una señal de ruido, y obtener un coeficiente de predicción […]

Método de procesamiento de señal de voz/audio y aparato de codificación, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de procesamiento de señal de voz/audio, que comprende: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante […]

Método para estimar ruido en una señal de audio, estimador de ruido, codificador de audio, decodificador de audio, y sistema para transmitir señales de audio, del 20 de Noviembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Método para estimar ruido en una señal de audio, comprendiendo el método: determinar (S100) un valor de energía para la señal de audio; convertir […]

Métodos y aparatos para retención DTX en codificación de audio, del 12 de Junio de 2019, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método realizado por un codificador, el codificador funcionando para codificar la conversación y aplicar un esquema de transmisión discontinua, DTX, que […]

Codificación y decodificación de posiciones de impulso de pistas de una señal de audio, del 3 de Junio de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para decodificar una señal de audio codificada, en el que una o más pistas se asocian con la señal de audio codificada, teniendo […]

Aparato y procedimiento para codificar una señal de audio usando una parte de anticipación alineada, del 10 de Abril de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para codificar una señal de audio que presenta un flujo de muestras de audio , que comprende: un dispositivo de división en ventanas […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .