Transposición armónica mejorada de producto cruzado.

Un sistema para generar una componente de alta frecuencia de una señal de audio a partir de una componentede baja frecuencia de la señal de audio,

que comprende:

- un banco de filtros de análisis (301) que proporciona una pluralidad de señales de subbanda de análisis de lacomponente de baja frecuencia de la señal de audio;

- una unidad de procesamiento no lineal (302) para generar una señal de subbanda de síntesis con unafrecuencia de síntesis multiplicando una fase compleja de una primera y una segunda señal de la pluralidad deseñales de subbanda de análisis y combinando las señales de subbanda de análisis multiplicadas en fase; y

- un banco de filtros de síntesis (303) para generar la componente de alta frecuencia de la señal de audio a partirde la señal de subbanda de síntesis;

en el que

- la unidad de procesamiento no lineal (302) comprende una unidad de múltiples entradas y única salida (800-n)de un primer y un segundo orden de transposición que genera la señal de subbanda de síntesis (803) a partir dela primera (801) y la segunda (802) señal de subbanda de análisis con una primera frecuencia de análisis w yuna segunda frecuencia de análisis (w+W), respectivamente;

- la primera señal de subbanda de análisis (801) está multiplicada en fase por el primer orden de transposición (Tr);

- la segunda señal de subbanda de análisis (803) está multiplicada en fase por el segundo orden de transposiciónr;

- T y r son enteros positivos y T >1; 1 £ r< T; y

- la frecuencia de síntesis es (T-r)·w + r·(w+W).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/050483.

Solicitante: DOLBY INTERNATIONAL AB.

Nacionalidad solicitante: Países Bajos.

Dirección: Apollo Building, 3E, Herikerbergweg 1-35 1101 CN Amsterdam Zuid-Oost PAISES BAJOS.

Inventor/es: VILLEMOES, LARS, HEDELIN,PER.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2427278_T3.pdf

 

Transposición armónica mejorada de producto cruzado.

Fragmento de la descripción:

Transposición armónica mejorada de producto cruzado

CAMPO TÉCNICO

La presente invención se refiere a sistemas de codificación de audio que utilizan un procedimiento de transposición armónica para una reconstrucción de alta frecuencia (HFR) .

ANTECEDENTES DE LA INVENCIÓN

Las tecnologías HFR, tal como la tecnología de replicación de banda espectral (SBR) , permiten mejorar significativamente la eficacia de codificación de los códecs de audio perceptivos tradicionales. En combinación con la codificación de audio avanzada (AAC) de MPEG-4, forma un códec de audio muy eficaz, que ya se utiliza en el

sistema de radio por satélite XM y en la radio digital mundial. La combinación de la ACC y la SBR se llama aacPlus. Es parte de la norma MPEG-4, en la que se denomina perfil AAC de alta eficacia. En general, la tecnología HFR puede combinarse con cualquier códec de audio perceptivo de manera compatible con versiones anteriores y futuras, ofreciendo por tanto la posibilidad de actualizar sistemas de radiodifusión ya establecidos como la Capa-2 de MPEG usada en el sistema DAB Eureka. Los procedimientos de transposición HFR también pueden combinarse con códecs de voz para permitir voz de banda ancha a velocidades binarias ultra bajas.

La idea básica subyacente a la HRF es la observación de que normalmente hay una estrecha correlación entre las características del intervalo de altas frecuencias de una señal y las características del intervalo de bajas frecuencias de la misma señal. Por tanto, una buena aproximación para la representación del intervalo de altas frecuencias de entrada original de una señal puede conseguirse mediante una transposición de señal desde el intervalo de bajas frecuencias hasta el intervalo de altas frecuencias.

Este concepto de transposición se estableció en el documento WO 98/57436 como un procedimiento para recrear una banda de altas frecuencias a partir de una banda de frecuencias más bajas de una señal de audio. Puede obtenerse un ahorro sustancial en la velocidad binaria usando este concepto en la codificación de audio y/o en la codificación de voz. A continuación se hará referencia a la codificación de audio, pero debe observarse que los procedimientos y sistemas descritos pueden aplicarse igualmente a la codificación de voz y a una codificación unificada de voz y audio (USAC) .

En un sistema de codificación de audio basado en HFR, una señal de bajo ancho de banda se presenta a un codificador de forma de onda principal y las frecuencias más altas se generan en el lado del descodificador usando la transposición de la señal de bajo ancho de banda e información complementaria adicional, que está codificada normalmente a velocidades binarias muy bajas y que describe la forma espectral objetivo. Para velocidades binarias bajas, en las que el ancho de banda de la señal codificada principal es estrecho, es cada vez más importante recrear una alta banda, es decir, el intervalo de altas frecuencias de la señal de audio, con características agradables desde un punto de vista perceptivo. A continuación se mencionan dos variantes de procedimientos de reconstrucción de frecuencias armónicas, una denominada transposición armónica y la otra denominada modulación de banda lateral única.

El principio de transposición armónica definido en el documento WO 98/57436 es que un sinusoide de frecuencia ω se correlaciona con un sinusoide de frecuencia Tω, donde T >1 es un entero que define el orden de la transposición. Una característica atractiva de la transposición armónica es que amplía un intervalo de frecuencias origen, formando un intervalo de frecuencias destino, en un factor igual al orden de transposición, es decir, en un factor igual a T. La transposición armónica funciona bien para material musical complejo. Además, la transposición armónica presenta bajas frecuencias de cruce, es decir, un gran intervalo de altas frecuencias superiores a la frecuencia de cruce puede generarse a partir de un intervalo relativamente pequeño de bajas frecuencias inferiores a la frecuencia de cruce.

A diferencia de la transposición armónica, una HFR basada en modulación de banda lateral única (SSB)

correlaciona un sinusoide de frecuencia ω con un sinusoide de frecuencia ω + Δω, donde Δω es un desplazamiento de frecuencia fijo. Se ha observado que, dada una señal principal con un bajo ancho de banda, puede generarse un artefacto de llamada disonante a partir de la transposición SSB. También debe observarse que para una baja frecuencia de cruce, es decir, un pequeño intervalo de frecuencias origen, la transposición armónica requerirá un menor número de ajustes con el fin de llenar un intervalo de frecuencias objetivo deseado en comparación con la transposición basada en SSB. A modo de ejemplo, si debe llenarse el intervalo de altas frecuencias de (ω, 4ω], usar una transposición armónica de orden de transposición T = 4 puede llenar este intervalo de frecuencias a partir de un intervalo de bajas frecuencias de Por otro lado, una transposición basada en SSB que usa el mismo intervalo de bajas frecuencias debe usar un desplazamiento de frecuencia de y es necesario repetir el proceso cuatro veces para llenar el intervalo de altas frecuencias (ω, 4ω].

Por otro lado, como se indica en el documento WO 02/052545 A1, la transposición armónica tiene desventajas para señales con una estructura periódica prominente. Tales señales son superposiciones de sinusoides relacionados de manera armónica con frecuencias Ω, 2Ω, 3Ω, …, donde Ω es la frecuencia fundamental. Tras la transposición 5 armónica de orden T, los sinusoides de salida tienen frecuencias TΩ, 2TΩ, 3TΩ, ..., que, en el caso de T >1, es solo un subconjunto estricto de la serie armónica total deseada. En lo que respecta a la calidad de audio resultante, normalmente se percibirá un tono "fantasma" correspondiente a la frecuencia fundamental transpuesta TΩ. Con frecuencia, la transposición armónica da como resultado un carácter sonoro “metálico” de la señal de audio codificada y descodificada. La situación puede mitigarse hasta cierto punto añadiendo varios órdenes de transposición T = 2, 3, …, Tmax a la HFR, pero este procedimiento es complejo desde un punto de vista computacional si van a evitarse la mayor parte de huecos espectrales.

Una solución alternativa para evitar la aparición de tonos “fantasma” cuando se usa la transposición armónica se ha presentado en el documento WO 02/052545 A1. La solución consiste en usar dos tipos de transposición, es decir, 15 una transposición armónica típica y una “transposición de impulsos" especial. El procedimiento descrito conmuta a la “transposición de impulsos” dedicada en aquellas partes de la señal de audio detectadas como periódicas a modo de un tren de impulsos. El problema de este enfoque es que la aplicación de la "transposición de impulsos" en material musical complejo degrada normalmente la calidad en comparación con una transposición armónica basada en un banco de filtros de alta resolución. Por tanto, los mecanismos de detección tienen que ajustarse de manera muy 20 conservadora para que la transposición de impulsos no se use con material complejo. Inevitablemente, los instrumentos y veces de un solo tono se clasifican algunas veces como señales complejas, invocándose de ese modo la transposición armónica y, por lo tanto, perdiéndose armónicos. Además, si la conmutación se produce en la parte central de una señal de un solo tono, o de una señal con un tono dominante en un fondo complejo más débil, la propia conmutación entre los dos procedimientos de transposición, que tienen propiedades de llenado de espectro muy diferentes, generará artefactos audibles.

RESUMEN DE LA INVENCIÓN

La presente invención proporciona un procedimiento y un sistema para completar la serie armónica resultante de la transposición armónica de una señal periódica. La transposición en el dominio de frecuencia comprende la etapa de correlacionar señales de subbanda modificadas de manera no lineal procedentes de un banco de filtros de análisis con subbandas seleccionadas de un banco de filtros de síntesis. La modificación no lineal comprende una modificación de fase o rotación de fase, que en un dominio de banco de filtros complejos puede obtenerse mediante una ley de potencia seguida de un ajuste de magnitud. Mientras que la transposición de la técnica anterior modifica una subbanda de análisis a la vez por separado, la presente invención añade una combinación no lineal de al menos dos subbandas... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema para generar una componente de alta frecuencia de una señal de audio a partir de una componente de baja frecuencia de la señal de audio, que comprende: 5

- un banco de filtros de análisis (301) que proporciona una pluralidad de señales de subbanda de análisis de la componente de baja frecuencia de la señal de audio;

- una unidad de procesamiento no lineal (302) para generar una señal de subbanda de síntesis con una frecuencia de síntesis multiplicando una fase compleja de una primera y una segunda señal de la pluralidad de señales de subbanda de análisis y combinando las señales de subbanda de análisis multiplicadas en fase; y

- un banco de filtros de síntesis (303) para generar la componente de alta frecuencia de la señal de audio a partir de la señal de subbanda de síntesis;

en el que 15

- la unidad de procesamiento no lineal (302) comprende una unidad de múltiples entradas y única salida (800-n) de un primer y un segundo orden de transposición que genera la señal de subbanda de síntesis (803) a partir de la primera (801) y la segunda (802) señal de subbanda de análisis con una primera frecuencia de análisis ω y una segunda frecuencia de análisis (ω+Ω) , respectivamente;

- la primera señal de subbanda de análisis (801) está multiplicada en fase por el primer orden de transposición (Tr) ;

- la segunda señal de subbanda de análisis (803) está multiplicada en fase por el segundo orden de transposición r;

-T y r son enteros positivos y T > 1; 1 ≤ r < T; .

25. la frecuencia de síntesis es (T-r) ·ω + r· (ω+Ω) .

2. El sistema según la reivindicación 1, que comprende además:

- una unidad de ganancia (902) para multiplicar la señal de subbanda de síntesis (803) por un parámetro de ganancia.

3. El sistema según cualquier reivindicación anterior, que comprende además:

- una pluralidad de unidades de múltiples entradas y única salida (800-n) y/o una pluralidad de unidades de

procesamiento no lineal que generan una pluralidad de señales de subbanda de síntesis parciales (803) con la frecuencia de síntesis; y

- una unidad de suma de subbandas (702) para combinar la pluralidad de señales de subbanda de síntesis parciales.

4. El sistema según cualquiera de las reivindicaciones 1 y 2, en el que la unidad de procesamiento no lineal (302) comprende además:

- una unidad de procesamiento directo (401) para generar una señal de subbanda de síntesis adicional a partir de una tercera señal de la pluralidad de señales de subbanda de análisis; y

-una unidad de suma de subbandas para combinar señales de subbanda de síntesis con la frecuencia de síntesis.

5. El sistema según la reivindicación 4, en el que

- la unidad de suma de subbandas ignora las señales de subbanda de síntesis generadas en las unidades de múltiples entradas y única salida (800-n) si el mínimo de la magnitud de la primera (801) y la segunda (802) señal de subbanda de análisis es inferior a una fracción predefinida de la magnitud de la señal.

6. El sistema según la reivindicación 4, en el que la unidad de procesamiento directo (401) comprende: 55

- una unidad de única entrada y única salida (401-n) de un tercer orden de transposición T’, que genera la señal de subbanda de síntesis a partir de la tercera señal de subbanda de análisis que presenta una tercera frecuencia de análisis, donde

- la tercera señal de subbanda de análisis está modificada en fase mediante el tercer orden de transposición T’;

- T’ es mayor que uno; y

- la frecuencia de síntesis corresponde a la tercera frecuencia de análisis multiplicada por el tercer orden de transposición.

7. El sistema según cualquiera de las reivindicaciones 1 a 6, en el que 65

- el banco de filtros de análisis (301) tiene N subbandas de análisis a una separación entre subbandas esencialmente constante de Δω;

- una subbanda de análisis está asociada a un índice de subbanda de análisis n, donde n ∈ {1, …, N};

- el banco de filtros de síntesis (303) tiene una subbanda de síntesis;

- la subbanda de síntesis está asociada a un índice de subbanda de síntesis n; y

-la subbanda de síntesis y la subbanda de análisis con índice n comprenden intervalos de frecuencias relacionados entre sí a través del factor T.

8. El sistema según la reivindicación 7, en el que - la señal de subbanda de síntesis (803) está asociada a la subbanda de síntesis con índice n;

- la primera señal de subbanda de análisis (801) está asociada a una subbanda de análisis con índice n-p1;

- la segunda señal de subbanda de análisis (802) está asociada a una subbanda de análisis con índice n+p2; y

- el sistema comprende además una unidad de selección de índice par seleccionar p1 y p2.

9. El sistema según la reivindicación 8, en el que - la unidad de selección de índice puede hacerse funcionar para seleccionar los desplazamientos de índice p1 y p2 a partir de una lista limitada de pares (p1, p2) almacenada en una unidad de almacenamiento de índices; -la unidad de selección de índice puede hacerse funcionar para seleccionar el par (p1, p2) de manera que el valor

mínimo de un conjunto que comprende la magnitud de la primera señal de subbanda de análisis y la magnitud de la segunda señal de subbanda de análisis se maximiza.

10. El sistema según la reivindicación 8, en el que la unidad de selección de índice puede hacerse funcionar para determinar una lista limitada de pares (p1, p2) de manera que

- el desplazamiento de índice p1 = r·l;

- el desplazamiento de índice p2 = (T-r) ·l; y

- I es un entero positivo;

donde la unidad de selección de índice puede hacerse funcionar para seleccionar los parámetros I y r de manera que el valor mínimo del conjunto que comprende la magnitud de la primera señal de subbanda de análisis y la magnitud de la segunda señal de subbanda de análisis se maximiza.

11. El sistema según la reivindicación 8, en el que la unidad de selección de índice puede hacerse funcionar para seleccionar los desplazamientos de índice p1 y p2 en función de una característica de la señal; en el que la señal comprende una frecuencia fundamental Ω; y en el que la unidad de selección de índice puede hacerse funcionar para seleccionar los desplazamientos de índice p1 y p2 de manera que su suma de los desplazamientos de índice p1+p2 se aproxima a la fracción Ω/Δω; y su fracción p1/p2 es un múltiplo de r/ (T-r) ; o en el que la unidad de selección de índice puede hacerse funcionar para seleccionar los desplazamientos de índice p1 y p2 de manera que su suma de los desplazamientos de índice p1+p2 se aproxima a la fracción Ω/Δω; y la fracción p1/p2 es igual a r/ (T-r) .

12. Un sistema para descodificar una señal de audio, que comprende:

-un sistema (102) según cualquiera de las reivindicaciones 1 a 11 para generar una componente de alta 45 frecuencia de la señal de audio a partir de una componente de baja frecuencia de la señal;

- un descodificador principal (101) para descodificar la componente de baja frecuencia de la señal;

- un muestreador ascendente (104) para llevar a cabo un muestreo ascendente de la componente de baja frecuencia para proporcionar una componente de baja frecuencia muestreada de manera ascendente;

- un ajustador de envolvente (103) para conformar la componente de alta frecuencia; y

-una unidad de suma de componentes para determinar la señal descodificada como la suma de la componente de baja frecuencia muestreada de manera ascendente y la componente ajustada de alta frecuencia.

13. Un procedimiento para llevar a cabo una reconstrucción de altas frecuencias de una componente de alta frecuencia a partir de una componente de baja frecuencia de una señal de audio, que comprende:

- proporcionar (301) una primera señal de subbanda de la componente de baja frecuencia con una primera frecuencia ω y una segunda señal de subbanda de la componente de baja frecuencia con una segunda frecuencia (ω+Ω) ;

-multiplicar una fase compleja de la primera señal de subbanda con un primer factor de transposición (T-r) para 60 proporcionar una primera señal de subbanda transpuesta;

- multiplicar una fase compleja de la segunda señal de subbanda con un segundo factor de transposición r para proporcionar una segunda señal de subbanda transpuesta; donde T y r son enteros positivos y T > 1; y 1 ≤ r < T; y

-combinar (303) la primera y la segunda señal de subbanda transpuesta para proporcionar una componente de 65 alta frecuencia con una alta frecuencia (T-r) ·ω + r· (ω+Ω) .

14. El procedimiento según la reivindicación 13, en el que la etapa de combinación comprende:

-multiplicar la primera y la segunda señal de subbanda transpuesta para proporcionar la señal de alta subbanda; 5 e

- introducir la señal de alta subbanda en un banco de filtros de síntesis para generar la componente de alta frecuencia.

15. Un programa de software adaptado para ejecutarse en un procesador y para realizar las etapas de 10 procedimiento de cualquiera de las reivindicaciones 13 y 14 cuando se llevan a cabo en un dispositivo informático.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .