PROCESAMIENTO DE SEÑALES DE MÚLTIPLES CANALES.

Procedimiento de generación de una señal monaural (S) que comprende una combinación de dos canales de audio de entrada (L,

R), que comprende las etapas de: para cada uno de una pluralidad de segmentos secuenciales (t(n)) de dichos canales de audio (L, R), sumar (46) componentes de frecuencia correspondientes de representaciones de espectro de frecuencia respectivas para cada canal de audio (L(k), R(k)) para proporcionar un conjunto de componentes de frecuencia sumados, S(k), para cada segmento secuencial; estando el procedimiento caracterizado porque comprende además las etapas de: para cada uno de dicha pluralidad de segmentos secuenciales, calcular (45) un factor de corrección (m(i)) para cada una de una pluralidad de bandas de frecuencia (i) como función de la energía de los componentes de frecuencia de la señal sumada en dicha banda y como función de la energía de dichos componentes de frecuencia de los canales de audio de entrada en dicha banda; y corregir (47) cada componente de frecuencia sumado como función del factor de corrección (m(i)) para la banda de frecuencia de dicho componente; en el que dichos factores de corrección (m(i)) se determinan según: donde L(k) representa un componente de frecuencia de subbanda k para un primero de los dos canales de audio de entrada, R(k) representa un componente de frecuencia de subbanda k for un segundo de los dos canales de audio de entrada e i representa la banda de frecuencia i de la pluralidad de bandas de frecuencia

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2004/050255.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: SCHUIJERS, ERIK, G., P., BEEBAART,Dirk,J.

Fecha de Publicación: .

Fecha Solicitud PCT: 15 de Marzo de 2004.

Clasificación Internacional de Patentes:

  • G10L19/00M

Clasificación PCT:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04S3/02 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.H04S 3/00 Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad). › del tipo matricial, es decir, en los que las señales de entrada son combinadas algebraicamente, p. ej. después de haber sido desfasadas las unas con relación a las otras.

Clasificación antigua:

  • G10L19/00 G10L […] › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • H04S3/02 H04S 3/00 […] › del tipo matricial, es decir, en los que las señales de entrada son combinadas algebraicamente, p. ej. después de haber sido desfasadas las unas con relación a las otras.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PROCESAMIENTO DE SEÑALES DE MÚLTIPLES CANALES.

Fragmento de la descripción:

La presente invención se refiere al procesamiento de señales de audio y, más particularmente, a la codificación de señales de audio de múltiples canales.

Un ejemplo de un procesamiento de una señal de audio se ilustra en la solicitud de patente europea n.º EP 0 5 466 665 que da a conocer un mezclador de sonido analógico con separación de banda.

Generalmente, los codificadores de audio de múltiples canales paramétricos sólo transmiten un canal de audio de ancho de banda completo combinado con un conjunto de parámetros que describen las propiedades espaciales de una señal de entrada. Por ejemplo, la figura 1 muestra las etapas realizadas en un codificador 10 descrito en la solicitud de patente europea n.º 02079817.9 presentada el 20 de noviembre de 2002 (expediente n.º PHNL021156). 10

En una etapa inicial S1, las señales de entrada L y R se dividen en subbandas 101, por ejemplo, mediante división en ventanas en el tiempo seguida de una operación de transformación. Posteriormente, en la etapa S2, se determina la diferencia de nivel (ILD) de señales de subbanda correspondientes; en la etapa S3 se determina la diferencia de tiempo (ITD o IPD) de señales de subbanda correspondientes; y en la etapa S4 se describe la cantidad de similitud o disimilitud de las formas de onda que no pueden determinarse mediante ILD o ITD. En las etapas posteriores 15 S5, S6 y S7, se cuantifican los parámetros determinados.

En la etapa S8, se genera una señal monaural S a partir de las señales de audio entrantes y finalmente, en la etapa S9, se genera una señal 102 codificada a partir de la señal monaural y los parámetros espaciales determinados.

La figura 2 muestra un diagrama de bloques esquemático de un sistema de codificación que comprende el codificador 10 y un decodificador 202 correspondiente. La señal 102 codificada que comprende la señal suma S y los 20 parámetros espaciales P se comunica a un decodificador 202. La señal 102 puede comunicarse a través de cualquier canal 204 de comunicaciones adecuado. De manera alternativa o adicional, la señal puede almacenarse en un medio 214 de almacenamiento extraíble, que puede transferirse del codificador al decodificador.

Se realiza la síntesis (en el decodificador 202) aplicando los parámetros espaciales a la señal suma para generar señales de salida izquierda y derecha. Por tanto, el decodificador 202 comprende un módulo 210 de 25 decodificación que realiza la operación inversa a la etapa S9 y extrae la señal suma S y los parámetros P de la señal 102 codificada. El decodificador comprende además un módulo 211 de síntesis que recupera los componentes estéreo L y R de la señal suma (o dominante) y los parámetros espaciales.

Uno de los desafíos es generar la señal monaural S, etapa S8, de tal manera que, al decodificar en los canales de salida, el timbre de sonido percibido es exactamente el mismo que para los canales de entrada. 30

Previamente se han sugerido varios procedimientos de generación de esta señal suma. En general componen una señal mono como combinación lineal de las señales de entrada. Técnicas particulares incluyen:

1. Simple suma de las señales de entrada. Véase por ejemplo “Efficient representation of spatial audio using perceptual parametrization”, por C. Faller y F. Baumgarte, WASPAA'01, Workshop on applications of signal processing on audio and acoustics, New Paltz, Nueva York, 2001. 35

2. Suma ponderada de las señales de entrada usando análisis de componentes principales (PCA). Véase por ejemplo la solicitud de patente europea n.º 02076408.0 presentada el 10 de abril de 2002 (expediente n.º PHNL020284) y la solicitud de patente europea n.º 02076410.6 presentada el 10 de abril de 2002 (expediente n.º PHNL020283). En este esquema, la suma de los pesos al cuadrado de la suma es igual a uno y los valores reales dependen de las energías relativas en las señales de entrada. 40

3. Suma ponderada con pesos que dependen de la correlación en el dominio del tiempo entre las señales de entrada. Véase por ejemplo “Joint stereo coding of audio signals”, por D. Sinha, solicitud de patente europea EP 1 107 232 A2. En este procedimiento, la suma de los pesos es igual a +1, mientras que los valores reales dependen de la correlación cruzada de los canales de entrada.

4. Documento US 5.701.346, Herre et al da a conocer la suma ponderada con escala de conservación de 45 energía para someter a mezcla descendente canales izquierdo, derecho y central de señales de banda ancha. Sin embargo, esto no se realiza como función de la frecuencia.

Estos procedimientos pueden aplicarse a la señal de ancho de banda completo o pueden aplicarse en señales filtradas por banda que tienen todas sus propios pesos para cada banda de frecuencia. Sin embargo, todos los procedimientos descritos tienen un inconveniente. Si la correlación cruzada depende de la frecuencia, lo que con mucha 50 frecuencia es el caso para grabaciones estéreo, se produce coloración (es decir, un cambio del timbre percibido) del sonido del decodificador.

Esto puede explicarse de la siguiente manera: para una banda de frecuencia que tiene una correlación cruzada de +1, la suma lineal de dos señales de entrada da como resultado una adición lineal de las amplitudes de señal y el cálculo del cuadrado de la señal aditiva para determinar la energía resultante. (Para dos señales en fase de igual amplitud, esto da como resultado que se duplica la amplitud con una cuadruplicación de la energía). Si la correlación cruzada es 0, la suma lineal da como resultado menos del doble de la amplitud y una cuadruplicación de la energía. 5 Además, si la correlación cruzada para una determinada banda de frecuencia es -1, los componentes de señal de esa banda de frecuencia se cancelan entre sí y no queda ninguna señal. Por tanto, para la suma simple, las bandas de frecuencia de la señal suma pueden tener una energía (potencia) de entre 0 y cuatro veces la potencia de las dos señales de entrada, dependiendo de los niveles relativos y la correlación cruzada de las señales de entrada.

La presente invención intenta aliviar este problema y proporciona un procedimiento según la reivindicación 1 y 10 un componente según la reivindicación 9.

Si bandas de frecuencia diferentes tienden en promedio a tener la misma correlación, entonces puede esperarse que a lo largo del tiempo la distorsión provocada por tal suma se promedie a través del espectro de frecuencia. Sin embargo, se ha reconocido que, en señales de múltiples canales, los componentes de frecuencia baja tienden a estar más correlacionados que los componentes de frecuencia alta. Por tanto, se observará que sin la 15 presente invención, la suma, que no tiene en cuenta la correlación de los canales dependiente de la frecuencia, tendería a potenciar indebidamente los niveles de energía de más bandas de frecuencia baja altamente correlacionadas y, en particular, psicoacústicamente sensibles.

La presente invención proporciona una corrección dependiente de la frecuencia de la señal mono en la que el factor de corrección depende de una correlación cruzada dependiente de la frecuencia y niveles relativos de las señales 20 de entrada. Este procedimiento reduce los artefactos de coloración espectral que se introducen mediante procedimientos de suma conocidos y garantiza la conservación de la energía en cada banda de frecuencia.

La corrección dependiente de la frecuencia puede aplicarse sumando en primer lugar las señales de entrada (o bien suma lineal o bien ponderadas) seguido por la aplicación de un filtro de corrección, o liberando la limitación de que la suma de los pesos para la suma (o sus valores cuadrados) es necesariamente igual a +1 sino que es igual a un valor 25 que depende de la correlación cruzada.

Debe observarse que aunque la invención puede aplicarse a cualquier sistema en el que se combinan dos o más canales de entrada.

Ahora se describirán realizaciones de la invención en referencia a los dibujos adjuntos, en los que:

la figura 1 muestra un codificador de la técnica anterior; 30

la figura 2 muestra un diagrama de bloques de un sistema de audio que incluye el codificador de la figura 1;

la figura 3 muestra las etapas realizadas por un componente de suma de señales de un codificador de audio según una primera realización de la invención; y

la figura 4 muestra...

 


Reivindicaciones:

1. Procedimiento de generación de una señal monaural (S) que comprende una combinación de dos canales de audio de entrada (L, R), que comprende las etapas de:

para cada uno de una pluralidad de segmentos secuenciales (t(n)) de dichos canales de audio (L, R), sumar (46) componentes de frecuencia correspondientes de representaciones de espectro de frecuencia 5 respectivas para cada canal de audio (L(k), R(k)) para proporcionar un conjunto de componentes de frecuencia sumados, S(k), para cada segmento secuencial;

estando el procedimiento caracterizado porque comprende además las etapas de:

para cada uno de dicha pluralidad de segmentos secuenciales, calcular (45) un factor de corrección (m(i)) para cada una de una pluralidad de bandas de frecuencia (i) como función de la energía de los 10 componentes de frecuencia de la señal sumada en dicha banda y como función de la energía de dichos componentes de frecuencia de los canales de audio de entrada en dicha banda; y

corregir (47) cada componente de frecuencia sumado como función del factor de corrección (m(i)) para la banda de frecuencia de dicho componente;

en el que dichos factores de corrección (m(i)) se determinan según: 15

donde L(k) representa un componente de frecuencia de subbanda k para un primero de los dos canales de audio de entrada, R(k) representa un componente de frecuencia de subbanda k for un segundo de los dos canales de audio de entrada e i representa la banda de frecuencia i de la pluralidad de bandas de frecuencia. 20

2. Procedimiento según la reivindicación 1, que comprende además las etapas de:

proporcionar (42) un conjunto respectivo de valores de señal muestreados para cada uno de una pluralidad de segmentos secuenciales para cada canal de audio de entrada; y

para cada uno de dicha pluralidad de segmentos secuenciales, transformar (44) cada uno de dicho conjunto de valores de señal muestreados en el dominio de la frecuencia para proporcionar dichas 25 representaciones de espectro de frecuencia complejas de cada canal de audio de entrada (L(k), R(k)).

3. Procedimiento según la reivindicación 2, en el que la etapa de proporcionar dichos conjuntos de valores de señal muestreados comprende:

para cada canal de audio de entrada, combinar segmentos solapados (m1, m2) en señales de dominio del tiempo respectivas que representan cada canal durante una ventana de tiempo (t(n)). 30

4. Procedimiento según la reivindicación 1, que comprende además la etapa de:

para cada segmento secuencial, convertir (48) dicha representación de espectro de frecuencia corregida de dicha señal sumada (S'(k)) en el dominio del tiempo.

5. Procedimiento según la reivindicación 4, que comprende además la etapa de:

aplicar superposición-adición (50) a representaciones de señal sumada convertidas sucesivas para 35 proporcionar una señal sumada final (s1, s2).

6. Procedimiento según la reivindicación 1, que comprende además las etapas de:

para cada una de dicha pluralidad de bandas de frecuencia, determinar un indicador ((i)) de la diferencia de fase entre componentes de frecuencia de dichos canales de audio en un segmento secuencial; y

antes de sumar componentes de frecuencia correspondientes, transformar los componentes de frecuencia 40 de al menos uno de dichos canales de audio como función de dicho indicador para la banda de frecuencia de dichos componentes de frecuencia.

7. Procedimiento según la reivindicación 6, en el que dicha etapa de transformación comprende realizar las

siguientes funciones en componentes de frecuencia (L(k), R(k)) de los canales de audio de entrada izquierdo y derecho (L, R):

donde 0 ≤ c ≤ 1 determina la distribución de alineación de fase entre dichos canales de entrada. 5

8. Procedimiento según la reivindicación 1, en el que dicho factor de corrección es una función de una suma de energía de los componentes de frecuencia de la señal sumada en dicha banda y una suma de la energía de dichos componentes de frecuencia de los canales de audio de entrada en dicha banda.

9. Componente (S8') para generar una señal monaural a partir de una combinación de dos canales de audio de entrada (L, R), que comprende: 10

un sumador (46) dispuesto para sumar, para cada uno de una pluralidad de segmentos secuenciales (t(n)) de dichos canales de audio (L, R), componentes de frecuencia correspondientes a partir de representaciones de espectro de frecuencia respectivas para cada canal de audio (L(k), R(k)) para proporcionar un conjunto de componentes de frecuencia sumados, S(k), para cada segmento secuencial;

y caracterizado porque comprende además: 15

medios para calcular (45) un factor de corrección (m(i)) para cada una de una pluralidad de bandas de frecuencia (i) de cada uno de dicha pluralidad de segmentos secuenciales como función de la energía de los componentes de frecuencia de la señal sumada en dicha banda y como función de la energía de dichos componentes de frecuencia de los canales de audio de entrada en dicha banda; y

un filtro de corrección (47) para corregir cada componente de frecuencia sumado como función del factor 20 de corrección (m(i)) para la banda de frecuencia de dicho componente;

en el que dichos factores de corrección (m(i)) se determinan según:

donde L(k) representa un componente de frecuencia de subbanda k para un primero de los dos canales de audio de entrada, R(k) representa un componente de frecuencia de subbanda k para un segundo de los 25 dos canales de audio de entrada e i representa la banda de frecuencia i de la pluralidad de bandas de frecuencia.

10. Codificador de audio que incluye el componente según la reivindicación 9.

11. Sistema de audio que comprende un codificador de audio según la reivindicación 10 y un reproductor de audio compatible. 30


 

Patentes similares o relacionadas:

MÉTODO, DISPOSITIVO, APARATO CODIFICADOR, APARATO DECODIFICADOR Y SISTEMA DE AUDIO, del 8 de Febrero de 2012, de Koninklijke Philips Electronics N.V. Dolby International AB: Método de procesamiento de una señal de mezcla descendente estéreo que comprende señales estéreo primera y segunda (L0, R0), codificando la señal de mezcla […]

PROCEDIMIENTO Y APARATO PARA CODIFICAR Y DECODIFICAR SEÑALES DIGITALES, del 13 de Enero de 2012, de SAMSUNG ELECTRONICS CO., LTD.: Un procedimiento de codificación de señales digitales compuestas de al menos dos canales, comprendiendo el procedimiento: dividir las señales digitales […]

Imagen de 'DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO…'DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL, del 13 de Mayo de 2011, de DOLBY LABORATORIES LICENSING CORPORATION: Método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada, en el que dichas señales de audio de entrada pueden incluir componentes […]

Imagen de 'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA'CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA, del 27 de Octubre de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador: - un módulo de combinación de […]

Imagen de 'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA…'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA APLICACIONES DE BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 19 de Agosto de 2010, de CODING TECHNOLOGIES SWEDEN AB: Método para codificar una envolvente espectral de potencia de una señal de audio estereofónica o de una señal de audio multicanal que tiene dos canales, teniendo […]

Imagen de 'CODIFICACION Y DECODIFICACION DE SEÑALES AUDIO MULTICANAL'CODIFICACION Y DECODIFICACION DE SEÑALES AUDIO MULTICANAL, del 18 de Junio de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento para codificar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal que representan una señal de […]

Imagen de 'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA, del 13 de Mayo de 2010, de CODING TECHNOLOGIES AB: Unidad de reverberación para generar un primer canal y un segundo canal de una señal estereofónica o una señal multicanal, que comprende: un detector para detectar terminaciones […]

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .