Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.

Un aparato para generar una señal lateral estereofónica, que tiene un primer canal lateral y un segundo canal lateral de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada, que comprende:

un generador de la información de modificación

(110; 610; 710; 810; 910; 1310) para generar la información de modificación, el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende un generador de ponderaciones espectrales (116; 615; 715; 815; 915) para generar la información de modificación, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica, y

un manipulador de la señal (120; 620; 720; 820; 1320) que está adaptado para manipular el primer canal de entrada, basándose en la información de modificación para obtener el primer canal lateral, y está adaptado para manipular el segundo canal de entrada, basándose en la información de modificación para obtener el segundo canal lateral.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2012/062932.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: UHLE, CHRISTIAN, HELLMUTH, OLIVER, FINAUER,STEFAN, STÖCKLMEIER,CHRISTIAN, PROKEIN,PETER, GAMPP,PATRICK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > SISTEMAS ESTEREOFONICOS > H04S3/00 (Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad))
google+ twitter facebookPin it
Ilustración 1 de Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.
Ilustración 2 de Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.
Ilustración 3 de Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.
Ilustración 4 de Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.
Ver la galería de la patente con 15 ilustraciones.
Método y aparato para descomponer una grabación estereofónica utilizando el procesamiento del dominio de la frecuencia empleando un generador de ponderaciones espectrales.

Texto extraído del PDF original:

DESCRIPCIÓN

La presente invención se relaciona con el procesamiento de audio, y en particular, con un método y un aparato para descomponer una grabación estereofónica, utilizando el procesamiento del dominio de la frecuencia. El procesamiento del audio ha avanzado en muchas formas. En particular, los sistemas de sonido envolventes se han vuelto más y más importantes. Sin embargo, la mayoría de las grabaciones de música todavía son codificadas y transmitidas como una señal estereofónica, y no como una señal en múltiples canales. Puesto que los sistemas envolventes comprenden una pluralidad de altavoces, por ejemplo, cuatro o cinco altavoces, ha sido el objeto de muchos estudios, cuáles señales deberían proporcionarse a la pluralidad de altavoces, cuando sólo hay dos señales de entrada disponibles.

En este contexto, la conversión del formato de las señales estereofónicas para la reproducción utilizando sistemas de sonido envolvente, es decir, mezclado, juega un papel importante. La expresión “mezclado m a n”, describe la conversión de una señal de audio del canal m a una señal de audio con n canales, en donde n > m. Se conocen ampliamente dos conceptos de mezclado: mezclado con información adicional que guía el proceso de mezclado y mezclado no guiado (“ciego”), sin el uso de ninguna información secundaria, que es en lo que se centra la presente. En la bibliografía, se reportan dos diferentes enfoques para un proceso de mezclado. Estos conceptos son el enfoque directo/ambiental y el enfoque “en la banda”. El componente central de las técnicas basadas en la dirección/ambiente, es la extracción de una señal ambiental que se alimenta a los canales traseros de una señal de sonido envolvente con múltiples canales. Los sonidos ambientales son aquellos que forman una impresión de un ambiente de audición (virtual), incluyendo la reverberación de la sala, sonidos de la audiencia (por ejemplo, aplausos), sonidos ambientales (por ejemplo, lluvia), sonidos con efecto pretendido artísticamente (por ejemplo, crujido del vinilo) y ruido de fondo. La reproducción del ambiente utilizando los canales traseros, evoca una impresión de envoltura (estando “inmerso en el sonido”) por el oyente. Además, las fuentes del sonido directo se distribuyen entre los canales frontales de acuerdo con su posición en el panorama estereofónico. El enfoque “en la banda” está dirigido a colocar todos los sonidos (sonido directo, así como sonidos ambientales) alrededor del oyente, utilizando todos los altavoces disponibles. Las posiciones de las fuentes de sonido percibidas cuando se reproduce el formato mezclado, es idealmente una función de sus posiciones percibidas en la señal de entrada estereofónica. Este enfoque puede implementarse utilizando el procesamiento de la señal propuesto. Se han desarrollado en el pasado varios enfoques para mezclar en el dominio de la frecuencia [9, 10]. Intentan una descomposición de la señal de entrada y del componente de la señal directo y ambiental, y una descomposición basada en las posiciones espaciales de las fuentes del sonido. Los componentes de la señal ambiental se identifican basándose en las medidas de la coherencia inter-canal entre el canal izquierdo y derecho. La descomposición basada en la dirección se logra basándose en la similitud de las magnitudes de los coeficientes espectrales. La solicitud de patente US 2009/0080666, describe un método para extraer una señal ambiental utilizando la ponderación espectral.

El documento US 2010/0030563, describe un método para extraer una señal ambiental para la aplicación del mezclado. El método utiliza la sustracción espectral. La representación del dominio tiempo-frecuencia se obtiene de la diferencia de la representación del dominio tiempo-frecuencia de la señal de entrada y una versión comprimida de la misma, de manera preferida calculada utilizando una factorización de la matriz no negativa.

El documento US 2010/0296672, describe un método de mezclado del dominio de la frecuencia, utilizando una descomposición de la señal basada en el vector. La descomposición tiene por objeto la extracción de un canal centrado, en contraste con una descomposición de la señal directa/ambiental [13]. Se calcula una señal de salida para el canal central, que contiene toda la información que es común para las señales de los canales de entrada izquierdo y derecho. La señal residual de las señales de entrada y las señales del canal central se calculan para las señales del canal de salida izquierdo y derecho. El documento WO 2010/140105 desvela un método para mezclar señales estereofónicas a canales frontales izquierdo y derecho y canales envolventes izquierdo y derecho. Desde una señal de entrada estereofónica se generan señales media/lateral por medio de predicción y filtrado adaptativo.

En un objeto de la presente invención proporcionar conceptos mejorados para generar canales adicionales de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada. El objeto de la presente invención se soluciona por un aparato para generar una señal lateral estereofónica de acuerdo con la reivindicación 1, un aparato para generar una señal media estereofónica de acuerdo con la reivindicación 10, un

E12731456 ES 2 552 996 T3 12-11-2015   método para generar una señal lateral estereofónica de acuerdo con la reivindicación 12, un método para generar una señal media estereofónica de acuerdo con la reivindicación 13, y un programa para computadora de acuerdo con la reivindicación 15.

Se exponen realizaciones adicionales en las reivindicaciones dependientes. La diferencia importante entre la señal lateral estereofónica propuesta en comparación con la señal lateral convencional, se describe por la propiedad estereofónica: la señal lateral estereofónica es una señal estereofónica de 2 canales, en contraste con la señal lateral convencional, que es monofónica. El canal izquierdo de la señal lateral estereofónica comprende todos los componentes de la señal, que están agrupados en el lado izquierdo en la señal de entrada. El canal derecho de la señal estereofónica comprende todos los componentes de la señal que están agrupados en el lado derecho. La señal media estereofónica es una señal estereofónica que comprende todos los componentes que existen en ambos canales de entrada. Es una señal estereofónica de 2 canales y comprende menos información estereofónica, en comparación con la señal de entrada, y en comparación con la señal lateral estereofónica, pero no es una señal monofónica como la señal media convencional. Comprende los mismos componentes de la señal que la señal media convencional, pero con la información estereofónica original.

Las realizaciones de la presente invención se explican con referencia a los dibujos adjuntos, en los cuales: La Figura 1 ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización, La Figura 1a ilustra un aparato para generar una señal lateral estereofónica de acuerdo con un ejemplo, en donde el generador de la información de manipulación comprende un sustractor espectral, La Figura 1b ilustra un aparato para generar una señal lateral estereofónica de acuerdo con la invención, en donde el generador de la información de modificación comprende un generador de ponderaciones espectrales, La Figura 2 ilustra un sustractor espectral, La Figura 3 ilustra un generador de la información de modificación de acuerdo con un ejemplo, La Figura 4 ilustra un aparato para generar una señal lateral estereofónica y una señal media estereofónica para realizar una sustracción espectral de acuerdo con un ejemplo, La Figura 5 ilustra un aparato para generar una señal lateral estereofónica y una señal media estereofónica de acuerdo con otro ejemplo, La Figura 6 ilustra un aparato para generar una señal lateral estereofónica, en donde el aparato comprende un generador de ponderaciones espectrales de acuerdo con la invención, La Figura 7 ilustra un aparato para generar una señal lateral estereofónica, en donde el aparato comprende un generador de ponderaciones espectrales de acuerdo con otra realización, La Figura 8 ilustra un aparato para generar una señal lateral estereofónica, en donde el aparato comprende un generador de ponderaciones espectrales de acuerdo con una realización adicional, La Figura 9 ilustra un generador de la información de modificación, en donde el aparato comprende un generador de ponderaciones espectrales y un generador de magnitud de acuerdo con una realización, La Figura 10 ilustra un aparato para generar una señal media estereofónica de acuerdo con una realización, La Figura 10a ilustra un aparato para generar una señal media estereofónica de acuerdo con una realización, en donde el generador de la información de manipulación comprende un sustractor espectral, La Figura 10b ilustra un aparato para generar una señal media estereofónica de acuerdo con una realización, en donde el generador de la información de modificación comprende un generador de ponderaciones espectrales, La Figura 11 ilustra las ganancias ejemplares para las señales laterales estereofónicas y las señales medias estereofónicas,

E12731456 ES 2 552 996 T3 12-11-2015   La Figura 12 ilustra los resultados de la ponderación espectral para las señales laterales estereofónicas y las señales medias estereofónicas, La Figura 13 ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización adicional, La Figura 14 ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización adicional, La Figura 15 ilustra un mezclador de acuerdo con una realización, La Figura 16 ilustra un sistema de reproducción cuadrafónica ejemplar, que utiliza las salidas de un procesamiento de la señal propuesto, La Figura 17 describe un diagrama de bloques que ilustra el procesamiento para generar una señal con múltiples canales, adecuada para la reproducción con 5 canales, La Figura 18 describe un diagrama de bloques de la descomposición M-S, La Figura 19 describe un diagrama de bloques que ilustra la ponderación espectral, y La Figura 20 ilustra las ponderaciones espectrales típicas utilizadas en la mejora del habla.

Antecedentes

Antes de describir las realizaciones preferidas de la presente invención, se describirán los conceptos relacionados, en particular el procesamiento M-S, se explicará el fundamento de una sustracción espectral y la ponderación espectral.

Primero, el Procesamiento del Lado Medio se describe con más detalle. Para explicar cómo se calculan las señales laterales y medias estereofónicas, se revisa brevemente lo básico del procesamiento M-S convencional. Una señal estereofónica de 2 canales x(t) puede representarse por dos señales x1(t) y xr(t) para el canal izquierdo y derecho, respectivamente, con un índice de tiempo t. Los términos izquierdo y derecho indican que eventualmente, estas señales son presentadas al oído izquierdo y derecho (utilizando altavoces o auriculares), respectivamente, o se reproducen por el canal izquierdo y derecho en un sistema de reproducción de audio, respectivamente. Suponiendo que la señal estereofónica es una mezcla de N señales de origen zi, i=1, , N, x1(t) y xr(t) pueden escribirse como en donde hli(t), hri(t) son funciones de transferencia que caracterizan como se mezclan las fuentes en la señal estereofónica, * es la operación de convolución, y n1(t), nr(t) son señales ambientales no correlacionadas. En el caso de mezclado utilizando sólo el agrupamiento de la amplitud, que es con frecuencia el caso para las grabaciones de estudio, tanto hli(t) como hri(t) son escalares. El resultado de este proceso de mezclado se conoce en la bibliografía como mezclas instantáneas en contraste con mezclas convolutivas (en los casos en donde hli(t) y hri(t) son de una longitud mayor que uno). Descartando los términos ambientales n1(t), nr(t), el modelo de la señal para el mezclado instantáneo puede escribirse como

E12731456 ES 2 552 996 T3 12-11-2015   con el factor de mezclado 0 ≤ ai(t) ≤ 1, que determina la dirección percibida de las señales de origen y la mezcla.

La misma información que la comprendida en la señal x(t)=[x1(t) xr(t)], se proporciona cuando se utiliza una representación M-S de la señal, en donde una señal media m1(t) (también referida como la señal de suma) y una señal lateral s1(t) (también referida como la señal de la diferencia), se calculan de x1(t) y xr(t) de acuerdo con: Los subíndices 1 se utilizan para designar que estas señales son monofónicas. Tal señal M-S es ventajosa para varias aplicaciones, en donde ambas señales lateral y media se procesan, codifican o transmiten de manera separada. Tales aplicaciones son grabación de sonidos, mejora de la imagen estereofónica artificial, codificación del audio para una producción virtual con altavoz, reproducción biaural en altavoces y producción cuadrafónica. Dada la representación M-S, las señales x1(t) y xr(t) pueden calcularse de acuerdo con: En la Figura 18, se ilustra la descomposición M-S.

Ambas representaciones comprenden la misma información. Nótese que las ponderaciones de normalización 0,5 en las ecuaciones (5) y (6) son opcionales y otras ponderaciones son posibles, pero la ponderación mostrada aquí garantiza que la aplicación de las ecuaciones (5) a (8), proporciona señales que son idénticas a las señales de entrada. El uso de otras ponderaciones puede proporcionar señales similares o escaladas.

Del modelo de la señal y las ecuaciones (3) y (4), resulta que la señal S1(t) comprende sólo los componentes de la señal que están agrupados fuera del centro (alguno de ellos con fase negativa), y es una señal monofónica. La señal media m1(t) comprende todas las señales, excepto aquellas en s1(t). Descrito con las palabras de Michael Gerzon, “M es la señal que contiene la información sobre la mitad de la etapa estereofónica, mientras que S solo contiene la información sobre los lados”. Ambas son señales monofónicas. Aunque los sonidos directos agrupados por la amplitud están atenuados en la señal lateral dependiendo de su posición en el panorama estereofónico, los componentes de la señal no correlacionados como la reverberación y otras señales ambientales, están atenuados en la señal media por 3 dB (para la correlación cero). Estas atenuaciones son causadas por la cancelación de la fase entre los componentes laterales en el canal izquierdo y derecho.

A continuación, se explicarán con más detalle la sustracción espectral y la ponderación espectral. La sustracción espectral es un método bien conocido para la mejora del habla y la reducción del ruido. Se ha propuesto (probablemente de manera original), por Boll para reducir los efectos del ruido aditivo en la comunicación del habla [2]. El procesamiento se realiza en el dominio de la frecuencia, en donde se procesa el espectro de cuadros cortos de porciones sucesivas (posiblemente superpuestas) de la señal de entrada. El principio básico es sustraer una estimación del espectro de la magnitud de la señal de ruido de interferencia del espectro de la magnitud de las señales de entrada, que se suponen como una mezcla de una señal del habla deseada y una señal de ruido de interferencia. La ponderación espectral (o Atenuación Espectral a Corto Plazo [3]), se utiliza comúnmente en varias aplicaciones de procesamiento de la señal de audio, por ejemplo, Mejora del Habla [4] y Separación Ciega de la Fuente. Como en la sustracción espectral, el objeto de este procesamiento es separar una señal deseada d(t) o atenuar una señal de interferencia n(t), en donde la señal de entrada x(t) es una mezcla aditiva de d(t) y n(t), Este procesamiento se ilustra en la Figura 19. El procesamiento de la señal se realiza en el dominio de la frecuencia.

E12731456 ES 2 552 996 T3 12-11-2015   Por lo tanto, la señal de entrada x(t) se transforma utilizando una Transformada de Fourier a Corto Plazo (STFT), un banco de filtro o cualquier otro medio para derivar una representación de la señal con múltiples bandas de la frecuencia X(f, k), con el índice de la banda de la frecuencia f y el índice del tiempo k. La representación del dominio de la frecuencia de las señales de entrada se procesa de manera que las señales de la subbanda son escaladas con ponderaciones que varían con el tiempo G(f, k), Las ponderaciones se calculan de la representación de la señal de entrada X(f, k), de manera que tienen magnitudes grandes para altas relaciones de señal a ruido (SNR), y bajos valores para SNR pequeñas. Para calcular las ponderaciones G(f, k), se requiere una estimación de la SNR típicamente dependiente del tiempo y la frecuencia, o de N(f, k) o S(f, k). En las aplicaciones de procesamiento del habla, la estimación del ruido se calcula durante la actividad que no es del habla [2, 5], o utilizando estadísticas mínimas [6], es decir, basándose en el rastreo de un mínimo local en cada subbanda, o utilizando un segundo micrófono cerca de la fuente del ruido.

El resultado de la operación de ponderación Y(f, k) es la representación del dominio de la frecuencia de la señal de salida. La señal del tiempo de salida y(t), se calcula utilizando el procesamiento inverso de la transformada del dominio de la frecuencia, por ejemplo, STFT Inversa. Con frecuencia, las ponderaciones G(f, k) se eligen para tener valores reales, proporcionando el espectro de salida Y, que tiene la misma información de la fase que X. Existen varias reglas de ganancia, por ejemplo, cómo se calculan las ponderaciones G(f, k), por ejemplo, derivadas de la sustracción espectral y del filtrado de Wiener. A continuación, se describirán diferentes métodos para derivar las ponderaciones espectrales. Se supone que s y n son mutuamente ortogonales, es decir A continuación, la filtración de Wiener se explica con más detalle. Dadas las estimaciones de las densidades espectrales de la potencia (PSD) (por ejemplo, derivadas de los coeficientes STFT) de la señal deseada Pdd y la señal de interferencia Pnn, las ponderaciones espectrales se derivan reduciendo al mínimo el error al cuadrado medio Se explica ahora la sustracción espectral utilizando la ponderación espectral. Las ponderaciones espectrales se calculan de manera que Pyy = Pxx-Pnn, es decir De manera alternativa, las ponderaciones espectrales con valor real pueden derivarse, lo que conduce a |Y| = |X| - |N|, con frecuencia referidos como la sustracción de la magnitud espectral, con ponderaciones |D| es el espectro de la magnitud de d(t). |N| es el espectro de la magnitud de n(t). Se explica ahora la generalización de la regla de ponderación espectral. La formulación generalizada del filtro STSA se deriva introduciendo tres parámetros α, β y γ, en donde α y β son exponentes que controlan la fuerza de atenuación, y γ es el factor de sobreestimación del ruido.

La ecuación (15) es una formulación generalizada de las reglas de supresión del ruido descritas anteriormente, en donde α = 2, β = 2 que corresponden a la sustracción espectral, y α = 2, β = 1 que corresponden a la filtración de

E12731456 ES 2 552 996 T3 12-11-2015   Wiener. La sustracción espectral de la magnitud (en lugar de las energías), se realiza fijando α = 1, β = 1. El parámetro γ controla la cantidad del ruido y se toma en cuenta para los posibles sesgos de un método de estimación del ruido. Puede elegirse para relacionarse con la SNR estimada o el índice de la frecuencia.

En la Figura 20, se ilustran ponderaciones espectrales típicas como una función de la SNR, como se utiliza en la mejora del habla. Puede encontrarse una variedad de otras reglas de ganancia, con las características comunes de que las ponderaciones se incrementan de manera monotónica con la SNR de la subbanda, por ejemplo, el estimador de Ephraim-Malah [7] o el algoritmo de Atenuación de Decisión Programable/Variable (SDVA) [8]. En las implementaciones prácticas, las ponderaciones espectrales se unen típicamente por un valor mínimo mayor que cero con el fin de reducir los artefactos. Pueden aplicarse diferentes reglas de ganancia en diferentes intervalos de la frecuencia [4]. Las ganancias resultantes pueden alisarse a lo largo del eje del tiempo y el eje de la frecuencia, con el fin de reducir los artefactos. Típicamente, se utiliza un filtro de paso bajo de primer orden (integrador con fugas) para el alisamiento a lo largo del eje del tiempo y un filtro de paso bajo de fase cero se aplica a lo largo del eje de la frecuencia. Realizaciones: La Figura 1 ilustra un aparato para generar una señal lateral estereofónica, que tiene un primer canal lateral S1(f) y un segundo canal lateral Sr(f) de una señal de entrada estereofónica, que tiene un primer canal de entrada X1(f) y un segundo canal de entrada Xr(f), de acuerdo con una realización. El aparato comprende un generador de la información de modificación 110, para generar la información de modificación modInf basándose en la información del lado medio midSideInf. Además, el aparato comprende un manipulador de la señal 120 que está adaptado para manipular el primer canal de entrada X1(f), basándose en la información de modificación modInf para obtener el primer canal lateral S1(f) y que está adaptado para manipular el segundo canal de entrada Xr(f), basándose en la información de modificación modInf para obtener el segundo canal lateral Sr(f).

Por ejemplo, el generador de la información de modificación 110 puede adaptarse para generar la información de modificación modInf basándose en la información del lado medio midSideInf que se relaciona con una señal media monofónica de una señal de entrada estereofónica, una señal lateral monofónica de la señal de entrada estereofónica y/o una relación entre la señal media monofónica y la señal lateral monofónica de una señal de entrada estereofónica.

La señal media monofónica puede depender de una señal de suma que resulta de sumar el primer y segundo canales de entrada X1(f), Xr(f). La señal lateral monofónica puede depender de una diferencia de la señal que resulta de sustraer el segundo canal de entrada del primer canal de entrada. Por ejemplo, la señal media monofónica puede calcularse de acuerdo con la fórmula: La señal lateral monofónica puede, por ejemplo, calcularse de acuerdo con la fórmula: La Figura 1a ilustra un aparato para generar una señal lateral estereofónica de acuerdo con un ejemplo, que no pertenece a la invención, en donde el generador de la información de manipulación 110 comprende un sustractor espectral 115. El sustractor espectral 115 está adaptado para generar la información de modificación modInf generando un valor de la diferencia, que indica una diferencia entre una señal media monofónica o una señal lateral monofónica de la señal de entrada estereofónica y el primer o segundo canales de entrada. Por ejemplo, el sustractor espectral 115 puede adaptarse para generar la información de modificación modInf sustrayendo un valor de la magnitud o un valor de la magnitud ponderada del primer o segundo canales de entrada de un valor de la magnitud o un valor de la magnitud ponderada de la señal media monofónica o la señal lateral monofónica de la señal de entrada estereofónica. O, el sustractor espectral 115 puede adaptarse para generar la información de modificación modInf sustrayendo un valor de la magnitud o un valor de la magnitud ponderada de la señal media monofónica o la señal lateral monofónica de la señal de entrada estereofónica de un valor de la magnitud o un valor de la magnitud ponderada del primer o segundo canales de entrada.

La Figura 1b ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización, en donde el generador de la información de modificación 110 comprende un generador de ponderaciones espectrales 116, para generar la información de modificación modInf, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica.

E12731456 ES 2 552 996 T3 12-11-2015   La Figura 2 ilustra un sustractor espectral 210 de acuerdo con una realización. Un primer espectro de la magnitud |X1(f)| del primer canal de entrada, un segundo espectro de la magnitud |Xr(f)| del segundo canal de entrada y un tercer espectro de la magnitud |M1(f)| de una señal media monofónica de la señal de entrada estereofónica se alimentan al sustractor espectral 210.

Una primera unidad de sustracción espectral 215 del sustractor espectral 210, sustrae el tercer espectro |M1(f)|, que es ponderado por el factor de ponderación w (w indica un factor escalar en el intervalo de 0 ≤ w ≤ 1), del primer espectro |X1(f)|, por ejemplo, un primer valor de la magnitud del tercer espectro de la magnitud |M1(f)| ponderado por el factor de ponderación w, es sustraído espectralmente de un primer valor de la magnitud del primer espectro de la magnitud |X1(f)|; un segundo valor de la magnitud del tercer espectro de la magnitud |M1(f)| ponderado por el factor de ponderación w, es sustraído espectralmente de un segundo valor de la magnitud del primer espectro de la magnitud |X1(f)|; etc. Mediante esto, se obtiene una pluralidad de primeros valores laterales de la magnitud como información de modificación. Los primeros valores laterales de la magnitud son valores de la magnitud de un espectro de la magnitud del primer canal lateral de la señal lateral estereofónica, cuando el resultado de la sustracción espectral es positivo. Así, la primera unidad de sustracción espectral 215 está adaptada para aplicar la fórmula: De manera similar, una segunda unidad de sustracción espectral 218 del sustractor espectral 210 sustrae el tercer espectro |M1(f)| que es ponderado por el factor de ponderación w (w indica un factor escalar en el intervalo de 0 ≤ w ≤ 1) del segundo espectro |Xr(f)|, por ejemplo, un primer valor de la magnitud del tercer espectro de la magnitud |M1(f)| ponderado por el factor de ponderación w, es sustraído espectralmente de un segundo valor de la magnitud del segundo espectro de la magnitud |Xr(f)|; un segundo valor de la magnitud del tercer espectro de la magnitud |M1(f)|, ponderado por el factor de ponderación w, es sustraído espectralmente de un segundo valor de la magnitud del segundo espectro de la magnitud |Xr(f)|; etc. Así, se obtiene una pluralidad de segundos valores laterales de la magnitud como la información de modificación, en donde los segundos valores laterales de la magnitud son valores de la magnitud de un espectro de la magnitud Sr(f) del segundo canal lateral de la señal lateral estereofónica, cuando el resultado de la sustracción espectral es positivo. Mediante esto, la segunda unidad de sustracción espectral 218 está adaptada para aplicar la fórmula: La Figura 3 ilustra un generador de la información de modificación de acuerdo con un ejemplo, que no pertenece a la invención. El generador de la información de modificación comprende un determinador de la magnitud 305 y un sustractor espectral 210. El determinador de la magnitud 305 está arreglado para recibir el primer X1(f) y el segundo Xr(f) canales de entrada y una señal media monofónica M1(f) de la señal de entrada estereofónica. Un primer valor de la magnitud de un primer espectro de la magnitud |X1(f)| del primer canal de entrada X1(f), un segundo valor de la magnitud de un segundo espectro de la magnitud |Xr(f)| del segundo canal de entrada Xr(f), y un tercer valor de la magnitud de un tercer espectro de la magnitud |M1(f)| de la señal media monofónica M1(f), se determina por el determinador de la magnitud. El determinador de la magnitud 305 alimenta el primer, el segundo y el tercer valores de la magnitud en un sustractor espectral 210. El sustractor espectral puede ser un sustractor espectral de acuerdo con la Figura 2, que está adaptado para generar un primer valor de la magnitud lateral estereofónica de un espectro de la magnitud S1(f) del primer canal lateral S1(f), y un segundo valor de la magnitud lateral estereofónica de un espectro de la magnitud Sr(f) del segundo canal lateral Sr(f). La Figura 4 ilustra un aparato que realiza una sustracción espectral de acuerdo con un ejemplo, que no pertenece a la invención. Un primer canal de entrada x1(t) y un segundo canal de entrada xr(t) que se representan en el dominio del tiempo, se fijan en una unidad de transformación 405. La unidad de transformación 405 está adaptada para transformar el primer y segundo canales de entrada del dominio del tiempo x1(t), xr(t) del dominio del tiempo en un dominio espectral, para obtener un primer canal de entrada del dominio espectral X1(f) y un segundo canal de entrada del dominio espectral Xr(f). Los canales de entrada del dominio espectral X1(f), Xr(f), se alimentan a un generador del canal 408. El generador del canal 408 está adaptado para generar una señal media monofónica M1(f). La señal media monofónica M1(f) puede generarse de acuerdo con la fórmula: El generador del canal 408 alimenta la señal media generada M1(f) en un primer extractor de la magnitud 411, que extrae los valores de la magnitud de la señal media generada M1(f). Además, el primer canal de entrada X1(f) se alimenta por la unidad de transformación 405 en un segundo extractor de la magnitud 412, que extrae los valores de la magnitud del primer canal de entrada X1(f). Además, la unidad de transformación 405 alimenta el segundo canal de entrada Xr(f) a un tercer extractor de la magnitud 413, que extrae los valores de la magnitud del segundo canal de

E12731456 ES 2 552 996 T3 12-11-2015   entrada. La unidad de transformación 405 también alimenta el primer canal de entrada x1(f) a un primer extractor de la fase 421, que extrae los valores de la fase del primer canal de entrada X1(f). Además, la unidad de transformación 405 también alimenta el segundo canal de entrada Xr(f) a un segundo extractor de la fase 422, que extrae los valores de la fase del segundo canal de entrada.

Regresando al primer extractor de la magnitud 411, los valores de la magnitud de la señal media monofónica generada |M1(f)| se alimentan a un primer sustractor 431. Además, los valores de la magnitud sustraídos |X1(f)| se alimentan al primer sustractor 431. El primer sustractor 431 genera un valor de la diferencia entre un valor de la magnitud del primer canal de entrada y un valor de la magnitud de la señal media generada. La magnitud de la señal media generada puede ser ponderada. Por ejemplo, el primer sustractor puede calcular el valor de la diferencia de acuerdo con la fórmula 16: De manera similar, el tercer extractor de la magnitud 413 alimenta los valores de la magnitud |Xr(f)| a un segundo sustractor 432. Además, los valores de la magnitud |M1(f)| también son alimentados al segundo sustractor 432. De manera similar a la primera unidad de sustracción 431, la segunda unidad de sustracción 432 genera un valor de la magnitud del segundo canal lateral, sustrayendo los valores de la magnitud |Xr(f)| y los valores de la magnitud de la señal media generada. La segunda unidad de sustracción 432 puede, por ejemplo, emplear la fórmula: La primera unidad de sustracción 431 alimenta entonces el valor de la magnitud generado a un primer combinador 441. Además, el primer extractor de la fase 421 alimenta un valor de la fase extraído del primer canal de entrada X1(f) en el primer combinador 441. El primer combinador 441 genera entonces los valores del dominio espectral del primer canal lateral, combinando el valor de la magnitud generado por la primera unidad de sustracción 431 y el valor de la fase suministrado por el primer extractor de la fase 421. Por ejemplo, el primer combinador 441 puede emplear la fórmula: Si algunos de los valores de son negativos, la aplicación la fórmula A A = exp(2πΦ i), resulta en una combinación del valor absoluto de y exp(2πΦ i), en donde Φ está desplazado en la fase por π.

De manera similar, la segunda unidad de sustracción 432 alimenta un valor de la magnitud generado de la segunda señal lateral a un segundo combinador 442. El segundo extractor de la fase 422 alimenta un valor de la fase extraído del segundo canal de entrada Xr(f) en el segundo combinador 442. El segundo combinador está adaptado para combinar el segundo valor de la magnitud suministrado por la segunda unidad de sustracción 432 y el valor de la fase suministrado por el extractor de la fase 422, para obtener un segundo canal lateral. Por ejemplo, el segundo combinador 442 puede emplear la fórmula: Si algunos de los valores de son negativos, la aplicación la fórmula Sr(f) = exp(2πΦr(f)i), resulta en una combinación del valor absoluto de y exp(2πΦr(f)i), en donde Φr(f) está desplazado en la fase por π.

El primer combinador 441 alimenta la primera señal lateral generada que está representada en un dominio espectral a una unidad de transformación inversa 450. La unidad de transformación inversa 450 transforma el primer canal lateral del dominio espectral de un dominio espectral a un dominio del tiempo, para obtener una primera señal lateral del dominio del tiempo. Además, la unidad de transformación inversa 450 recibe el segundo canal lateral que es representado en un dominio espectral del segundo combinador 442. La unidad de transformación inversa 450 transforma el segundo canal lateral del dominio espectral de un dominio espectral a un dominio del tiempo, para obtener un segundo canal lateral del dominio del tiempo. Como ya se explicó, los valores de la magnitud del primer y segundo canales laterales, puede generarse por la primera unidad de sustracción 431 y la segunda unidad de sustracción 432, de acuerdo con las fórmulas:

E12731456 ES 2 552 996 T3 12-11-2015   Un factor escalar 0 ≤ w ≤ 1 controla el grado de separación. El resultado de la sustracción espectral es el espectro de la magnitud de las señales laterales estereofónicas y Sr(f).

La señal del tiempo m(t) = [m1(t) mr(t)], se calcula sustrayendo la señal lateral estereofónica de la señal de entrada.

El hecho de que la señal media se calcule sustrayendo las señales del tiempo, hace que se requieran sólo dos transformadas inversas de la frecuencia. El parámetro w se elige de manera preferida para estar cercano a 1, puede ser dependiente de la frecuencia.

La Figura 5 ilustra un aparato que emplea estos conceptos. El aparato comprende además, una primera unidad de transformación 501 que está adaptada para transformar el primer canal de entrada del dominio del tiempo x1(t) del dominio del tiempo a un dominio espectral, para obtener un primer canal de entrada del dominio espectral X1(f), y una segunda unidad de transformación 502 que está adaptada para transformar el segundo canal de entrada del dominio del tiempo xr(t) del dominio del tiempo al dominio espectral, para obtener un segundo canal de entrada del dominio espectral Xr(f). El aparato comprende además, un generador del canal 508, un primer 511, segundo 512 y tercer 513 extractores de la magnitud, un primer 521 y un segundo 522 extractores de la fase, una primera 531 y una segunda 532 unidades de sustracción y un primer 541 y un segundo 542 combinadores, que pueden corresponder al generador del canal 408, el primer 411, segundo 412 y tercer 413 extractores de la magnitud, el primer 421 y segundo 422 extractores de la fase, la primera 431 y segunda 432 unidades de sustracción y el primer 441 y un segundo 442 combinadores del aparato de la Figura 4, respectivamente.

Además, el aparato comprende una primera unidad de transformación inversa 551. La primera unidad de transformación inversa 551 recibe un primer canal lateral generado que está representado en un dominio espectral del primer combinador 541. La primera unidad de transformación inversa 551 transforma un primer canal lateral del dominio espectral generado S1(f) de un dominio espectral a un dominio del tiempo para obtener un primer canal lateral del dominio del tiempo s1(t).

Además, el aparato comprende una segunda unidad de transformación inversa 552. La segunda unidad de transformación inversa 552 recibe un segundo canal lateral generado que está representado en un dominio espectral del segundo combinador 542. La segunda unidad de transformación inversa 552 transforma el segundo canal lateral del dominio espectral Sr(f) de un dominio espectral a un dominio del tiempo, para obtener un segundo canal lateral del dominio del tiempo sr(t). Además, el aparato comprende un primer generador del canal medio 561. El primer generador del canal medio 561 genera un primer canal medio m1(t) de una señal media estereofónica en un dominio del tiempo aplicando la fórmula 20: Además, el aparato comprende un segundo generador del canal medio 562. El segundo generador del canal medio 562 genera un primer canal medio mr(t) de una señal media estereofónica en un dominio del tiempo aplicando la fórmula 21: Se obtienen resultados idénticos implementando este procesamiento utilizando la ponderación espectral (de manera similar al procesamiento en la sección descrita anteriormente “Antecedentes”), como se muestra de manera ejemplar para el canal izquierdo en la presente. Los espectros con valores complejos X1(f) se ponderan como se muestra en la siguiente ecuación:

E12731456 ES 2 552 996 T3 12-11-2015   Aunque la ecuación anterior proporciona un resultado idéntico con la ponderación real obtenida con la sustracción espectral (pero con una carga computacional más grande; principalmente debido a la división para calcular las ponderaciones espectrales), el enfoque de la ponderación espectral tiene ventajas, debido a que ofrece más posibilidades para parametrizar el procesamiento, que conduce a diferentes resultados con características similares, como se describe a continuación: La descomposición de la señal utilizando la ponderación espectral se explica ahora con más detalle. La razón fundamental del concepto de acuerdo con la invención, es aplicar la ponderación espectral a las señales del canal izquierdo y derecho x1(t) y xr(t), en donde las ponderaciones espectrales se derivan de la composición M-S. Un resultado intermedio de la descomposición M-S es la relación de la señal media y lateral por bloque de tiempo-frecuencia, a continuación, referido como relación media-lateral (MSR). Esta MSR puede utilizarse para calcular las ponderaciones espectrales, pero nótese que las ponderaciones pueden calcularse de manera alternativa sin la noción de la MSR. En este caso, la MSR sirve principalmente para el propósito de explicar la idea básica del método. Para calcular la señal media estereofónica m(t)=[m1(t) mr(t)], las ponderaciones se eligen de manera que están relacionadas de manera monotónica con la MSR. Para calcular la señal lateral estereofónica s(t)=[s1(t) sr(t)], las ponderaciones se eligen de manera que están relacionadas de manera monotónica con el inverso de la MSR. En la invención, un generador de la información de modificación comprende un generador de las ponderaciones espectrales. La Figura 6 ilustra un aparato de acuerdo con tal realización. El aparato comprende un generador de la información de modificación 610 y un manipulador de la señal 620. El generador de la información de modificación comprende un generador de las ponderaciones espectrales 615. El manipulador de la señal 620 comprende una primera unidad de manipulación 621 para la manipulación de un primer canal de entrada X1(f) de una señal estereofónica y una segunda unidad de manipulación 622 para manipular un segundo canal de entrada Xr(f) de la señal de entrada estereofónica. El generador de las ponderaciones espectrales 615 de la Figura 6 recibe una señal media monofónica M1(f) y una señal lateral monofónica S1(f) de la señal de entrada estereofónica. El generador de las ponderaciones espectrales 615 está adaptado para determinar un factor de ponderación espectral Gs(f), basándose en la señal media monofónica M1(f) y en la señal lateral monofónica S1(f) de la señal de entrada estereofónica. El manipulador de la señal 620 alimenta entonces el factor de ponderación espectral generado Gs(f) como una información de modificación en el generador de la información de modificación 620. La primera unidad de modificación 621 del generador de la información de modificación 620, está adaptada para manipular el primer canal de entrada X1(f) de la señal de entrada estereofónica, basándose en el factor de ponderación espectral generado Gs(f), para obtener un primer canal lateral S1(f) de una señal lateral estereofónica.

Otra realización se ilustra en la Figura 7. Como el aparato de la Figura 6, el aparato de la Figura 7 comprende un generador de la información de modificación 710 y un manipulador de la señal 720. El generador de la información de modificación comprende un generador de ponderaciones espectrales 715. El manipulador de la señal 720 comprende una primera unidad de manipulación 721 para manipular un primer canal de entrada X1(f) de una señal estereofónica, y una segunda unidad de manipulación 722 para manipular un segundo canal de entrada Xr(f) de la señal de entrada estereofónica. El manipulador de la señal 720 de la realización de la Figura 7, está adaptado para manipular un primer canal de entrada X1(f), así como un segundo canal de entrada Xr(f), basándose en el mismo factor de ponderación espectral generado Gs(f), para obtener un primer S1(f) y un segundo Sr(f) canal lateral de una señal lateral estereofónica.

Una realización adicional se ilustra en la Figura 8. Como el aparato de la Figura 6, el aparato de la Figura 8 comprende un generador de la información de modificación 810 y un manipulador de la señal 820. El generador de la información de modificación comprende un generador de ponderaciones espectrales 815. El manipulador de la señal 820 comprende un primera unidad de manipulación 821 para manipular un primer canal de entrada X1(f) de una señal estereofónica y una segunda unidad de manipulación 822 para manipular un segundo canal de entrada Xr(f) de la señal de entrada estereofónica. El generador de ponderaciones espectrales 815 está adaptado para generar dos o más factores de ponderaciones espectrales. Además, la primera unidad de manipulación 821 del generador de la información de modificación 820, está adaptada para manipular un primer canal de entrada, basándose en un primer factor de ponderación espectral generado. La segunda unidad de manipulación 822 del generador de la información de modificación 820, está adaptada además, para manipular el segundo canal de entrada, basándose en un segundo factor de ponderación espectral generado. La Figura 9 ilustra un generador de la información de modificación 910 de acuerdo con una realización. El generador de la información de modificación 910 comprende un determinador de la magnitud 912 y un generador de ponderaciones espectrales 915. El determinador de la magnitud 912 está adaptado para recibir la señal media monofónica M1(f) que está representada en un dominio espectral. Además, el determinador de la magnitud 912 está adaptado para recibir la señal lateral monofónica S1(f), que está representada en un dominio espectral. El determinador de la magnitud 912 está adaptado para determinar un valor de la magnitud de un espectro |S1(f)| de la señal lateral monofónica S1(f), como un valor lateral de la magnitud. Además, el determinador de la magnitud 912 está adaptado para determinar un valor de la magnitud de un espectro |M1(f)| de la señal media monofónica M1(f)

E12731456 ES 2 552 996 T3 12-11-2015   como un valor medio de la magnitud. El determinador de la magnitud 912 está adaptado para alimentar el valor lateral de la magnitud y el valor medio de la magnitud en el generador de ponderaciones espectrales 915. El generador de ponderaciones espectrales 915 está adaptado para generar el primer factor de ponderación espectral Gs(f), basándose en la relación de un primer número a un segundo número, en donde el primer número depende del valor lateral de la magnitud, y en donde el segundo número depende del valor medio de la magnitud y el valor lateral de la magnitud. Por ejemplo, el primer factor de ponderación espectral Gs(f) puede calcularse de acuerdo con la fórmula: en donde α, β, γ, δ y η son factores escalares. A continuación, se describe el cálculo de las ponderaciones espectrales en más detalle. Tales ponderaciones espectrales pueden derivarse utilizando una de las reglas de ganancia descritas anteriormente, como se describe en el contexto de la sustracción espectral y la ponderación espectral en la sección anterior “Antecedentes”, sustituyendo la señal deseada d(t) y la señal de interferencia n(t), de acuerdo con la Tabla 1.

Tabla 1. Asignación de las señales M-S a las señales utilizadas para calcular las ponderaciones espectrales.

señal deseada de interferencia señal lateral estereofónica s(t) m(t) señal media estereofónica m(t) s(t) Por ejemplo, la señal lateral estereofónica s(t)=[s1(t) sr(t)], puede calcularse de acuerdo con las ecuaciones (23), (24) y (25).

Un parámetro adicional δ se introduce para controlar el impacto de los componentes de la señal lateral estereofónica en el proceso de descomposición. Nótese que la transformada de la frecuencia sólo necesita calcularse para el par de la señal [x1(t) xr(t)] o [m(t) s(t)], y el par superior se deriva mediante la adición y sustracciones de acuerdo con las Ecuaciones (5) y (6).

De una manera similar, la señal media estereofónica m(t)=[m1(t) mr(t)], puede calcularse de acuerdo con las Ecuaciones (26), (27) y (28).

La Figura 10 ilustra un aparato para generar una señal media estereofónica que tiene un primer canal medio M1(f) y un segundo canal medio Mr(f) de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada. El aparato comprende un generador de la información de modificación 1010 para generar la información de modificación modInf2, basándose en la información lateral media midSideInf, y un manipulador de la señal 1020 que está adaptado para manipular el primer canal de entrada X1(f), basándose en la información de modificación, para obtener el primer canal medio M1(f), y está adaptado para manipular el segundo canal de entrada Xr(f), basándose en la información de modificación modInf, para obtener el segundo canal medio Mr(f). La Figura 10a ilustra un aparato para generar una señal media estereofónica de acuerdo con un ejemplo, que no

E12731456 ES 2 552 996 T3 12-11-2015   pertenece a la invención, en donde el generador de la información de manipulación 1010 comprende un sustractor espectral 1015. El sustractor espectral 1015 está adaptado para generar la información de modificación modInf2 para generar un valor de la diferencia que indica una diferencia entre una señal media monofónica o una señal lateral monofónica de la señal de entrada estereofónica y el primer o segundo canales de entrada. Por ejemplo, el sustractor espectral 1015 puede adaptarse para generar la información de modificación modInf2 sustrayendo un valor de la magnitud o un valor de la magnitud ponderada del primer o segundo canales de entrada de un valor de la magnitud o un valor de la magnitud ponderado de la señal media monofónica o la señal lateral monofónica de la señal de entrada estereofónica. O, el sustractor espectral 1015 puede adaptarse para generar la información de modificación modInf2, sustrayendo un valor de la magnitud o un valor de la magnitud ponderado de la señal media monofónica o la señal lateral monofónica de la señal de entrada estereofónica, de un valor de la magnitud o un valor de la magnitud ponderada del primer o el segundo canales de entrada. La Figura 10b ilustra un aparato para generar una señal media estereofónica de acuerdo con una realización, en donde el generador de la información de modificación 1010 comprende un generador de ponderaciones espectrales 1016 para generar la información de modificación modInf2 generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica. El generador de la información de modificación puede generar la información de modificación modInf2, por ejemplo, de acuerdo con la fórmula 26: Una alternativa a las ponderaciones mostradas en la Ecuación 26, es derivar las ponderaciones de un criterio para mezclar la compatibilidad, en donde Gs(f) + Gm(f) = 1, conduciendo a una extensión del método descrito anteriormente es motivada por la observación de que la función de la ganancia (23) no conduce a una ponderación igual a 1, incluso en el caso de que los intervalos de tiempo-frecuencia estén muy agrupados en un lado. Esta es una consecuencia del hecho de que el denominador siempre es mayor que el numerador, puesto que la señal media solo se aproximará a cero si ambos coeficientes espectrales izquierdo y derecho son cero. Para lograr Gs(f)=1 para los componentes de la señal muy agrupada, la ecuación (23) puede modificarse a La modificación en la ecuación (30) conduce a ganancias unitarias para los componentes muy agrupados. De manera alternativa, las ecuaciones (31) y (32) muestran fórmulas de la ganancia con un parámetro η, cuyos resultados son iguales a la ecuación (23) para η = 0 y (30) para η = 1.

con Nótese que una ponderación espectral descrita anteriormente no garantiza la compatibilidad de la mezcla en todos los casos, es decir Si se desea una separación de la conservación de la energía, las ponderaciones necesitan elegirse de manera que

E12731456 ES 2 552 996 T3 12-11-2015   que puede solucionarse calculando como se describió anteriormente, y calculando los otros factores de ponderación en consecuencia, por ejemplo, como Opcionalmente, puede aplicarse un factor de escalamiento constante adicional a una de las funciones de ganancia antes de la sustracción. Para el ejemplo de la reproducción cuadrafónica con compatibilidad de la mezcla, los parámetros a ser ajustados son Las ponderaciones espectrales Gs(f) se calculan primero y se escalan por 1,5 dB. Las ganancias de la señal media estereofónica se calculan como Gm(f) = 1 - Gs(f). Las funciones de la ganancia se ilustran como una función del parámetro de agrupamiento a en la Figura 11. En la Figura 11, se ilustran las ganancias ejemplares para las señales laterales estereofónicas (línea continua) y las señales medias estereofónicas (líneas discontinuas). Se muestra que las ganancias son complementarias, es decir, la separación es compatible con la mezcla. Los componentes de la señal que están agrupados en cualquier lado se atenúan en la señal media estereofónica, y los componentes de la señal que están agrupados en el centro, son atenuados en la señal lateral estereofónica. Los componentes de la señal que están agrupados aparecen en ambas señales. Las funciones de la ganancia se ilustran como una función del parámetro de agrupamiento a en la Figura 12. La Figura 12 ilustra los resultados de la ponderación espectral para las señales laterales estereofónicas (Figura superior) y las señales medias estereofónicas (Figura inferior) para el canal izquierdo (línea continua) y derecho (línea discontinua). La Figura 13 ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización adicional. El aparato comprende una unidad de transformación 1203, un generador de la información de modificación 1310, un manipulador de la señal 1320 y una unidad de transformación inversa 1325. Un primer canal de entrada x1(t) y un segundo canal de entrada xr(t) de una señal de entrada estereofónica y una señal media m1(t) y una señal lateral s1(t) de la señal de entrada estereofónica, se alimentan a la unidad de transformación 1305. La unidad de transformación pueden ser una unidad de transformada de Fourier a Corto Plazo (unidad STFT), un banco de filtros, o cualquier otro medio para derivar una representación de la señal con múltiples bandas de frecuencia X(f, k), con el índice de la banda de la frecuencia f y el índice del tiempo k. La unidad de transformación, transforma la señal media mid1(t), la señal lateral s1(t), el primer canal de entrada x1(t) y el segundo canal de entrada xr(t), que están representados en un dominio del tiempo a señales del dominio espectral, en particular, en una señal media del dominio espectral M1(f), una señal lateral del dominio espectral S1(f), un primer canal de entrada del dominio espectral X1(f) y un segundo canal de entrada del dominio espectral Xr(f). La señal media del dominio espectral M1(f) y la señal lateral del dominio espectral S1(f) se alimentan en el generador de la información de modificación 1310 como una información media-lateral. El generador de la información de modificación 1310 genera la información de modificación modInf basándose en la señal media monofónica del dominio espectral M1(f) y la señal lateral monofónica S1(f). El generador de la información de modificación de la Figura 13 también puede tomar en cuenta el primer canal de entrada X1(f) y/o el segundo canal de entrada Xr(f), como se indica por las líneas de conexión punteadas 1312 y 1314. Por ejemplo, el generador de la información de modificación 1310 puede generar la información de modificación que se basa en la señal media monofónica M1(f), el primer canal de entrada X1(f) y el segundo canal de entrada Xr(f).

El generador de la modificación 1310 pasa entonces la información de modificación generada modInf al manipulador de la señal 1320. Además, la unidad de transformación 1305 alimenta el primer canal de entrada del dominio espectral X1(f) y el segundo canal de entrada del dominio espectral Xr(f) en el manipulador de la señal 1320. El

E12731456 ES 2 552 996 T3 12-11-2015   manipulador de la señal 1320 está adaptado para manipular el primer canal de entrada, basándose en la información de modificación modInf, para obtener un primer canal lateral del dominio espectral S1(f) y un segundo canal lateral del dominio espectral Sr(f), que se alimentan a la unidad de transformación inversa 1325 por el manipulador de la señal 1320.

La unidad de transformación inversa 1325 está adaptada para transformar el primer canal lateral del dominio espectral S1(f) en un dominio del tiempo, para obtener un primer canal lateral del dominio del tiempo s1(t), y para transformar el segundo canal lateral del dominio espectral Sr(f) en un dominio del tiempo, para obtener un segundo canal lateral del dominio del tiempo sr(t), respectivamente.

La Figura 14 ilustra un aparato para generar una señal lateral estereofónica de acuerdo con una realización adicional. El aparato ilustrado por la Figura 14, difiere del aparato de la Figura 13 en que el aparato de la Figura 14 comprende además un generador del canal 1307, que está adaptado para recibir el primer canal de entrada X1(f) y el segundo canal de entrada Xr(f), y para generar una señal media monofónica M1(f) y/o una señal lateral monofónica S1(f), del primer y segundo canales de entrada X1(f), Xr(f). Por ejemplo, la señal media monofónica M1(f) puede generarse de acuerdo con la fórmula: La señal lateral monofónica S1(f) puede, por ejemplo, generarse de acuerdo con la fórmula: La razón fundamental del método propuesto es calcular una estimación del espectro de la magnitud de las señales deseadas, en concreto de m(t) = [m1(t) mr(t)] y s = [s1(t) sr(t)], procesando la señal de entrada x(t)=[x1(t) xr(t)], y aprovechando el hecho de que la representación del dominio de la frecuencia de m1(t) y s1(t) comprende los componentes deseados de la señal. En un ejemplo, que no pertenece a la invención, se emplea la sustracción espectral. Los espectros de las señales de entrada se modifican utilizando los espectros de la señal media monofónica. En otra realización, se emplea la ponderación espectral, en donde las ponderaciones se derivan utilizando la señal media monofónica y la señal lateral monofónica. De acuerdo con las realizaciones, las señales deberán calcularse con características similares como la señal media y lateral, pero sin perder la señal estereofónica cuando se escucha cada una de las señales de manera separada. Esto se logra utilizando la sustracción espectral en un ejemplo, que no pertenece a la invención, y utilizando la ponderación espectral en la presente invención. De acuerdo con otra realización, se proporciona un mezclador para generar al menos cuatro canales de mezclado de una señal estereofónica que tiene dos canales de entrada del mezclador. El mezclador comprende un aparato para generar una señal lateral estereofónica de acuerdo con una de las realizaciones descritas anteriormente, para generar un primer canal lateral como el primer canal de mezclado, y para generar un segundo canal lateral como un segundo canal de mezclado. El mezclador comprende además, una primera unidad de combinación y una segunda unidad de combinación. La primera unidad de combinación está adaptada para combinar el primer canal de entrada y el primer canal lateral, para obtener un primer canal medio como un tercer canal de mezclado. Además, la segunda unidad de combinación está adaptada para combinar el segundo canal de entrada y el segundo canal lateral como un cuarto canal de mezclado.

La Figura 15 ilustra un mezclador de acuerdo con un ejemplo, que no pertenece a la invención. El mezclador comprende un aparato para generar una señal lateral estereofónica 1510, un primer generador del canal medio 1520 y un segundo generador del canal medio 1530. Un primer canal de entrada X1(f) se alimenta al aparato para generar una señal lateral estereofónica 1510 y en el primer generador del canal medio 1520. Además, un segundo canal de entrada X(f) se alimenta al aparato para generar una señal lateral estereofónica 1510 y en el segundo generador del canal medio 1530. Además, el aparato para generar una señal lateral estereofónica 1510 alimenta el primer canal lateral generado S1(f) en el primer generador del canal medio 1520, y alimenta además, el segundo canal lateral generado Sr(f) en el segundo generador del canal medio 1530. El primer canal lateral S1(f) es producido como un primer canal del mezclador generado por el mezclador. El segundo canal lateral Sr(f) se produce como un segundo canal del mezclador generado por el mezclador. El primer generador del canal medio 1520 combina el primer canal de entrada X1(f) y el primer canal lateral generado S1(f), para obtener un primer canal de una señal media estereofónica M1(f). Por ejemplo, el generador del canal medio 1520 puede emplear la fórmula:

E12731456 ES 2 552 996 T3 12-11-2015   Además, la segunda unidad de combinación, combina el segundo canal Sr(f) de la señal lateral estereofónica y el segundo canal de entrada Xr(f) por el generador del canal medio 1530 para obtener un segundo canal Mr(f) de la señal media estereofónica. Por ejemplo, la segunda unidad de combinación puede emplear la fórmula: El primer canal de la señal media estereofónica M1(f) y el segundo canal de la señal media estereofónica Mr(f), se producen como el tercer y cuarto canales del mezclador, respectivamente. Como puede observarse, la existencia de una señal media estereofónica y una señal lateral estereofónica es ventajosa para la aplicación de mezclado de una señal estereofónica, para la reproducción utilizando sistemas de sonido envolvente. Una posible aplicación de la señal lateral estereofónica y media estereofónica, es la reproducción del sonido cuadrafónico como se muestra en la Figura 16. Comprende cuatro canales que se alimentan a las señales medias estereofónicas y las señales laterales estereofónicas.

La aplicación ejemplar de la reproducción cuadrafónica como se describió anteriormente, es una buena ilustración para las características de la señal lateral estereofónica y la señal media estereofónica. Nótese que el procesamiento descrito puede extenderse además, para reproducir la señal de audio con diferentes formatos que el cuadrafónico. Más señales del canal de salida se combinan separando primero la señal lateral estereofónica y la señal media estereofónica, y aplicando el procesamiento descrito nuevamente a una o ambas de ellas. Por ejemplo, una señal para la reproducción utilizando 5 canales de acuerdo con ITU-R BS.775 [1], puede derivarse repitiendo la descomposición de la señal con la señal media estereofónica como la señal de entrada. La Figura 17 ilustra un diagrama de bloques del procesamiento para generar una señal con múltiples canales, adecuada para la reproducción con cinco canales, con un canal central C, un izquierdo L, un derecho R, un izquierdo envolvente SL y un derecho envolvente SR. Los métodos y aparatos descritos anteriormente se han presentado para descomponer una señal de entrada estereofónica en una señal lateral estereofónica y/o una señal media estereofónica. Se aplica la sustracción espectral o la ponderación espectral para la separación espectral. Una descomposición MS proporciona la información basada en la dirección, que es necesaria para calcular el grado al cual cada bloque de tiempo- frecuencia contribuye a la señal lateral estereofónica y la señal media estereofónica. Tales señales pueden utilizarse para la aplicación del mezclado de señales estereofónicas para la reproducción por sistemas de sonido envolvente.

Aunque algunos aspectos se han descrito en el contexto de un aparato, está claro que estos aspectos también representan una descripción del método correspondiente, en donde un bloque o un dispositivo corresponde a una etapa del método o una característica de una etapa del método. De manera análoga, los aspectos descritos en el contexto de una etapa del método también representan una descripción de un bloque o punto o característica correspondiente de un aparato correspondiente.

La señal descompuesta inventiva puede almacenarse en un medio de almacenamiento digital, o puede transmitirse en un medio de transmisión, tal como un medio de transmisión inalámbrico o un medio de transmisión cableado, tal como Internet.

Dependiendo de ciertos requisitos de la implementación, las realizaciones de la invención pueden implementarse en hardware o software. La implementación puede realizarse utilizando un medio de almacenamiento digital, por ejemplo, un disco flexible, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tienen señales de control legibles electrónicamente almacenadas en ellas, que cooperan (o son capaces de cooperar) con un sistema de computadora programable, de manera que se realiza el método respectivo.

Algunas realizaciones de acuerdo con la invención comprenden un portador de datos no transitorio, que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema de computadora programable, de manera que se realiza uno de los métodos descritos en la presente.

Generalmente, las realizaciones de la presente invención pueden implementarse como un producto de un programa de computadora con un código del programa, el código del programa es operativo para realizar uno de los métodos, cuando el producto del programa de computadora se ejecuta en una computadora. El código del programa puede almacenarse, por ejemplo, en un portador legible por la máquina.

Otras realizaciones comprenden el programa de computadora para realizar uno de los métodos descritos en la presente, almacenado en un portador legible por la máquina. En otras palabras, una realización del método inventivo es, por lo tanto, un programa de computadora que tiene un código del programa para realizar uno de los métodos descritos en la presente, cuando el programa de computadora

E12731456 ES 2 552 996 T3 12-11-2015   se ejecuta en una computadora. Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora), que comprende, grabado en el mismo, el programa de computadora para realizar uno de los métodos descritos en la presente. Una realización adicional del método inventivo es, por lo tanto, una corriente de datos o una secuencia de señales que representan el programa de computadora, para realizar uno de los métodos descritos en la presente. La corriente de datos o la secuencia de señales puede configurarse, por ejemplo, para transferirse mediante una conexión de comunicación de datos, por ejemplo, mediante Internet. Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora o un dispositivo lógico programable, configurado para, o adaptado para realizar uno de los métodos descritos en la presente.

Una realización adicional comprende una computadora que tiene instalado en el mismo el programa de computadora para realizar uno de los métodos descritos en la presente. En algunas realizaciones, puede utilizarse un dispositivo lógico programable (por ejemplo, un campo de matrices de puertas programables), para realizar una o todas las funcionalidades de los métodos descritos en la presente. En algunas realizaciones, un campo de matrices de puertas programables puede cooperar con un microprocesador, con el fin de realizar uno de los métodos descritos en la presente. Generalmente, los métodos se realizan de manera preferida mediante cualquier aparato de hardware. Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invención. Se entenderá que las modificaciones y variaciones de las disposiciones y los detalles descritos en la presente, serán evidentes para los expertos en la materia. Por lo tanto, pretenden estar limitadas sólo por el alcance de las reivindicaciones de la patente a continuación y no por los detalles específicos presentados a manera de descripción y explicación de las realizaciones en la presente.

Bibliografía: [1] International Telecommunication Union, Radiocommunication Assembly, “Multichannel stereophonic sound system with and without accompanying picture”, Recommendation ITU-R.BS.775-2, 2006, Ginebra, Suiza.

[2] S. Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. on Accoustics, Speech, and Signal Processing, vol. 27, nº 2, págs.. 113-120, 1979 [3] O. Cappé, “Elimination of the musical noise phenomenon with the Ephraim-Malah noise suppressor”, IEEE Trans. On Speech and Audio Processing, vol. 2, págs. 345-349, 1994.

[4] G. Schmidt, “Single-channel noise suppression based on spectral weighting”, Eurasip Newsletter, 2004. [5] M. Berouti, R. Schwartz y J. Makhoul, “Enhancement of speech corrupted by acoustic noise”, in Proc. of the IEEE Int. Conf. On Acoustics, Speech, and Signal Processing, ICASSP, 1979 [6] R. Martin, “Spectral subtraction based on minimum statistics”, in Proc. of EUSIPCO, Edinburgh, Reino Unido, 1994 [7] Y. Ephraim y D. Malah, “Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator”, in Proc. of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1984 [8] E George, “Single-sensor speech enhancement using a soft-decision/variable attenuation algorithm”, in Proc. Of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1995.

[9] C. Avendano y J.-M. Jot, “A frequency-domain approach to multi-channel upmix”, J. Audio Eng. Soc., vol. 52, 2004. [10] C. Faller, “Multiple-loudspeaker playback of stereo signals”, J. Audio Eng. Soc., vol. 54, 2006.

[11] C. Uhle, J. Herre, S. Geyersberger, F. Ridderbusch, A. Walter y O. Moser, “Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program”, Solicitud de Patente de Estados Unidos 2009/0080666, 2009. [12] C. Uhle, J. Herre, A. Walther, O. Hellmuth y C. Janssen, “Apparatus and method for generating an ambient

E12731456 ES 2 552 996 T3 12-11-2015   signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program”, Solicitud de Patente de Estados Unidos 2010/0030563, 2010. [13] E. Vickers, “Two-to-three channel upmix for center channel derivation”, Solicitud de Patente de Estados Unidos 2010/0296672, 2010.

E12731456 ES 2 552 996 T3 12-11-2015  

REIVINDICACIONES

1. Un aparato para generar una señal lateral estereofónica, que tiene un primer canal lateral y un segundo canal lateral de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada, que comprende: un generador de la información de modificación (110; 610; 710; 810; 910; 1310) para generar la información de modificación, el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende un generador de ponderaciones espectrales (116; 615; 715; 815; 915) para generar la información de modificación, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica, y un manipulador de la señal (120; 620; 720; 820; 1320) que está adaptado para manipular el primer canal de entrada, basándose en la información de modificación para obtener el primer canal lateral, y está adaptado para manipular el segundo canal de entrada, basándose en la información de modificación para obtener el segundo canal lateral.

2. Un aparato de acuerdo con la reivindicación 1, en el que el manipulador de la señal (120; 620; 720; 820; 1320) está adaptado para manipular el segundo canal de entrada, basándose en el primer factor de ponderación espectral como la información de modificación, para obtener el segundo canal lateral. 3. Un aparato de acuerdo con la reivindicación 1 o 2, en el que el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende el generador de ponderaciones espectrales (116; 615; 715; 815; 915), para generar la información de modificación, generando el primer factor de ponderación espectral, basándose en la señal media monofónica y en la señal lateral monofónica de la señal de entrada estereofónica, en el que el generador de ponderaciones espectrales (116; 615; 715; 815; 915) está adaptado para generar un segundo factor de ponderación espectral, basándose en la señal media monofónica y en la señal lateral monofónica de la señal de entrada estereofónica, y en el que el manipulador de la señal (120; 620; 720; 820; 1320) está adaptado para manipular el segundo canal de entrada, basándose en el segundo factor de ponderación espectral como la información de modificación para obtener el segundo canal lateral. 4. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende el generador de ponderaciones espectrales (116; 615; 715; 815; 915) para generar la información de modificación, generando el primer factor de ponderación espectral, basándose en la señal media monofónica y en la señal lateral monofónica de la señal de entrada estereofónica, en el que el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende además un determinador de la magnitud (912), en el que el determinador de la magnitud (912) está adaptado para recibir la señal media monofónica que está representada en un dominio espectral, y en el que el determinador de la magnitud está adaptado para recibir la señal lateral monofónica que está representada en un dominio espectral, en el que el determinador de la magnitud (912) está adaptado para determinar un valor de la magnitud de la señal lateral monofónica como un valor lateral de la magnitud, y en el que el determinador de la magnitud (912) está adaptado para determinar un valor de la magnitud de la señal media monofónica como un valor medio de la magnitud, en el que el determinador de la magnitud (912) está adaptado para alimentar el valor lateral de la magnitud y el valor medio de la magnitud en el generador de ponderaciones espectrales (116; 615; 715; 815; 915), y en el que el generador de ponderaciones espectrales (116; 615; 715; 815; 915) está adaptado para generar el primer factor de ponderación espectral, basándose en una relación de un primer número a un segundo número, en el que el primer número depende del valor lateral de la magnitud, y en el que el segundo número depende del valor medio de la magnitud y el valor lateral de la magnitud.

5. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el generador de la información de modificación (110; 610; 710; 810; 910; 1310) comprende el generador de ponderaciones espectrales (116; 615; 715; 815; 915), para generar la información de modificación, generando el primer factor de ponderación espectral, basándose en la señal media monofónica y en la señal lateral monofónica de la señal de entrada estereofónica, en el que el generador de ponderaciones espectrales (116; 615; 715; 815; 915) está adaptado para generar el factor de modificación de acuerdo con la fórmula

E12731456 ES 2 552 996 T3 12-11-2015   o, en el que el generador de ponderaciones espectrales (116; 615; 715; 815; 915) está adaptado para generar el factor de modificación de acuerdo con la fórmula: o, en el que el generador de ponderaciones espectrales (116; 615; 715; 815; 915) está adaptado para generar el factor de modificación de acuerdo con la fórmula: con en el que |S(f)| indica un espectro de la magnitud de la señal lateral monofónica, en el que |M(f)| indica un espectro de la magnitud de la señal lateral monofónica, en el que indica un espectro de la magnitud del primer canal de entrada, en el que |Xr(f)| indica un espectro de la magnitud del segundo canal de entrada, en el que M(f) indica la señal media monofónica, y en el que α, β, γ, δ y η son factores escalares.

6. Un aparato de acuerdo con una de las reivindicaciones 2 a 5, en el que el generador de la información de modificación (110; 610; 710; 810; 910; 1310) está adaptado para generar la información de modificación, basándose en la señal media monofónica de la señal de entrada estereofónica o en la señal lateral monofónica de la señal de entrada estereofónica, en el que la señal media monofónica depende de una señal de suma que resulta de sumar el primer y el segundo canales de entrada, y en el que la señal lateral monofónica depende de una señal de la diferencia que resulta de sustraer el segundo canal de entrada del primer canal de entrada. 7. Un aparato de acuerdo con una de las reivindicaciones 2 a 6, en el que el aparato comprende además un generador del canal (561, 562), en el que el generador del canal está adaptado para generar la señal media monofónica o la señal lateral monofónica, basándose en el primer y segundo canales de entrada.

8. Un aparato de acuerdo con una de las reivindicaciones 2 a 7, en el que el aparato comprende además: una unidad de transformación (1305) para transformar el primer y segundo canales de entrada de la señal de entrada estereofónica, de un dominio del tiempo a un dominio espectral, y una unidad de transformación inversa (1325), en el que el manipulador de la señal (120; 620; 720; 820; 1320) está adaptado para manipular el primer canal de entrada que está representado en el dominio espectral y el segundo canal de entrada que está representado en el dominio espectral, para obtener la señal lateral estereofónica que está representada en el dominio espectral, y en el que la unidad de transformación inversa (1325) está adaptada para transformar la señal lateral estereofónica que está representada en el dominio espectral del dominio espectral al dominio del tiempo.

9. Un mezclador, que comprende: un aparato para generar una señal lateral estereofónica (1510) que tiene un primer canal lateral y un segundo canal lateral, de acuerdo con una de las reivindicaciones anteriores, en el que el aparato está adaptado para generar el primer canal lateral como un primer canal mezclador, y en el que el aparato está adaptado para generar el primer canal lateral como un primer canal mezclador, un primer generador del canal medio (1520) para generar el primer canal medio como un tercer canal mezclador, basándose en una diferencia entre el primer canal de entrada estereofónica y el primer canal lateral, y un segundo generador del canal medio (1530) para generar el segundo canal medio como un cuarto canal mezclador, basándose en una diferencia entre el segundo canal de entrada estereofónica y el segundo canal lateral.

10. Un aparato para generar una señal media estereofónica que tiene un primer canal medio y un segundo canal medio, de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada, que comprende: un generador de la información de modificación (1010) para generar información de modificación, el generador de la información de modificación (1010) comprende un generador de ponderaciones espectrales para generar la

E12731456 ES 2 552 996 T3 12-11-2015   información de modificación, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica, y un manipulador de la señal (1020) que está adaptado para manipular el primer canal de entrada, basándose en la información de modificación para obtener el primer canal medio y que está adaptado para manipular el segundo canal de entrada, basándose en la información de modificación para obtener el segundo canal medio.

11. Un aparato de acuerdo con la reivindicación 10, en el que el generador de la información de modificación comprende además, un determinador de la magnitud, en el que el determinador de la magnitud está adaptado para determinar un valor de la magnitud de la señal lateral monofónica, que está representada en un dominio espectral, como un valor lateral de la magnitud, y en el que el determinador de la magnitud está adaptado para determinar un valor de la magnitud de la señal media monofónica que está representada en un dominio espectral como un valor medio de la magnitud, en el que el determinador de la magnitud está adaptado para alimentar el valor lateral de la magnitud y el valor medio de la magnitud al generador de ponderaciones espectrales, y en el que el generador de ponderaciones espectrales está adaptado para generar el primer factor de ponderación espectral, basándose en una relación de un primer número a un segundo número, en el que el primer número depende del valor lateral de la magnitud, y en el que el segundo número depende del valor medio de la magnitud y el valor lateral de la magnitud.

12. Método para generar una señal lateral estereofónica, que tiene un primer canal lateral y un segundo canal lateral de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada, que comprende: generar la información de modificación, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica, manipular el primer canal de entrada, basándose en la información de modificación para obtener el primer canal lateral, y manipular el segundo canal de entrada, basándose en la información de modificación para obtener el segundo canal lateral.

13. Método para generar una señal media estereofónica que tiene un primer canal medio y un segundo canal medio, de una señal de entrada estereofónica, que tiene un primer canal de entrada y un segundo canal de entrada, que comprende: generar la información de modificación, generando un primer factor de ponderación espectral, basándose en una señal media monofónica y en una señal lateral monofónica de la señal de entrada estereofónica, manipular el primer canal de entrada, basándose en la información de modificación, para obtener el primer canal medio, y manipular el segundo canal de entrada, basándose en la información de modificación para obtener el segundo canal medio.

14. Método de acuerdo con la reivindicación 13, en el que la etapa de generar la información de modificación comprende: generar la información de modificación, generando un primer factor de ponderación espectral, en el que el primer factor de ponderación espectral depende de una señal media monofónica y una señal lateral monofónica de la señal de entrada estereofónica, determinar un valor de la magnitud de la señal lateral monofónica que está representada en un dominio espectral como un valor lateral de la magnitud determinar un valor de la magnitud de la señal media monofónica que está representada en un dominio espectral como un valor medio de la magnitud, alimentar el valor lateral de la magnitud y el valor medio de la magnitud en el generador de ponderaciones espectrales, y generar el primer factor de ponderación espectral, basándose en una relación de un primer número a un segundo número, en el que el primer número depende del valor lateral de la magnitud, y en el que el segundo número depende del valor medio de la magnitud y el valor lateral de la magnitud.

15. Programa para computadora para implementar un método de acuerdo con una de las reivindicaciones 12 a 14, ejecutado en una computadora o un procesador.

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015  

E12731456 ES 2 552 996 T3 12-11-2015