Método y aparato para procesar una señal.

Método de procesado de una señal que incluye una señal de habla y una señal de audio, comprendiendo el método:

recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales

(L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX);

decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R);

obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial;

obtener el valor de IPD de una banda paramétrica (pb≥0, ..., pb ≥4) de un espacio de tiempo paramétrico ([0], [1],...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode);

suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y

generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX),

en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L,R), en el que el espacio de tiempo paramétrico ([0], [1],...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD,

en el que la banda paramétrica (pb≥0, ..., pb≥4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD,

en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y

en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09012229.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: YOON,Sung Yong, LEE,Hyun Kook, KIM,Dong Soo, LIM,Jae Hyun.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/008 (Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado)

PDF original: ES-2547232_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método y aparato para procesar una señal.

Campo técnico

La presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo. Aunque la presente invención resulta adecuada para una amplia variedad de aplicaciones, la misma es particularmente apropiada para mejorar la calidad de sonido de una señal y reconstruir más perfectamente una señal introducida, de tal manera que usa una señal generada a partir de cambiar una fase de la señal introducida y utiliza un valor de diferencia de fase entre canales de la señal con fase cambiada.

Antecedentes técnicos En general, para generar una señal estereofónica a partir de una señal monofónica, la señal se codifica usando un decorrelador.

Además, un procesador de señales puede codificar una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales.

El artículo "MPEG4-Ext2: CE on Low Complexity parametric stereo" de W. Oomen et al., y publicado por la Organización Internacional para la Normalización, proporciona una descripción técnica detallada para el denominado "Core Experiment" sobre estéreo paramétrico de baja complejidad. En particular, se describe una alternativa a la síntesis de sonido estereofónico paramétrico basada en la FFT, fundamentándose dicha alternativa en la QMF y siendo de baja complejidad, en donde en lugar de FFT, se usan bancos de filtros basados en una QMF híbrida compleja que funcionan sobre el banco de filtros de QMF Compleja de 64 bandas utilizado en la tecnología de SBR (Replicación de la Banda Espectral) .

Se puede considerar que "Improved Externalization an Frontal Perception of Headphone Signals", S. G. Weinrich, Proceedings of 92nd AES Convention Preprint, da a conocer una técnica en la cual la externalización de imágenes espaciales depende de la recreación de la relación entre diferencias de tiempo interaurales y diferencias de nivel interaurales. La discriminación entre la parte frontal y la posterior depende del equilibrio adecuado de sonoridad entre las bandas direccionales trasera y delantera y posiblemente también del grado de fusión binaural.

Se puede considerar que "Low complexity parametric stereo coding in MPEG-4", de H. Purnhagen, Proceedings on the 7th International Conference on Digital Audio Effects, da a conocer una técnica para la codificación estereofónica paramétrica en un codificador para la señal de audio monoaural subyacente. La técnica utiliza bancos de filtros modulados complejos, lo cual permite una implementación con baja complejidad computacional. El sistema es retrocompatible y permite una codificación estereofónica de alta calidad con una velocidad de bits total de 24 kbit/s cuando se usa en combinación con AAC de Alta Eficiencia.

Exposición de la invención Problema técnico No obstante, en caso de que una señal de audio se genere utilizando un decorrelador, este último no puede reproducir de manera precisa una diferencia de fase o retardo existente entre señales del canal.

En caso de que se codifique una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales, no se puede restablecer ni reflejar una diferencia de fase entre canales de la señal de entrada. Por lo tanto, resulta difícil llevar a cabo una localización precisa de imágenes sonoras. Además, no se puede restablecer la reverberación de una señal de entrada.

Solución técnica Por consiguiente, la presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo, según definen las reivindicaciones independientes adjuntas 1 y 4, las cuales eluden sustancialmente uno o más de los problemas debidos a limitaciones y desventajas de la técnica relacionada.

Un objetivo de la presente invención es proporcionar un aparato para procesar una señal y un método para lo mismo, por medio de los cuales la calidad de sonido se mejora y se puede proporcionar una señal próxima a un sonido original de tal manera que se reconstruye y cambia una fase de una señal decodificada de audio o de habla.

Efectos ventajosos Por lo tanto, la presente invención proporciona los siguientes efectos y/o ventajas.

En un método y un aparato para procesar una señal de audio de acuerdo con la presente invención, recibiendo la bandera de modo de diferencia de fase entre canales (IPD) que indica si el valor de diferencia de fase entre canales (IPD) se usa para cada trama, se puede decodificar una señal utilizando el valor de diferencia de fase entre canales (IPD) si ello fuera necesario.

Además, modificando (suavizando) el valor de diferencia de fase entre canales de un espacio de tiempo paramétrico actual con la utilización del valor de diferencia de fase entre canales de un espacio de tiempo paramétrico previo, se puede eliminar el ruido que se puede generar de manera transitoria a partir de una diferencia entre las dos informaciones de fase entre canales.

Además, transmitiendo el valor de diferencia de fase entre canales únicamente si se cumple una condición predeterminada, se puede aumentar la eficiencia de codificación. Por otro lado, también se puede decodificar una señal próxima a un sonido original.

Descripción de los dibujos Los dibujos adjuntos, los cuales se incluyen para aportar una interpretación adicional de la invención, ilustran formas de realización de la misma y, junto con la descripción, sirven para explicar los principios de la invención. 20 En los dibujos:

la figura 1 es un diagrama correspondiente a un concepto de un método de procesado de señales de audio según una forma de realización de la presente invención;

la figura 2 es un diagrama de bloques de un aparato para procesar una señal de audio de acuerdo con una forma de realización de la presente invención;

la figura 3 es una gráfica correspondiente a una relación entre una fase y un tiempo en una señal;

la figura 4 es un diagrama de bloques detallado de una unidad de medición de IPD y una unidad de obtención de IPD representadas en la figura 2;

la figura 5 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de 35 realización de la presente invención;

la figura 6 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 7 es un diagrama correspondiente a un concepto de espacio de tiempo paramétrico según una técnica relacionada;

la figura 8 es un diagrama esquemático correspondiente a un método de modificación (suavización) del valor de diferencia de fase entre canales según otra forma de realización de la presente invención;

la figura 9 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención representada en la figura 8;

la figura 10 es un diagrama correspondiente a un concepto de un problema resuelto por un aparato y un método 50 de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 11 y la figura 12 son diagramas de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 13 es un diagrama correspondiente a un concepto de utilización de un valor de diferencia de fase entre canales (IPD) global a nivel de tramas, según otra forma de realización de la presente invención;

la figura 14 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

las figuras 15 a 17 son diagramas de bloques de un aparato... [Seguir leyendo]

 


Reivindicaciones:

1. Método de procesado de una señal que incluye una señal de habla y una señal de audio, comprendiendo el método:

recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX) ;

decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R) ;

obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial;

obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb =4) de un espacio de tiempo paramétrico ([0], [1], ...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode) ;

suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX) , en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L, R) , en el que el espacio de tiempo paramétrico ([0], [1], ...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD, en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD, 45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.

2. Método según la reivindicación 1, que comprende además:

generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales utilizando el valor de IPD; y 55 modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.

3. Método según la reivindicación 1, que comprende además:

determinar el valor de IPD de un espacio de tiempo al que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.

4. Aparato (200, 900, 1700) para procesar una señal que incluye una señal de habla y una señal de audio, 65 comprendiendo el aparato (200, 900, 1700) :

una unidad de recepción de señales (210, 240; 910, 940) adaptada para recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX) ;

una unidad de decodificación de señales de audio (1750) adaptada para decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

una unidad de decodificación de señales de habla (1760) adaptada para decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

una unidad de decodificación de señales de extensión de ancho de banda (1770) adaptada para reconstruir la señal de mezcla descendente expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R) ;

una unidad de obtención de banderas de codificación de diferencias de fase entre canales, IPD, (231, 931, 1781) adaptada para obtener una bandera de codificación de IPD que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

una unidad de obtención de banderas de modo de IPD (232, 932, 1782) adaptada para obtener una bandera de modo de IPD sobre la base de la bandera de codificación de IPD a partir de una trama de la información espacial, indicando la bandera de modo de IPD si el valor de IPD se utiliza en la trama de la información espacial;

una unidad de obtención de IPD (233, 933, 1783) adaptada para obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb=4) de un espacio de tiempo paramétrico ([0], [1], ...) , sobre la base de la bandera de modo de IPD;

una unidad de suavización de IPD (934) adaptada para suavizar el valor de IPD modificando el valor de IPD 30 utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y una unidad de mezclado ascendente (240, 940, 1784) adaptada para generar la señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente, en el que la información espacial está dividida por un encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales, en el que el espacio de tiempo paramétrico ([0], [1], ...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica 40 el valor de IPD, en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD, 45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente. 50

5. Aparato según la reivindicación 4, en el que la unidad de suavización de IPD comprende:

una unidad de generación de ángulos de corrección adaptada para generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales, utilizando el valor de IPD; y 55 una unidad de modificación de ángulos de corrección adaptada para modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.

6. Aparato según la reivindicación 4, que comprende además una unidad de interpolación de IPD adaptada para 60 determinar el valor de IPD de un espacio de tiempo en el que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.