Método y aparato para procesar una señal.

Método de procesado de una señal que incluye una señal de habla y una señal de audio,

comprendiendo el método:

recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX);

decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R);

obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial;

obtener el valor de IPD de una banda paramétrica (pb≥0, ..., pb ≥4) de un espacio de tiempo paramétrico ([0], [1],...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode);

suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y

generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX),

en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L,R), en el que el espacio de tiempo paramétrico ([0], [1],...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD,

en el que la banda paramétrica (pb≥0, ..., pb≥4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD,

en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y

en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09012229.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: YOON,Sung Yong, LEE,Hyun Kook, KIM,Dong Soo, LIM,Jae Hyun.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/008 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado.

PDF original: ES-2547232_T3.pdf

 


Fragmento de la descripción:

Método y aparato para procesar una señal.

Campo técnico

La presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo. Aunque la presente invención resulta adecuada para una amplia variedad de aplicaciones, la misma es particularmente apropiada para mejorar la calidad de sonido de una señal y reconstruir más perfectamente una señal introducida, de tal manera que usa una señal generada a partir de cambiar una fase de la señal introducida y utiliza un valor de diferencia de fase entre canales de la señal con fase cambiada.

Antecedentes técnicos En general, para generar una señal estereofónica a partir de una señal monofónica, la señal se codifica usando un decorrelador.

Además, un procesador de señales puede codificar una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales.

El artículo "MPEG4-Ext2: CE on Low Complexity parametric stereo" de W. Oomen et al., y publicado por la Organización Internacional para la Normalización, proporciona una descripción técnica detallada para el denominado "Core Experiment" sobre estéreo paramétrico de baja complejidad. En particular, se describe una alternativa a la síntesis de sonido estereofónico paramétrico basada en la FFT, fundamentándose dicha alternativa en la QMF y siendo de baja complejidad, en donde en lugar de FFT, se usan bancos de filtros basados en una QMF híbrida compleja que funcionan sobre el banco de filtros de QMF Compleja de 64 bandas utilizado en la tecnología de SBR (Replicación de la Banda Espectral) .

Se puede considerar que "Improved Externalization an Frontal Perception of Headphone Signals", S. G. Weinrich, Proceedings of 92nd AES Convention Preprint, da a conocer una técnica en la cual la externalización de imágenes espaciales depende de la recreación de la relación entre diferencias de tiempo interaurales y diferencias de nivel interaurales. La discriminación entre la parte frontal y la posterior depende del equilibrio adecuado de sonoridad entre las bandas direccionales trasera y delantera y posiblemente también del grado de fusión binaural.

Se puede considerar que "Low complexity parametric stereo coding in MPEG-4", de H. Purnhagen, Proceedings on the 7th International Conference on Digital Audio Effects, da a conocer una técnica para la codificación estereofónica paramétrica en un codificador para la señal de audio monoaural subyacente. La técnica utiliza bancos de filtros modulados complejos, lo cual permite una implementación con baja complejidad computacional. El sistema es retrocompatible y permite una codificación estereofónica de alta calidad con una velocidad de bits total de 24 kbit/s cuando se usa en combinación con AAC de Alta Eficiencia.

Exposición de la invención Problema técnico No obstante, en caso de que una señal de audio se genere utilizando un decorrelador, este último no puede reproducir de manera precisa una diferencia de fase o retardo existente entre señales del canal.

En caso de que se codifique una señal utilizando un valor de diferencia de nivel entre canales y un valor de correlación entre canales, no se puede restablecer ni reflejar una diferencia de fase entre canales de la señal de entrada. Por lo tanto, resulta difícil llevar a cabo una localización precisa de imágenes sonoras. Además, no se puede restablecer la reverberación de una señal de entrada.

Solución técnica Por consiguiente, la presente invención se refiere a un aparato para procesar una señal de audio y a un método para lo mismo, según definen las reivindicaciones independientes adjuntas 1 y 4, las cuales eluden sustancialmente uno o más de los problemas debidos a limitaciones y desventajas de la técnica relacionada.

Un objetivo de la presente invención es proporcionar un aparato para procesar una señal y un método para lo mismo, por medio de los cuales la calidad de sonido se mejora y se puede proporcionar una señal próxima a un sonido original de tal manera que se reconstruye y cambia una fase de una señal decodificada de audio o de habla.

Efectos ventajosos Por lo tanto, la presente invención proporciona los siguientes efectos y/o ventajas.

En un método y un aparato para procesar una señal de audio de acuerdo con la presente invención, recibiendo la bandera de modo de diferencia de fase entre canales (IPD) que indica si el valor de diferencia de fase entre canales (IPD) se usa para cada trama, se puede decodificar una señal utilizando el valor de diferencia de fase entre canales (IPD) si ello fuera necesario.

Además, modificando (suavizando) el valor de diferencia de fase entre canales de un espacio de tiempo paramétrico actual con la utilización del valor de diferencia de fase entre canales de un espacio de tiempo paramétrico previo, se puede eliminar el ruido que se puede generar de manera transitoria a partir de una diferencia entre las dos informaciones de fase entre canales.

Además, transmitiendo el valor de diferencia de fase entre canales únicamente si se cumple una condición predeterminada, se puede aumentar la eficiencia de codificación. Por otro lado, también se puede decodificar una señal próxima a un sonido original.

Descripción de los dibujos Los dibujos adjuntos, los cuales se incluyen para aportar una interpretación adicional de la invención, ilustran formas de realización de la misma y, junto con la descripción, sirven para explicar los principios de la invención. 20 En los dibujos:

la figura 1 es un diagrama correspondiente a un concepto de un método de procesado de señales de audio según una forma de realización de la presente invención;

la figura 2 es un diagrama de bloques de un aparato para procesar una señal de audio de acuerdo con una forma de realización de la presente invención;

la figura 3 es una gráfica correspondiente a una relación entre una fase y un tiempo en una señal;

la figura 4 es un diagrama de bloques detallado de una unidad de medición de IPD y una unidad de obtención de IPD representadas en la figura 2;

la figura 5 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de 35 realización de la presente invención;

la figura 6 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 7 es un diagrama correspondiente a un concepto de espacio de tiempo paramétrico según una técnica relacionada;

la figura 8 es un diagrama esquemático correspondiente a un método de modificación (suavización) del valor de diferencia de fase entre canales según otra forma de realización de la presente invención;

la figura 9 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención representada en la figura 8;

la figura 10 es un diagrama correspondiente a un concepto de un problema resuelto por un aparato y un método 50 de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 11 y la figura 12 son diagramas de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 13 es un diagrama correspondiente a un concepto de utilización de un valor de diferencia de fase entre canales (IPD) global a nivel de tramas, según otra forma de realización de la presente invención;

la figura 14 es un diagrama de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

las figuras 15 a 17 son diagramas de bloques de un aparato de procesado de señales de audio según otra forma de realización de la presente invención;

la figura 18 es un diagrama esquemático de una configuración de un producto que incluye una unidad de 65 obtención de banderas de codificación de IPD, una unidad de obtención de banderas de modo de IPD, una

unidad de obtención de IPD y una unidad de mezclado ascendente según otra forma de realización de la presente invención;

la figura 19 representa diagramas esquemáticos correspondientes a relaciones de productos que incluyen una unidad de obtención de banderas de codificación de IPD, una unidad de obtención de banderas de modo de IPD, una unidad de obtención de IPD y una unidad de mezclado ascendente, según otra forma de realización de la presente invención, respectivamente; y la figura 20 es un diagrama de bloques esquemático de un aparato de decodificación de señales de difusión general que incluye una unidad de obtención de banderas de codificación... [Seguir leyendo]

 


Reivindicaciones:

1. Método de procesado de una señal que incluye una señal de habla y una señal de audio, comprendiendo el método:

recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX) ;

decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

reconstruir la señal de mezcla descendente (DMX) expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R) ;

obtener una bandera de codificación de diferencias de fase entre canales, IPD, (bsPhaseCoding) que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

obtener una bandera de modo de IPD (bsPhaseMode) sobre la base de la bandera de codificación de IPD (bsPhaseCoding) a partir de una trama de la información espacial, indicando la bandera de modo de IPD (bsPhaseMode) si el valor de IPD se utiliza en la trama de la información espacial;

obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb =4) de un espacio de tiempo paramétrico ([0], [1], ...) en la trama, sobre la base de la bandera de modo de IPD (bsPhaseMode) ;

suavizar el valor de IPD modificando el valor de IPD utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y generar una señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente (DMX) , en el que la información espacial está dividida por el encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales (L, R) , en el que el espacio de tiempo paramétrico ([0], [1], ...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica el valor de IPD, en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD, 45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente.

2. Método según la reivindicación 1, que comprende además:

generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales utilizando el valor de IPD; y 55 modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.

3. Método según la reivindicación 1, que comprende además:

determinar el valor de IPD de un espacio de tiempo al que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.

4. Aparato (200, 900, 1700) para procesar una señal que incluye una señal de habla y una señal de audio, 65 comprendiendo el aparato (200, 900, 1700) :

una unidad de recepción de señales (210, 240; 910, 940) adaptada para recibir la señal, información de extensión e información espacial que indican un atributo de una señal de varios canales (L, R) para mezclar en sentido ascendente una señal de mezcla descendente (DMX) ;

una unidad de decodificación de señales de audio (1750) adaptada para decodificar la señal de audio en un dominio de la frecuencia de acuerdo con una transformada de coeficiente discreta modificada inversa;

una unidad de decodificación de señales de habla (1760) adaptada para decodificar la señal de habla en un dominio del tiempo utilizando un esquema de codificación por predicción lineal;

una unidad de decodificación de señales de extensión de ancho de banda (1770) adaptada para reconstruir la señal de mezcla descendente expandiendo la señal de audio decodificada y la señal de habla decodificada en una señal de mezcla descendente de banda completa utilizando la información de extensión, generándose la señal de mezcla descendente (DMX) a partir de la señal de varios canales (L, R) ;

una unidad de obtención de banderas de codificación de diferencias de fase entre canales, IPD, (231, 931, 1781) adaptada para obtener una bandera de codificación de IPD que indica si se utiliza un valor de IPD en la información espacial a partir de un encabezamiento de la información espacial;

una unidad de obtención de banderas de modo de IPD (232, 932, 1782) adaptada para obtener una bandera de modo de IPD sobre la base de la bandera de codificación de IPD a partir de una trama de la información espacial, indicando la bandera de modo de IPD si el valor de IPD se utiliza en la trama de la información espacial;

una unidad de obtención de IPD (233, 933, 1783) adaptada para obtener el valor de IPD de una banda paramétrica (pb=0, ..., pb=4) de un espacio de tiempo paramétrico ([0], [1], ...) , sobre la base de la bandera de modo de IPD;

una unidad de suavización de IPD (934) adaptada para suavizar el valor de IPD modificando el valor de IPD 30 utilizando el valor de IPD de un espacio de tiempo paramétrico previo; y una unidad de mezclado ascendente (240, 940, 1784) adaptada para generar la señal de varios canales aplicando el valor de IPD suavizado a la señal de mezcla descendente, en el que la información espacial está dividida por un encabezamiento y una pluralidad de las tramas, en el que el valor de IPD indica una diferencia de fase entre dos canales de la señal de varios canales, en el que el espacio de tiempo paramétrico ([0], [1], ...) indica un espacio de tiempo (1, 2, 3, 4, ..., N) al que se aplica 40 el valor de IPD, en el que la banda paramétrica (pb=0, ..., pb=4) es por lo menos una subbanda de un dominio de la frecuencia que incluye el valor de IPD, 45 en el que el valor de IPD se recibe cuando la relación entre el valor de IPD y un valor de la diferencia de nivel entre canales, ILD, supera un umbral, y en el que el valor de ILD indica una diferencia de nivel entre dos canales de la señal de varios canales incluida en la señal de mezcla descendente. 50

5. Aparato según la reivindicación 4, en el que la unidad de suavización de IPD comprende:

una unidad de generación de ángulos de corrección adaptada para generar un ángulo de corrección que indica un ángulo entre dos canales de la señal de varios canales, utilizando el valor de IPD; y 55 una unidad de modificación de ángulos de corrección adaptada para modificar el ángulo de corrección utilizando un ángulo de corrección del espacio de tiempo paramétrico previo.

6. Aparato según la reivindicación 4, que comprende además una unidad de interpolación de IPD adaptada para 60 determinar el valor de IPD de un espacio de tiempo en el que no se aplica el valor de IPD utilizando por lo menos uno de entre el valor de IPD y el valor de IPD suavizado.


 

Patentes similares o relacionadas:

Uso eficaz de la información de fase en la codificación y decodificación de audio, del 8 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador de audio para generar una representación codificada de señales de audio de entrada primera y segunda, que comprende: un estimador […]

Codificación de audio jerárquica multicanal con información lateral compacta, del 8 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para generar una representación paramétrica de una señal de audio que tiene al menos dos canales izquierdos originales (224a, 224b) […]

Codificación residual en un sistema de audio basado en objetos, del 8 de Mayo de 2019, de DTS, INC: Un método de descompresión y mezcla ascendente de una señal de audio compuesta comprimida y mezclada de manera descendente, que comprende […]

Mezcla ascendente espacial controlada por renderizador, del 1 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo decodificador de audio para la decodificación de una señal de audio de entrada comprimida que comprende por lo menos un decodificador […]

Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales, del 26 de Abril de 2019, de DTS, INC: Un método realizado por uno o más dispositivos de procesamiento para transmitir una señal de audio de entrada que tiene N canales, que comprende: seleccionar […]

Metadatos para control de sonoridad y rango dinámico, del 24 de Abril de 2019, de APPLE INC.: Un procedimiento para descodificar audio durante el procesamiento de reproducción, que comprende: recibir una señal de audio codificada; recibir […]

Especificación de coeficientes ambisónicos de orden superior y/o armónicos esféricos en flujos de bits, del 24 de Abril de 2019, de QUALCOMM INCORPORATED: Un procedimiento de generación de un flujo de bits representativo de contenido de audio, comprendiendo el procedimiento: determinar que uno o más de […]

Descodificación estéreo de predicción compleja basada en TCMD, del 17 de Abril de 2019, de DOLBY INTERNATIONAL AB: Un sistema descodificador para proporcionar una señal estéreo por codificación estéreo de predicción compleja, que comprende: una etapa de mezcla ascendente (406, […]

Otras patentes de LG ELECTRONICS INC.