Método y aparato para procesar una señal de audio.

Método para procesar una señal de audio, que comprende:

extraer (1301,

1303), a partir de un flujo continuo de bits recibido, una señal de submezcla, una señal auxiliar,información de identificación de encabezamiento que indica si está incluido un encabezamiento en la señalauxiliar, y una señal de extensión que se incluye en un área de extensión dentro de la señal auxiliar,en el que la señal de extensión es por lo menos una de entre una señal residual, una señal de submezclaartística o una señal de extensión de árbol artística, y

en el que la señal de submezcla, la señal auxiliar y la señal de extensión están destinadas a generar una señalde audio multicanal (y1, y2, ... ym);

adquirir (1307) información de longitud de la señal de extensión a partir del encabezamiento, cuando elencabezamiento está incluido en la señal auxiliar según la información de identificación de encabezamiento(1305), comprendiendo la adquisición de la información de longitud:

- leer la señal de extensión hasta un primer número predeterminado de bits y determinar el valor deinformación de longitud de la señal de extensión basándose en el número de bits leídos;

- si el valor de información de longitud determinado no es igual a un primer valor predeterminado de longitud,adquirir la información de longitud de la señal de extensión, como valor de información de longituddeterminado, si no,

-- leer la señal de extensión adicionalmente hasta un segundo número predeterminado de bits y determinar elvalor de información de longitud de la señal de extensión, basándose en el número de bits leídos hasta elmomento,

-- si el valor de información de longitud determinado no es igual a un segundo valor de longitudpredeterminado, adquirir la información de longitud de la señal de extensión como valor de información delongitud determinado, si no

--- leer la señal de extensión adicionalmente hasta un tercer número predeterminado de bits, determinar elvalor de información de longitud de la señal de extensión, basándose en el número de bits leídos hasta elmomento, y adquirir la información de longitud de la señal de extensión como valor de información delongitud determinado;

omitir (1309) la decodificación de la señal de extensión o no usar un resultado de la decodificación,basándose la omisión de la decodificación de la señal de extensión en la información de longitud adquirida;

y

generar (1313) la señal de audio multicanal (y1, y2, ... ym) aplicando la señal auxiliar a la señal desubmezcla.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2007/000868.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: KIM,Dong Soo, LIM,Jae Hyun, OH,Hyen O, JUNG,Yang Won, PANG,HEE SUCK.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/008 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p.ej. estéreo conjunto, codificación de la intensidad o matrizado.
  • G10L19/24 G10L 19/00 […] › Codecs de frecuencia variable, p. ej. para generar diferentes calidades utilizando una representación escalable como una codificación jerárquica o en capas.

PDF original: ES-2407820_T3.pdf

 


Fragmento de la descripción:

Método y aparato para procesar una señal de audio.

Campo técnico

La presente invención se refiere a un método y un aparato para procesar una señal de audio. Aunque la presente invención es adecuada para una amplia variedad de aplicaciones, resulta particularmente adecuada para procesar una señal residual.

Antecedentes de la técnica En general, una señal de audio incluye una señal de submezcla (downmix) y una señal de datos auxiliares. Además, la señal de datos auxiliares puede incluir una señal de información espacial y una señal de extensión. En este caso, señal de extensión significa una señal adicional necesaria para permitir la reconstrucción de una señal de manera similar a una señal original en la generación de una señal multicanal mediante mezclado ascendente (upmixing) de la señal de submezcla. Por ejemplo, la señal de extensión puede incluir una señal residual. Señal residual significa una señal correspondiente a una diferencia entre una señal original y una señal codificada. En la codificación de audio multicanal, la señal residual es útil para los siguientes casos. Por ejemplo, la señal residual es útil para la compensación de una señal de submezcla artística o la compensación de canales específicos en la decodificación. Además, la señal residual es útil también para ambas compensaciones. Por lo tanto, una señal de audio introducida se puede reconstruir en una señal más similar a una señal original utilizando la señal residual para mejorar la calidad de sonido.

Se puede considerar que el documento EP 1 315 148 A1 da a conocer un flujo continuo de bits de normativa mp3, que se formatea en una secuencia de tramas de datos de longitud fija. Las mismas incluyen encabezamientos, información lateral, información principal, y un campo de datos restantes sin información definida de manera general, indicada como “datos auxiliares”. El formato mp3PRO es una extensión del formato mp3, en donde los datos mp3PRO adicionales se transfieren en los campos de datos auxiliares. En varias aplicaciones, por ejemplo, máquinas de búsqueda de música de Internet, surge la necesidad de una determinación rápida de los tipos de los flujos continuos de bits. Dicha determinación se ejecuta normalmente usando un decodificador mp3PRO. No obstante, debido a que el encabezamiento de las tramas no contiene un puntero correspondiente a la dirección de inicio del campo de datos auxiliares, un decodificador mp3PRO debe codificar completamente en primer lugar por lo menos una trama de datos según la normativa mp3 con el fin de hallar la dirección final de los datos mp3, y de este modo la siguiente dirección de inicio de los datos mp3PRO en esa trama de datos. Después de esto, el decodificador mp3PRO debe examinar los datos que siguen en el flujo continuo de datos, en relación con características que son típicas para información adicional mp3PRO. El documento EP ’148 da a conocer cómo se puede determinar el tipo del flujo continuo de bits sin usar decodificación mp3 y sin usar un decodificador mp3PRO.

Se puede considerar que el documento EP 1 617 413 A2 da a conocer un método y un aparato de codificación y/o decodificación de datos de audio multicanal. El método de codificación incluye: codificar datos de audio monofónicos y/o estereofónicos; y codificar datos de audio multicanal extendidos diferentes a los datos de audio monofónicos y/o estereofónicos. El método de decodificación incluye: decodificar datos de audio monofónicos y/o estereofónicos; examinar si hay o no datos de audio multicanal extendidos a decodificar, diferentes a los datos de audio monofónicos y/o estereofónicos; y si hay datos extendidos a decodificar, decodificar los datos de audio multicanal extendidos.

Se puede considerar que “Der MPEG-2-Standard: Generische Codierung für Bewegtbilder und zugerhörige Audioinformation. Audio-Codierung (Teil 4) ”, E. Schroeder et. al, FKT FERNSEH UND KINOTECHNIK, FACHVERLAG SCHIELE & SCHON GMBH., BERLIN, DE, vol. 48, n.º 7/08, 30 de agosto de 1994, páginas 364 a 368, 370, da a conocer una trama MPEG-2 que comprende datos auxiliares. Completamente independiente con respecto a la trama MPEG-2, se puede proporcionar o no un flujo continuo de bits de extensión especializado (además de un flujo continuo de bits MPEG-1 que transporte las tramas MPEG-2) , para dar acomodo a todos los bits que superen la capacidad del flujo continuo de bits MPEG-1.

Divulgación de la invención Problema técnico No obstante, si un decodificador lleva a cabo una decodificación sobre una señal de extensión de forma incondicional, aunque, según el tipo del decodificador, se puede mejorar la calidad de sonido, aumenta la complejidad y se incrementa la carga operativa.

Por otra parte, puesto que, en general, la información de encabezamiento para una señal de audio no es variable, la información de encabezamiento se inserta únicamente en un flujo continuo de bits una vez. Sin embargo, en caso de que la información de encabezamiento se inserte en el flujo continuo de bits solamente una vez, si es necesario decodificar una señal de audio desde un punto de temporización aleatorio para una radiodifusión o VOD, es posible que no se pueda decodificar información de tramas de datos debido a la ausencia de la información de encabezamiento.

Solución técnica Se proporcionan un método y un aparato según las reivindicaciones independientes. En las reivindicaciones dependientes se consideran evoluciones.

Preferentemente, se dispone de un método y un aparato para procesar una señal de audio, que eliminan sustancialmente uno o más de los problemas debidos a las limitaciones y desventajas de la técnica relacionada.

Efectos ventajosos La presente invención proporciona los siguientes efectos o ventajas.

En primer lugar, en caso de efectuar una decodificación, la presente invención decodifica selectivamente una señal de extensión para posibilitar una decodificación más eficiente. En caso de efectuar una decodificación sobre una señal de extensión, la presente invención puede mejorar la calidad de sonido de una señal de audio. En caso de no 20 realizar la decodificación sobre una señal de extensión, la presente invención puede reducir la complejidad. Por otra parte, incluso si se realiza una decodificación sobre una señal de extensión, la presente invención puede mejorar la calidad de sonido decodificando solamente una parte predeterminada de baja frecuencia y también puede reducir la carga de funcionamiento. Además, en caso de usar una señal de audio para radiodifusión o similares, la presente invención puede procesar una señal de audio desde un punto de temporización aleatorio de tal manera que se identifique una presencia o no presencia de información de encabezamiento dentro de la señal de audio.

Breve descripción de los dibujos Los dibujos adjuntos, que se incluyen para proporcionar una comprensión más detallada de la invención y se 30 incorporan a la presente memoria y constituyen parte de la misma, ilustran formas de realización de la invención y, junto con la descripción, sirven para explicar los fundamentos de la invención.

En los dibujos:

la FIG. 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención;

la FIG. 2 es un diagrama de bloques esquemático de una unidad de decodificación de señales de extensión 90 según una forma de realización de la presente invención;

la FIG. 3 y la FIG. 4 son diagramas para explicar la asignación de bits fijos de información de longitud para una señal de extensión según una forma de realización de la presente invención;

la FIG. 5 y la FIG. 6 son diagramas para explicar la asignación de bits variables de información de longitud para 45 una señal de extensión en función del tipo de longitud según una forma de realización de la presente invención;

la FIG. 7 y la FIG. 8 son diagramas para explicar la asignación adaptativa de bits de información de longitud para una señal de extensión en función de la longitud real de la señal de extensión, de acuerdo con una forma de realización de la presente invención;

la FIG. 9 es un diagrama de una estructura de flujos continuos de bits que configura una señal de audio con una señal de submezcla, una señal auxiliar, y una señal de extensión, según una forma de realización de la presente invención;

la FIG. 10 es un diagrama de una estructura de flujos continuos de bits que configura una señal de audio con una señal auxiliar que incluye una señal de extensión y una señal de submezcla,... [Seguir leyendo]

 


Reivindicaciones:

1. Método para procesar una señal de audio, que comprende:

extraer (1301, 1303) , a partir de un flujo continuo de bits recibido, una señal de submezcla, una señal auxiliar, información de identificación de encabezamiento que indica si está incluido un encabezamiento en la señal auxiliar, y una señal de extensión que se incluye en un área de extensión dentro de la señal auxiliar,

en el que la señal de extensión es por lo menos una de entre una señal residual, una señal de submezcla artística o una señal de extensión de árbol artística, y

en el que la señal de submezcla, la señal auxiliar y la señal de extensión están destinadas a generar una señal de audio multicanal (y1, y2, ... ym) ;

adquirir (1307) información de longitud de la señal de extensión a partir del encabezamiento, cuando el encabezamiento está incluido en la señal auxiliar según la información de identificación de encabezamiento (1305) , comprendiendo la adquisición de la información de longitud:

- leer la señal de extensión hasta un primer número predeterminado de bits y determinar el valor de información de longitud de la señal de extensión basándose en el número de bits leídos;

- si el valor de información de longitud determinado no es igual a un primer valor predeterminado de longitud, adquirir la información de longitud de la señal de extensión, como valor de información de longitud determinado, si no,

-- leer la señal de extensión adicionalmente hasta un segundo número predeterminado de bits y determinar el valor de información de longitud de la señal de extensión, basándose en el número de bits leídos hasta el momento,

-- si el valor de información de longitud determinado no es igual a un segundo valor de longitud predeterminado, adquirir la información de longitud de la señal de extensión como valor de información de longitud determinado, si no

--- leer la señal de extensión adicionalmente hasta un tercer número predeterminado de bits, determinar el

valor de información de longitud de la señal de extensión, basándose en el número de bits leídos hasta el momento, y adquirir la información de longitud de la señal de extensión como valor de información de longitud determinado;

omitir (1309) la decodificación de la señal de extensión o no usar un resultado de la decodificación, basándose la omisión de la decodificación de la señal de extensión en la información de longitud adquirida; y

generar (1313) la señal de audio multicanal (y1, y2, ... ym) aplicando la señal auxiliar a la señal de submezcla.

2. Método según la reivindicación 1, en el que la etapa de generación (1313) de la señal de audio multicanal (y1, y2, ... ym) comprende mezclar en sentido ascendente la señal de submezcla usando la señal de extensión e información espacial incluida en la señal auxiliar.

3. Método según la reivindicación 1 ó 2, en el que la señal auxiliar incluye un parámetro espacial para generar una señal de audio multicanal, incluyendo el parámetro espacial información, que representa una diferencia de energía entre canales, información que representa una correlación entre canales e información de coeficientes de predicción de canales.

4. Método según la reivindicación 1 ó 2, en el que la señal auxiliar incluye por lo menos un encabezamiento para cada intervalo temporal o espacial preestablecido.

5. Método según la reivindicación 1 ó 2, en el que la información de longitud de la señal de extensión es asignado como bits adaptativos, basándose en una longitud de la señal de extensión.

6. Aparato para procesar una señal de audio, que comprende:

una unidad de demultiplexado (60) configurada para extraer (1301, 1303) , a partir de un flujo continuo de bits recibido, una señal de submezcla, una señal auxiliar, una señal de extensión que se incluye en un área de 65 extensión dentro de la señal auxiliar e información de identificación de encabezamiento, que indica si está incluido un encabezamiento en la señal auxiliar,

en el que la señal de extensión es por lo menos una de entre una señal residual, una señal de submezcla artística o una señal de extensión de árbol artística, y

en el que la señal de submezcla, la señal auxiliar y la señal de extensión están destinadas a generar una señal de audio multicanal (y1, y2, ..., ym) ;

una unidad de lectura de longitudes de señales de extensión configurada para adquirir (1307) información de longitud de la señal de extensión a partir del encabezamiento cuando el encabezamiento está incluido en la señal 10 auxiliar según la información de identificación de encabezamiento (1305) , de manera que la información de longitud se adquiere:

- leyendo la señal de extensión hasta un primer número predeterminado de bits y determinando el valor de

información de longitud de la señal de extensión, basándose en el número de bits leídos; 15

- si el valor de información de longitud determinado no es igual a un primer valor predeterminado de longitud, adquiriendo la información de longitud de la señal de extensión como valor de información de longitud determinado, si no,

- - leyendo la señal de extensión adicionalmente hasta un segundo número predeterminado de bits y determinando el valor de información de longitud de la señal de extensión, basándose en el número de bits leídos hasta el momento,

--si el valor de información de longitud determinado no es igual a un segundo valor de longitud 25 predeterminado, adquiriendo la información de longitud de la señal de extensión como valor de información de longitud determinado, si no

---leyendo la señal de extensión adicionalmente hasta un tercer número predeterminado de bits, determinando el valor de información de longitud de la señal de extensión basándose en el número de bits leídos hasta el 30 momento, y adquiriendo la información de longitud de la señal de extensión como valor de información de

longitud determinado;

una unidad de decodificación selectiva (90) configurada para omitir (1309) la decodificación de la señal de extensión o no usar un resultado de la decodificación, basándose la omisión de la decodificación de la señal 35 de extensión en la información de longitud adquirida; y

una unidad de mezclado ascendente (100) configurada para generar (1313) la señal de audio multicanal (y1, y2, ... ym) aplicando la señal auxiliar a la señal de submezcla.

7. Aparato según la reivindicación 6, en el que la señal auxiliar incluye un parámetro espacial para generar una señal de audio multicanal, incluyendo el parámetro espacial información, que representa una diferencia de energía entre canales, información que representa una correlación entre canales e información de coeficientes de predicción de canales.

8. Aparato según la reivindicación 6 ó 7, en el que la señal auxiliar incluye por lo menos un encabezamiento para cada intervalo temporal o espacial preestablecido.

9. Aparato según la reivindicación 6 ó 7, en el que la información de longitud de la señal de extensión es asignada como bits adaptativos, basándose en una longitud de la señal de extensión. 50


 

Patentes similares o relacionadas:

Uso eficaz de la información de fase en la codificación y decodificación de audio, del 8 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador de audio para generar una representación codificada de señales de audio de entrada primera y segunda, que comprende: un estimador […]

Codificación de audio jerárquica multicanal con información lateral compacta, del 8 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para generar una representación paramétrica de una señal de audio que tiene al menos dos canales izquierdos originales (224a, 224b) […]

Codificación residual en un sistema de audio basado en objetos, del 8 de Mayo de 2019, de DTS, INC: Un método de descompresión y mezcla ascendente de una señal de audio compuesta comprimida y mezclada de manera descendente, que comprende […]

Mezcla ascendente espacial controlada por renderizador, del 1 de Mayo de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo decodificador de audio para la decodificación de una señal de audio de entrada comprimida que comprende por lo menos un decodificador […]

Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales, del 26 de Abril de 2019, de DTS, INC: Un método realizado por uno o más dispositivos de procesamiento para transmitir una señal de audio de entrada que tiene N canales, que comprende: seleccionar […]

Metadatos para control de sonoridad y rango dinámico, del 24 de Abril de 2019, de APPLE INC.: Un procedimiento para descodificar audio durante el procesamiento de reproducción, que comprende: recibir una señal de audio codificada; recibir […]

Especificación de coeficientes ambisónicos de orden superior y/o armónicos esféricos en flujos de bits, del 24 de Abril de 2019, de QUALCOMM INCORPORATED: Un procedimiento de generación de un flujo de bits representativo de contenido de audio, comprendiendo el procedimiento: determinar que uno o más de […]

Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio, del 17 de Abril de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Decodificador de audio para la decodificación de una corriente de bits de audio y una corriente de bits de metadatos (MBS) relacionada con la corriente de bits de audio, […]

Otras patentes de LG ELECTRONICS INC.