Método y aparato para decodificar una señal de audio.

Método de decodificación de una señal de audio, que comprende:



recibir (S501) una señal de audio que incluye una señal de submezcla, una señal de información espacialclasificada en un caso que incluye un encabezamiento e información espacial y un caso que incluye solamente lainformación espacial sin el encabezamiento, y un descriptor de audio,

reconocer que la señal de audio incluye la señal de submezcla y la señal de información espacial usando eldescriptor de audio; y

obtener (S503), a partir de la señal de audio, información de identificación de encabezamiento que indica si unatrama de la señal de información espacial incluye o no el encabezamiento;

si la información de identificación de encabezamiento indica que la trama de la señal de información espacialincluye el encabezamiento:

- extraer (S505) información de configuración a partir del encabezamiento, estando incluida por lo menos unainformación de alineación temporal en la información de configuración;

- decodificar (S507) la información espacial a partir de la señal de información espacial usando la informaciónde configuración extraída;

- discriminar una diferencia de retardo de tiempo entre dos señales en la generación de una señal multicanalusando la señal de submezcla y la señal de información espacial basándose en la información de alineacióntemporal incluida en la información de configuración extraída; y

- convertir la señal de submezcla en la señal multicanal usando la información de configuración y lainformación espacial.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2006/002583.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: PANG,Hee Suk, KIM,Dong Soo, LIM,Jae Hyun, OH,Hyen O, JUNG,Yang Won.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2387574_T3.pdf

 


Fragmento de la descripción:

Método y aparato para decodificar una señal de audio.

Campo técnico

La presente invención se refiere al procesado de una señal de audio, y más particularmente, a un aparato para codificar y decodificar una señal de audio y a un método correspondiente.

Antecedentes de la técnica

En general, un aparato de codificación de señales de audio comprime una señal de audio en una señal de submezcla de tipo monofónico o estereofónico, en lugar de comprimir cada uno de los canales de una señal de audio multicanal. El aparato de codificación de señales de audio transfiere la señal de submezcla comprimida a un aparato de codificación junto con una señal de información espacial (o, señal de datos auxiliar) o almacena la señal de submezcla comprimida y la señal de información espacial en un soporte de almacenamiento.

En este caso, la señal de información espacial, que se extrae en el submezclado de una señal de audio multicanal, se usa en la restauración de una señal de audio multicanal original a partir de una señal de submezcla comprimida.

La señal de información espacial incluye un encabezamiento e información espacial. Además, en el encabezamiento se incluye información de configuración. El encabezamiento es la información para interpretar la información espacial.

Un aparato de decodificación de señales de audio decodifica la información espacial usando la información de configuración incluida en el encabezamiento. La información de configuración, que está incluida en el encabezamiento, se transfiere a un aparato de decodificación o se almacena en un soporte de almacenamiento junto con la información espacial.

Un aparato de codificación de señales de audio multiplexa una señal de submezcla codificada y la señal de información espacial juntas en forma de un flujo continuo de bits, y a continuación transfiere la señal multiplexada a un aparato de codificación. Puesto que en general la información de configuración es invariable, un encabezamiento que incluye información de configuración se inserta una vez en un flujo continuo de bits. Puesto que la información de configuración se transmite insertándola inicialmente una vez en una señal de audio, un aparato de decodificación de señales de audio padece un problema en la decodificación de la información espacial debido a la no existencia de información de configuración en caso de que la señal de audio se reproduzca a partir de un punto de temporización aleatorio. A saber, puesto que una señal de audio se reproduce a partir de un punto de temporización específico solicitado por un usuario, en lugar de reproducirse desde una parte inicial en el caso de una emisión de radiodifusión, VOD (vídeo bajo demanda) o similar, no se puede usar la información de configuración que se transfiere al ser incluida en una señal de audio. Por lo tanto, no se puede decodificar la información espacial.

“Der MPEG-2-Standard: Generische Codierung für Bewegtbilder und zugehörige Audio-Information, Audio-Codierung” (Teil 4) , Schröder E F et al, Fernseh -und Kino -Technik, vol. 48, nº 7/08, 30 de agosto de 1994, páginas 364 a 368, y 370 a 373, da a conocer el uso de encabezamientos que incluyen información espacial los cuales se incorporan en una capa multicanal de mejora.

Se puede considerar que “Proposed changes in MPEG-4 BSAC multi-channel audio coding”, Eunmi L. Oh et al., ISO/IEC JTC1/SC29/WG11 MPEG2004/M11018, 19 de Julio de 2004, páginas 1 a 7, da a conocer una técnica referente al multicanal BSAC, que conlleva modificaciones de sintaxis que mejorarían el multicanal BSAC proporcionando compatibilidad retroactiva.

Se puede considerar que “Low complexity parametric stereo coding”, Schuijers E. et al., CONVENTION OF THE AUDIO ENGINEERING SOCIETY, 8 de Mayo de 2004, páginas 1 a 11, da a conocer una técnica de codificación estereofónica paramétrica para codificar eficazmente una señal de audio estereofónica en forma de una señal monoaural más una pequeña cantidad de parámetros estereofónicos. La señal monoaural se puede codificar usando cualquier codificador de audio. Los parámetros estereofónicos se pueden integrar en la parte auxiliar del flujo continuo de bits monofónico creando una compatibilidad monofónica retroactiva. En el decodificador, en primer lugar se decodifica la señal monoaural tras lo cual se reconstruye la señal estereofónica a partir de los parámetros estereofónicos.

Se proporcionan un método y un aparato según las reivindicaciones independientes.

En las reivindicaciones dependientes se exponen evoluciones.

Exposición de la invención

Es un objetivo de la presente invención proporcionar un método y un aparato para decodificar una señal de audio, que permite decodificar la señal de audio, incluso si la señal de audio se reproduce a partir de un punto aleatorio por medio del aparato de decodificación de señales de audio, haciendo que el encabezamiento se incluya selectivamente en una trama en la señal de información espacial.

Preferentemente, un método de decodificación de una señal de audio incluye preferentemente recibir una señal de audio que incluye un descriptor de audio, reconocer que la señal de audio incluye una señal de submezcla y una señal de información espacial usando el descriptor de audio, y convertir la señal de submezcla en una señal multicanal usando la señal de información espacial, en donde la señal de información espacial incluye un encabezamiento por cada intervalo temporal o espacial prestablecido.

Breve descripción de los dibujos

La figura 1 es un diagrama de configuración de una señal de audio de acuerdo con una forma de realización de la presente invención.

La figura 2 es un diagrama de configuración de una señal de audio de acuerdo con otra forma de realización de la presente invención.

La figura 3 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención.

La figura 4 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención.

La figura 5 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización de la presente invención.

La figura 6 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización de la presente invención.

La figura 7 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.

La figura 8 es un diagrama de flujo de un método de obtención de una cantidad que representa información de posición de acuerdo con una forma de realización de la presente invención.

La figura 9 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización adicional de la presente invención.

Modo óptimo de poner en práctica la invención

A continuación se hará referencia detalladamente a las formas de realización preferidas de la presente invención, cuyos ejemplos se ilustran en los dibujos adjuntos.

Para entender la presente invención, se explican un aparato y un método de codificación de una señal de audio antes que un aparato y un método de decodificación de una señal de audio. Sin embargo, el aparato y el método de decodificación según la presente invención no se limitan al aparato y el método de codificación siguientes. Además, la presente invención es aplicable a un esquema de codificación de audio para generar un multicanal usando información espacial así como MP3 (MPEG 1/2 capa III) y AAC (codificación de audio avanzada) .

La figura 1 es un diagrama de configuración de una señal de audio transferida a un aparato de decodificación de señales de audio desde un aparato de codificación de señales de audio, de acuerdo con una forma de realización de la presente invención.

En referencia a la figura 1, una señal de audio incluye un descriptor de audio 101, una señal de sub-mezcla 103 y una señal de información espacial 105.

En caso de usar un esquema de codificación... [Seguir leyendo]

 


Reivindicaciones:

1. Método de decodificación de una señal de audio, que comprende:

recibir (S501) una señal de audio que incluye una señal de submezcla, una señal de información espacial clasificada en un caso que incluye un encabezamiento e información espacial y un caso que incluye solamente la información espacial sin el encabezamiento, y un descriptor de audio,

reconocer que la señal de audio incluye la señal de submezcla y la señal de información espacial usando el descriptor de audio; y

obtener (S503) , a partir de la señal de audio, información de identificación de encabezamiento que indica si una trama de la señal de información espacial incluye o no el encabezamiento;

si la información de identificación de encabezamiento indica que la trama de la señal de información espacial incluye el encabezamiento:

- extraer (S505) información de configuración a partir del encabezamiento, estando incluida por lo menos una información de alineación temporal en la información de configuración;

- decodificar (S507) la información espacial a partir de la señal de información espacial usando la información de configuración extraída;

- discriminar una diferencia de retardo de tiempo entre dos señales en la generación de una señal multicanal usando la señal de submezcla y la señal de información espacial basándose en la información de alineación temporal incluida en la información de configuración extraída; y

- convertir la señal de submezcla en la señal multicanal usando la información de configuración y la información espacial.

2. Método según la reivindicación 1, en el que la señal de información espacial incluye además información de posición de un espacio de tiempo.

3. Método según la reivindicación 2, que comprende además:

4. Aparato adaptado para realizar el método según cualquiera de las reivindicaciones 1 a 3.

aplicar (S703) un parámetro incluido en la señal de información espacial a un espacio de tiempo correspondiente usando información de posición del espacio de tiempo correspondiente incluida en la señal de información espacial.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .