Método y aparato para codificar señales de audio basadas en objetos.
Método de codificación de audio, que comprende:
realizar una codificación multicanal usando objetos musicales como base de los canales para generar una primera señal de audio,
la cual es una señal de submezcla resultante de dicha codificación multicanal, y una primera información de parámetros de audio basada en canales extrayendo información sobre los objetos musicales;
codificar, sobre una base de objeto, objetos vocales junto con la primera señal de audio de dicha codificación multicanal para generar una señal de submezcla, y una segunda información de parámetros de audio basada en objetos;
generar un flujo continuo de bits, en el cual se combinan la señal de submezcla generada mediante la codificación de objetos e información lateral, siendo la información lateral información que incluye el primer parámetro de audio generado por la codificación multicanal, y el segundo parámetro de audio generado por la codificación de objetos.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2007/005968.
Solicitante: LG ELECTRONICS INC..
Nacionalidad solicitante: República de Corea.
Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.
Inventor/es: YOON,Sung Yong, PANG,Hee Suk, LEE,Hyun Kook, KIM,Dong Soo, LIM,Jae Hyun.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L19/14
PDF original: ES-2387692_T3.pdf
Fragmento de la descripción:
Método y aparato para codificar señales de audio basadas en objetos.
Campo técnico
La presente invención se refiere a un método de codificación y decodificación de audio y a un aparato para codificar y decodificar señales de audio basadas en objetos de manera que las señales de audio se pueden procesar de forma eficaz a través de una agrupación.
Antecedentes de la técnica
En general, un códec de audio basado en objetos utiliza un método para enviar la suma de un parámetro específico extraído de cada señal de objeto y las señales de objetos, restaurar a partir de la misma las señales de objetos respectivas, y mezclar tantas señales de objetos como un número deseado de canales. Por lo tanto, cuando el número de señales de objetos es elevado, la cantidad de información necesaria para mezclar señales de objetos respectivas se incrementa en proporción al número de las señales de objetos.
Sin embargo, en señales de objetos que presentan una correlación estrecha, se envía información de mezcla similar, y otras, con respecto a cada señal de objeto. Por consiguiente, si las señales de objetos se empacan en un grupo y la misma información se envía solo una vez, se puede mejorar la eficacia.
El documento WO 2006/048203 A1 (CODING TECH AB [SE]; KONINKL, PHILIPS ELECTRONICS NV [NL]; VILLEMOES L) , da a conocer un esquema de (de) codificación multicanal para señales de audio representativas de objetos musicales y/o vocales, que se basa en la submezcla y la transmisión de otros parámetros de audio como información lateral.
El documento “Concepts of Object-Oriented Spatial Audio Coding”, JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 E ITU-T SG16 Q6) , n.º N8329, 21 de julio de 2006, XP030014821, da a conocer una codificación de audio espacial basada en objetos y menciona cómo dicho paradigma de codificación puede permitir diferentes posibles efectos, tales como suprimir algunos instrumentos o enfatizar las partes vocales sobre la música, y otros.
Incluso en un método de codificación y decodificación general, puede obtenerse un efecto similar empacando varias señales de objetos en una señal de objeto. Sin embargo, si se usa este método, la unidad de la señal de objeto se incrementa y además resulta imposible mezclar la señal de objeto como una unidad de señal de objeto original antes de empacarla.
Exposición de la invención
Problema técnico
Por consiguiente, es un objetivo de la presente invención proporcionar un método de codificación y decodificación de audio para codificar y decodificar señales de objetos, en el cual señales de audio de objetos con una asociación se empacan en un grupo y así pueden procesarse basándose en cada grupo individual, y también proporcionar un aparato para ello.
Solución técnica
Para alcanzar el objetivo anterior, un método de codificación de señales de audio de acuerdo con la presente invención incluye las etapas mencionadas en la reivindicación 1.
Al mismo tiempo, un aparato de codificación de señales de audio de acuerdo con la presente invención incluye la estructura mencionada en la reivindicación 2.
Efectos ventajosos
De acuerdo con la presente invención, las señales de audio de objetos con una asociación se pueden procesar basándose en cada grupo individual al mismo tiempo que se utilizan las ventajas de codificar y decodificar señales de audio basadas en objetos al mayor nivel posible. Por consiguiente, se pueden mejorar la eficacia en términos de la cantidad de cálculo en los procesos de codificación y decodificación, el tamaño de un flujo continuo de bits que se codifica, y otros. Además, la presente invención se puede aplicar a un sistema de karaoke, etcétera, de manera útil mediante la agrupación de señales de objetos en un objeto musical, un objeto vocal, etcétera.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 2 es un diagrama de bloques de un aparato de codificación y decodificación de audio; la figura 3 es una vista que ilustra una correlación entre una fuente de sonido, grupos y señales de objetos;
la figura 4 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
las figuras 5 y 6 son vistas que ilustran un objeto principal y un objeto de fondo;
las figuras 7 y 8 son vistas que ilustran una configuración de un flujo continuo de bits generado en el aparato de codificación;
la figura 9 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 10 es una vista que ilustra un caso en el que se usa una pluralidad de objetos principales;
la figura 11 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 12 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 13 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 14 es un diagrama de bloques de un aparato de codificación y decodificación de audio;
la figura 15 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con una forma de realización de la presente invención; y
la figura 16 es una vista que ilustra un caso el que se codifican objetos vocales paso a paso.
Mejor modo de poner en práctica la invención
La presente invención se describirá a continuación detalladamente en referencia a los dibujos adjuntos.
La figura 1 es un diagrama de bloques de un aparato de codificación y decodificación de audio de acuerdo con un primer ejemplo. El aparato de codificación y decodificación de audio de acuerdo con el presente ejemplo decodifica y codifica una señal de objeto correspondiente a una señal de audio basada en objetos sobre la base de un concepto de agrupación. En otras palabras, se llevan a cabo procesos de codificación y decodificación basándose en cada grupo individual uniendo una o más señales de objetos con una asociación en el mismo grupo.
Haciendo referencia a la figura 1, se muestran un aparato de codificación de audio 110 que incluye un codificador de objetos 111, y un aparato de decodificación de audio 120 que incluye un decodificador de objetos 121 y un mezclador/reconstructor 123. Aunque no se muestra en el dibujo, el aparato de codificación 110 puede incluir un multiplexor, etcétera, para generar un flujo continuo de bits en el cual se combinan una señal de submezcla e información lateral, y el aparato de decodificación 120 puede incluir un demultiplexor, etcétera, para extraer una señal de submezcla e información lateral de un flujo continuo de bits recibido. Esta construcción es el caso con el aparato de codificación y decodificación de acuerdo con otros ejemplos que se describen más adelante.
El aparato de codificación 110 recibe N señales de objetos, e información de grupos que incluye información de posición relativa, información de tamaño, información de desfases de tiempo, etcétera, basándose en cada grupo individual, de una señal de objeto con una asociación. El aparato de codificación 110 codifica una señal en la cual se agrupan señales de objetos con una asociación, y genera una señal de submezcla basada en objetos que tiene uno
o más canales e información lateral, incluyendo información extraída de cada señal de objeto, etcétera.
En el aparato de decodificación 120, el decodificador de objetos 121 genera señales, que se codifican basándose en la agrupación, sobre la base de la señal de submezcla y la información lateral, y el mezclador/reconstructor 123 coloca las señales obtenidas a la salida del decodificador de objetos 121 en posiciones específicas sobre un espacio multicanal en un nivel específico basándose en información de control. Es decir, el aparato de decodificación 120 genera señales multicanal sin desempaquetar señales, que están codificadas sobre la base de una agrupación, sobre una base de objeto.
A través de esta construcción, la cantidad de información... [Seguir leyendo]
Reivindicaciones:
1. Método de codificación de audio, que comprende:
realizar una codificación multicanal usando objetos musicales como base de los canales para generar una primera señal de audio, la cual es una señal de submezcla resultante de dicha codificación multicanal, y una primera información de parámetros de audio basada en canales extrayendo información sobre los objetos musicales;
codificar, sobre una base de objeto, objetos vocales junto con la primera señal de audio de dicha codificación multicanal para generar una señal de submezcla, y una segunda información de parámetros de audio basada en objetos;
generar un flujo continuo de bits, en el cual se combinan la señal de submezcla generada mediante la codificación de objetos e información lateral, siendo la información lateral información que incluye el primer parámetro de audio generado por la codificación multicanal, y el segundo parámetro de audio generado por la codificación de objetos.
2. Aparato de codificación de audio, que comprende:
un codificador multicanal (351) para realizar una codificación multicanal usando objetos musicales como base de los canales para generar una primera señal de audio, la cual es una señal de submezcla resultante de dicha codificación multicanal, y una primera información de parámetros de audio basada en canales extrayendo información sobre los objetos musicales;
un codificador de objetos (353) para codificar, sobre una base de objeto, objetos vocales junto con la primera señal de audio del codificador multicanal (351) con el fin de generar una señal de submezcla, y una segunda información de parámetros de audio basada en objetos;
un multiplexor (355) para generar un flujo continuo de bits, en el cual se combinan la señal de submezcla generada por el codificador de objetos (353) e información lateral, siendo la información lateral información que incluye el primer parámetro de audio generado por el codificador multicanal (351) , y el segundo parámetro de audio generado por el codificador de objetos (353) .
Patentes similares o relacionadas:
Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]
Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]
Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]
Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]
Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]
Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]
Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]
Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]