Procedimiento y aparato para procesar una se;al de audio.

Procedimiento para procesar una señal de audio, que comprende:

recibir información 5 de modo de salida;

recibir una señal de submezcla que incluye por lo menos una señal de objeto;

recibir información de objeto extraída cuando la señal de submezcla es generada;

recibir información de mezcla para controlar la señal de objeto;

generar información de procesamiento de la submezcla utilizando la información de objeto y la información demezcla si la información del modo de salida recibida indica una salida mono;

generar información multicanal utilizando la información de objeto y la información de mezcla si la información delmodo recibida indica una salida multicanal;

si la información de procesamiento de la submezcla es generada, generar una primera señal de salida aplicandola información de procesamiento de la submezcla a la señal de submezcla, controlando la información deprocesamiento de la submezcla la ganancia y/o el panning de dicha por lo menos una señal de objeto; y

si la información multicanal es generada, generar una segunda señal de salida mediante el mezclado ascendentede la señal de submezcla utilizando la información multicanal;

en el que:

la señal de submezcla y la primera señal de salida son una señal mono;

la segunda señal de salida es una señal de audio multicanal, y

la información multicanal incluye por lo menos una de entre la información de nivel del canal y la información decorrelación de canal.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2008/007866.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, YEOUIDO-DONG YEONGDEUNGPO-GU SEOUL 150-721 REPUBLICA DE COREA.

Inventor/es: OH,Hyen O, JUNG,Yang Won.

Fecha de Publicación: 5 de Septiembre de 2012.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
H04S5/00 H04S […] › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.
H04S7/00 H04S […] › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2391801_T3.pdf

Fragmento de la descripción:

Procedimiento y aparato para procesar una señal de audio.

5 Campo técnico

La presente invención se refiere a un aparato y un procedimiento para procesar una señal de audio. Aunque la presente invención es adecuada para un amplio espectro de aplicaciones, es particularmente adecuada para procesar una señal de audio recibida a través de un soporte digital, una señal de difusión y similar.

Antecedentes de la técnica

Generalmente, en el proceso para someter a submezcla una serie de objetos dentro de una señal mono o estéreo, se extraen respectivamente parámetros de la señales de objeto. Estos parámetros pueden ser utilizados por un 15 decodificador. El panning (panorámica polifónica) y la ganancia de cada uno de los objetos son controlables mediante una selección de usuario.

El documento XP030015133 se refiere a una propuesta sobre codificación de objetos de audio espacial. La figura 4 de dicho documento puede tener como objetivo dar a conocer un decodificador de objetos de audio espacial (SAOC)

que recibe información secundaria que puede ser considerada información de objeto. La figura 5 de dicho documento puede tener como objetivo dar a conocer un flujo de bits de MPEG surround que puede ser considerado como información multicanal.

Exposición de la invención

Problema técnico

No obstante, para controlar cada señal de objeto, cada fuente contenida en una submezcla debe ser posicionada o paneada adecuadamente.

Además, para proveer compatibilidad regresiva conforme a un sistema de decodificación orientado a canal, los parámetros de objeto deben ser convertidos a parámetros multicanal para mezclado ascendente.

Solución técnica

En consecuencia, la presente invención está dirigida a un aparato y un procedimiento para procesar una señal de audio, los cuales sustancialmente obvian uno o más de los problemas debidos a las limitaciones e inconvenientes de la técnica relacionada.

Un objetivo de la presente invención consiste en disponer un aparato y un procedimiento para procesar una señal de audio, mediante los cuales pueden emitirse una señal mono, una señal estéreo y una señal multicanal controlando la ganancia y el paneado de un objeto.

Otro objetivo de la presente invención consiste en disponer un aparato y un procedimiento para procesar una señal 45 de audio, mediante el cual pueden emitirse una señal mono y una señal estéreo a partir de una señal de submezcla sin efectuar el sistema complicado de un decodificador de multicanal.

Otro objetivo de la presente invención consiste en disponer un aparato y un procedimiento para procesar una señal de audio, mediante los cuales puede evitarse la distorsión del sonido en caso de ajuste de una ganancia de una 50 música vocal o de fondo con una amplitud considerable.

Efectos convenientes

En consecuencia, la presente invención aporta los siguientes efectos o ventajas. 55 En primer lugar, la presente invención puede controlar la ganancia y el panning de un objeto sin limitaciones.

En segundo lugar, la presente invención puede controlar la ganancia y el panning de un objeto basándose en una selección de usuario.

60 En tercer lugar, en el caso de que el modo salida sea un modo mono o estéreo, la presente invención genera una señal de salida sin efectuar el complicado sistema de un decodificador de multicanal, facilitando la implementación y disminuyendo la complejidad.

65 En cuarto lugar, en el caso de que se dispongan uno o dos altavoces para un dispositivo de esta clase como un

dispositivo móvil, la presente invención puede controlar la ganancia y el panning del objeto para la señal de submezcla sin un códec para el decodificador de multicanal.

En quinto lugar, en caso de que se suprima completamente la música vocal o la música de fondo, la presente invención puede evitar la distorsión de la calidad del sonido conforme al ajuste de ganancia.

En sexto lugar, en caso de que existan por lo menos dos objetos independientes (canal estéreo o algunas señales vocales) tales como un objeto vocal y similar, la presente invención puede evitar la distorsión de la calidad del sonido conforme al ajuste de la ganancia.

Descripción de los dibujos

Los dibujos adjuntos, que se incluyen para proveer una mejor comprensión de la invención y se incorporan como parte constituyente de esta especificación, ilustran formas de realización de la invención y junto con la descripción sirven para explicar los principios de la invención.

En los dibujos:

la figura 1 es un diagrama de bloques de un aparato para procesar una señal de audio según la presente invención para generar una señal mono/estéreo;

la figura 2 es un diagrama de bloques detallado de un primer ejemplo de la unidad de procesamiento de submezcla representada en la figura 1;

la figura 3 es un diagrama de bloques detallado de un segundo ejemplo de la unidad de procesamiento de submezcla representada en la figura 1;

la figura 4 es un diagrama de bloques de un aparato para procesar una señal de audio según una forma de realización de la presente invención para generar una señal binaural;

la figura 5 es un diagrama de bloques detallado de la unidad de procesamiento de submezcla representada en la figura 4;

la figura 6 es un diagrama de bloques de un aparato para procesar una señal de audio según otra forma de realización de la presente invención para generar una señal binaural;

la figura 7 es un diagrama de bloques de un aparato para procesar una señal de audio según una forma de realización de la presente invención para controlar un objeto independiente;

la figura 8 es un diagrama de bloques de un aparato para procesar una señal de audio según otra forma de realización de la presente invención para controlar un objeto independiente;

la figura 9 es un diagrama de bloques de un aparato para procesar una señal de audio según una quinta forma de realización de la presente invención para procesar un objeto mejorado;

la figura 10 es un diagrama de bloques de un aparato para procesar una señal de audio según una segunda forma de realización de la presente invención para procesar un objeto mejorado; y

la figura 11 y la figura 12 son diagramas de bloques de un aparato para procesar una señal de audio según una tercera forma de realización de la presente invención para procesar un objeto mejorado.

Mejor modo de realización de la invención

En la descripción siguiente se describen características y ventajas de la invención, que en parte se pondrán de manifiesto a partir de la descripción, o podrán aprenderse mediante la práctica de la invención. Los objetivos y otras ventajas de la invención se realizarán y alcanzarán mediante la estructura indicada en la descripción escrita y en las reivindicaciones, así como en los dibujos adjuntos.

Para alcanzar estas y otras ventajas conforme a los fines de la presente invención, tal como se expone y se describe ampliamente, un procedimiento de procesamiento de una señal de audio según la presente invención comprende las características señaladas en la reivindicación independiente 1.

En las reivindicaciones subordinadas 2 a 5 se definen formas de realización preferidas del procedimiento.

Para alcanzar adicionalmente estas y otras ventajas conforme al objetivo de la presente invención, el aparato para procesar una señal de audio comprende las características de la reivindicación independiente 6.

En las reivindicaciones subordinadas 7 a 10 se definen formas de realización preferidas del aparato.

Para alcanzar adicionalmente estas y otras ventajas conforme al objetivo de la presente invención, se define un soporte de grabación legible por ordenador en la reivindicación independiente 11.

Se entiende que tanto la descripción general anterior como la siguiente descripción detallada tienen carácter de ejemplo y explicativo y su propósito es proporcionar una explicación adicional de la invención según las reivindicaciones.

Modo de realización de la invención

A... [Seguir leyendo]

Reivindicaciones:

1. Procedimiento para procesar una señal de audio, que comprende:

recibir información de modo de salida;

recibir una señal de submezcla que incluye por lo menos una señal de objeto;

recibir información de objeto extraída cuando la señal de submezcla es generada;

recibir información de mezcla para controlar la señal de objeto;

generar información de procesamiento de la submezcla utilizando la información de objeto y la información de mezcla si la información del modo de salida recibida indica una salida mono;

generar información multicanal utilizando la información de objeto y la información de mezcla si la información del modo recibida indica una salida multicanal;

si la información de procesamiento de la submezcla es generada, generar una primera señal de salida aplicando la información de procesamiento de la submezcla a la señal de submezcla, controlando la información de procesamiento de la submezcla la ganancia y/o el panning de dicha por lo menos una señal de objeto; y

si la información multicanal es generada, generar una segunda señal de salida mediante el mezclado ascendente de la señal de submezcla utilizando la información multicanal; 25 en el que:

la señal de submezcla y la primera señal de salida son una señal mono;

la segunda señal de salida es una señal de audio multicanal, y

la información multicanal incluye por lo menos una de entre la información de nivel del canal y la información de correlación de canal.

2. Procedimiento según la reivindicación 1, en el que la señal de submezcla, la primera señal de salida y la segunda señal de salida corresponden a una señal en dominio temporal.

3. Procedimiento según la reivindicación 1, en el que la generación de la primera señal de salida comprende: generar una señal de subbanda mediante la descomposición de la señal de submezcla; procesar la señal de subbanda mediante la utilización de la información de procesamiento de la submezcla; y generar la primera señal de salida mediante la sintetización de la señal de subbanda.

4. Procedimiento según la reivindicación 1, en el que la información del modo de salida es determinada según el número de altavoces, y en el que el número de altavoces está basado en una de entre la información de mezcla y la información del dispositivo almacenadas en un decodificador.

5. Procedimiento según la reivindicación 1, en el que la información de mezcla es generada basándose por lo menos en una de entre la información de posición de objeto, la información de ganancia de objeto y la información de la configuración de reproducción.

6. Aparato para procesar una señal de audio, que comprende:

55 un demultiplexador (110) configurado para recibir una señal de submezcla en el dominio temporal que incluye por lo menos una señal de objeto y para recibir información de objeto recibida extraída cuando la señal de submezcla es generada;

una unidad de generación de información (120) configurada para:

recibir información del modo de salida; recibir información de mezcla para controlar la señal de objeto; generar información de procesamiento de submezcla utilizando la información de objeto y la información de

65 mezcla si la información del modo de salida recibida indica una salida mono; y generar información multicanal utilizando la información de objeto y la información de mezcla si la información del modo de salida recibida indica

una salida multicanal;

una unidad de procesamiento de la submezcla (130) configurada para, si la información de procesamiento de submezcla es generada, generar una primera señal de salida mediante la aplicación de la información de 5 procesamiento de la submezcla a la señal de submezcla, controlando la información de procesamiento de la submezcla la ganancia y/o el panning de dicha por lo menos una señal de objeto; y

un decodificador de multicanal (140) configurado para, si la información multicanal es generada, generar una segunda señal de salida mediante el mezclado ascendente de la señal de submezcla utilizando la información multicanal,

en el que:

la señal de submezcla y la primera señal de salida son señales mono; 15 la segunda señal de salida es una señal de audio multicanal; y

la información multicanal incluye por lo menos una de entre la información de nivel de canal y la información de correlación de canal.

7. Aparato según la reivindicación 6, en el que la señal de submezcla, la primera señal de salida y la segunda señal de salida corresponden a una señal en un dominio temporal.

8. Aparato según la reivindicación 6, en el que la unidad de procesamiento de submezcla comprende:

una unidad de descomposición en subbandas (132A) configurada para generar una señal de subbanda descomponiendo la señal de submezcla;

una unidad de procesamiento mono a mono (134A) configurada para procesar la señal de subbanda utilizando la información de procesamiento de submezcla; y

una unidad de sintetización de subbandas (136A) configurada para generar la primera señal de salida mediante la sintetización de la señal de subbanda.

9. Aparato según la reivindicación 6, en el que la información del modo de salida es determinada según el número de altavoces, y en el que el número de altavoces está basado en una de entre la información de mezcla y la información del dispositivo almacenadas en el aparato.

10. Aparato según la reivindicación 6, en el que la información de mezcla es generada basándose por lo menos en una de entre la información de la posición de objeto, la información de ganancia del objeto y la información de la configuración de reproducción.

11. Soporte de grabación legible por ordenador que comprende un programa almacenado en el mismo, estando el

programa previsto para ejecutar un procedimiento para procesar señales de audio, comprendiendo dicho 45 procedimiento:

recibir información de modo de salida;

recibir una señal de submezcla que incluye por lo menos una señal de objeto;

recibir información de objeto extraída cuando la señal de submezcla es generada;

recibir información de mezcla para controlar la señal de objeto;

55 generar información de procesamiento de la submezcla utilizando la información de objeto y la información de mezcla si la información del modo de salida recibida indica una salida mono;

generar información multicanal utilizando la información de objeto y la información de mezcla si la información del modo recibida indica una salida multicanal;

65 si la información multicanal es generada, generar una segunda señal de salida mediante el mezclado ascendente de la señal de submezcla utilizando la información multicanal;

en el que:

la señal de submezcla y la primera señal de salida son una señal mono, y 5 la segunda señal de salida es una señal de audio multicanal, y

la información multicanal incluye por lo menos una de entre la información de nivel del canal y la información de correlación de canal. 10

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]