CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Codificador para codificar objetos de audio, comprendiendo el codificador:

- medios (401) para recibir una pluralidad de objetos de audio; - medios (403) de codificación para codificar la pluralidad de objetos de audio en un número de señales de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio; - medios (409) para recibir datos de modificación de codificación desde una unidad remota; y - medios (405) de parámetro para determinar los datos paramétricos en respuesta a los datos de modificación de codificación

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/IB2007/053748.

Solicitante: KONINKLIJKE PHILIPS ELECTRONICS N.V..

Nacionalidad solicitante: Países Bajos.

Dirección: GROENEWOUDSEWEG 1 5621 BA EINDHOVEN PAISES BAJOS.

Inventor/es: BREEBAART, DIRK, J..

Fecha de Publicación: 8 de Junio de 2011.

Fecha Solicitud PCT: 17 de Septiembre de 2007.

Clasificación PCT:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2360740_T3.pdf

Ilustración 1 de CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Ilustración 2 de CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Ilustración 3 de CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Ilustración 4 de CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Ver la galería de la patente con 7 ilustraciones.

CODIFICACIÓN Y DECODIFICACIÓN DE OBJETOS DE AUDIO.

Fragmento de la descripción:

CAMPO DE LA INVENCIÓN

La invención se refiere a la codificación y decodificación de objetos de audio y en particular, pero no exclusivamente a la manipulación de objetos de audio de una señal espacial de mezcla descendente.

ANTECEDENTES DE LA INVENCIÓN

La codificación digital de diversas señales de audio ha pasado a ser cada vez más importante durante las últimas décadas porque la representación y comunicación de señal digital ha sustituido cada vez más a la representación y comunicación analógica.

En la última década ha habido una tendencia al audio multicanal y específicamente al audio espacial que se extiende más allá de las señales estéreo convencionales. Por ejemplo, las grabaciones estéreo tradicionales sólo comprenden dos canales mientras que los sistemas de audio avanzados modernos normalmente usan cinco o seis canales, como en los sistemas de sonido envolvente 5.1 populares. Esto proporciona una experiencia sonora más complicada en la que el usuario puede estar rodeado por fuentes de sonido.

Se han desarrollado diversas técnicas y normas para la comunicación de tales señales multicanal. Por ejemplo, pueden transmitirse seis canales discretos que representan un sistema envolvente 5.1 según normas tales como la norma de codificación de audio avanzada (AAC) o las normas de Dolby Digital.

Sin embargo, para proporcionar retrocompatibilidad, se conoce mezclar de manera descendente el mayor número de canales para dar un menor número de canales y específicamente se usa con frecuencia para mezclar de manera descendente una señal de sonido envolvente 5.1 para dar una señal estéreo permitiendo reproducir una señal estéreo por decodificadores legados (estéreo) y una señal 5.1 por decodificadores de sonido envolvente.

Un ejemplo es el procedimiento de codificación retrocompatible envolvente MPEG normalizado por el grupo de expertos en imágenes en movimiento (MPEG). En tal sistema, una señal multicanal se mezcla de manera descendente para dar una señal estéreo y las señales adicionales se codifican mediante datos paramétricos en la parte de datos auxiliares permitiendo que un decodificador multicanal envolvente MPEG genere una representación de la señal multicanal. Un decodificador mono o estéreo legado ignorará los datos auxiliares y por tanto sólo decodificará la mezcla descendente mono o estéreo.

Por tanto, en (de)codificadores de audio espacial (paramétricos), los parámetros se extraen de la señal de audio original para producir una señal de audio que tiene un número reducido de canales, por ejemplo sólo un canal único, más un conjunto de parámetros que describen las propiedades espaciales de la señal de audio original. En los decodificadores de audio espacial (paramétricos), las propiedades espaciales descritas por los parámetros espaciales transmitidos se usan para recrear la señal multicanal espacial original. Un codificador y decodificador de audio espacial paramétricos a modo de ejemplo se da a conocer en el documento US 2003/0035553 A1.

Recientemente, las técnicas para la distribución de objetos de audio individuales que pueden procesarse y manipularse en el extremo receptor han atraído un interés significativo. Por ejemplo, dentro del marco MPEG, un elemento de trabajo se inicia en codificación de audio espacial basada en objetos. El objetivo de este elemento de trabajo es explorar nueva tecnología y reutilizar los componentes y tecnologías envolventes MPEG actuales para la codificación eficaz de tasa de transmisión de bits de múltiples fuentes u objetos de sonido a un número de canales de mezcla descendente y parámetros espaciales correspondientes. Por tanto, la intención es usar técnicas similares a las que se usan para la mezcla descendente de canales (envolventes) espaciales a menos canales para mezclar de manera descendente objetos de audio independientes a un menor número de canales.

En sistemas de audio orientados a objetos, el decodificador puede proporcionar un posicionamiento discreto de estas fuentes/objetos y una adaptación a diversas configuraciones de altavoz así como presentación binaural. Adicionalmente, puede usarse la interacción del usuario para controlar el reposicionamiento/desplazamiento panorámico de las fuentes individuales en el lado de reproducción.

En otras palabras, el objetivo de la investigación es codificar múltiples objetos de audio en un conjunto limitado de canales de mezcla descendente acompañados por parámetros. En el lado del decodificador, los usuarios pueden interactuar con el contenido por ejemplo reposicionando los objetos individuales. Como ejemplo específico, un número de instrumentos individuales puede codificarse y distribuirse como objetos de audio permitiendo de ese modo a un usuario que recibe los datos codificados posicionar independientemente los instrumentos individuales en la imagen de sonido.

La figura 1 ilustra un ejemplo de un codificador y decodificador de audio orientado a objetos según la técnica anterior. En el ejemplo, un conjunto de objetos de audio (O1 a O4) se codifican en un codificador 101ºrientado a objetos que genera una señal de mezcla descendente y parámetros de objeto. Éstos se transmiten al decodificador 103 orientado a objetos que genera copias aproximadas de las señales de objeto de audio usando los parámetros de objeto transmitidos.

Posteriormente, un elemento 105 de presentación genera la señal de salida que tiene las características deseadas. Por ejemplo, el elemento 105 de presentación puede posicionar los objetos en posiciones de fuente de sonido indicadas por el usuario, por ejemplo usando una ley de desplazamiento panorámico. La configuración de la señal de salida es flexible. Por ejemplo, si la señal de salida es mono, el usuario aún puede manipular la intensidad/volumen relativo de cada objeto. En una configuración de la señal de salida estéreo, puede aplicarse una ley simple de desplazamiento panorámico para posicionar cada objeto en una posición deseada. Obviamente, para una configuración de salida multicanal, la flexibilidad es incluso mayor.

**(Ver fórmula)**

Sin embargo, aunque el sistema puede proporcionar un rendimiento ventajoso, también tiene un número de desventajas. Por ejemplo, en muchos casos la calidad reproducida es subóptima y no es posible una manipulación completamente libre e independiente de los objetos de audio individuales. Específicamente, en general la mezcla descendente del codificador no es completamente reversible en el decodificador que por consiguiente sólo puede generar aproximaciones de los objetos de audio originales. Por tanto, el decodificador no puede reconstruir completamente las señales de objeto individuales sino que sólo puede estimarlas según criterios de percepción. Esto da como resultado específicamente una interferencia cruzada (diafonía) entre objetos de audio dando así como resultado que los objetos de audio ya no sean completamente independientes. Como resultado las manipulaciones en un objeto de audio afectan a las características y la percepción de otro objeto.

Por ejemplo, uno de los parámetros más importantes que los usuarios normalmente desearían ajustar es el volumen relativo de cada objeto de audio. Sin embargo, si se realizan grandes ajustes de volumen esto dará como resultado artefactos considerables y una diafonía no deseada dando como resultado una degradación de calidad perceptible.

Por tanto, sería ventajoso un sistema mejorado para la codificación/decodificación de objetos de audio y en particular sería ventajoso un sistema que permitiera una flexibilidad aumentada, calidad mejorada, implementación facilitada y/o rendimiento mejorado.

SUMARIO DE LA INVENCIÓN

Por consiguiente, la invención busca preferiblemente mitigar, aliviar o eliminar una o más de las desventajas anteriormente mencionadas de manera individual o en cualquier combinación.

Según un primer aspecto de la invención se proporciona un codificador para codificar objetos de audio, comprendiendo el codificador: medios para recibir una pluralidad de objetos de audio; medios de codificación para codificar la pluralidad de objetos de audio en un número de señales de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio; medios para recibir datos de modificación de codificación desde una unidad... [Seguir leyendo]

Reivindicaciones:

1. Codificador para codificar objetos de audio, comprendiendo el codificador:

- medios (401) para recibir una pluralidad de objetos de audio;

- medios (403) de codificación para codificar la pluralidad de objetos de audio en un número de señales de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio;

- medios (409) para recibir datos de modificación de codificación desde una unidad remota; y

- medios (405) de parámetro para determinar los datos paramétricos en respuesta a los datos de modificación de codificación.

2. Codificador según la reivindicación 1, en el que los medios de codificación están dispuestos para generar el número de señales de audio mediante una mezcla descendente de los objetos de audio y los medios (405) de parámetro están dispuestos para modificar un peso de mezcla descendente de al menos uno de los objetos de audio en respuesta a los datos de modificación de codificación.

3. Codificador según la reivindicación 1, en el que los medios (405) de parámetro están dispuestos para ajustar a escala al menos un primer objeto de audio en respuesta a los datos de modificación de codificación y para modificar parámetros de objeto para el primer objeto de audio en respuesta al ajuste a escala.

4. Codificador según la reivindicación 1, en el que al menos algunos de los datos de modificación de codificación son específicos de la frecuencia y los medios (405) de parámetro están dispuestos para determinar al menos un parámetro de objeto en respuesta a una característica de frecuencia del parámetro de objeto.

5. Codificador según la reivindicación 1, en el que los medios (403) de codificación están dispuestos para modificar al menos un objeto de audio en respuesta a los datos de modificación de codificación antes de una mezcla descendente de los objetos de audio al número de señales de audio.

6. Codificador según la reivindicación 1, en el que los medios (403) de codificación están dispuestos para generar el número de señales de audio como una mezcla descendente espacial.

7. Codificador según la reivindicación 6, en el que los medios (403) de codificación están dispuestos para modificar en respuesta a los datos de modificación de codificación al menos una característica seleccionada del grupo que consiste en:

- una ubicación espacial de al menos uno de los objetos de audio;

- una característica de distancia de al menos uno de los objetos de audio;

- un modo de presentación espacial del codificador, y

- una característica de frecuencia de al menos uno de los objetos de audio.

8. Codificador según la reivindicación 1, en el que cada objeto de audio está asociado con un conjunto de fuentes de audio que son independientes de las fuentes de audio de otros objetos de audio.

9. Codificador según la reivindicación 1, en el que el codificador está dispuesto para recibir un primer objeto de audio desde la unidad remota y los medios (409) para recibir los datos de modificación de codificación están dispuestos para extraer los datos de modificación de codificación de datos de codificación recibidos para el primer objeto de audio.

10. Codificador según la reivindicación 1, en el que el codificador está dispuesto para recibir datos de modificación de codificación desde una pluralidad de unidades remotas y para generar diferentes datos paramétricos para las diferentes unidades remotas en respuesta a recibir diferentes datos de modificación de codificación desde las diferentes unidades remotas.

11. Decodificador para decodificar objetos de audio, comprendiendo el decodificador:

- un receptor (303) para recibir desde un codificador de objetos de audio remoto un número de señales de audio que son una mezcla descendente de una pluralidad de objetos de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio;

- medios (303) de decodificación para decodificar los objetos de audio del número de señales de audio en

respuesta a los datos paramétricos;

- medios (305) de presentación para generar una señal de salida multicanal espacial a partir de los objetos de audio;

- medios (501) para generar datos de modificación de codificación para el codificador de objetos de audio remoto; y

- medios (503) para transmitir los datos de modificación de codificación al codificador de objetos de audio remoto.

**(Ver fórmula)**

12. Centro de teleconferencia para soportar una teleconferencia entre una pluralidad de unidades de comunicación remotas, comprendiendo el centro de teleconferencia:

- medios (401) para recibir una primera pluralidad de señales de voz desde la pluralidad de unidades de comunicación remotas;

- medios (403) de codificación para codificar para una primera unidad de comunicación remota la primera pluralidad de señales de voz en un número de señales de audio y datos paramétricos que representan la pluralidad de señales de voz en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos una de las diferentes señales de voz;

- medios (409) para recibir datos de modificación de codificación desde la primera unidad de comunicación remota; y

- medios (405) de parámetro para determinar los datos paramétricos en respuesta a los datos de modificación de codificación; y

- medios (407) para transmitir el número de señales de audio y datos paramétricos a la primera unidad de comunicación remota.

13. Transmisor para transmitir señales de audio, comprendiendo el transmisor un codificador según la reivindicación 1.

14. Receptor para recibir señales de audio, comprendiendo el receptor un decodificador según la reivindicación

11.

15. Sistema de comunicación para comunicar señales de audio, comprendiendo el sistema de comunicación:

- un transmisor (201) según la reivindicación 13; y

- un receptor (203) según la reivindicación 14

en el que el receptor está configurado para proporcionar los datos de modificación de codificación al transmisor (201).

16. Procedimiento de codificación de objetos de audio, comprendiendo el procedimiento:

- recibir (601) una pluralidad de objetos de audio;

- codificar (603) la pluralidad de objetos de audio en un número de señales de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio;

- recibir (605) datos de modificación de codificación desde una unidad remota; y

- determinar (603) los datos paramétricos en respuesta a los datos de modificación.

17. Procedimiento de decodificación de objetos de audio, comprendiendo el procedimiento:

- recibir (701) desde un codificador de objetos de audio remoto un número de señales de audio que son una mezcla descendente de una pluralidad de objetos de audio y datos paramétricos que representan la pluralidad de objetos de audio en relación con el número de señales de audio, comprendiendo los datos paramétricos un conjunto de parámetros de objeto para al menos uno de los diferentes objetos de audio;

- decodificar (703) los objetos de audio a partir del número de señales de audio en respuesta a los datos paramétricos;

- generar (705) una señal de salida multicanal espacial a partir de los objetos de audio;

- generar (707) datos de modificación de codificación para el codificador de objetos de audio remoto; y

- transmitir (709) los datos de modificación de codificación al codificador de objetos de audio remoto.

**(Ver fórmula)**

18. Producto de programa informático para ejecutar el procedimiento según cualquiera de las reivindicaciones 16 a 17.

19. Dispositivo (203) de reproducción de audio que comprende un decodificador (215) según la reivindicación

5 11.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]