Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales.

Un aparato operable para codificar una señal de audio de múltiples canales,

que comprende:un codificador que recibe una señal de audio de múltiples canales que comprende una pluralidad de señales deaudio y codifica la señal de audio de múltiples canales para generar una señal de audio codificada;

un generador de factor de equilibrio de un codificador de capa de mejora que recibe una señal de audiocodificada y genera un factor de equilibrio que tiene una pluralidad de componentes de factor de equilibrio cadauno asociado con una señal de audio de la pluralidad de señales de audio de la señal de audio de múltiplescanales;

un generador de vector de ganancia de un codificador de capa de mejora que determina un valor de ganancia aser aplicado a la señal de audio codificada para generar una estimación de la señal de audio de múltiplescanales basada en el factor de equilibrio y la señal de audio de múltiples canales, en donde el valor de gananciase configura para minimizar un valor de distorsión entre la señal de audio de múltiples canales y la estimación dela señal de audio de múltiples canales; y

un transmisor que transmite una representación del valor de ganancia para al menos uno de transmisión yalmacenamiento.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/066507.

Solicitante: Motorola Mobility LLC .

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 600 North US Highway 45 Libertyville, IL 60048 ESTADOS UNIDOS DE AMERICA.

Inventor/es: ASHLEY,JAMES P, MITTAL,UDAR.

Fecha de Publicación: 18 de Septiembre de 2013.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/14

PDF original: ES-2430639_T3.pdf

Fragmento de la descripción:

Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales Referencia a las solicitudes relacionadas La presente solicitud está relacionada con las siguientes solicitudes de patente europeas de propiedad común junto con esta solicitud por Motorola, Inc.:

Solicitud EP 2382 627 A0, titulada “SELECTIVE SCALING MASK COMPUTATION BASED ON PEAK DETECTION”;

Solicitud EP 2382 622 A0, titulada “METHOD AND APPARATUS FOR GENERATING AN ENHANCEMENT LAYER WITHIN A MULTIPLE-CHANNEL AUDIO CODING SYSTEM” (Expediente del Agente Nº CS36627AUD) ; y

Solicitud EP 2382 626 A0, titulada “SELECTIVE SCALING MASK COMPUTATION BASED ON PEAK DETECTION”.

Campo de la descripción La presente invención se refiere, en general, a sistemas de comunicación y, más particularmente, a codificar señales de habla y audio en tales sistemas de comunicación.

Antecedentes La compresión de señales de habla y audio es bien conocida. Se requiere generalmente compresión para transmitir señales eficientemente sobre un canal de comunicaciones, o para almacenar señales comprimidas en un dispositivo de medios digital, tal como un dispositivo de memoria de estado sólido o disco duro de ordenador. Aunque hay muchas técnicas de compresión (o “codificación”) , un método que ha permanecido muy popular para codificación de habla digital se conoce como Predicción Lineal Excitada de Código (CELP) , que es uno de una familia de algoritmos de codificación de “análisis por síntesis”. Análisis por síntesis se refiere de manera general a un proceso de codificación por el cual se usan múltiples parámetros de un modelo digital para sintetizar un conjunto de señales candidatas que se comparan con una señal de entrada y analizan para distorsión. Un conjunto de parámetros que produce la distorsión más baja entones o bien se transmite o bien se almacena, y eventualmente se usa para reconstruir una estimación de la señal de entrada original. CELP es un método de análisis por síntesis particular que usa uno o más libros de códigos cada uno que comprende esencialmente conjuntos de vectores de código que se recuperan del libro de códigos en respuesta a un índice de libro de códigos.

En los codificadores CELP modernos, hay un problema con el mantenimiento de una reproducción de habla y audio de elevada calidad a tasas de datos razonablemente bajas. Esto es verdadero especialmente para música u otras señales de audio genéricas que no cumplen muy bien el modelo de habla CELP. En este caso, el desajuste del modelo puede causar una calidad de audio severamente degradada que puede ser inaceptable para un usuario final del equipo que emplea tales métodos. Por lo tanto, sigue habiendo una necesidad de mejorar el rendimiento de los codificadores de habla tipo CELP a tasas de bit bajas, especialmente para música y otras entradas no de tipo habla.

La EP 1 818 911 (A1) describe un dispositivo de codificación de sonido que tiene una estructura escalable monoaural/estéreo y capaz de codificar eficientemente sonido estéreo incluso cuando es pequeña la correlación entre las señales de canal de una señal estéreo.

Los objetivos antes mencionados se resuelven por las reivindicaciones de la presente invención.

Breve descripción de los dibujos Las figuras anexas, donde números de referencia iguales se refieren a elementos idénticos o de similar funcionalidad en todas las vistas separadas, las cuales junto con la descripción detallada de más adelante se incorporan en y forman parte de la especificación y sirven para ilustrar además diversas realizaciones de conceptos que incluyen la invención reivindicada, y para explicar diversos principios y ventajas de esas realizaciones.

La FIG. 1 es un diagrama de bloques de un sistema de compresión de habla/audio integrado de la técnica anterior.

La FIG. 2 es un ejemplo más detallado del codificador de capa de mejora de la FIG. 1

La FIG. 3 es un ejemplo más detallado del codificador de capa de mejora de la FIG. 1

La FIG. 4 es un diagrama de bloques de un codificador y descodificador de capa de mejora.

La FIG. 5 es un diagrama de bloques de un sistema de codificación integrado de múltiples capas.

La FIG. 6 es un diagrama de bloques de un codificador y descodificador de 4 capas.

La FIG. 7 es un diagrama de flujo que muestra la operación de los codificadores de la FIG. 4 y la FIG. 6.

La FIG. 8 es un diagrama de bloques de un sistema de compresión de habla/audio integrado de la técnica anterior.

La FIG. 9 es un ejemplo más detallado del codificador de capa de mejora de la FIG. 8.

La FIG. 10 es un diagrama de bloques de un codificador y descodificador de capa de mejora, según diversas realizaciones.

La FIG. 11 es un diagrama de bloques de un codificador y descodificador de capa de mejora, según diversas realizaciones.

La FIG. 12 es un diagrama de flujo de codificación de señal de audio de múltiples canales, según diversas realizaciones.

La FIG. 13 es un diagrama de flujo de codificación de señal de audio de múltiples canales, según diversas realizaciones.

La FIG. 14 es un diagrama de flujo de descodificación de una señal de audio de múltiples canales, según diversas realizaciones.

La FIG. 15 es un gráfico de frecuencia de detección de pico en base a generación de máscara, según diversas realizaciones.

La FIG. 16 es un gráfico de frecuencia de escalado de capa central que usa generación de máscara pico, según diversas realizaciones.

Las FIG. 17-19 son diagramas de flujo que ilustran la metodología para la codificación y descodificación usando generación de máscara basada en detección de pico, según diversas realizaciones.

Los expertos apreciarán que los elementos en las figuras se ilustran para simplicidad y claridad y no han sido dibujados necesariamente a escala. Por ejemplo, las dimensiones de algunos de los elementos en las figuras pueden estar exageradas con respecto a otros elementos para ayudar a mejorar la compresión de diversas realizaciones. Además, la descripción y los dibujos no requieren necesariamente el orden ilustrado. Se apreciará además que se pueden describir o representar ciertas acciones y/o pasos en un orden particular de aparición aunque los expertos en la técnica entenderán que tal especificidad con respecto a la secuencia no se requiere realmente. Los componentes del aparato y método se han representado donde sea adecuado mediante símbolos convencionales en los dibujos, mostrando solamente aquellos detalles específicos que son pertinentes para la comprensión de las diversas realizaciones para no oscurecer la descripción con detalles que serán fácilmente evidentes a aquellos expertos en la técnica que tienen el beneficio de la descripción de la presente memoria. De esta manera, se apreciará que para simplicidad y claridad de ilustración, los elementos comunes y bien conocidos que son útiles o necesarios en una realización comercialmente factible pueden no ser representados a fin de facilitar una vista menos obstruida de estas diversas realizaciones.

Descripción detallada A fin de abordar la necesidad anteriormente mencionada, se describe en la presente memoria un método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio. Durante la operación una señal de entrada a ser codificada se recibe y codifica para producir una señal de audio codificada. La señal de audio codificada entonces se escala con una pluralidad de valores de ganancia para producir una pluralidad de señales de audio codificadas escaladas, cada una que tiene un valor de ganancia asociado y se determina que existen una pluralidad de valores de error entre la señal de entrada y cada una de la pluralidad de señales de audio codificadas escaladas. Se elige entonces un valor de ganancia que está asociado con una señal de audio codificada escalada provocando un valor de error bajo que existe entre la señal de entrada y la señal de audio codificada escalada. Finalmente, el valor de error bajo se transmite junto con el valor de ganancia como parte de una capa de mejora para la señal de audio codificada.

Un sistema de compresión de habla/audio integrado de la técnica anterior se muestra en la FIG. 1. El audio de entrada s (n) se procesa en primer lugar por un codificador de capa central 120, que para estos propósitos puede ser un algoritmo de codificación de habla de tipo CELP. El flujo de bits codificado se transmite al canal 125, además de ser introducido a un descodificador de capa central local 115, donde se genera la señal de audio central reconstruida... [Seguir leyendo]

Reivindicaciones:

1. Un aparato operable para codificar una señal de audio de múltiples canales, que comprende:

un codificador que recibe una señal de audio de múltiples canales que comprende una pluralidad de señales de audio y codifica la señal de audio de múltiples canales para generar una señal de audio codificada;

un generador de factor de equilibrio de un codificador de capa de mejora que recibe una señal de audio codificada y genera un factor de equilibrio que tiene una pluralidad de componentes de factor de equilibrio cada uno asociado con una señal de audio de la pluralidad de señales de audio de la señal de audio de múltiples canales;

un generador de vector de ganancia de un codificador de capa de mejora que determina un valor de ganancia a ser aplicado a la señal de audio codificada para generar una estimación de la señal de audio de múltiples canales basada en el factor de equilibrio y la señal de audio de múltiples canales, en donde el valor de ganancia se configura para minimizar un valor de distorsión entre la señal de audio de múltiples canales y la estimación de la señal de audio de múltiples canales; y

un transmisor que transmite una representación del valor de ganancia para al menos uno de transmisión y almacenamiento.

2. El aparato de la reivindicación 1, que además comprende:

una unidad de escalado del codificador de capa de mejora que escala la señal de audio codificada con una pluralidad de valores de ganancia para generar una pluralidad de señales de audio codificadas candidatas, en donde se escala al menos una de las señales de audio codificadas candidatas;

en donde la unidad de escalado y el generador de factor de equilibrio generan la estimación de la señal de audio de múltiples canales en base al factor de equilibrio y la al menos una señal de audio codificada escalada de la pluralidad de señales de audio codificadas candidatas; y

un selector de ganancia del codificador de capa de mejora que evalúa el valor de distorsión en base a la estimación de la señal de audio de múltiples canales y la señal de audio de múltiples canales para determinar una representación de un valor de ganancia óptimo de la pluralidad de valores de ganancia.

3. El aparato de la reivindicación 1, en donde el codificador codifica la señal de audio para generar un vector de audio reconstruido S y el generador del vector de ganancia que además comprende:

una unidad de escalado que detecta un conjunto de picos en el vector de audio reconstruido S de una señal de audio recibida, genera una máscara de escalado ) ( Sˆ ) en base al conjunto de picos detectados, genera una pluralidad de vectores de ganancia gj basados en la máscara de escalado, y escala la señal de audio reconstruida con la pluralidad de vectores de ganancia para producir la pluralidad de señales de audio reconstruidas escaladas;

un generador de señal de error que genera una pluralidad de distorsiones en base a la señal de audio y la pluralidad de señales de audio reconstruidas escaladas; y

un selector de ganancia que elige un vector de ganancia a partir de la pluralidad de vectores de ganancia en base a la pluralidad de distorsiones, en donde el transmisor saca para al menos uno de transmisión y almacenamiento el índice representativo del vector de ganancia.

4. El aparato de la reivindicación 3, en donde el selector de ganancia detecta el conjunto de picos adicionales según una función de detección de pico dada como:

donde ! es un valor umbral.

5. Un aparato operable para codificar una señal de audio de múltiples canales, que comprende:

una unidad de escalado de un codificador de capa de mejora que escala la señal de audio codificada con una pluralidad de valores de ganancia para generar una pluralidad de señales de audio codificadas candidatas, en donde se escala al menos una de las señales de audio codificadas candidatas;

un generador de factor de equilibrio que genera un factor de equilibrio que tiene una pluralidad de componentes de factor de equilibrio cada uno asociado con una señal de audio de la pluralidad de señales de audio de la señal de audio de múltiples canales;

en donde la unidad de escalado y el generador de factor de equilibrio generan una estimación de la señal de audio de múltiples canales en base al factor de equilibrio y la al menos una señal de audio codificada escalada de la pluralidad de señales de audio codificadas candidatas;

un selector de ganancia del codificador de capa de mejora que evalúa un valor de distorsión en base a la estimación de la señal de audio de múltiples canales y la señal de audio de múltiples canales para determinar una representación de un valor de ganancia óptimo de la pluralidad de valores de ganancia;

un transmisor que transmite la representación del valor de ganancia óptimo para al menos uno de transmisión y almacenamiento.

6. El aparato de la reivindicación 5, en donde un valor de ganancia de la pluralidad de valores de ganancia es una matriz de ganancia con el vector gj como la componente diagonal y en donde la matriz de ganancia es selectiva en frecuencia.

7. El aparato de la reivindicación 5, en donde la representación del valor de ganancia óptimo se da por:

reivindicación 5, en donde cada componente del factor de equilibrio se da por:

, WR = 2-WL.

9. El aparato de la reivindicación 5, en donde el generador de factor de equilibrio genera un valor de correlación entre la señal de audio codificada escalada y al menos una de las señales de audio de la señal de audio de múltiples canales.

10. El aparato de la reivindicación 5, en donde el generador de factor de equilibrio genera una auto correlación entre al menos una de las señales de audio de la señal de audio de múltiples canales y genera una raíz cuadrada de la auto correlación.

11. El aparato de la reivindicación 5, en donde el selector de ganancia genera un valor de distorsión en base a la estimación de la señal de audio de múltiples canales y la señal de audio de múltiples canales y en donde el valor de ganancia está basado en el valor de distorsión.

12. Un método para codificar una señal de audio de múltiples canales, que comprende:

recibir una señal de audio de múltiples canales que comprende una pluralidad de señales de audio;

codificar la señal de audio de múltiples canales para generar una señal de audio codificada;

generar un factor de equilibrio que tenga una pluralidad de componentes de factor de equilibrio cada uno asociado con una señal de audio de la pluralidad de señales de audio de la señal de audio de múltiples canales;

determinar un valor de ganancia a ser aplicado a la señal de audio codificada para generar una estimación de la señal de audio de múltiples canales en base al factor de equilibrio y la señal de audio de múltiples canales, en donde el valor de ganancia se configura para minimizar un valor de distorsión entre la señal de audio de múltiples canales y la estimación de la señal de audio de múltiples canales; y

sacar una representación del valor de ganancia para al menos uno de transmisión y almacenamiento.

13. El método de la reivindicación 12, que además comprende:

escalar la señal de audio codificada con una pluralidad de valores de ganancia para generar una pluralidad de señales de audio codificadas candidatas, en donde se escala al menos una de las señales de audio codificadas candidatas;

generar la estimación de la señal de audio de múltiples canales en base al factor de equilibrio y la al menos una señal de audio codificada ponderada de la pluralidad de señales de audio codificadas candidatas; y

evaluar el valor de distorsión en base a la estimación de la señal de audio de múltiples canales y la señal de audio de múltiples canales para determinar una representación de un valor de ganancia óptimo de la pluralidad 5 de valores de ganancia.

14. El método de la reivindicación 12, que además comprende: detectar un conjunto de picos en un vector de audio reconstruido S de una señal de audio recibida;

generar una máscara de escalado ) ( Sˆ ) basada en el conjunto de picos detectados;

generar un vector de ganancia g* basado en al menos la máscara de escalado y un índice j representativo del

vector de ganancia; escalar la señal de audio reconstruida con el vector de ganancia para producir una señal de audio reconstruida escalada;

generar una distorsión basada en la señal de audio y señal de audio reconstruida escalada; y sacar el índice del vector de ganancia basado en la distorsión generada.

15. El método de la reivindicación 12, que además comprende: recibir una señal de audio; codificar la señal de audio para generar un vector de audio reconstruido S;

detectar un conjunto de picos en el vector de audio reconstruido Sˆ de una señal de audio recibida;

generar una máscara de escalado ) ( Sˆ ) basada en el conjunto de picos detectados;

generar una pluralidad de vectores de ganancia gj basados en la máscara de escalado;

escalar la señal de audio reconstruida con la pluralidad de vectores de ganancia para producir la pluralidad de señales de audio reconstruidas escaladas; generar una pluralidad de distorsiones basadas en la señal de audio y una pluralidad de señales de audio reconstruidas escaladas; 25 elegir un vector de ganancia de la pluralidad de vectores de ganancia en base a la pluralidad de distorsiones; y sacar para al menos uno de transmisión y almacenamiento el índice representativo del vector de ganancia.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]