Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales.

Un aparato que decodifica una señal de audio de múltiples canales,

que comprende:

un decodificador que recibe una señal de audio codificada, un factor de balance codificado y un valor deganancia codificado;

un decodificador de un vector de ganancia de un decodificador de la capa de mejora que genera un valorde ganancia decodificado a partir del valor de ganancia codificado;

una unidad de escala del decodificador de la capa de mejora que cambia la escala de la señal de audiocodificada con el valor de ganancia decodificado para generar una señal de audio a escala;

un combinador de señales que aplica el factor de balance codificado a la señal de audio a escala paragenerar una señal decodificada de audio de múltiples canales y produce la señal decodificada de audio demúltiples canales.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/066616.

Solicitante: Motorola Mobility LLC .

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 600 North US Highway 45 Libertyville, IL 60048 ESTADOS UNIDOS DE AMERICA.

Inventor/es: ASHLEY,JAMES P, MITTAL,UDAR.

Fecha de Publicación: 25 de Septiembre de 2013.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/14

PDF original: ES-2434251_T3.pdf

Fragmento de la descripción:

Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales Referencia a solicitudes relacionadas La presente solicitud está relacionada con las siguientes solicitudes de patente europea de propiedad conjunta con esta solicitud de Motorola Mobility, Inc.:

Solicitud EP 2 382 621 A0, titulada “METHOD AND APPARATUS FOR GENERATING AN ENHANCEMENT LAYER WITHIN A MULTIPLE-CHANNEL AUDIO CODING SYSTEM”;

Solicitud EP 2 382 627 A0, titulada “SELECTIVE SCALING MASK COMPUTATION BASED ON PEAK DETECTION”; y

Solicitud EP 2 382 626 A0, titulada “SELECTIVE SCALING MASK COMPUTATION BASED ON PEAK DETECTION”.

Campo de la divulgación La presente divulgación versa, en general, acerca de sistemas de comunicaciones y, más en particular, acerca de la codificación de señales de voz y audio en tales sistemas de comunicaciones.

Antecedentes La compresión de señales digitales de voz y audio es bien conocida. Generalmente, se requiere la compresión para transmitir eficientemente señales por un canal de comunicaciones o para almacenar señales comprimidas en un dispositivo de medios digitales, tal como un dispositivo de memoria de estado sólido o un disco duro de ordenador. Aunque hay muchas técnicas de compresión (o “codificación”) , un método que ha seguido siendo muy popular para la codificación de voz digital se denomina predicción lineal con excitación por código (CELP) , que es uno de una familia de algoritmos de codificación de “análisis por síntesis”. Generalmente, análisis por síntesis se refiere a un procedimiento de codificación por medio del cual se usan múltiples parámetros de un modelo digital para sintetizar un conjunto de señales candidatas que se comparan con una señal de entrada y se analizan en busca de distorsiones. Entonces se transmite o se almacena un conjunto de parámetros que producen la menor distorsión, que acaba usándose para reconstruir una estimación de la señal original de entrada. La CELP es un método particular de análisis por síntesis que usa uno o más libros de códigos, cada uno de los cuales comprende esencialmente conjuntos de vectores de código que se recuperan del libro de códigos en respuesta a un índice del libro de códigos.

En los codificadores CELP modernos existe el problema de mantener una reproducción de voz y audio de alta calidad con velocidades de transferencia de datos razonablemente bajas. Esto se aplica en especial a la música u otras señales genéricas de audio que no encajan muy bien en el modelo de voz de CELP. En este caso, la discordancia del modelo puede causar una calidad de audio muy degradada que puede resultar inaceptable para un usuario final del equipo que emplee tales métodos. Por lo tanto, subsiste la necesidad de mejorar el rendimiento de los codificadores de voz de tipo CELP con velocidades bajas de transferencia de bits, especialmente para música y otras entradas de tipo distinto a la voz.

El documento EP 1 818 911 (A1) da a conocer un dispositivo de codificación del sonido que tiene una estructura monoaural/estereofónica de escala variable y capaz de codificar eficientemente sonido estereofónico cuando la correlación entre las señales de los canales de una señal estereofónica es pequeña.

Los objetivos anteriores son resueltos por las reivindicaciones de la presente invención.

Breve descripción de los dibujos Las figuras adjuntas, en las que números de referencia semejantes se refieren a elementos idénticos o funcionalmente similares en todas las distintas vistas, que, junto con la descripción detallada que sigue, están incorporadas en la memoria y forman parte de la misma, sirven para ilustrar adicionalmente diversas realizaciones de conceptos que incluyen la invención reivindicada y para explicar diversos principios y ventajas de esas realizaciones.

La FIG. 1 es un diagrama de bloques de un sistema de compresión integrado de voz/audio de la técnica anterior.

La FIG. 2 es un ejemplo más detallado del codificador de la capa de mejora de la FIG. 1.

La FIG. 3 es un ejemplo más detallado del codificador de la capa de mejora de la FIG. 1.

La FIG. 4 es un diagrama de bloques de un codificador y un decodificador de la capa de mejora.

La FIG. 5 es un diagrama de bloques de un sistema integrado de codificación de múltiples capas.

La FIG. 6 es un diagrama de bloques de un codificador y un decodificador de la capa 4.

La FIG. 7 es un diagrama de flujo que muestra la operación de los codificadores de la FIG. 4 y la FIG. 6.

La FIG. 8 es un diagrama de bloques de un sistema de compresión integrado de voz/audio de la técnica anterior.

La FIG. 9 es un ejemplo más detallado del codificador de la capa de mejora de la FIG. 8.

La FIG. 10 es un diagrama de bloques de un codificador y un decodificador de la capa de mejora según diversas realizaciones.

La FIG. 11 es un diagrama de bloques de un codificador y un decodificador de la capa de mejora según diversas realizaciones.

La FIG. 12 es un diagrama de flujo de la codificación de una señal de audio de múltiples canales según diversas realizaciones.

La FIG. 13 es un diagrama de flujo de la codificación de una señal de audio de múltiples canales según diversas realizaciones.

La FIG. 14 es un diagrama de flujo de la decodificación de una señal de audio de múltiples canales según diversas realizaciones.

La FIG. 15 es un gráfico de frecuencias de generación de máscara basada en la detección de picos según diversas realizaciones.

La FIG. 16 es un gráfico de frecuencias del cambio de escala de la capa de núcleo usando una generación de máscara de picos según diversas realizaciones.

Las FIGURAS 17-19 son diagramas de flujo que ilustran la metodología para codificar y decodificar usando la generación de máscara basada en la detección de picos según diversas realizaciones.

Los expertos en la técnica apreciarán que algunos elementos de las figuras se ilustran en aras de la simplicidad y la claridad y que no han sido dibujados necesariamente a escala. Por ejemplo, las dimensiones de algunos de los elementos de las figuras pueden estar exageradas con respecto a otros elementos para contribuir a mejorar la comprensión de diversas realizaciones. Además, la descripción y los dibujos no requieren necesariamente el orden ilustrado. Se apreciará, además, que ciertas acciones y/o etapas pueden ser descritas o representadas en un orden particular de incidencia, mientras que los expertos en la técnica entenderán que, en realidad, no se requiere tal especificidad con respecto a la secuencia. Cuando ha sido apropiado, se han representado componentes de aparatos y de métodos mediante símbolos convencionales en los dibujos, mostrando únicamente aquellos detalles específicos que son pertinentes a la comprensión de las diversas realizaciones para no ofuscar la divulgación con detalles que serán inmediatamente evidentes a las personas con un dominio normal de la técnica que cuenten con el beneficio de la descripción del presente documento. Así, se apreciará que, en aras de la simplicidad y la claridad de la ilustración, pueden no estar representados elementos comunes y bien entendidos que son útiles o necesarios en realizaciones comercialmente viables para facilitar una visión menos obstaculizada de estas diversas realizaciones.

Descripción detallada Para abordar la necesidad mencionada en lo que antecede, en el presente documento se describen un método y un aparato para generar una capa de mejora dentro de un sistema de codificación de audio. Durante la operación, se recibe y se codifica una señal de entrada que ha de ser codificada para producir una señal de audio codificada. A continuación, se cambia la escala de la señal de audio codificada con varios valores de ganancia para producir varias señales de audio codificadas a escala, cada una de las cuales tiene un valor de ganancia asociado, y se determinan varios valores de error que existen entre la señal de entrada y cada una de las varias señales de audio codificadas a escala. Acto seguido, se escoge un valor de ganancia que está asociado con una señal de audio codificada a escala que da como resultado que exista un valor bajo de error entre la señal de entrada y la señal de audio codificada a escala. Por último, se transmite el valor bajo de error junto con el valor de ganancia como parte de una capa de mejora a la señal de audio codificada.

En la FIG. 1 se muestra un sistema de compresión integrado de voz/audio de la técnica anterior. El audio s (n) de entrada es tratado en primer lugar por un codificador 110 de la capa... [Seguir leyendo]

Reivindicaciones:

1. Un aparato que decodifica una señal de audio de múltiples canales, que comprende:

un decodificador que recibe una señal de audio codificada, un factor de balance codificado y un valor de ganancia codificado;

un decodificador de un vector de ganancia de un decodificador de la capa de mejora que genera un valor de ganancia decodificado a partir del valor de ganancia codificado;

una unidad de escala del decodificador de la capa de mejora que cambia la escala de la señal de audio codificada con el valor de ganancia decodificado para generar una señal de audio a escala;

un combinador de señales que aplica el factor de balance codificado a la señal de audio a escala para 10 generar una señal decodificada de audio de múltiples canales y produce la señal decodificada de audio de múltiples canales.

2. El aparato de la reivindicación 1 en el que el valor de ganancia es una matriz de ganancia.

3. El aparato de la reivindicación 1 en el que la señal de audio codificada es una de entre una señal monoaural y una señal de múltiples canales.

4. El aparato de la reivindicación 1 en el que el decodificador del vector de ganancia recibe un vector 8 de audio reconstruido y un índice representativo de un vector de ganancia y en el que el decodificador del vector de ganancia, además, comprende:

un selector de ganancia del decodificador del vector de ganancia que detecta un conjunto de picos en el vector de audio reconstruido, genera una máscara / (5) de escala en función del conjunto detectado de 20 picos y genera el vector g* de ganancia en función de al menos la máscara de escala y del índice representativo del vector de ganancia; y

una unidad de escala del decodificador del vector de ganancia que cambia la escala del vector de audio reconstruido con el vector de ganancia para producir una señal de audio reconstruida a escala.

5. Un método para decodificar una señal de audio de múltiples canales, que comprende:

recibir una señal de audio codificada, un factor de balance codificado y un valor de ganancia codificado; generar un valor de ganancia decodificado a partir del valor de ganancia codificado; cambiar la escala de la señal de audio codificada con el valor de ganancia decodificado para generar una señal de audio a escala; aplicar el factor de balance codificado a la señal de audio a escala para generar una señal de audio de 30 múltiples canales decodificada; y producir la señal de audio de múltiples canales decodificada.

6. El método de la reivindicación 5, comprendiendo el método: recibir un vector 8 de audio reconstruido y un índice representativo de un vector de ganancia; detectar un conjunto de picos en el vector de audio reconstruido;

generar una máscara / (5) de escala en función del conjunto de picos detectado;

generar el vector g* de ganancia en función de al menos la máscara de escala y el índice representativo del vector de ganancia; y cambiar la escala el vector de audio reconstruido con el vector de ganancia para producir una señal de audio reconstruida a escala.

7. Un método para codificar una señal de audio de múltiples canales, que comprende: recibir una señal de audio de múltiples canales que comprende varias señales de audio; codificar la señal de audio de múltiples canales para generar una señal de audio codificada; cambiar la escala de la señal de audio codificada con varios valores de ganancia para generar varias señales de audio codificadas candidatas, estando a escala al menos una de las señales de audio 45 codificadas candidatas; generar un factor de balance que tiene varios componentes del factor de balance, estando asociado cada uno con una señal de audio de las varias señales de audio de la señal de audio de múltiples canales;

generar una estimación de la señal de audio de múltiples canales en función del factor de balance y la al menos una señal de audio codificada a escala de las varias señales de audio codificadas candidatas;

evaluar un valor de distorsión en función de la estimación de la señal de audio de múltiples canales y de la señal de audio de múltiples canales para determinar una representación de un valor óptimo de ganancia de los varios valores de ganancia;

producir para al menos uno de una transmisión y un almacenamiento la representación del valor óptimo de ganancia.

8. El método de la reivindicación 7 en el que un valor de ganancia de los varios valores de ganancia es una matriz de ganancia con el vector gj como componente diagonal.

9. El método de la reivindicación 7 en el que la representación del valor óptimo de ganancia está dada por:

j =

SIk −WIk ⋅G jk ⋅Sk

SDk −WDk ⋅G jk ⋅Sk

≤ j<M

10. El método de la reivindicación 7 en el que cada componente del factor de balance está dado por:

STI SI

WI =

WD =−WISTI SI + STDSD

11. El método de la reivindicación 7 en el que la generación del factor de balance comprende generar un valor de correlación entre la señal de audio codificada a escala y al menos una de las señales de audio de la señal de audio de múltiples canales.

12. El método de la reivindicación 7 en el que la generación del factor de balance comprende: generar una autocorrelación entre al menos una de las señales de audio de la señal de audio de múltiples canales; y 20 generar una raíz cuadrada de la autocorrelación.

13. El método de la reivindicación 7 que, además, comprende la generación de un valor de distorsión en función de la estimación de la señal de audio de múltiples canales y de la señal de audio de múltiples canales.

14. El método de la reivindicación 13 en el que el valor de ganancia está basado en el valor de distorsión.

15. El método de la reivindicación 14 en el que el valor de distorsión comprende varios valores de distorsión 25 correspondientes a las varias estimaciones.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]