Esquema de codificación/decodificación de audio que tiene una derivación conmutable.

Aparato para codificar una señal de audio para obtener una señal de audio codificada,

estando la señal deaudio en un primer dominio, que comprende:

un primer conversor (510) de dominio para convertir la señal de audio desde el primer dominio en unsegundo dominio;

una derivación (50) conmutable para puentear el primer conversor (510) de dominio si la derivaciónconmutable se pone en un estado activo o para ocasionar una conversión de la señal de audio por el primerconversor (510) de dominio si la derivación conmutable se pone en un estado inactivo en respuesta a unaseñal (51) de control de conmutación de la derivación;

un segundo conversor (410) de dominio para convertir una señal de audio recibida desde la derivación (50)conmutable o el primer conversor (510) de dominio en un tercer dominio, siendo el tercer dominio diferentedel segundo dominio;

un primer procesador (420) para codificar la señal de audio del tercer dominio según un primer algoritmo decodificación; y

un segundo procesador (520) para codificar la señal de audio recibida desde el primer conversor (510) dedominio si la derivación conmutable se pone en un estado inactivo según un segundo algoritmo decodificación que es diferente del primer algoritmo de codificación para obtener una segunda señalprocesada,

en el que la señal codificada para una parte de la señal de audio incluye la primera señal procesada o lasegunda señal procesada

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/004875.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: BESSETTE, BRUNO, SALAMI, REDWAN, LEFEBVRE, ROCH, GEIGER, RALF, GRILL, BERNHARD, POPP, HARALD, HILPERT, JOHANNES, GEYERSBERGER,STEFAN, RETTELBACH,NIKOLAUS, MULTRUS,MARKUS, NEUENDORF,Max, KRAEMER,Ulrich, FUCHS,Guillaume, LECOMTE,Jérémie, BAYER,Stefan, LAPIERRE,JIMMY, GOURNAY,PHILIPPE.

Fecha de Publicación: 25 de Julio de 2012.

Clasificación Internacional de Patentes:

G10L19/14

PDF original: ES-2391715_T3.pdf

Fragmento de la descripción:

Esquema de codificación/decodificación de audio que tiene una derivación conmutable.

La presente invención se refiere a la codificación de audio y, en particular, a esquemas de codificación de audio de baja tasa de bits.

En la técnica se conocen esquemas de codificación en el dominio de frecuencia tales como MP3 o AAC. Estos codificadores en el dominio de frecuencia se basan en una conversión de dominio del tiempo/dominio de frecuencia, una etapa de cuantificación subsiguiente en la que se controla el error de cuantificación mediante el uso de información de un módulo psicoacústico, y una etapa de codificación en la que los coeficientes espectrales cuantificados y la correspondiente información secundaria se codifican por entropía mediante el uso de tablas de código.

Por otra parte, hay codificadores que son muy adecuados para el procesamiento del habla (speech) tal como el AMR-WB+ que se ha descrito en el documento 3GPP TS 26.290. Tales esquemas de codificación del habla llevan a cabo un filtrado predictivo lineal de una señal en el dominio del tiempo. Un filtrado LP de este tipo se deriva de un análisis predictivo lineal de la señal en el dominio del tiempo. Los coeficientes de filtro de LP resultantes son seguidamente codificados y transmitidos como información secundaria. Este proceso se conoce como LPC (Linear Prediction Coding, Codificación de Predicción Lineal) . En la salida del filtro, la señal residual de predicción o la señal de error de predicción que también se conoce como señal de excitación, se codifica mediante las etapas de análisis por síntesis (analysis-by-synthesis stages) del codificador ACELP, o como alternativa, se codifica mediante un codificador de transformada, que utiliza una transformada de Fourier con una superposición. La decisión entre la codificación ACELP y la codificación de excitación codificada por transformada, que también recibe la denominación de codificación TCX, se lleva a cabo mediante el uso de un bucle cerrado o de un algoritmo de bucle abierto.

Los esquemas de codificación de audio en el dominio de la frecuencia, tales como el esquema de codificación AAC de alta eficiencia, que combina un esquema de codificación AAC con una técnica de replicación de ancho de banda espectral, también pueden combinarse para dar una herramienta de codificación conjunta estéreo o de múltiples canales, conocida con el término “MPEG surround”.

Por otra parte, los codificadores de habla tales como el AMR-WB+ también pueden tener una etapa de refuerzo de alta frecuencia y una funcionalidad estéreo.

Los esquemas de codificación en el dominio de la frecuencia son ventajosos porque muestran una elevada calidad a bajas velocidades de bits para las señales de música. Sin embargo, es problemática la calidad de las señales de habla a bajas velocidades de bits.

Los esquemas de codificación del habla muestran una elevada calidad para las señales de habla, aún a bajas velocidades de bits, pero muestran una pobre calidad para las señales de música a bajas velocidades de bits.

El documento WO 2008/071353 A2 da a conocer un códec híbrido de música y habla que combina codificación y decodificación en el dominio del tiempo y en el dominio de la frecuencia. La conmutación de dominio tiene lugar dependiendo de su la señal de auido parece habla o música. La síntesis conmutable al pasar el añadido de superposición tiene lugar en el decodificador si la señal que va a decodificarse se ha codificado en el dominio del tiempo.

Uno objeto de la presente invención es proporcionar un concepto mejorado de codificación/decodificación.

Se logra este objetivo mediante un aparato para codificar una señal de audio según la reivindicación 1, un método para codificar una señal de audio según la reivindicación 11, un aparato para decodificar una señal de audio codificada según la reivindicación 12, un método para decodificar una señal de audio codificada según la reivindicación 18, o un programa informático según la reivindicación 19.

En un codificador según la presente invención, se utilizan dos conversores de dominio, en el que el primer conversor de dominio convierte una señal de audio desde el primer dominio tal como el dominio del tiempo en un segundo dominio tal como un dominio de LPC. El segundo conversor de dominio está operativo para convertir desde un dominio de entrada en un dominio de salida, y el segundo conversor de dominio recibe, como una entrada, una señal de salida del primer conversor de dominio o una señal de salida de una derivación conmutable, que está conectado para puentear el primer conversor de dominio. En otras palabras, esto significa que el segundo conversor de dominio recibe, como una entrada, la señal de audio en el primer dominio tal como el dominio del tiempo, o como alternativa, la señal de salida del primer conversor de dominio, es decir, una señal de audio, que ya ha sido convertida desde uno de los dominios en un dominio diferente. La salida del segundo conversor de dominio se procesa por un primer procesador a fin de generar una segunda señal procesada, y la salida del primer conversor de dominio se procesa por un segundo procesador a fin de generar una segunda señal procesada. Es preferible que la derivación conmutable también pueda adicionalmente conectarse al segundo procesador de manera tal que la entrada en el segundo procesador sea la señal de audio en el dominio del tiempo en lugar de una salida del primer conversor de dominio.

Este concepto de codificación, sumamente flexible, es especialmente útil para la codificación de audio de alta calidad y de elevada eficiencia de bit, ya que permite codificar una señal de audio en al menos tres dominios diferentes y, cuando la derivación conmutable también está adicionalmente conectada al segundo procesador, incluso en cuatro dominios. Esto puede lograrse mediante la conmutación controlable de la derivación conmutable a fin de derivar o puentear o no, el primer conversor de dominio para una determinada parte de la señal de audio en el dominio del tiempo. Aunque se puentee el primer conversor de dominio, sigue habiendo dos posibilidades diferentes para codificar la señal de audio del dominio del tiempo, es decir por medio del primer procesador conectado a un segundo conversor de dominio o al segundo procesador.

Es preferible que el primer procesador y el segundo conversor de dominio formen conjuntamente un codificador de modelo de sumidero de información, tal como el codificador de audio accionado psicoacústicamente según se conoce de conocido de la capa 3 de MPEG 1 o MPEG 4 (AAC) .

Es preferible que el otro codificador, es decir, el segundo procesador sea un codificador del dominio del tiempo, que es por ejemplo el codificador residual conocido de un codificador ACELP, en el que la señal residual de LPC residual se codifica mediante el uso de un codificador residual tal como un codificador de cuantificación de vectores para la señal residual de LPC o una señal del dominio del tiempo. En una forma de realización, este codificador del dominio del tiempo recibe como una entrada, una señal del dominio de LPC, cuando la derivación está abierta. Un codificador de este tipo es un codificador modelo de fuentes de información ya que, a diferencia del codificador modelo de sumideros de información, el codificador modelo de fuentes de información ha sido específicamente diseñado para utilizar caracteres específicos de un modelo generador de habla. Sin embargo, si la derivación está cerrada, la señal introducida en el segundo procesador será una señal del dominio del tiempo en lugar de una señal de dominio de LPC.

Sin embargo, si la derivación conmutable está desactivada, lo que significa que la señal de audio procedente del primer dominio se convierte en un segundo dominio antes de su procesamiento ulterior, nuevamente quedan dos posibilidades diferentes, es decir o bien codificar la salida del primer conversor de dominio en el segundo dominio, que puede ser por ejemplo un dominio de LPC, o bien, como alternativa, transformar la señal del segundo dominio en un tercer dominio, que puede ser por ejemplo un dominio espectral.

Es ventajoso que el conversor de dominio espectral, es decir el segundo conversor de dominio, esté adaptado para implementar el mismo algoritmo independientemente de si la señal introducida en el segundo conversor de dominio está en el primer dominio tal como el dominio del tiempo o de si está en el segundo dominio tal como el... [Seguir leyendo]

Reivindicaciones:

1. Aparato para codificar una señal de audio para obtener una señal de audio codificada, estando la señal de audio en un primer dominio, que comprende:

un primer conversor (510) de dominio para convertir la señal de audio desde el primer dominio en un segundo dominio;

una derivación (50) conmutable para puentear el primer conversor (510) de dominio si la derivación conmutable se pone en un estado activo o para ocasionar una conversión de la señal de audio por el primer conversor (510) de dominio si la derivación conmutable se pone en un estado inactivo en respuesta a una señal (51) de control de conmutación de la derivación;

un segundo conversor (410) de dominio para convertir una señal de audio recibida desde la derivación (50) conmutable o el primer conversor (510) de dominio en un tercer dominio, siendo el tercer dominio diferente del segundo dominio;

un primer procesador (420) para codificar la señal de audio del tercer dominio según un primer algoritmo de codificación; y

un segundo procesador (520) para codificar la señal de audio recibida desde el primer conversor (510) de dominio si la derivación conmutable se pone en un estado inactivo según un segundo algoritmo de codificación que es diferente del primer algoritmo de codificación para obtener una segunda señal procesada,

en el que la señal codificada para una parte de la señal de audio incluye la primera señal procesada o la segunda señal procesada.

2. Aparato según la reivindicación 1, en el que el primer conversor (510) de dominio comprende un filtro de análisis de LPC para el filtrado en LPC de la señal de audio para obtener una señal residual de LPC y datos de parámetros de LPC.

3. Aparato según la reivindicación 1 ó 2, en el que el segundo conversor (410) de dominio comprende un conversor de tiempo-frecuencia para convertir una señal de entrada en una representación espectral de la misma.

4. Aparato según una de las reivindicaciones anteriores, en el que el segundo procesador (520) está operativo para generar una señal de salida codificada de manera que la señal de salida codificada esté en el mismo dominio que una señal de entrada en el segundo procesador (520) .

5. Aparato según una de las reivindicaciones anteriores, en el que el primer procesador (420) comprende un cuantificador y un codificador de entropía y en el que el segundo procesador (520) comprende un codificador de fuente basado en un libro de código.

6. Aparato según una de las reivindicaciones anteriores, en el que el primer procesador (420) se basa en un modelo de sumidero de información y el segundo procesador (520) se basa en un modelo de fuente de información.

7. Aparato según una de las reivindicaciones anteriores, que además comprende una etapa (200) de conmutación conectada entre una salida del primer conversor (510) de dominio y una entrada del segundo conversor (410) de dominio y una entrada del segundo procesador (520) ,

en el que la etapa (200) de conmutación está adaptada para conmutar entre la entrada del segundo conversor (410) de dominio y la entrada del segundo procesador (520) en respuesta a una señal de control de la etapa de conmutación.

8. Aparato según una de las reivindicaciones anteriores, en el que una salida de la derivación (50) conmutable está conectada a una salida del primer conversor (510) de dominio y una entrada de la derivación (50) conmutable está conectada a una entrada en el primer conversor (510) de dominio.

9. Aparato según una de las reivindicaciones anteriores, que además comprende un clasificador de señales para controlar la derivación (50) conmutable para una parte de la señal de audio en función de un resultado de análisis para la parte de la señal de audio.

10. Aparato según una de las reivindicaciones anteriores, en el que el segundo conversor (410) de dominio está operativo para convertir una señal de entrada por bloques y en el que el segundo conversor de dominio está operativo para llevar a cabo una conmutación basada en bloques en respuesta a un análisis de señal de audio de manera que se controla el segundo conversor (410) de dominio porque los bloques de diferentes longitudes se convierten en función del contenido de la señal de audio.

11. Método para codificar una señal de audio para obtener una señal de audio codificada, estando la señal de audio en un primer dominio, que comprende:

convertir (510) la señal de audio del primer dominio en un segundo dominio;

puentear (50) la etapa de la conversión (510) de la señal de audio del primer dominio en un segundo dominio u ocasionar una conversión de la señal de audio del primer dominio en un segundo dominio en respuesta a una señal (51) de control de conmutación de la derivación;

convertir (410) una señal (50) de audio derivada o una señal de audio en el segundo dominio en un tercer dominio, siendo el tercer dominio diferente del segundo dominio;

codificar (420) la señal de audio del tercer dominio generada por la etapa de convertir (410) la señal (50) de audio derivada o la señal de audio en el segundo dominio según un primer algoritmo de codificación; y

codificar (520) la señal de audio en el segundo dominio si la derivación (50) no se ha activado según un segundo algoritmo de codificación que es diferente del primer algoritmo de codificación para obtener una segunda señal procesada,

en el que la señal codificada para una parte de la señal de audio incluye la primera señal procesada o la segunda señal procesada.

12. Aparato para decodificar una señal de audio codificada, comprendiendo la señal de audio codificada una primera señal procesada que está en un tercer dominio y una segunda señal procesada que está en un segundo dominio, en el que el segundo dominio y el tercer dominio son diferentes entre sí, que comprende:

un primer procesador (430) inverso para el procesamiento inverso de la primera señal procesada;

un segundo procesador (530) inverso para el procesamiento inverso de la segunda señal procesada;

un segundo conversor (440) para la conversión de dominio de la primera señal procesada inversa del tercer dominio en un dominio diferente;

un primer conversor (540) para convertir la segunda señal procesada inversa en un primer dominio o para convertir la primera señal procesada inversa, que se convirtió en un dominio diferente, en el primer dominio cuando el dominio diferente no es el primer dominio; y

una derivación (52) para puentear el primer conversor (540) cuando el dominio diferente es el primer dominio.

13. Aparato según la reivindicación 12, que además comprende un combinador (600) para combinar una salida del primer conversor (540) y una salida de la derivación (52) para obtener una señal (699) de audio decodificada combinada.

14. Aparato para decodificar según una cualquiera de las reivindicaciones 12 ó 13, que además comprende una interfaz (900) de entrada para extraer, de una señal de audio codificada, la primera señal procesada, la segunda señal procesada y la señal de control indicativa de si para una determinada primera señal procesada inversa, el primer conversor (540) debe puentearse por la derivación o no.

15. Aparato para decodificar según una cualquiera de las reivindicaciones 12 a 14, en el que el primer conversor (540) comprende una etapa de síntesis de codificación de predicción lineal (LPC) , y

en el que el segundo conversor (440) comprende un conversor de tiempo espectral para convertir una representación espectral de una señal de audio en una representación de tiempo de la señal de audio.

16. Aparato para decodificar según una cualquiera de las reivindicaciones 12 a 15, en el que el primer procesador (430) inverso comprende un decodificador de entropía y un decuantificador y en el que el segundo procesador (530) inverso comprende el decodificador de fuente basado en un libro de código.

17. Aparato para decodificar según una cualquiera de las reivindicaciones 12 a 16, en el que el segundo conversor (440) está operativo para llevar a cabo una operación de filtrado de síntesis tal como una operación inversa de filtrado de transformada de coseno discreta modificada distorsionada en tiempo controlable mediante información (434) adicional incluida en la señal de audio codificada.

18. Método para decodificar una señal de audio codificada, comprendiendo la señal de audio codificada una primera señal procesada que está en un tercer dominio y una segunda señal procesada que está en un segundo dominio, en el que el segundo dominio y el tercer dominio son diferentes entre sí, que comprende:

el procesamiento (430) inverso de la primera señal procesada;

el procesamiento (530) inverso de la segunda señal procesada; la conversión (440) de segundo dominio de la primera señal procesada inversa del tercer dominio en un dominio diferente; 5 la conversión (540) de primer dominio de la segunda señal procesada inversa en un primer dominio o la conversión de la primera señal procesada inversa, que se convirtió en un dominio diferente, en el primer dominio cuando el dominio diferente no es el primer dominio; y puentear (52) la etapa de la conversión (540) de primer dominio cuando el dominio diferente es el primer dominio. 10 19. Programa informático para llevar a cabo, cuando se ejecuta en un ordenador, un método para codificar una señal de audio según la reivindicación 11 o un método para decodificar una señal de audio codificada según la reivindicación 18.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]