Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal.

Un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado,

en el que el aparato comprende:

una unidad de procesamiento (110) para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, un determinador de pseudo coeficientes (120) para determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral,

una unidad de modificación de espectro (130) para ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado,

una unidad de conversión de espectro-tiempo (140) para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo,

un oscilador controlable (150) para generar una señal de oscilador de dominio de tiempo, estando controlado el oscilador controlable (150) mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y

un mezclador (160) para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2012/076746.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27 C 80686 MUNCHEN ALEMANIA.

Inventor/es: GEIGER, RALF, DIETZ, MARTIN, DISCH,SASCHA, SCHUBERT,BENJAMIN.

Fecha de Publicación: 17 de Junio de 2015.

Clasificación Internacional de Patentes:

G10L19/032 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Cuantificación o descuantificación de componentes espectrales.

PDF original: ES-2545053_T3.pdf

Fragmento de la descripción:

Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal

La presente invención se refiere a codificación, decodificación y procesamiento de señal de audio, y, en particular, a codificación y decodificación de audio que emplea sustitución sinusoidal.

El procesamiento de las señales de audio se hace más y más importante. Surgen desafíos, ya que se requieren códec de audio perceptuales de módem para suministrar satisfactoriamente calidad de audio a tasas de bits cada vez más bajas. Adicionalmente, en ocasiones la latencia permisible es también muy baja, por ejemplo, para aplicaciones de comunicación bidireccional o juego distribuido, etc.

Los códec de audio de módem, como por ejemplo USAC (Codificación Unificada de Audio y Habla) , a menudo cambian entre codificación predictiva de dominio de tiempo y codificación en el dominio de la transformada,

independientemente del contenido de música se codifica aún predominantemente en el dominio de la transformada. A bajas tasas de bits, por ejemplo < 14 kbit/s, los componentes tonales en elementos de música a menudo suenan mal cuando se codifican a través de codificadores de transformada, que hace la tarea de codificar audio a suficiente calidad incluso más desafiante.

Adicionalmente, las restricciones de bajo retardo conducen generalmente a una respuesta de frecuencia subóptima del banco de filtros del codificador de transformada (debido a la forma de ventana y/o a longitud de transformada optimizadas a bajo retardo) y por lo tanto compromete adicionalmente la calidad perceptual de tales códec.

De acuerdo con el modelo psicoacústico clásico, se definen prerequisitos para transparencia con respecto a la cuantificación de ruido. A altas tasas de bits, esto se refiere a una distribución de tiempo/frecuencia óptima perceptualmente adaptada de ruido de cuantificación que cumple los niveles de enmascaramiento auditivos humanos. A bajas tasas de bits, sin embargo, no puede alcanzarse la transparencia. Por lo tanto, puede emplearse una estrategia de reducción de requisitos de nivel de enmascaramiento a bajas tasas de bits.

Ya se han proporcionado códec de ranura superior para contenido de música, en particular, codificadores de transformada basándose en la Transformada Modificada Discreta del Coseno (MDCT) , que cuantifican y transmiten coeficientes espectrales en el dominio de frecuencia. Sin embargo, a velocidades de datos muy bajas, únicamente pueden codificarse muy pocas líneas espectrales de cada trama de tiempo mediante los bits disponibles para esa trama. Como una consecuencia, son inevitables los artefactos de modulación temporal y los denominados artefactos de tipo trino (warbling) introducidos en la señal codificada.

Más importante, estos tipos de artefactos se perciben en componentes tonales cuasiestacionarios. Esto ocurre especialmente si, debido a restricciones de retardo, se ha de elegir una forma de ventana de transformada que introduce diafonía significativa entre coeficientes espectrales adyacentes (ensanchamiento espectral) debido al

efecto de filtración bien conocido. Sin embargo, no obstante, normalmente únicamente uno o pocos de estos coeficientes espectrales adyacentes permanecen distintos de cero después de la cuantificación aproximada mediante el codificador de baja tasa de bits.

Como se ha indicado anteriormente, en la técnica anterior, de acuerdo con un enfoque, se emplean codificadores de 45 transformada. Los códec de audio de alta relación de compresión actuales que son bien adecuados para codificación de contenido de música se basan todos en codificación de transformada. Los ejemplos más importantes son MPEG2/4 Codificación de Audio Avanzada (AAC) y MPEGD Codificación Unificada de Audio y Habla (USAC) . USAC tiene un núcleo conmutado que consiste en un módulo de Predicción Lineal con Excitación por Código Algebraico (ACELP) más un módulo Excitación Codificada de Transformada (TCX) (véase [5]) pretendida 50 principalmente para codificación de habla y, como alternativa, AAC pretendida principalmente para codificación de música. Como AAC, también TCX es un método de codificación basado en transformada. A configuraciones de baja tasa de bits, estos esquemas de codificación son propensos a mostrar artefactos de tipo trino, especialmente si los esquemas de codificación subyacentes están basados en la Transformada Modificada Discreta del Coseno (MDCT) (véase [1]) .

Para reproducción de música, los codificadores de transformada son la técnica preferida para compresión de datos de audio. Sin embargo, a bajas tasas de bits, los codificadores de transformada tradicionales muestran intensos artefactos de trino y desigualdad. La mayoría de los artefactos se originan desde demasiados componentes espectrales tonales escasamente codificados. Esto ocurre especialmente si estos están espectralmente extendidos 60 mediante una función de transferencia espectral subóptima (efecto de filtración) que está principalmente diseñada para cumplir estrictas restricciones de retardo.

De acuerdo con otro enfoque en la técnica anterior, los esquemas de codificación son completamente paramétricos para transitorios, sinusoides y ruido. En particular, para tasas de bits medias y bajas, se han normalizado los códec

de audio completamente paramétricos, los más importantes de los que son MPEG4 Parte 3, Subparte 7 Armónicos y Líneas Individuales más Ruido (HILN) (véase [2]) y MPEG4 Parte 3, Subparte 8 Codificación Sinusoidal (SSC) (véase [3]) . Los codificadores paramétricos, sin embargo, sufren de un sonido desagradablemente artificial y, con tasas de bits crecientes, no escalan bien hacia la transparencia perceptual.

Un enfoque adicional proporciona codificación de forma de onda y paramétrica híbrida. En [4], se propone un híbrido de codificación de forma de onda basada en transformada y MPEG 4SSC (parte sinusoidal únicamente) . En un proceso iterativo, las sinusoides se extraen y restan de la señal para formar una señal residual a codificar mediante técnicas de codificación de transformada. Las sinusoides extraídas se codifican mediante un conjunto de parámetros y se transmiten junto con el residuo. En [6], se proporciona un enfoque de codificación híbrida que codifica sinusoides y residuo por separado. En [7], en el denominado códec de Transformación Superpuesta de Energía Restringida (CELT) / página web fantasma, se presenta la idea de utilizar un banco de osciladores para codificación híbrida.

A tasas de bits medias o superiores, los codificadores de transformada son bien adecuados para codificación de música debido a su sonido natural. Ahí, los requisitos de transparencia del modelo psicoacústico subyacente se cumplen completa o casi completamente. Sin embargo, a bajas tasas de bits, los codificadores tienen que infringir seriamente los requisitos del modelo psicoacústico y en una situación de este tipo los codificadores de transformada son propensos a artefactos de trino, desigualdad y de ruido musical.

Aunque los códec de audio completamente paramétricos son muy adecuados para tasas de bits más bajas, son conocidos, sin embargo, por sonido desagradablemente artificial. Además, estos códec no escalan sin problemas a la transparencia perceptual, puesto que un refinamiento gradual del modelo paramétrico bastante aproximado no es factible.

La forma de onda híbrida y la codificación paramétrica podrían potencialmente superar los límites de los enfoques individuales y podrían potencialmente beneficiarse de las propiedades ortogonales mutuas de ambas técnicas. Sin embargo, se ven obstaculizadas, en el estado actual de la técnica, por una carencia de interacción entre la parte de codificación de transformada y la parte paramétrica del códec híbrido. Los problemas se refieren a la división de señal entre la parte de códec paramétrico y de la transformada, presupuesto de bits que se dirigen entre la parte de transformada y la paramétrica, técnicas de señalización de parámetros y unión sin problemas de la salida del códec paramétrico y de transformación.

El objeto de la presente invención es proporcionar conceptos mejorados para codificación y decodificación de audio híbrida. El objeto de la presente invención se resuelve mediante un aparato de acuerdo con la reivindicación 1, un aparato de acuerdo con la reivindicación 12, mediante un método de acuerdo con la reivindicación 29, mediante un método de acuerdo con la reivindicación 30 y mediante un programa informático de acuerdo con la reivindicación 31.

Se proporciona un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio... [Seguir leyendo]

Reivindicaciones:

1. Un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado, en el que el aparato comprende:

una unidad de procesamiento (110) para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, un determinador de pseudo coeficientes (120) para determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral,

una unidad de modificación de espectro (130) para ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado, una unidad de conversión de espectrotiempo (140) para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo, un oscilador controlable (150) para generar una señal de oscilador de dominio de tiempo, estando controlado el

oscilador controlable (150) mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y un mezclador (160) para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.

2. Un aparato de acuerdo con la reivindicación 1, en el que cada uno de los coeficientes espectrales tiene al menos uno de un predecesor inmediato y un sucesor inmediato, en el que el predecesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en la secuencia de coeficientes espectrales, en el que el sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el determinador de pseudo coeficientes (120) está configurado para determinar el uno o más pseudo coeficientes del espectro de señal de audio decodificado determinando al menos un coeficiente espectral de la secuencia que tiene un valor espectral que es diferente del valor predefinido, que tiene un predecesor inmediato el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato el valor espectral del cual es igual al valor predefinido.

3. Un aparato de acuerdo con la reivindicación 2, en el que el valor predefinido es cero.

4. Un aparato de acuerdo con la reivindicación 2 o 3, en el que el determinador de pseudo coeficientes (120) está configurado para determinar el uno o más pseudo

coeficientes del espectro de señal de audio decodificado determinando el al menos un coeficiente espectral de la secuencia como un pseudo coeficiente candidato, que tiene un predecesor inmediato, el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, y en el que el determinador de pseudo coeficientes (120) está configurado para determinar si el pseudo coeficiente candidato es un pseudo coeficiente determinando si la información lateral indica que dicho pseudo coeficiente 45 candidato es un pseudo coeficiente.

5. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo que tiene una frecuencia de señal de oscilador de modo que la frecuencia de señal del oscilador de la señal del oscilador depende de la localización espectral de 50 uno del uno o más pseudo coeficientes.

6. Un aparato de acuerdo con la reivindicación 5, en el que los pseudo coeficientes son valores con signo, comprendiendo cada uno un componente de signo, y en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo de 55 modo que la frecuencia de señal del oscilador de la señal del oscilador depende adicionalmente del componente de signo de uno del uno o más pseudo coeficientes de modo que la frecuencia de señal del oscilador tiene un primer valor de frecuencia, cuando el componente de signo tiene un primer valor de signo, y de modo que la frecuencia de señal del oscilador tiene un segundo valor de frecuencia diferente, cuando el componente de signo tiene un segundo valor diferente.

7. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo, en el que la amplitud de la señal del oscilador depende del valor espectral de uno del uno o más pseudo coeficientes, de modo que la amplitud de la señal del oscilador tiene un primer valor de amplitud cuando el valor espectral tiene un tercer valor, y de modo que la amplitud

de la señal del oscilador tiene un segundo valor de amplitud diferente cuando el valor espectral tiene un cuarto valor diferente, siendo el segundo valor de amplitud mayor que el primer valor de amplitud, cuando el cuarto valor es mayor que el tercer valor.

8. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está controlado adicionalmente mediante uno o más parámetros extrapolados obtenidos desde un pseudo coeficiente de una trama anterior.

9. Un aparato de acuerdo con una de las reivindicaciones anteriores,

en el que el espectro de señal de audio modificado es un espectro de MDCT, que comprende coeficientes de MDCT, y en el que en la unidad de conversión de espectrotiempo (140) está configurada para convertir el espectro de MDCT desde un dominio de MDCT al dominio de tiempo convirtiendo al menos algunos de los coeficientes del espectro de señal de audio decodificado al dominio de tiempo.

10. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el mezclador (160) está configurado para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo añadiendo la señal de conversión de dominio de tiempo a la señal de oscilador de dominio de tiempo en el dominio de tiempo.

11. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la señal de oscilador de dominio de tiempo generada mediante el oscilador controlable (150) es una primera señal de oscilador de dominio de tiempo, en el que el aparato comprende adicionalmente uno o más osciladores controlables (252, 254, 256) adicionales para generar una o más señales de oscilador de dominio de tiempo adicionales, en el que cada uno del uno o más osciladores controlables (252, 254, 256) adicionales está configurado para generar una de la una o más señales de oscilador de dominio de tiempo adicionales, en el que cada uno de los osciladores controlables (252, 254, 256) adicionales está controlado mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y en el que el mezclador (160) está configurado para mezclar la primera señal de oscilador de dominio de tiempo, la una o más señales de oscilador de dominio de tiempo adicionales y la señal de conversión de dominio de tiempo para obtener la señal de salida de audio.

12. Un aparato para codificar un espectro de entrada de señal de audio de una señal de audio, comprendiendo el espectro de entrada de señal de audio una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de entrada de señal de audio, un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y uno o más sucesores, en el que cada uno de los predecesores de dicho coeficiente espectral

es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia, en el que cada uno de los sucesores de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia, y en el que el aparato comprende:

un determinador de extremos (410) para determinar uno o más coeficientes de extremo,

un modificador de espectro (420) para modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral de al menos uno de los predecesores o al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido, en el que el modificador de espectro (420) está configurado para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más 50 coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido, una unidad de procesamiento (430) para procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado, y un generador de información lateral (440) para generar y transmitir información lateral, en el que el generador de 55 información lateral (440) está configurado para localizar uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado generado mediante el modificador de espectro (420) , en el que el generador de información lateral (440) está configurado para seleccionar al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y en el que el generador de información lateral (440) está configurado para generar la información lateral de modo que la información lateral indica los candidatos 60 seleccionados como los pseudo coeficientes, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de al menos uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de al menos uno de sus sucesores, o

en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus predecesores y el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus sucesores.

13. Un aparato de acuerdo con la reivindicación 12, en el que el generador de información lateral (440) está

configurado para transmitir el tamaño de la información lateral. 10

14. Un aparato de acuerdo con la reivindicación 12 o 13, en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de señal de audio se dejan sin modificar en el espectro de señal de audio modificado.

15. Un aparato de acuerdo con una de las reivindicaciones 12 a 14, en el que cada uno de los coeficientes espectrales tiene al menos uno de un predecesor inmediato como uno de sus predecesores y un sucesor inmediato como uno de sus sucesores, en el que el predecesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio para obtener el espectro de señal de audio modificado ajustando el valor espectral del predecesor inmediato o el sucesor inmediato de al menos uno de los coeficientes de extremo al valor predefinido, en el que el modificador de espectro (420) está configurado para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido, y en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del

cual es mayor que el valor espectral de su predecesor inmediato y el valor espectral del cual es mayor que el valor espectral de su sucesor inmediato, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de su predecesor inmediato y el valor de comparación del cual es mayor que el valor de comparación de su sucesor inmediato.

16. Un aparato de acuerdo con la reivindicación 15, en el que el determinador de extremos (410) está configurado para determinar uno o más coeficientes mínimos, de

modo que cada uno del uno o más coeficientes mínimos es uno de los coeficientes espectrales el valor espectral del cual es más pequeño que el valor espectral de uno de sus predecesores y el valor espectral del cual es más pequeño que el valor espectral de uno de sus sucesores, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes mínimos, de modo que cada uno de los coeficientes mínimos 45 es uno de los coeficientes espectrales el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus predecesores y el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus sucesores, y en el que el modificador de espectro (420) está configurado para determinar un valor de representación basándose en los valores espectrales o los valores de comparación de uno o más de los coeficientes de extremos y uno o más 50 de los coeficientes mínimos, de modo que el valor de representación es diferente del valor predefinido, y en el que el modificador de espectro (420) está configurado para cambiar el valor espectral de uno de los coeficientes del espectro de entrada de señal de audio ajustando dicho valor espectral al valor de representación.

17. Un aparato de acuerdo con la reivindicación 16,

en el que el modificador de espectro (420) está configurado para determinar, si una diferencia de valor entre uno del valor de comparación o del valor espectral de uno de los coeficientes de extremo es más pequeño que un valor umbral, y en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de 60 señal de audio se dejan sin modificar en el espectro de señal de audio modificado dependiendo de si la diferencia de valor es más pequeña que el valor umbral.

18. Un aparato de acuerdo con la reivindicación 16 o 17, en el que el determinador de extremos (410) está configurado para determinar una o más subsecuencias de la

secuencia de valores espectrales, de modo que cada una de las subsecuencias comprende una pluralidad de coeficientes espectrales posteriores al espectro de entrada de señal de audio, estando secuencialmente ordenados los coeficientes espectrales posteriores en la subsecuencia de acuerdo con su posición espectral, en el que cada una de las subsecuencias tiene un primer elemento que es el primero en dicha subsecuencia secuencialmente ordenada y un último elemento que es el último en dicha subsecuencia secuencialmente ordenada, en el que cada una de las subsecuencias comprende exactamente dos de los coeficientes mínimos y exactamente uno de los coeficientes de extremo, siendo uno de los coeficientes mínimos el primer elemento de la subsecuencia, siendo el otro de los coeficientes mínimos el último elemento de la subsecuencia, y en el que el modificador de espectro (420) está configurado para determinar el valor de representación basándose en los valores espectrales o los valores de comparación de los coeficientes de una de las subsecuencias, y en el que el modificador de espectro (420) está configurado para cambiar el valor espectral de uno de los coeficientes de dicha subsecuencia ajustando dicho valor espectral al valor de representación.

19. Un aparato de acuerdo con la reivindicación 18, en el que el modificador de espectro (420) está configurado para determinar el valor de representación determinando una suma de los cuadrados de los valores de comparación de los coeficientes de dicha una de la subsecuencias.

20. Un aparato de acuerdo con la reivindicación 18 o 19, en el que el determinador de extremos (410) está configurado para determinar un coeficiente de centro de gravedad

determinando el producto del valor de comparación y el valor de localización para cada coeficiente espectral de la subsecuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores de comparación de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más cercano en el resultado intermedio para obtener el

coeficiente del centro de gravedad, y en el que el modificador de espectro (420) está configurado para establecer los valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido, o en el que el determinador de extremos (410) está configurado para determinar un coeficiente de centro de gravedad determinando el producto del valor espectral y el valor de localización para cada coeficiente espectral de la sub

secuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores espectrales de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más cercano en el resultado intermedio para obtener el coeficiente del centro de gravedad, y en el que el modificador de espectro (420) está configurado para establecer los valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido.

21. Un aparato de acuerdo con una de las reivindicaciones 12 a 20, en el que el valor predefinido es cero.

22. Un aparato de acuerdo con una de las reivindicaciones 12 a 21, en el que el valor de comparación de cada coeficiente espectral es un valor cuadrado de un coeficiente adicional de un espectro adicional que resulta de una transformación de conservación de energía de la señal de audio.

23. Un aparato de acuerdo con una de las reivindicaciones 12 a 22, en el que el valor de comparación de cada 45 coeficiente espectral es un valor de amplitud de un coeficiente adicional de un espectro adicional que resulta de una transformación de conservación de energía de la señal de audio.

24. Un aparato de acuerdo con una de las reivindicaciones 12 a 23, en el que el espectro adicional es un espectro de la Transformada Modificada Discreta del Coseno Compleja, y en el que la transformación de conservación de 50 energía es una Transformada Modificada Discreta del Coseno Compleja.

25. Un aparato de acuerdo con una de las reivindicaciones 12 a 24, en el que el modificador de espectro (420) está configurado para recibir información de ajuste fino, en el que los coeficientes espectrales del espectro de entrada de señal de audio son valores con signo, comprendiendo cada uno 55 un componente de signo, en el que el modificador de espectro (420) está configurado para establecer el componente de signo del valor espectral de uno del uno o más coeficientes de extremo o del pseudo coeficiente a un primer valor de signo, cuando la información de ajuste fino está en un primer estado de ajuste fino para obtener el espectro de señal de audio modificado, y

en el que el modificador de espectro (420) está configurado para establecer el componente de signo del valor espectral de uno del uno o más coeficientes de extremo o del pseudo coeficiente a un segundo valor de signo diferente, cuando la información de ajuste fino está en un segundo estado de ajuste fino diferente para obtener el espectro de señal de audio modificado.

26. Un aparato de acuerdo con una de las reivindicaciones 12 a 25, en el que el espectro de entrada de señal de audio es un espectro de MDCT que comprende coeficientes de MDCT.

27. Un aparato de acuerdo con una de las reivindicaciones 12 a 26,

en el que la unidad de procesamiento (430) está configurada para cuantificar el espectro de señal de audio modificado para obtener un espectro de señal de audio cuantificado, en el que la unidad de procesamiento (430) está configurada adicionalmente para procesar el espectro de señal de audio cuantificado para obtener un espectro de señal de audio codificado, en el que la unidad de procesamiento (430) está configurada adicionalmente para generar información lateral que indica únicamente aquellos coeficientes espectrales del espectro de señal de audio cuantificado que tienen un predecesor inmediato el valor espectral del cual es igual al valor predefinido y un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo, en el que el predecesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que precede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado, y en el que el sucesor

inmediato de dicho coeficiente espectral es otro coeficiente espectral que sucede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado.

28. Un aparato de acuerdo con una de las reivindicaciones 12 a 27, en el que el modificador de espectro (420) está configurado para sustituir uno de los coeficientes de extremo mediante un pseudo coeficiente que tiene un valor

espectral obtenido desde el valor espectral o el valor de comparación de dicho coeficiente de extremo, desde el valor espectral o el valor de comparación de dicho coeficiente de extremo de uno de los predecesores de dicho coeficiente de extremo o desde el valor espectral o el valor de comparación de dicho coeficiente de extremo de uno de los sucesores de dicho coeficiente de extremo.

29. Un método para generar una señal de salida de audio basándose en un espectro de señal de audio codificado, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, y en el que el método comprende:

procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral,

ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado, convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo, generar una señal de oscilador de dominio de tiempo mediante un oscilador controlable que está controlado mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y

mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.

30. Un método para codificar un espectro de entrada de señal de audio, comprendiendo el espectro de entrada de señal de audio una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene 45 una localización espectral en el espectro de entrada de señal de audio, un valor espectral y un valor de comparación, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y uno o más sucesores, en el que cada uno de los predecesores de dicho coeficiente 50 espectral es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia, en el que cada uno de los sucesores de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia, y en el que el método comprende:

determinar uno o más coeficientes de extremo,

modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral de al menos uno de los predecesores o al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido, en el que modificar el espectro de entrada de señal de audio se realiza no ajustando los valores espectrales del uno o más coeficientes de extremo al valor predefinido,

o sustituyendo al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el

valor espectral del pseudo coeficiente es diferente del valor predefinido, procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado, y generar y transmitir información lateral, en el que la información lateral se genera localizando uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado, en el que la información lateral se genera seleccionando al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y

en el que la información lateral se genera de modo que la información lateral indica los candidatos seleccionados como los pseudo coeficientes, en el que se determinan el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de al

menos uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de al menos uno de sus sucesores, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que se determinan el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el

valor de comparación de al menos uno de sus predecesores y el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus sucesores.

31. Un programa informático para implementar el método de la reivindicación 29 o 30 cuando se ejecuta en un ordenador o procesador de señal. 15

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Predicción basada en modelo en un banco de filtros, del 1 de Enero de 2020, de DOLBY INTERNATIONAL AB: Un método en un decodificador para estimar una muestra de una señal de subbanda a partir de dos o más muestras anteriores de […]

Postprocesador, preprocesador, codificador de audio, decodificador de audio y métodos relacionados para mejorar el procesamiento de transitorios, del 4 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Postprocesador de audio para post-procesar una señal de audio que contiene información de ganancia de alta frecuencia variable […]

Métodos de descodificación de audio, descodificadores de audio, y programa y soporte de registro correspondientes, del 25 de Septiembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de descodificación de señal de audio que comprende: una etapa de descodificación de información de predicción a largo plazo de un código de periodo de tono […]

Dispositivo de codificación de audio de voz, dispositivo de decodificación de audio de voz, procedimiento de codificación de audio de voz y procedimiento de decodificación de audio de voz, del 25 de Septiembre de 2019, de Panasonic Intellectual Property Corporation of America: Un aparato de codificación de voz/audio que comprende: una sección de transformación de tiempo/frecuencia que está adaptada para transformar […]

Codificación de audio en base a una representación eficiente de coeficientes autorregresivos, del 10 de Julio de 2019, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un codificador para codificar una representación espectral paramétrica (f) de coeficientes autorregresivos (a) que representan parcialmente una señal de […]