Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica.
Un sistema de codificador, configurado para codificar una señal estéreo en una señal de flujo de bits (6),
comprendiendo el sistema de codificador:
- un medio de mezclado descendente (8) configurado para generar una señal de mezclado descendente y una señalresidual en base a la señal estéreo;
- un medio de determinación de parámetros (9) configurado para determinar uno o más parámetros estéreoparamétricos (5);
- medios de codificación perceptual (2, 3) aguas abajo del medio de mezclado descendente (8), donde los medios decodificación perceptual (2, 3) están configurados para seleccionar:
* codificación en base a una suma de la señal de mezclado descendente y la señal residual y en base a unadiferencia de la señal de mezclado descendente y la señal residual, o
* codificación en base a la señal de mezclado descendente y en base a la señal residual,de manera variable en frecuencia o invariable en frecuencia.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2010/052866.
Solicitante: DOLBY INTERNATIONAL AB.
Nacionalidad solicitante: Países Bajos.
Dirección: Apollo Building, 3E, Herikerbergweg 1-35 1101 CN Amsterdam Zuid-Oost PAISES BAJOS.
Inventor/es: KJORLING, KRISTOFER, PURNHAGEN,HEIKO, CARLSSON,PONTUS.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
PDF original: ES-2415155_T3.pdf
Fragmento de la descripción:
Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica 5
Campo técnico La solicitud se refiere a la codificación de audio, en particular a la codificación de audio estéreo que combina técnicas de codificación paramétricas y basadas en formas de onda.
Antecedentes de la invención La codificación conjunta de los canales izquierdo (L) y derecho (R) de una señal estéreo permite una codificación más eficaz en comparación con la codificación independiente de L y R. Un enfoque habitual de la codificación estéreo conjunta es la codificación central/lateral (M/S) . En este caso, una señal central (M) se forma sumando las señales L y R, por ejemplo la señal M puede tener la forma Además, una señal lateral (S) se forma restando los dos canales L y R, por ejemplo la señal S puede tener la forma En caso de codificación M/S, las señales M y S se codifican en lugar de las señales L y R.
En la norma AAC (Codificación de Audio Avanzada) de MPEG (Grupo de Expertos en Imágenes en Movimiento) (véase documento normativo ISO/IEC 13818-7) , la codificación estéreo L/R y la codificación estéreo M/S pueden elegirse de manera variable en el tiempo y variable en frecuencia. Por tanto, el codificador estéreo puede aplicar codificación L/R para algunas bandas de frecuencias de la señal estéreo, mientras que la codificación M/S se utiliza para codificar otras bandas de frecuencias de la señal estéreo (variante de frecuencia) . Además, el codificador puede conmutar en el tiempo entre codificación L/R y M/S (variante de tiempo) . En la norma AAC de MPEG, la codificación estéreo se lleva a cabo en el dominio de frecuencia, más en particular en el dominio MDCT (transformada de coseno discreta modificada) . Esto permite elegir de manera adaptativa la codificación L/R o la codificación M/S de manera variable en frecuencia y también de manera variable en el tiempo. La decisión entre la codificación estéreo L/R y M/S puede basarse en una evaluación de la señal lateral: cuando la energía de la señal lateral es baja, la codificación estéreo M/S es más eficaz y debería utilizarse. Como alternativa, para decidir entre ambos esquemas de codificación estéreo, ambos esquemas de codificación pueden probarse y la selección puede basarse en los esfuerzos de cuantificación resultantes, es decir, la entropía perceptual observada.
Un enfoque alternativo a la codificación estéreo conjunta es la codificación estéreo paramétrica (PS) . En este caso, la señal estéreo se proporciona como una señal mono de mezclado descendente (downmix) después de codificar la señal de mezclado descendente con un codificador de audio convencional, tal como un codificador AAC. La señal de mezclado descendente es una superposición de los canales L y R. La señal mono de mezclado descendente se proporciona en combinación con parámetros PS adicionales variables en el tiempo y variables en frecuencia, tales 45 como la diferencia de intensidad entre canales (es decir, entre L y R) (IID) y la correlación cruzada entre canales (ICC) . En el descodificador, en función de la señal de mezclado descendente descodificada y de los parámetros estéreo paramétricos, se reconstruye una señal estéreo que se aproxima a la imagen estéreo perceptual de la señal estéreo original. Para la reconstrucción, un descorrelador genera una versión descorrelacionada de la señal de mezclado descendente. Este descorrelador puede implementarse mediante un filtro de todo paso apropiado. La codificación y descodificación PS se describen en el documento “Low Complexity Parametric Stereo Coding in MPEG-4”, H. Purnhagen, Actas de la séptima Conferencia Internacional sobre Efectos de Audio Digitales (DAFx’04) , Nápoles, Italia, del 5 al 8 de octubre de 2004, páginas 163 a 168. La descripción de este documento se incorpora por la presente como referencia.
La norma MPEG Surround (véase el documento ISO/IEC 23003-1) utiliza el concepto de codificación PS. En un descodificador MPEG Surround se crea una pluralidad de canales de salida en función de menos canales de entrada y parámetros de control. Los descodificadores y codificadores MPEG Surround se fabrican conectando en cascada módulos estéreo paramétricos, que en MPEG Surround se denominan módulos OTT (módulos uno a dos) para el descodificador y módulos R-OTT (módulos inversos uno a dos) para el codificador. Un módulo OTT determina dos canales de salida mediante un único canal de entrada (señal de mezclado descendente) acompañado de parámetros PS. Un módulo OTT corresponde a un descodificador PS y un módulo R-OTT corresponde a un codificador PS. La codificación estéreo paramétrica puede llevarse a cabo usando MPEG Surround con un único módulo OTT en el lado del descodificador y un único módulo R-OTT en el lado del codificador; esto también se denomina modo “MPEG Surround 2-1-2”. La sintaxis del flujo de bits puede ser diferente, pero la teoría subyacente y
el procesamiento de señales son los mismos. Por lo tanto, en lo sucesivo, todas las referencias a PS incluyen también codificación estéreo paramétrica basada en “MPEG Surround 2-1-2” o en MPEG Surround.
En un codificador PS (por ejemplo, en un codificador PS MPEG Surround) una señal residual (RES) puede determinarse y transmitirse además de la señal de mezclado descendente. Tal señal residual indica el error asociado a representar los canales originales mediante sus parámetros de mezclado descendente y PS. En el descodificador, la señal residual puede usarse en lugar de la versión descorrelacionada de la señal de mezclado descendente. Esto permite una mejor reconstrucción de las formas de onda de los canales originales L y R. La utilización de una señal residual adicional se describe, por ejemplo, en la norma MPEG Surround (véase el documento ISO/IEC 23003-1) y en el documento “MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding”, de J. Herre et al., documento 7084 de la Convención de Ingeniería de Audio, Convención n.º 122, del 5 al 8 de mayo de 2007. La descripción de ambos documentos, en particular las observaciones acerca de la señal residual, se incorporan en el presente documento como referencia.
La codificación PS con señales residuales es un enfoque más general a la codificación estéreo conjunta que la codificación M/S: la codificación M/S lleva a cabo una rotación de señal cuando transforma las señales L/R en señales M/S. Además, la codificación PS con señales residuales lleva a cabo una rotación de señal cuando transforma las señales L/R en señales de mezclado descendente y residuales. Sin embargo, en el segundo caso, la rotación de señal es variable y depende de los parámetros PS. Debido al enfoque más general de la codificación PS con señales residuales, la codificación PS con señales residuales permite una codificación más eficaz de determinados tipos de señales, como una señal mono panoramizada, que la codificación M/S. Por tanto, el codificador propuesto permite combinar de manera eficaz técnicas de codificación estéreo paramétricas y técnicas de codificación estéreo basadas en formas de onda. Un primer diseño de una posible combinación de la codificación PS con señales residuales y del codificador estéreo perceptual AAC MPEG se ilustra en el documento “MPEG-4 high-efficiency AAC coding - standards in a nutshell”, de J. Herre et al., IEEE Signal Processing Magazine, volumen 25, mayo de 2008, páginas 137 a 142.
Normalmente, los codificadores estéreo perceptuales, tales como un codificador estéreo perceptual AAC MPEG, pueden decidir entre codificación estéreo L/R y codificación estéreo M/S, donde en el segundo caso, una señal central/lateral se genera en función de la señal estéreo. Tal selección puede variar en frecuencia, es decir, para algunas bandas de frecuencias puede usarse codificación estéreo L/R, mientras que para otras bandas de frecuencias puede usarse codificación estéreo M/S.
En una situación en la que los canales L y R son básicamente señales independientes, tal codificador estéreo perceptual no usará normalmente codificación estéreo M/S, ya que en esta situación tal esquema de codificación no ofrece ninguna ganancia de codificación en comparación con la codificación estéreo L/R. El codificador volverá a la codificación estéreo L/R sencilla, básicamente procesando L y R de manera independiente.
En la misma situación, un sistema de codificador PS creará una señal de mezclado descendente que contiene los canales L y R, lo que impide procesar... [Seguir leyendo]
Reivindicaciones:
1. Un sistema de codificador, configurado para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el sistema de codificador: 5
- un medio de mezclado descendente (8) configurado para generar una señal de mezclado descendente y una señal residual en base a la señal estéreo;
-un medio de determinación de parámetros (9) configurado para determinar uno o más parámetros estéreo paramétricos (5) ;
- medios de codificación perceptual (2, 3) aguas abajo del medio de mezclado descendente (8) , donde los medios de codificación perceptual (2, 3) están configurados para seleccionar:
• codificación en base a una suma de la señal de mezclado descendente y la señal residual y en base a una diferencia de la señal de mezclado descendente y la señal residual, o • codificación en base a la señal de mezclado descendente y en base a la señal residual, de manera variable en frecuencia o invariable en frecuencia. 2. El sistema de codificador según la reivindicación 1, en el que los medios de codificación perceptual (2, 3)
comprenden.
25. un medio de transformación (2) configurado para realizar una transformación en base a la señal de mezclado descendente y la señal residual, generándose así una señal seudoestéreo izquierda/derecha; y
- un codificador perceptual (3, 48) configurado para codificar la señal seudoestéreo izquierda/derecha, donde el codificador perceptual (3, 48) está configurado para seleccionar:
• codificación perceptual izquierda/derecha, o • codificación perceptual central/lateral, 35 de manera variable en frecuencia o invariable en frecuencia.
3. El sistema de codificador según cualquiera de las reivindicaciones anteriores, en el que el sistema de codificador está configurado para seleccionar de manera variable en frecuencia o invariable en frecuencia entre:
- codificación estéreo paramétrica de la señal estéreo en la señal de flujo de bits (6) , o
- codificación izquierda/derecha de la señal estéreo en la señal de flujo de bits (6) ,
donde el sistema de codificador comprende además medios de desactivación configurados para desactivar de 45 manera eficaz la codificación estéreo paramétrica de manera variable en frecuencia o invariable en frecuencia.
4. El sistema de codificador según la reivindicación 2, en el que el sistema de codificador comprende, además del codificador perceptual (3, 48) , un segundo codificador (71) basado en un análisis predictivo lineal, y el sistema de codificador está configurado de manera que en un primer modo el codificador perceptual (3, 48) se usa para la codificación y en un segundo modo el segundo codificador (71) se usa para la codificación.
5. Un sistema de codificador, configurado para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el sistema de codificador:
- un medio de mezclado descendente (8) configurado para generar una señal de mezclado descendente y una señal residual en función de la señal estéreo;
-un medio de determinación de parámetros (9) configurado para determinar uno o más parámetros estéreo paramétricos;
- un medio de transformación (2) configurado para realizar una transformación en base a la señal de mezclado descendente y la señal residual, generándose así una señal seudoestéreo izquierda/derecha; y
- un codificador estéreo perceptual (3) configurado para codificar la señal seudoestéreo izquierda/derecha, donde el 65 codificador estéreo perceptual (3) está configurado para seleccionar:
• codificación perceptual izquierda/derecha, o
• codificación perceptual central/lateral,
de manera variable en frecuencia o invariable en frecuencia.
6. Un sistema de descodificador, configurado para descodificar una señal de flujo de bits que incluye uno o más parámetros estéreo paramétricos (5) en una señal estéreo, comprendiendo el sistema de descodificador:
- medios de descodificación perceptual (11, 12) configurados para descodificar en función de la señal de flujo de bits (6) , donde los medios de descodificación (11, 12) están configurados para generar, descodificando una primera señal y una segunda señal, y proporcionar una señal de mezclado descendente y una señal residual, donde los medios de descodificación (11, 12) están configurados para seleccionar la señal de mezclado descendente y la señal residual:
• en base a una suma de la primera señal y de la segunda señal y en función de una diferencia de la primera señal y de la segunda señal, o
• en base a una primera señal y basada en la segunda señal,
de manera variable en frecuencia o invariable en frecuencia; y
- un medio de mezclado ascendente (13) configurado para generar la señal estéreo en base a la señal de mezclado
descendente y la señal residual, donde la operación de mezclado ascendente del medio de mezclado ascendente 25 depende del uno o más parámetros estéreo paramétricos (5) .
7. El sistema de descodificador según la reivindicación 6, en el que los medios de descodificación perceptual (11, 12) comprenden:
- un descodificador estéreo perceptual (11) configurado para descodificar basada en la señal de flujo de bits (6) , generando el descodificador una señal seudoestéreo, donde el descodificador está configurado para realizar de manera selectiva:
• descodificación perceptual izquierda/derecha, o 35
• descodificación perceptual central/lateral,
de manera variable en frecuencia o invariable en frecuencia; y
- un medio de transformación (12) configurado para realizar una transformación en base a la señal seudoestéreo, generándose así la señal de mezclado descendente y la señal residual.
8. El sistema de descodificador según cualquiera de las reivindicaciones 5 a 7, en el que los parámetros estéreo paramétricos (5) comprenden:
- un parámetro variable en frecuencia o invariable en frecuencia que indica una diferencia de intensidad entre canales, y
- un parámetro variable en frecuencia o invariable en frecuencia que indica una correlación cruzada entre canales.
5.
9. El sistema de descodificador según cualquiera de las reivindicaciones 5 a 8, en el que, en caso de que el canal izquierdo de la señal estéreo y el canal derecho de la señal estéreo sean independientes y tengan el mismo nivel para una banda de frecuencias, la operación de mezclado ascendente puede describirse según la siguiente ecuación:
en la que L denota una componente de banda de frecuencias del canal izquierdo de la señal estéreo, R denota una componente de banda de frecuencias del canal derecho de la señal estéreo, DMX denota una componente de banda 60 de frecuencias de la señal de mezclado descendente, RES denota una componente de banda de frecuencias de la señal residual y c es un factor.
10. Un sistema de descodificador, configurado para descodificar una señal de flujo de bits (6) que incluye uno o más parámetros estéreo paramétricos (5) en una señal estéreo, comprendiendo el sistema de descodificación:
- un descodificador estéreo perceptual (11) configurado para descodificar en base a la señal de flujo de bits (6) ,
generando el descodificador una señal seudoestéreo, donde el descodificador está configurado para realizar de manera selectiva:
• descodificación perceptual izquierda/derecha, o • descodificación perceptual central/lateral, de manera variable en frecuencia o invariable en frecuencia;
-un medio de transformación de izquierda/derecha a central/lateral (12) configurado para realizar una
transformación de izquierda/derecha a central/lateral en función de la señal seudoestéreo, generándose así una señal de mezclado descendente y una señal residual; y
- un medio de mezclado ascendente (13) configurado para generar la señal estéreo en base a la señal de mezclado
descendente y la señal residual, donde la operación de mezclado ascendente del medio de mezclado ascendente 20 depende del uno o más parámetros estéreo paramétricos (5) .
11. Un método para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el método:
- generar una señal de mezclado descendente y una señal residual en base a la señal estéreo; 25
- determinar uno o más parámetros estéreo paramétricos (5) ;
- codificar de manera perceptual aguas abajo de la generación de la señal de mezclado descendente y la señal
residual, donde: 30
• codificación basada en una suma de la señal de mezclado descendente y la señal residual y basada en una diferencia de la señal de mezclado descendente y la señal residual, o
• codificación basada en la señal de mezclado descendente y basada en la señal residual,
puede seleccionarse de manera variable en frecuencia o invariable en frecuencia.
12. Un método para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el método:
- generar una señal de mezclado descendente y una señal residual en base a la señal estéreo;
- determinar uno o más parámetros estéreo paramétricos (5) ;
- generar una señal seudoestéreo izquierda/derecha realizando una transformación en base a la señal de mezclado 45 descendente y la señal residual; y
-realizar una codificación estéreo perceptual de la señal seudoestéreo izquierda/derecha, donde:
• codificación perceptual izquierda/derecha, o 50
• codificación perceptual central/lateral, puede seleccionarse de manera variable en frecuencia o invariable en frecuencia.
13. Un método para descodificar una señal de flujo de bits (6) que incluye parámetros estéreo paramétricos (5) en una señal estéreo, comprendiendo el método:
- descodificar de manera perceptual en base a la señal de flujo de bits (6) , donde una primera señal y una segunda señal se generan mediante descodificación y una señal de mezclado descendente y una señal residual se
proporcionan después de la descodificación perceptual, estando, de manera selectiva, la señal de mezclado descendente y la señal residual:
• basadas en la suma de la primera señal y de la segunda señal y basadas en la diferencia de la primera señal y de la segunda señal, o 65
-basadas en la primera señal y basadas en la segunda señal,
de manera variable en frecuencia o invariable en frecuencia; y
- generar la señal estéreo basándose en la señal de mezclado descendente y la señal residual mediante una operación de mezclado ascendente, donde la operación de mezclado ascendente depende de los parámetros estéreo paramétricos (5) .
14. El método según la reivindicación 13, en el que la descodificación perceptual en base a la señal de flujo de bits 10 (6) comprende:
- realizar una descodificación estéreo perceptual en base a la señal de flujo de bits (6) para generar una señal seudoestéreo, donde:
• descodificación perceptual izquierda/derecha, o • descodificación perceptual central/lateral,
puede seleccionarse de manera variable en frecuencia o invariable en frecuencia; y 20
- generar una señal de mezclado descendente y una señal residual realizando una transformación en función de la señal seudoestéreo.
15. Un método para descodificar una señal de flujo de bits (6) que incluye parámetros estéreo paramétricos (5) en 25 una señal estéreo, comprendiendo el método:
- realizar una descodificación estéreo perceptual en base a la señal de flujo de bits (6) para generar una señal seudoestéreo, donde:
• descodificación perceptual izquierda/derecha o • descodificación perceptual central/lateral,
puede seleccionarse de manera variable en frecuencia o invariable en frecuencia; 35
- generar una señal de mezclado descendente y una señal residual realizando una transformación en base a la señal seudoestéreo; y
- generar la señal estéreo en base a la señal de mezclado descendente y la señal residual mediante una operación
de mezclado ascendente, donde la operación de mezclado ascendente depende de los parámetros estéreo paramétricos (5) .
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]