Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica.
Un sistema de codificador, configurado para codificar una señal estéreo en una señal de flujo de bits (6),
comprendiendo el sistema de codificador:
- un medio de mezclado descendente (8) configurado para generar una señal de mezclado descendente y una señal residual en base a la señal estéreo;
- un medio de determinación de parámetros (9) configurado para determinar uno o más parámetros estéreo paramétricos (5);
- medios de codificación perceptual (2, 3) aguas abajo del medio de mezclado descendente (8), donde los medios de codificación perceptual (2, 3) están configurados para seleccionar de manera variable en frecuencia o invariable en frecuencia:
- codificación en base a una suma de la señal de mezclado descendente y la señal residual y en base a una diferencia de la señal de mezclado descendente y la señal residual, o
- codificación en base a la señal de mezclado descendente y en base a la señal residual,
en el que los medios de codificación perceptual (2, 3) comprenden:
- un medio de transformación (2) configurado para realizar una transformación de suma y diferencia en función de la señal de mezclado descendente y la señal residual para generar una señal seudoestéreo izquierda/derecha para una o más o todas las bandas de frecuencias usadas; y
- los medios de decisión para decidir entre codificación perceptual izquierda/derecha y codificación perceptual central/lateral de manera variable en frecuencia o invariable en frecuencia; en el que
- la codificación basada en la señal de mezclado descendente y la señal residual se selecciona cuando los medios de decisión seleccionan la codificación perceptual central/lateral, y
- la codificación basada en la suma y diferencia se selecciona cuando los medios de decisión seleccionan la codificación perceptual izquierda/derecha.
Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E13166660.
Solicitante: DOLBY INTERNATIONAL AB.
Inventor/es: PURNHAGEN,HEIKO, KJOERLING,KRISTOFER, CARLSSON,PONTUS.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L19/008 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Codificación de señales de audio multicanalde o de decodificación mediante la correlación entre canales para reducir la redundancia, p. ej. estéreo conjunto, codificación de la intensidad o matrizado.
- G10L19/18 G10L 19/00 […] › Codificadores de voz que utilizan modos múltiples.
PDF original: ES-2519415_T3.pdf
Fragmento de la descripción:
Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
Campo técnico
La solicitud se refiere a la codificación de audio, en particular a la codificación de audio estéreo que combina técnicas de codificación paramétricas y basadas en formas de onda.
Antecedentes de la invención
La codificación conjunta de los canales izquierdo (L) y derecho (R) de una señal estéreo permite una codificación más eficaz en comparación con la codificación independiente de L y R. Un enfoque habitual de la codificación estéreo conjunta es la codificación central/lateral (M/S). En este caso, una señal central (M) se forma sumando las señales L y R, por ejemplo la señal M puede tener la forma
M = |(£ + tf)
Además, una señal lateral (S) se forma restando los dos canales L y R, por ejemplo la señal S puede tener la forma
S = -(L- R)
En caso de codificación M/S, las señales M y S se codifican en lugar de las señales L y R.
En la norma AAC (Codificación de Audio Avanzada) de MPEG (Grupo de Expertos en Imágenes en Movimiento) (véase documento normativo ISO/IEC 13818-7), la codificación estéreo L/R y la codificación estéreo M/S pueden elegirse de manera variable en el tiempo y variable en frecuencia. Por tanto, el codificador estéreo puede aplicar codificación L/R para algunas bandas de frecuencias de la señal estéreo, mientras que la codificación M/S se utiliza para codificar otras bandas de frecuencias de la señal estéreo (variante de frecuencia). Además, el codificador puede conmutar en el tiempo entre codificación L/R y M/S (variante de tiempo). En la norma AAC de MPEG, la codificación estéreo se lleva a cabo en el dominio de frecuencia, más en particular en el dominio MDCT (transformada de coseno discreta modificada). Esto permite elegir de manera adaptativa la codificación L/R o la codificación M/S de manera variable en frecuencia y también de manera variable en el tiempo. La decisión entre la codificación estéreo L/R y M/S puede basarse en una evaluación de la señal lateral: cuando la energía de la señal lateral es baja, la codificación estéreo M/S es más eficaz y debería utilizarse. Como alternativa, para decidir entre ambos esquemas de codificación estéreo, ambos esquemas de codificación pueden probarse y la selección puede basarse en los esfuerzos de cuantificación resultantes, es decir, la entropía perceptual observada.
Un enfoque alternativo a la codificación estéreo conjunta es la codificación estéreo paramétrica (PS). En este caso, la señal estéreo se proporciona como una señal mono de mezclado descendente (downmix) después de codificar la señal de mezclado descendente con un codificador de audio convencional, tal como un codificador AAC. La señal de mezclado descendente es una superposición de los canales L y R. La señal mono de mezclado descendente se proporciona en combinación con parámetros PS adicionales variables en el tiempo y variables en frecuencia, tales como la diferencia de intensidad entre canales (es decir, entre L y R) (IID) y la correlación cruzada entre canales (ICC). En el descodificador, en función de la señal de mezclado descendente descodificada y de los parámetros estéreo paramétricos, se reconstruye una señal estéreo que se aproxima a la imagen estéreo perceptual de la señal estéreo original. Para la reconstrucción, un descorrelador genera una versión descorrelacionada de la señal de mezclado descendente. Este descorrelador puede ¡mplementarse mediante un filtro de todo paso apropiado. La codificación y descodificación PS se describen en el documento "Low Complexity Parametric Stereo Coding in MPEG-4", H. Purnhagen, Actas de la séptima Conferencia Internacional sobre Efectos de Audio Digitales (DAFx04), Nápoles, Italia, del 5 al 8 de octubre de 2004, páginas 163 a 168.
La norma MPEG Surround (véase el documento ISO/IEC 23003-1) utiliza el concepto de codificación PS. En un descodificador MPEG Surround se crea una pluralidad de canales de salida en función de menos canales de entrada y parámetros de control. Los descodificadores y codificadores MPEG Surround se fabrican conectando en cascada módulos estéreo paramétricos, que en MPEG Surround se denominan módulos OTT (módulos uno a dos) para el descodificador y módulos R-OTT (módulos inversos uno a dos) para el codificador. Un módulo OTT determina dos canales de salida mediante un único canal de entrada (señal de mezclado descendente) acompañado de parámetros PS. Un módulo OTT corresponde a un descodificador PS y un módulo R-OTT corresponde a un
codificador PS. La codificación estéreo paramétrica puede llevarse a cabo usando MPEG Surround con un único módulo OTT en el lado del descodificador y un único módulo R-OTT en el lado del codificador; esto también se denomina modo "MPEG Surround 2-1-2". La sintaxis del flujo de bits puede ser diferente, pero la teoría subyacente y el procesamiento de señales son los mismos. Por lo tanto, en lo sucesivo, todas las referencias a PS incluyen también codificación estéreo paramétrica basada en "MPEG Surround 2-1 -2" o en MPEG Surround.
En un codificador PS (por ejemplo, en un codificador PS MPEG Surround) una señal residual (RES) puede determinarse y transmitirse además de la señal de mezclado descendente. Tal señal residual indica el error asociado a representar los canales originales mediante sus parámetros de mezclado descendente y PS. En el descodificador, la señal residual puede usarse en lugar de la versión descorrelacionada de la señal de mezclado descendente. Esto permite una mejor reconstrucción de las formas de onda de los canales originales L y R. La utilización de una señal residual adicional se describe, por ejemplo, en la norma MPEG Surround (véase el documento ISO/IEC 23003-1) y en el documento "MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding", de J. Herre et al., documento 7084 de la Convención de Ingeniería de Audio, Convención n.° 122, del 5 al 8 de mayo de 2007.
La codificación PS con señales residuales es un enfoque más general a la codificación estéreo conjunta que la codificación M/S: la codificación M/S lleva a cabo una rotación de señal cuando transforma las señales L/R en señales M/S. Además, la codificación PS con señales residuales lleva a cabo una rotación de señal cuando transforma las señales L/R en señales de mezclado descendente y residuales. Sin embargo, en el segundo caso, la rotación de señal es variable y depende de los parámetros PS. Debido al enfoque más general de la codificación PS con señales residuales, la codificación PS con señales residuales permite una codificación más eficaz de determinados tipos de señales, como una señal mono panoramizada, que la codificación M/S. Por tanto, el codificador propuesto permite combinar de manera eficaz técnicas de codificación estéreo paramétricas y técnicas de codificación estéreo basadas en formas de onda.
Normalmente, los codificadores estéreo perceptuales, tales como un codificador estéreo perceptual AAC MPEG, pueden decidir entre codificación estéreo L/R y codificación estéreo M/S, donde en el segundo caso, una señal central/lateral se genera en función de la señal estéreo. Tal selección puede variar en frecuencia, es decir, para algunas bandas de frecuencias puede usarse codificación estéreo L/R, mientras que para otras bandas de frecuencias puede usarse codificación estéreo M/S.
En una situación en la que los canales L y R son básicamente señales independientes, tal codificador estéreo perceptual no usará normalmente codificación estéreo M/S, ya que en esta situación tal esquema de codificación no ofrece ninguna ganancia de codificación en comparación con la codificación estéreo L/R. El codificador volverá a la codificación estéreo L/R sencilla, básicamente procesando L y R de manera independiente.
En la misma situación, un sistema de codificador PS creará una señal de mezclado descendente que contiene los canales L y R, lo que impide procesar de manera independiente los canales L y R. En la codificación PS con una señal residual, esto puede implicar una codificación menos eficaz en comparación con la codificación estéreo, donde la codificación estéreo L/R o la codificación estéreo M/S puede seleccionarse de manera adaptativa.
Por tanto, hay situaciones en las que un codificador PS supera a un codificador estéreo perceptual con selección adaptativa entre codificación estéreo L/R y codificación estéreo M/S, mientras que en otras situaciones, el segundo codificador supera al codificador PS.... [Seguir leyendo]
Reivindicaciones:
1. Un sistema de codificador, configurado para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el sistema de codificador:
- un medio de mezclado descendente (8) configurado para generar una señal de mezclado descendente y una señal residual en base a la señal estéreo;
- un medio de determinación de parámetros (9) configurado para determinar uno o más parámetros estéreo paramétricos (5) ; 10
- medios de codificación perceptual (2, 3) aguas abajo del medio de mezclado descendente (8) , donde los medios de codificación perceptual (2, 3) están configurados para seleccionar de manera variable en frecuencia o invariable en frecuencia:
ï· codificación en base a una suma de la señal de mezclado descendente y la señal residual y en base a una diferencia de la señal de mezclado descendente y la señal residual, o
ï· codificación en base a la señal de mezclado descendente y en base a la señal residual, 20
en el que los medios de codificación perceptual (2, 3) comprenden:
- un medio de transformación (2) configurado para realizar una transformación de suma y diferencia en función de la señal de mezclado descendente y la señal residual para generar una señal seudoestéreo izquierda/derecha para una o más o todas las bandas de frecuencias usadas; y 25
- los medios de decisión para decidir entre codificación perceptual izquierda/derecha y codificación perceptual central/lateral de manera variable en frecuencia o invariable en frecuencia; en el que
- la codificación basada en la señal de mezclado descendente y la señal residual se selecciona cuando los medios 30 de decisión seleccionan la codificación perceptual central/lateral, y
- la codificación basada en la suma y diferencia se selecciona cuando los medios de decisión seleccionan la codificación perceptual izquierda/derecha.
2. El sistema de codificador según la reivindicación 1, en el que el sistema de codificador está configurado para seleccionar de manera variable en frecuencia o invariable en frecuencia entre:
- codificación estéreo paramétrica de la señal estéreo en la señal de flujo de bits (6) , o 40
- codificación izquierda/derecha de la señal estéreo en la señal de flujo de bits (6) .
3. El sistema de codificador según cualquiera de las reivindicaciones anteriores, en el que el medio de codificación perceptual (3) comprende un codificador estéreo basado en AAC (48) .
4. El sistema de codificador según cualquiera de las reivindicaciones anteriores, en el que la codificación perceptual en el medio de codificación perceptual (3) se lleva a cabo en un dominio MDCT críticamente muestreado.
5. El sistema de codificador según cualquiera de las reivindicaciones anteriores, en el que el sistema de codificador comprende además un codificador SBR (32) . 50
6. El sistema de codificador según la reivindicación 5, en el que el codificador SBR (32) está conectado aguas arriba del medio de mezclado descendente (8) .
7. El sistema de codificador según la reivindicación 5, en el que el sistema de codificador funciona en 55
- una primera configuración en la que un codificador SBR (32) está aguas abajo del medio de mezclado descendente (8) , y
- una segunda configuración en la que un codificador SBR (32) está aguas arriba del medio de mezclado 60 descendente (8) ,
en el que el sistema de codificador está configurado para seleccionar la primera configuración o la segunda configuración dependiendo de la velocidad binaria objetivo deseada.
8. Un sistema de descodificador, configurado para descodificar una señal de flujo de bits que incluye uno o más parámetros estéreo paramétricos (5) en una señal estéreo, comprendiendo el sistema de descodificador:
- medios de descodificación perceptual (11, 12) configurados para descodificar en función de la señal de flujo de bits 5 (6) , donde los medios de descodificación (11, 12) están configurados para generar, una primera señal y una segunda señal, y proporcionar una señal de mezclado descendente y una señal residual, donde los medios de descodificación (11, 12) están configurados para seleccionar, de manera variable en frecuencia o invariable en frecuencia, la señal de mezclado descendente y la señal residual:
ï· en base a una suma de la primera señal y de la segunda señal y en función de una diferencia de la primera señal y de la segunda señal, o
ï· en base a una primera señal y basada en la segunda señal;
- un medio de mezclado ascendente (13) configurado para generar la señal estéreo en base a la señal de mezclado descendente y la señal residual, donde la operación de mezclado ascendente del medio de mezclado ascendente depende del uno o más parámetros estéreo paramétricos (5) ; y
- un medio de transformación (12) configurado para realizar una transformación de suma y diferencia en función de 20 la primera señal y la segunda señal para una o más o todas las bandas de frecuencia usadas, en el que los medios de descodificación perceptual (11, 12) comprenden un selector configurado para seleccionar entre descodificación perceptual L/R y descodificación perceptual M/S de manera variable en frecuencia o invariable en frecuencia; en el que 25
- la señal de mezclado descendente y la señal residual se seleccionan para que estén basadas en la suma de la primera señal y de la segunda señal y basadas en la diferencia de la primera señal y de la segunda señal, respectivamente, cuando el selector selecciona descodificación perceptual L/R, y
- la señal de mezclado descendente y la señal residual se seleccionan para que estén basadas en la primera señal y 30 basadas en la segunda señal, respectivamente, cuando el selector selecciona descodificación perceptual M/S.
9. El sistema de descodificación según la reivindicación 8, en el que el sistema de descodificación está configurado para conmutar de manera variable en frecuencia o invariable en frecuencia entre 35
- descodificación estéreo paramétrica de la señal de flujo de bits en la señal estéreo, o
- descodificación izquierda/derecha de la señal de flujo de bits en la señal estéreo.
10. El sistema de descodificación según cualquiera de las reivindicaciones 8 a 9, en el que los medios de 40 descodificación perceptual comprenden un descodificador basado en AAC.
11. El sistema de descodificación según cualquiera de las reivindicaciones 8 a 10, en el que el sistema de descodificación comprende además un descodificador SBR.
12. El sistema de descodificación según la reivindicación 11, en el que el descodificador SBR está situado aguas abajo del medio de mezclado ascendente (13) .
13. El sistema de descodificación según la reivindicación 11, en el que el sistema de descodificación funciona en 50
- una primera configuración en la que un descodificador SBR está aguas arriba del medio de mezclado ascendente (13) , y
- una segunda configuración en la que un descodificador SBR está aguas abajo del medio de mezclado ascendente (13) . 55
en el que el sistema de descodificación está configurado para seleccionar la primera configuración o la segunda configuración en función de información en la señal de flujo de bits (6) .
14. Un método para codificar una señal estéreo en una señal de flujo de bits (6) , comprendiendo el método: 60
- generar una señal de mezclado descendente y una señal residual en base a la señal estéreo;
- determinar uno o más parámetros estéreo paramétricos (5) ;
- codificar de manera perceptual aguas abajo de la generación de la señal de mezclado descendente y la señal residual, donde:
ï· codificación basada en una suma de la señal de mezclado descendente y la señal residual y basada en una diferencia de la señal de mezclado descendente y la señal residual, o 5
ï· codificación basada en la señal de mezclado descendente y basada en la señal residual,
puede seleccionarse de manera variable en frecuencia o invariable en frecuencia;
en el que la codificación perceptual comprende realizar una transformación de suma y diferencia en función de la señal de mezclado descendente y la señal residual para generar una señal seudoestéreo izquierda/derecha para 10 una o más o todas las bandas de frecuencias usadas, y decidir entre codificación perceptual izquierda/derecha y codificación perceptual central/lateral de manera variable en frecuencia o invariable en frecuencia; en el que
- la codificación basada en la señal de mezclado descendente y la señal residual se selecciona cuando se elige la codificación perceptual central/lateral, y 15
- la codificación basada en la suma y diferencia se selecciona cuando se elige la codificación perceptual izquierda/derecha.
15. Un método para descodificar una señal de flujo de bits (6) que incluye parámetros estéreo paramétricos (5) en 20 una señal estéreo, comprendiendo el método:
- descodificar de manera perceptual en base a la señal de flujo de bits (6) , donde una primera señal y una segunda señal se generan y una señal de mezclado descendente y una señal residual se proporcionan después de la descodificación perceptual, estando, de manera selectiva, la señal de mezclado descendente y la señal residual: 25
ï· basadas en una suma de la primera señal y de la segunda señal y basadas en una diferencia de la primera señal y de la segunda señal, o
- basadas en la primera señal y basadas en la segunda señal, 30
de manera variable en frecuencia o invariable en frecuencia; y
- generar la señal estéreo basándose en la señal de mezclado descendente y la señal residual mediante una operación de mezclado ascendente, donde la operación de mezclado ascendente depende de los parámetros 35 estéreo paramétricos (5) ,
en el que que la descodificación perceptual basada en la señal de flujo de bits (6) comprende realizar una transformación de suma y diferencia en función de la primera señal y la segunda señal para una o más o todas las bandas de frecuencia usadas y seleccionar entre la descodificación perceptual L/R y la descodificación perceptual 40 M/S de manera variable en frecuencia o invariable en frecuencia, donde
- la señal de mezclado descendente y la señal residual se seleccionan para que estén basadas en la suma de la primera señal y de la segunda señal y basadas en la diferencia de la primera señal y de la segunda señal, respectivamente, cuando se selecciona la descodificación perceptual L/R, y 45
- la señal de mezclado descendente y la señal residual se seleccionan para que estén basadas en la primera señal y basadas en la segunda señal, respectivamente, cuando se selecciona la descodificación perceptual M/S.
Patentes similares o relacionadas:
Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]
Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]
Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]
Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]
Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]