Descodificador multi-canal binaural en el contexto de reglas de mezcla ascendente que no conservan la energía.

Descodificador multi-canal para generar una señal binaural a partir de una señal de mezcla descendente derivada de una señal multi-canal original empleando parámetros que incluyen una información de regla de mezcla ascendente utilizable para mezclar hacia arriba la señal de mezcla descendente con una regla de mezcla ascendente,

dando como resultado la regla de mezcla ascendente un error de energía, que comprende:

un calculador de factor de ganancia (180, 302) para calcular al menos un factor de ganancia (g1, g2) para reducir o eliminar el error de energía, a partir de la información de regla de mezcla ascendente y características de filtros de filtros a base de función de transferencia relativa a la cabeza correspondientes a canales de mezcla ascendente, en el que el calculador de factor de ganancia (180, 302) es capaz de calcular el factor de ganancia a partir de una energía de una respuesta de impulso combinada de las características del filtro, calculándose la respuesta de impulso combinada añadiendo o restando respuestas de impulso de filtro individuales; y un procesador de filtro (182) para filtrar la señal de mezcla descendente empleando el al menos un factor de ganancia (g1, g2), las características de filtro y la información de regla de mezcla ascendente para obtener una señal binaural con energía corregida.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10155535.

Solicitante: DOLBY INTERNATIONAL AB.

Nacionalidad solicitante: Países Bajos.

Dirección: Apollo Building, 3E, Herikerbergweg 1-35 1101 CN Amsterdam Zuid-Oost PAISES BAJOS.

Inventor/es: VILLEMOES, LARS.

Fecha de Publicación: 12 de Noviembre de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
H04S7/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2527918_T3.pdf

Fragmento de la descripción:

Descodificador multi-canal binaural en el contexto de reglas de mezcla ascendente que no conservan la energía Sector de la invención

[0001] La presente invención se refiere a decodlflcación binaural de señales de audio multi-canal a partir de señales de mezcla descendente disponibles y datos de control adicionales, mediante filtración HRTF.

Contexto técnico de la invención v Antecedentes

[0002] El reciente desarrollo en la codificación de audio ha hecho puesto procedimientos a disposición para recrear una representación multicanal de una señal de audio a partir de una señal estéreo (o mono) de la señal y los datos de control correspondientes. Estos procedimientos difieren sustancialmente de la solución más antigua basada en matriz tal como Dolby Prologlc, puesto que los datos de control adicionales se transmiten para controlar la recreación, también denominada como upmlx, de los canales envolventes basándose en los canales mono o estéreo transmitidos.

[0003] Por lo tanto, un decodlflcador de audio multicanal paramétrlco como este, por ejemplo, MPEG Surround reconstruye N canales a partir de M canales transmitidos, donde N > M, y los datos de control adicionales. Los datos de control adicionales representan una velocidad de datos significativamente menor que la requerida para la transmisión de todos los N canales, haciendo que la codificación sea muy eficaz mientras que al mismo tiempo se garantiza la compatibilidad tanto con dispositivos de M canales y los dispositivos con N canales. [J. Breebaart et al. "MPEG codlfication of spatlal audio / MPEG Surround: overview and current status", Proc. 119th AES convention, New York, USA, October2005, Preprint 6447],

[0004] Estos procedimientos de codificación de sonido envolvente paramétricos generalmente comprenden una parametrlzaclón de la señal envolvente a partir de la Diferencia de nivel de Canales (CLD) y la Coherencia/ correlación entre canales (ICC). Estos parámetros describen niveles de potencia y correlación entre pares de canales en el proceso de mezcla ascendente. También se usan otros Coeficientes de predicción de canal (CPC) en el estado de la técnica para predecir canales intermedios o de salida durante el proceso de mezcla ascendente.

[0005] Otros desarrollos en la codificación de audio han proporcionado medios para obtener una impresión de señal multicanal con auriculares estéreo. Esto se realiza comúnmente por mezcla descendente de una señal multicanal a estéreo utilizando la señal multicanal original y filtros HRTF (funciones de transferencia relacionadas con la cabeza).

[0006] Como alternativa, por supuesto, sería útil por razones de eficiencia computacional y también por razones de calidad de audio simplificar la generación de la señal binaural que tienen el canal binaural izquierdo y el canal binaural derecho.

[0007] Sin embargo, la cuestión es cómo se pueden combinar los filtros HRTF originales. Además surge un problema en un contexto de una regla de mezcla ascendente afectada de pérdida de energía, es decir, cuando la señal de entrada del decodificador multicanal incluye una señal de mezcla descendente que tiene, por ejemplo, un primer canal de mezclado descendente y un segundo canal de mezclado descendente, y que tiene además parámetros espaciales, que se utilizan para mezclar hacia arriba de una manera que no conserva la energía. Estos parámetros son también conocidos como parámetros de predicción o parámetros de CPC. Estos parámetros tienen, en contraste con la diferencia de nivel de parámetros de canal, la propiedad de que no se calculan para reflejar la distribución de energía entre dos canales, sino que se calculan para realizar una adaptación lo mejor-posible a la forma de onda lo que resulta automáticamente en un error de energía (por ejemplo, pérdida), ya que, cuando se generan los parámetros de predicción, a uno no le importa acerca de las propiedades de conservación de energía de una mezcla ascendente, sino que se preocupa de tener una mejor coincidencia de la forma de onda en el dominio del tiempo o de sub-banda con respecto a la señal reconstruida en comparación con la señal original.

[0008] Cuando simplemente se combinan linealmente filtros HRTF sobre la base de estos parámetros de predicción espaciales de transmisión, se recibirán artefactos que son especialmente graves, cuando la predicción de los canales se realiza mal. En esta situación, incluso las dependencias lineales sutiles conducen a la coloración espectral no deseada de la salida binaural. Se ha encontrado que este artefacto se produce con mayor frecuencia cuando los canales originales llevan señales a pares no correlacionadas y que tienen magnitudes comparables.

[0009] WO 2006/048203 A1 describe la utilización de una medida de energía para compensar pérdidas de energía debido a una mezcla ascendente predicitva para reconstrucción multi-canal de señales de audio a partir de al menos un canal de base. La medida de energía se puede aplicar en el codificador o el descodificador. Además, una señal descorrelacionada se añade a canales de salida generados por un proceso de mezcla ascendente que introduce pérdidas de energía. La energía de la señal descorrelacionada es menor o igual que un error de energía introducido por la mezcla ascendente predictiva.

[0010] WO 2004/028204 A2 describe un procedimiento y un sistema de medios de/para una generación de al menos una señal de salida a partir de al menos una señal de entrada a partir de un segundo conjunto de señales de sonido que tienen segundo conjunto relacionado de Funciones de Transferencia Relativas a la Cabeza. El sistema de medios puede ser una TV, un reproductor de CD, un reproductor de DVD, una radio, una pantalla visual, un amplificador, un auricular o un VCR. El procedimiento incluye las etapas de determinar, para cada señal en el segundo conjunto de señales de sonido, una relación ponderada que comprende al menos una señal a partir de una tercera etapa de señales de sonido intermedias y al menos un valor de ponderación; determinar un primer conjunto de Funciones de Transferencia Relativas a la Cabeza a partir del segundo conjunto de señales de sonido, el segundo conjunto de Funciones de Transferencia Relativas a la Cabeza y la relación ponderada; y transferir al menos una señal del tercer conjunto de señales de sonido intermedias mediante al menos un HRTF a partir de dicho primer conjunto de Funciones de Transferencia Relativas a la Cabeza para generar al menos una señal de salida, que pertenecen a dicho primer conjunto de señales de sonido.

Resumen de la invención

[0011] Es el objeto de la presente invención proporcionar un concepto eficiente y cualitativamente aceptable para la decodificación multicanal para obtener una señal binaural que se pueda utilizar, por ejemplo, para la reproducción de una señal multicanal en auriculares.

[0012] Este objeto se logra con un descodificador multi-canal según la reivindicación 1.

[0013] Además, este objeto se logra con un procedimiento de descodificación multi-canal según la reivindicación 2.

[0014] Otros aspectos de esta invención se refieren a un programa de ordenador que tiene un código legible por ordenador que implementa, cuando se ejecuta en un ordenador, el procedimiento de descodificación multi-canal.

[0015] La presente invención se basa en el hallazgo de que se puede incluso utilizar ventajosamente información de regla de mezcla ascendente en una mezcla ascendente que resulta en un error de energía para el filtrado de una señal de mezcla descendente para obtener una señal binaural sin tener que representar totalmente la señal multicanal y aplicar posteriormente un gran número de filtros HRTF. En lugar de ello, de acuerdo con la presente invención, la información de regla de mezcla ascendente relativa a una regla de mezcla ascendente afectada de error de energía puede ser usada ventajosamente para la representación binaural acortada de una señal de mezcla descendente, cuando, de acuerdo con la presente invención, se calcula un factor de ganancia y se utiliza en el filtrado de la señal de mezcla descendente, en el que este factor de ganancia se calcula de manera que el error de energía se reduce o se elimina por completo.

[0016] En particular, el factor de ganancia no sólo depende de la información sobre la regla de mezcla ascendente como los parámetros de predicción, pero, sobre todo, también depende de filtros a base de funciones de transferencia relativas a la cabeza correspondientes a canales de mezcla ascendente, para los que se proporciona la regla de mezcla ascendente. En particular, estos canales de mezcla ascendente nunca existen en la realización preferida de la presente invención,... [Seguir leyendo]

Reivindicaciones:

1. Descodificador multi-canal para generar una señal binaural a partir de una señal de mezcla descendente derivada de una señal multi-canal original empleando parámetros que incluyen una información de regla de mezcla ascendente utilizable para mezclar hacia arriba la señal de mezcla descendente con una regla de mezcla ascendente, dando como resultado la regla de mezcla ascendente un error de energía, que comprende:

un calculador de factor de ganancia (180, 302) para calcular al menos un factor de ganancia (gi, g2) para reducir o eliminar el error de energía, a partir de la información de regla de mezcla ascendente y características de filtros de filtros a base de función de transferencia relativa a la cabeza correspondientes a canales de mezcla ascendente, en el que el calculador de factor de ganancia (180, 302) es capaz de calcular el factor de ganancia a partir de una energía de una respuesta de impulso combinada de las características del filtro, calculándose la respuesta de impulso combinada añadiendo o restando respuestas de impulso de filtro individuales; y un procesador de filtro (182) para filtrar la señal de mezcla descendente empleando el al menos un factor de ganancia (gi, g2), las características de filtro y la información de regla de mezcla ascendente para obtener una señal binaural con energía corregida.

2. Procedimiento de descodificación multi-canal para generar una señal binaural a partir de una señal de mezcla descendente derivada de una señal multi-canal original empleando parámetros que incluyen una información de regla de mezcla ascendente utilizable para mezclar hacia arriba la señal de mezcla descendente con una regla de mezcla ascendente, dando como resultado la regla de mezcla ascendente un error de energía, que comprende:

calcular (180, 302) al menos un factor de ganancia (gi, g2) para reducir o eliminar el error de energía, a partir de la información de regla de mezcla ascendente y características de filtros de filtros a base de función de transferencia relativa a la cabeza correspondiente a canales de mezcla ascendente, en el que el factor de ganancia se calcula a partir de una energía de una respuesta de impulso combinada de las características del filtro, calculándose la respuesta de impulso combinada añadiendo o restando respuestas de impulso de filtro individuales; y

filtrar (182) la señal de mezcla descendente empleando el al menos un factor de ganancia (gi, g2), las características de filtro y la información de regla de mezcla ascendente para obtener una señal binaural con energía corregida.

3. Programa de ordenador que tiene un código de programa para realizar el procedimiento según la reivindicación 2, cuando el programa de ordenador se ejecuta en un ordenador.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]