Generación de señales para señales binaurales.

Dispositivo para generar una contribución relacionada con la reflexión/reverberación de un espacio (46a,

46b) de una señal binaural basándose en una señal multicanal (18) que representa una pluralidad de canales y que está pensada para reproducción por una configuración de altavoces que tiene una posición de fuente de sonido virtual asociada a cada canal, que comprende:

un generador de mezcla descendente (42) que forma una mezcla descendente mono o estéreo (48) de los canales de la señal multicanal; y un

procesador de espacio (44) para generar la contribución relacionada con las reflexiones/la reverberación de un espacio (46a, 46b) de la señal binaural modelizando las reflexiones/reverberaciones de un espacio basándose en la señal mono o estéreo,

en el que el generador de mezcla descendente (42) está configurado para formar la mezcla descendente mono o estéreo (48) de manera que la pluralidad de canales contribuyen a la mezcla descendente mono o estéreo a un nivel que difiere entre al menos dos canales de la señal multicanal (18),

en el que el generador de mezcla descendente (42) está configurado para reconstruir, mediante codificación de audio espacial, la pluralidad de canales a partir de una señal de mezcla descendente (18) y de parámetros espaciales asociados (64) que describen diferencias de nivel, diferencias de fase, diferencias de tiempo y/o medidas de correlación entre las pluralidades de canales, y

en el que el generador de mezcla descendente (42) está configurado para realizar la formación de la mezcla descendente mono o estéreo (48) de manera que una cantidad de reducción de nivel de un primero de los al menos dos canales en relación con un segundo de los al menos dos canales depende de los parámetros espaciales (64).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E11168514.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: SILZLE, ANDREAS, HILPERT, JOHANNES, PLOGSTIES,JAN, MUNDT,HARALD, NEUGEBAUER,BERNHARD.

Fecha de Publicación: 10 de Septiembre de 2014.

Clasificación Internacional de Patentes:

G10K15/12 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10K DISPOSITIVOS GENERADORES DE SONIDOS (juguetes musicales o sonoros A63H 5/00 ); METODOS O DISPOSITIVOS PARA PROTEGER CONTRA, O PARA AMORTIGUAR, RUIDO U OTRAS ONDAS ACUSTICAS EN GENERAL; ACUSTICA NO PREVISTA EN OTRO LUGAR. › G10K 15/00 Acústica no prevista en otro lugar. › utilizando redes retardadoras electrónicas.
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
H04S7/00 H04S […] › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2531422_T3.pdf

Fragmento de la descripción:

Generación de señales para señales binaurales

[0001] La presente invención se refiere a la generación de una contribución relacionada con la reflexión y/o reverberación de un espacio de una señal binaural, la generación de una señal binaural en sí, y la formación de un conjunto decreciente de intersimilitud de funciones de transferencia relacionadas con la cabeza.

[0002] El sistema auditivo humano es capaz de determinar la dirección o las direcciones de las que proceden 10 los sonidos percibidos. Con este fin, el sistema auditivo humano evalúa ciertas diferencias entre el sonido recibido

en el oído derecho y el sonido recibido en el oído izquierdo. Esta información comprende, por ejemplo, las denominadas pistas interaurales que pueden, a su vez, referirse a la diferencia de señal sonora entre los oídos. Las pistas interaurales son los medios más importantes para la localización. La diferencia de nivel de presión entre los oídos, concretamente la diferencia de nivel interaural (ILD) es la pista individual más importante para la localización. 15 Cuando el sonido llega del plano horizontal con un acimut distinto de cero, tiene un nivel diferente en cada oído. El oído en sombra tiene una imagen sonora suprimida naturalmente, comparado con el oído no en sombra. Otra propiedad muy importante que se ocupa de la localización es la diferencia de tiempo interaural (ITD). El oído en sombra tiene una distancia más larga hasta la fuente de sonido, y por tanto recibe el frente de onda sonora después que el oído no en sombra. El significado de la ITD se enfatiza en las bajas frecuencias que no se atenúan mucho 20 cuando llegan al oído en sombra comparado con el oído no en sombra. La ITD es menos importante en las frecuencias más altas porque la longitud de onda del sonido se acerca a la distancia entre los oídos. De ahí que, en otras palabras, la localización se aprovecha del hecho de que el sonido está sometido a diferentes interacciones con la cabeza, los oídos, y los hombros del oyente que se desplaza de la fuente de sonido al oído izquierdo y derecho, respectivamente.

[0003] Se producen problemas cuando una persona escucha una señal estéreo que está pensada para ser reproducida por un sistema de altavoces a través de auriculares. Es muy probable que el oyente considere el sonido como poco natural, molesto y perturbador ya que el oyente siente que la fuente de sonido está localizada en la cabeza. Este fenómeno a menudo se denomina en la bibliografía como localización "en la cabeza". La escucha

prolongada de sonido "en la cabeza" puede conducir a fatiga auditiva. Se produce porque la información en la que se basa el sistema auditivo humano, cuando posiciona las fuentes de sonido, es decir, las pistas interaurales, falta o es ambigua.

[0004] Con el fin de interpretar señales estéreo, o incluso señales multicanal con más de dos canales para 35 reproducción por auriculares, pueden usarse filtros direccionales con el fin de modelizar estas interacciones. Por

ejemplo, la generación de una salida de auriculares a partir de una señal multicanal descodificada puede comprender filtrar cada señal después la descodificación por medio de un par de filtros direccionales. Estos filtros modelan típicamente la transmisión acústica desde una fuente de sonido virtual en un espacio hasta el conducto auditivo de un oyente, la denominada función de transferencia binaural de un espacio (BRTF). La BRTF realiza 40 modificaciones de tiempo, de nivel y espectrales, y modeliza las reflexiones y la reverberación de un espacio. Los filtros direccionales pueden implementarse en el dominio del tiempo o la frecuencia.

[0005] Sin embargo, como se requieren muchos filtros, concretamente Nx2 siendo N el número de canales descodificados, estos filtros direccionales son bastante largos, tales como 20000 derivaciones de filtro a 44,1 kHz, y

el proceso de filtrado es computacionalmente exigente. Por lo tanto, los filtros direccionales a veces se reducen a un mínimo. Las denominadas funciones de transferencia relacionadas con la cabeza (HRTF) contienen la información direccional que incluye las pistas interaurales. Se usa un bloque de procesamiento común para modelizar las reflexiones y la reverberación de un espacio. El módulo de procesamiento de espacio puede ser un algoritmo de reverberación en el dominio del tiempo o la frecuencia, y puede operar sobre una señal de entrada de uno o dos 50 canales de la señal de entrada multicanal. Tal estructura se describe, por ejemplo, en el documento W099/14983A1. Tal como se acaba de describir, el bloque de procesamiento de espacio implementa las reflexiones y/o la reverberación de un espacio. Las reflexiones y la reverberación de un espacio son esenciales para los sonidos localizados, especialmente con respecto a la distancia y los sonidos que significan externalización se perciben fuera de la cabeza del oyente. El documento anteriormente mencionado también sugiere implementar los filtros 55 direccionales como un conjunto de filtros FIR que operan sobre versiones retardadas de manera diferente del canal respectivo, para modelizar el recorrido directo desde la fuente de sonido hasta el oído respectivo y distintas reflexiones. Por otra parte, al describir varias medidas para proporcionar una experiencia auditiva más agradable a través de un par de auriculares, este documento también sugiere retardar una mezcla del canal central y el canal delantero izquierdo, y el canal central y el canal delantero derecho, respectivamente, en relación con una suma y

una diferencia de los canales trasero izquierdo y trasero derecho, respectivamente.

[0006] Sin embargo, los resultados auditivos conseguidos hasta ahora todavía carecen en gran medida de una anchura espacial reducida de la señal de salida binaural y carecen de externalización. Además, se ha caído en

la cuenta de que, a pesar de las medidas anteriormente mencionadas para interpretar señales multicanal para reproducción por auriculares, porciones de voz en los diálogos de películas y la música a menudo se perciben reverberantes de manera poco natural y espectralmente desiguales.

[0007] El documento US5371799 describe un sistema para procesar una señal de audio para reproducción 10 por auriculares en el cual la fuente de sonido aparate está localizada fuera de la cabeza del oyente procesa la señal

de entrada como si estuviera constituida por una porción de onda directa, una porción de reflexiones iniciales, y una porción de reverberaciones. La porción de onda directa de la señal se procesa en filtros cuyos coeficientes de filtro se escogen basándose en el acimut deseado de la localización de la fuente de sonido virtual. La porción de reflexión inicial se pasa a través de un banco de filtros conectados en paralelo cuyos coeficientes se escogen basándose en 15 cada acimut de reflexión. Las salidas de estos filtros se pasan a través de escalares para ajustar la amplitud para simular un intervalo deseado de la fuente de sonido virtual. La porción de reverberación se procesa sin ninguna información de localización de fuente de sonido, usando un generador de números aleatorios, por ejemplo, y la salida es atenuada en un atenuador exponencial para que se atenúe gradualmente. Todas las salidas de los escalares y los atenuadores se suman entonces para producir señales de auriculares izquierda y derecha para 20 reproducción por los transductores de auriculares respectivos.

[0008] Por lo tanto, el objeto de la presente invención es proporcionar un esquema para generación de señales binaurales, que produzca una reproducción por auriculares más estable y agradable.

[0009] Este objeto se consigue mediante un dispositivo según la reivindicación 1 y un procedimiento según la reivindicación 7.

[0010] Una ¡dea subyacente a la presente solicitud es que algunas porciones en películas y música tienen como resultado una reproducción por auriculares percibida de manera más natural, cuando la mezcla descendente mono o

estéreo de los canales de la señal multicanal que ha de someterse al procesador de espacio para generar la contribución relacionada con las reflexiones/la reverberación de un espacio de la señal binaural, se forma de manera que la pluralidad de canales contribuyen a la mezcla descendente mono o estéreo a un nivel que difiere entre al menos dos canales de la señal multicanal. Por ejemplo, los inventores se dieron cuenta de que las voces en los diálogos de películas y la música típicamente se mezclan principalmente con el canal central de una señal 35 multicanal, y que la señal del canal central, cuando se suministra al módulo de procesamiento de espacio, tiene como resultado una salida a menudo percibida reverberante... [Seguir leyendo]

Reivindicaciones:

1. Dispositivo para generar una contribución relacionada con la reflexión/reverberación de un espacio (46a, 46b) de una señal binaural basándose en una señal multlcanal (18) que representa una pluralidad de canales y

que está pensada para reproducción por una configuración de altavoces que tiene una posición de fuente de sonido virtual asociada a cada canal, que comprende:

un generador de mezcla descendente (42) que forma una mezcla descendente mono o estéreo (48) de los canales de la señal multicanal; y un

procesador de espacio (44) para generar la contribución relacionada con las reflexiones/la reverberación de un espacio (46a, 46b) de la señal binaural modelizando las reflexiones/reverberaciones de un espacio basándose en la señal mono o estéreo,

en el que el generador de mezcla descendente (42) está configurado para formar la mezcla descendente mono o estéreo (48) de manera que la pluralidad de canales contribuyen a la mezcla descendente mono o estéreo a un nivel que difiere entre al menos dos canales de la señal multicanal (18),

en el que el generador de mezcla descendente (42) está configurado para reconstruir, mediante codificación de 20 audio espacial, la pluralidad de canales a partir de una señal de mezcla descendente (18) y de parámetros espaciales asociados (64) que describen diferencias de nivel, diferencias de fase, diferencias de tiempo y/o medidas de correlación entre las pluralidades de canales, y

en el que el generador de mezcla descendente (42) está configurado para realizar la formación de la mezcla 25 descendente mono o estéreo (48) de manera que una cantidad de reducción de nivel de un primero de los al menos dos canales en relación con un segundo de los al menos dos canales depende de los parámetros espaciales (64).

2. Dispositivo según la reivindicación 1, en el que el generador de mezcla descendente (42) está configurado para formar la mezcla descendente mono o estéreo de manera que un canal central de la pluralidad de

canales contribuye a la mezcla descendente mono o estéreo de una manera de nivel reducido en relación con los otros canales de la señal multicanal.

3. Dispositivo según la reivindicación 1, en el que el generador de mezcla descendente (42) está configurado para reconstruir, mediante codificación de audio espacial, la pluralidad de canales a partir de una señal

de mezcla descendente estéreo, describiendo los coeficientes de predicción de canal cómo los canales de la señal de mezcla descendente estéreo han de ser combinados llnealmente para predecir un triplete de canales central, derecho e Izquierdo, y una señal residual (270) que refleja un residuo de predicción cuando se predice el triplete.

4. Dispositivo según cualquiera de las reivindicaciones 1 a 3, en el que el generador de mezcla 40 descendente (42) está configurado para realizar la formación de manera que una cantidad de reducción de nivel de

un primero de los al menos dos canales en relación con un segundo de los al menos dos canales depende de una diferencia de nivel y/o una correlación entre canales individuales de la pluralidad de canales.

5. Dispositivo según la reivindicación 4, en el que el generador de mezcla descendente (42) está 45 configurado para adquirir la diferencia de nivel y/o la correlación entre canales individuales de la pluralidad de

canales basándose en parámetros espaciales que acompañan a una señal de mezcla descendente que representan juntos la pluralidad de canales.

6. Dispositivo según cualquiera de las reivindicaciones 1 a 3, en el que el generador de mezcla 50 descendente (42) está configurado para realizar la formación de manera que una cantidad de reducción de nivel de

un primero de los al menos dos canales en relación con un segundo de los al menos dos canales varía con el tiempo tal como se Indica por un indicador variable con el tiempo transmitido dentro de información secundaria de la señal multicanal.

7. Procedimiento para generar una contribución relacionada con la reflexión/reverberación de un espacio

de una señal binaural basándose en una señal multicanal que representa una pluralidad de canales y que está pensada para reproducción por una configuración de altavoces que tiene una posición de fuente de sonido virtual asociada a cada canal, que comprende:

formar una mezcla descendente mono o estéreo de los canales de la señal multicanal; y

generar la contribución relacionada con las reflexiones/la reverberación de un espacio de la señal binaural modelizando las reflexiones/reverberaciones de un espacio basándose en la señal mono o estéreo,

en el que la mezcla descendente mono o estéreo se forma de manera que la pluralidad de canales contribuyen a la mezcla descendente mono o estéreo a un nivel que difiere entre al menos dos canales de la señal multicanal,

en el que el procedimiento comprende además reconstruir, mediante codificación de audio espacial, la pluralidad de 10 canales a partir de una señal de mezcla descendente y de parámetros espaciales asociados que describen diferencias de nivel, diferencias de fase, diferencias de tiempo y/o medidas de correlación entre las pluralidades de canales, y

la formación de la mezcla descendente mono o estéreo de manera que una cantidad de reducción de nivel de un 15 primero de los al menos dos canales en relación con un segundo de los al menos dos canales depende de los parámetros espaciales.

8. Programa informático que tiene Instrucciones para realizar, cuando se ejecuta en un ordenador, un

procedimiento según la reivindicación 7.

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]