Generación de señal para señales binaurales.

Dispositivo para formar un conjunto de HRTFs decreciente de similitud mutua para modelizar una transmisión acústica de una pluralidad de canales a partir de una posición de fuente sonora virtual asociada con el canal respectivo a canales de oído de un oyente,

comprendiendo el dispositivo: un proveedor de HRTF (32) adaptado para proporcionar una pluralidad original de HRTFs implementados como filtros FIR, mediante la consulta o el cálculo de tomas de filtro para cada una de la pluralidad original de HRTFs en respuesta a una selección o cambio de las posiciones de fuentes sonoras virtuales; y un procesador HRTF (34) adaptado para provocar que las respuestas de impulso de las HRTFs que modelizan las transmisiones acústicas de un par predeterminado de canales se retrasen entre sí, o para modificar de manera diferente - en un sentido variable espectralmente - sus respuestas de fase y/o amplitud, siendo el par de canales uno de entre un canal izquierdo y un canal derecho de la pluralidad de canales, un canal frontal y posterior de la pluralidad de canales, y un canal central y no central de la pluralidad de canales.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/005548.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: SILZLE, ANDREAS, HILPERT, JOHANNES, PLOGSTIES,JAN, MUNDT,HARALD, NEUGEBAUER,BERNHARD.

Fecha de Publicación: 27 de Agosto de 2014.

Clasificación Internacional de Patentes:

G10K15/12 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10K DISPOSITIVOS GENERADORES DE SONIDOS (juguetes musicales o sonoros A63H 5/00 ); METODOS O DISPOSITIVOS PARA PROTEGER CONTRA, O PARA AMORTIGUAR, RUIDO U OTRAS ONDAS ACUSTICAS EN GENERAL; ACUSTICA NO PREVISTA EN OTRO LUGAR. › G10K 15/00 Acústica no prevista en otro lugar. › utilizando redes retardadoras electrónicas.
H04S3/00 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04S SISTEMAS ESTEREOFONICOS. › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
H04S7/00 H04S […] › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

PDF original: ES-2524391_T3.pdf

Ilustración 1 de Generación de señal para señales binaurales.

Ilustración 2 de Generación de señal para señales binaurales.

Ilustración 3 de Generación de señal para señales binaurales.

Ilustración 4 de Generación de señal para señales binaurales.

Ver la galería de la patente con 12 ilustraciones.

Generación de señal para señales binaurales.

Fragmento de la descripción:

Generación de señal para señales blnaurales

[1] La presente invención se refiere a la generación de una contribución relacionada con la reflexión y/o reverberación de sala de una señal binaural, la propia generación de una señal binaural, y la formación de un conjunto decreciente de similitud mutua de funciones de transferencia relativas a la cabeza.

[2] El sistema auditivo humano es capaz de determinar la dirección o las direcciones de donde proceden los sonidos percibidos. Para este fin, el sistema auditivo humano evalúa ciertas diferencias entre el sonido recibido en el oído derecho y el sonido recibido en el oído izquierdo. Esta última información comprende, por ejemplo, las llamadas señales inter-aurales que pueden, a su vez, referirse a la diferencia de la señal de sonido entre oídos. Las señales Inter-aurales son el medio más importante para la localización. La diferencia de nivel de presión entre los oídos, es decir, la diferencia de nivel inter-aural (ILD), es la señal más importante para la localización. Cuando el sonido llega desde el plano horizontal con un acimut distinto de cero, tiene un nivel diferente en cada oído. El oído sombreado tiene una imagen de sonido suprimida naturalmente, en comparación con el oído sin sombra. Otra propiedad muy importante al tratar con la localización es la diferencia horaria inter-aural (ITD). El oído sombreado tiene una distancia más larga a la fuente de sonido, y por lo tanto el frente de onda de sonido llega más tarde a este que al oído sin sombra. El significado de la ITD se enfatiza en las frecuencias bajas que no se atenúan mucho cuando llega al oído sombreado en comparación con el oído sin sombra. La ITD es menos importante en las frecuencias más altas debido a que la longitud de onda del sonido es más cercana a la distancia entre oídos. Por lo tanto, en otras palabras, la localización explota el hecho de que el sonido está sujeto a diferentes interacciones con la cabeza, los oídos y los hombros del oyente cuando viaja desde la fuente de sonido hasta el oído izquierdo y el derecho, respectivamente.

[3] Los problemas se producen cuando una persona escucha una señal estéreo que está destinada a ser reproducida por una configuración de altavoces a través de auriculares. Es muy probable que el oyente considere el sonido como poco natural, incómodo, y perturbador ya que el oyente siente que la fuente de sonido se encuentra en la cabeza. Este fenómeno se denomina a menudo en la literatura como la localización " en-la-cabeza " (in the head). Escuchar el sonido "en-la-cabeza" a largo plazo puede conducir a la fatiga auditiva. Esto ocurre porque la información en la que se basa el sistema auditivo humano, al colocar las fuentes de sonido, es decir, las señales inter-aurales, falta o es ambigua.

[4] A fin representar las señales estéreo, o incluso señales de múltiples canales con más de dos canales para la reproducción de auriculares, se pueden utilizar filtros direccionales con el fin de modelar estas interacciones. Por ejemplo, la generación de una salida de auriculares de una señal multicanal descodificada puede comprender filtrar cada señal después de la decodificación por medio mediante un par de filtros direccionales. Estos filtros suelen modelar la transmisión acústica a partir de una fuente de sonido virtual en una sala para el canal del oído de un oyente, que es la así llamada función de transferencia de habitación binaural (BRTF). La BRTF realiza modificaciones de tiempo, de nivel y espectrales y modeliza las reflexiones y la reverberación de la sala. Los filtros direccionales pueden implementarse en el dominio del tiempo o de la frecuencia.

[5] Sin embargo, ya que son necesarios muchos filtros, a saber, Nx2 siendo N el número de canales descodificados, estos filtros direccionales son bastante largos, tales como 2. tomas de filtro a 44,1 kHz, y el proceso de filtrado es computacionalmente exigente. Por lo tanto, a veces se reducen los filtros direccionales a un mínimo. Las así llamadas funciones de transferencia relacionadas con la cabeza (HRTF) contienen la información direccional incluyendo las señales interaurales. Se utiliza un bloque de procesamiento común para modelizar las reflexiones y la reverberación de la sala. El módulo de procesamiento de sala puede ser un algoritmo de reverberación en el dominio del tiempo o de la frecuencia, y puede funcionar en una señal de entrada de uno o dos canales obtenida a partir de la señal de entrada multicanal mediante una suma de los canales de la señal de entrada multicanal. Esta estructura se describe, por ejemplo, en el documento WO 99/14983 A1. Tal como se acaba de describir, el bloque de procesamiento de sala implementa reflexiones y / o la reverberación de la sala. Las reflexiones y la reverberación de la sala son esenciales para sonidos localizados, especialmente en relación con la distancia y la externalización - lo que significa que los sonidos se perciben fuera de la cabeza del oyente. El citado documento también sugiere la aplicación de los filtros direccionales como un conjunto de filtros FIR que operan en versiones retardadas de manera diferente del canal respectivo, a fin de modelar el camino directo desde la fuente de sonido al oído respectivo y las reflexiones distintas. Por otra parte, en la descripción de una serie de medidas para proporcionar una experiencia de sonido más agradable con un par de auriculares, este documento también sugiere retrasar una mezcla del canal central y el canal delantero izquierdo y el canal central y el canal delantero derecho, respectivamente, en relación con una suma y una diferencia de los canales izquierdo y derecho traseros, respectivamente.

[6] Sin embargo, los resultados de escucha alcanzados hasta ahora todavía carecen en gran medida de una anchura espacial reducida de la señal de salida binaural y de la falta de externalización. Además, se ha comprobado que a pesar de las medidas antes mencionadas para la representación de señales multicanal para la reproducción

por auriculares, partes de voz en los diálogos y la música de películas se perciben a menudo como reverberantes de manera poco natural y espectralmente desiguales.

[7] Por lo tanto, es el objeto de la presente invención proporcionar un esquema para la generación de la señal binaural, que produzca una reproducción por auriculares más estable y agradable.

[8] Este objeto se consigue mediante el contenido de las reivindicaciones independientes.

[9] Se puede conseguir una señal binaural más estable y agradable para la reproducción con auriculares mediante el procesamiento diferente, y reduciendo así la similitud entre, al menos uno de entre un canal izquierdo y un canal derecho de la pluralidad de canales de entrada, un canal frontal y posterior de la pluralidad de canales de entrada, y un canal central y no central de la pluralidad de canales, obteniendo de este modo un conjunto de canales de similitud mutua reducida. Este conjunto de canales de similitud mutua reducida se suministra entonces a una pluralidad de filtros direccionales seguidos por respectivos mezcladores para los oídos izquierdo y derecho, respectivamente. Al reducir la inter-similitud de canales de la señal de entrada multi-canal, se puede aumentar la anchura espacial de la señal de salida binaural y se puede aumentar la externalización.

[1] Además, se puede lograr una señal binaural más estable y agradable para reproducción con auriculares realizando - en un sentido variable espectralmente - una modificación de manera diferente de fase y/o magnitud entre al menos dos canales de la pluralidad de canales, obteniendo de este modo el conjunto de canales de similitud mutua reducida el cual, a su vez, puede ser entonces suministrado a una pluralidad de filtros direccionales seguidos de mezcladores respectivos para los oídos izquierdo y derecho, respectivamente. De nuevo, mediante la reducción de la similitud mutua de canales de la señal de entrada multi-canal, se puede aumentar la anchura espacial de la señal de salida binaural y se puede aumentar la externalización.

[11] Las ventajas antes mencionadas también son alcanzables cuando se forma un conjunto decreciente de similitud mutua de funciones de transferencia relativas a la cabeza provocando que las respuestas de impulso de una pluralidad original de funciones de transferencia relacionadas con la cabeza se retrasen entre sí, o - en un sentido variable espectralmente - respuestas de fase y/o magnitud de la pluralidad original de fundones de transferencia relacionadas con la cabeza de manera diferente en relación unas con otras. La formación se puede realizar fuera de línea como etapa de diseño, o en línea durante la generación de la señal binaural, mediante el uso de las... [Seguir leyendo]

Reivindicaciones:

1. Dispositivo para formar un conjunto de HRTFs decreciente de similitud mutua para modelizar una transmisión acústica de una pluralidad de canales a partir de una posición de fuente sonora virtual asociada con el canal respectivo a canales de oído de un oyente, comprendiendo el dispositivo: un proveedor de HRTF (32) adaptado para proporcionar una pluralidad original de FIRTFs implementados como filtros FIR, mediante la consulta o el cálculo de tomas de filtro para cada una de la pluralidad original de FIRTFs en respuesta a una selección o cambio de las posiciones de fuentes sonoras virtuales; y un procesador FIRTF (34) adaptado para provocar que las respuestas de Impulso de las FIRTFs que modelizan las transmisiones acústicas de un par predeterminado de canales se retrasen entre sí, o para modificar de manera diferente - en un sentido variable espectralmente - sus respuestas de fase y/o amplitud, siendo el par de canales uno de entre un canal izquierdo y un canal derecho de la pluralidad de canales, un canal frontal y posterior de la pluralidad de canales, y un canal central y no central de la pluralidad de canales.

2. Dispositivo según la reivindicación 1, en el que el procesador FIRTF (34) está configurado para provocar que las respuestas de impulso de las FIRTFs que modelizan las transmisiones acústicas de un par predeterminado de canales se retrasen entre sí mediante el desplazamiento de las tomas de filtro.

3. Dispositivo según la reivindicación 1 o la 2, en el que el procesador FIRTF (34) está configurado para provocar que las respuestas de impulso de las FIRTFs que modelizan las transmisiones acústicas de un par predeterminado de canales se retrasen entre sí, o modifiquen de manera diferente - en un sentido variable espectralmente - sus respuestas de fase y/o amplitud de modo que los retardos de grupo de un primero de entre los FIRTFs con respecto a otro de los FIRTFs, muestren, para bandas de Bark, una desviación estándar de al menos un octavo de una muestra.

4. Dispositivo según cualquiera de las reivindicaciones 1 a 3, en el que el proveedor de HRTF (32) está configurado para proporcionar la pluralidad original de HRTFs a partir de las posiciones de fuentes sonoras virtuales y

parámetros HRTF.

5. Dispositivo según cualquiera de las reivindicaciones 1 a 4, en el que el procesador HRTF (34) está configurado para filtrar pasa-todo de manera diferente las respuestas de impulso del par predeterminado de canales.

6. Procedimiento para formar un conjunto decreciente de similitud mutua de funciones de transferencia relativas a la cabeza para modelizar una transmisión acústica de una pluralidad de canales a partir de una posición de fuente sonora virtual asociada con el canal respectivo a canales de oído de un oyente, comprendiendo el procedimiento:

proporcionar una pluralidad original de HRTFs implementados como filtros FIR, mediante la consulta o el cálculo de tomas de filtro para cada una de la pluralidad original de HRTFs en respuesta a una selección o cambio de las posiciones de fuentes sonoras virtuales; y modificar de manera diferente - en un sentido variable espectralmente - respuestas de fase y/o magnitud de respuestas de impulso de las HRTFs que modelizan las transmisiones acústicas de un par predeterminado de canales de modo que los retardos de grupo de un primero de entre los HRTFs con respecto a otro de los HRTFs muestran, para bandas de Bark, una desviación estándar de al menos un octavo de una muestra, siendo el par de canales uno de entre un canal izquierdo y un canal derecho de la pluralidad de canales, un canal frontal y posterior de la pluralidad de canales, y un canal central y no central de la pluralidad de canales.

7. Programa de ordenador que tiene instrucciones para realizar, cuando se ejecuta en un ordenador, un procedimiento según la reivindicación 6.

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]