PROCEDIMIENTO DE CONVERSION DE FORMATO SONORO 5.1. A BINAURAL HIBRIDO.

Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido que comprende obtener las señales de los canales FL,

FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; auralizar los canales FL, FR, SL y SR en las siguientes posiciones;

FL: elevación de 0º a 30º; azimut de -10º a -30º.

FR: elevación de 0º a 30º; azimut de +10º a + 30º.

SL: elevación de 175º a 195º; azimut de -30º a -60º.

SR: elevación de 175º a 195º; azimut de +30º a +60º,

obteniéndose las señales FL{sub,1}, FR{sub,1}, SL{sub,1} y SR{sub,1}; modelar la respuesta del recinto a partir de las señales introduciendo un efecto reverberación; y mezclar las señales FL{sub,2}, FR{sub,2}, SL{sub,2}, y SR{sub,2} obtenidas en la operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha

Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P200800112.

Solicitante: PORTAS ARRONDO,IVAN.

Nacionalidad solicitante: España.

Provincia: GUIPÚZCOA.

Inventor/es: PORTAS ARRONDO,IVAN.

Fecha de Solicitud: 17 de Enero de 2008.

Fecha de Publicación: .

Fecha de Concesión: 15 de Abril de 2010.

Clasificación Internacional de Patentes:

  • H04S3/00A2

Clasificación PCT:

  • H04S3/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
PROCEDIMIENTO DE CONVERSION DE FORMATO SONORO 5.1. A BINAURAL HIBRIDO.

Fragmento de la descripción:

Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido.

Objeto de la invención

El objeto principal de la presente invención es un procedimiento para convertir sonido en formato sonoro 5.1, habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido.

Antecedentes de la invención

Actualmente, el formato 5.1 representa el estándar para la reproducción sonora doméstica de cine. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. Cada uno de los canales corresponde a un altavoz, y a su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima.

Los altavoces principales (FL y FR en la Figura 1) forman idealmente un triángulo equilátero con la posición del usuario (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110º con respecto al eje vertical (recta que une O y C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en la reproducción. Su ubicación no es determinante, ya que la información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Es decir, no se puede determinar de donde proviene el sonido.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en la ubicación óptima con respecto de los altavoces. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a la cabeza del usuario, no modifican su posición relativa respecto a su cabeza.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear la cabeza. La audición humana es por naturaleza binaural, donde la resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. El término "binaural" hace referencia a la naturaleza de la audición humana, debido a que las personas somos capaces de captar toda la información espacial sonora a través de un único par de oídos.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. El sonido intracraneal consiste en la sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por lo que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales.

Existen fundamentalmente dos formas de lograr reproducciones binaurales:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda la fenomenología descrita anteriormente.

La segunda se basa en realizar un procedimiento de auralización. Para ello, se suele medir o modelar la respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir la señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. Específicamente, se describe cómo dividir la señal de entrada según distintas bandas de frecuencia para, una vez dividida la señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural.

Descripción de la invención

La presente invención describe un nuevo procedimiento para la auralización en tiempo real de audio en formato 5.1. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular la reproducción.

Las ventajas más importantes del procedimiento de la invención se pueden resumir en las siguientes:

- Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, la posición relativa entre el sistema de reproducción y el usuario no varía.
- El modelo híbrido que se describe, que combina la auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a la constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados.
- El reajuste de las proporciones de los diferentes tipos de información, mediante la separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo.
- La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de la profundidad justa al plano frontal.
- La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva.
- El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga la impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas.

Del mismo modo, el término "canal" hace referencia a la señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a la izquierda (left, en inglés) y derecha (right, en inglés) del usuario. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a la posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a la posición de los canales a los lados del usuario.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. Concretamente, la presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE.

De acuerdo con un aspecto de la presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones:

1) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del...

 


Reivindicaciones:

1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones

obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido;

auralizar los canales FL, FR, SL y SR en las siguientes posiciones:

FL: elevación de 0º a 30º; azimut de -10º a -30º. FR: elevación de 0º a 30º; azimut de +10 a +30º. SL: elevación de 175º a 195º; azimut de -30º a -60º. SR: elevación de 175º a 195º; azimut de +30º a +60º,

obteniéndose como resultado las señales FL1, FR1, SL1 y SR1;

procesar independientemente las señales del plano frontal (FL1 y FR1) y las del plano trasero (SL1 y SR1), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL2, FR2, SL2 y SR2;

mezclar las señales FL2, FR2, SL2 y SR2 obtenidas en la operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha.

2. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con la reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 s y 1 s para el primero, y de entre 1 s y 3,5 s para el segundo.

3. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a la operación final de mezcla, una compresión del canal LFE.

4. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de la operación de auralización comprende las operaciones de:

separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R;

remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR.

5. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con la reivindicación anterior, caracterizado porque la operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales:

FL: 70-90% música L, 30-10% voz y efectos frontales FR: 70-90% música R, 30-10% voz y efectos frontales C: 70-90% voz y efectos frontales, 30-10% música L y R SL: 70-90% efectos traseros L, 30-10% música L SR: 70-90% efectos traseros R, 30-10% música R.

6. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con la reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de la siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador.

7. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores.

8. Programa de ordenador de acuerdo con la reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento.

9. Programa de ordenador de acuerdo con la reivindicación 7, caracterizado porque se transmite a través de una señal portadora.


 

Patentes similares o relacionadas:

Imagen de 'DISPOSITIVO Y METODO PARA GENERAR UNA SEÑAL ESTEREOFONICA CODIFICADA…'DISPOSITIVO Y METODO PARA GENERAR UNA SEÑAL ESTEREOFONICA CODIFICADA DE UNA PIEZA DE AUDIO O FLUJO DE DATOS DE AUDIO, del 9 de Junio de 2010, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para generar una señal estereofónica codificada de una pieza de audio o un flujo de datos de audio con un primer canal estereofónico y un segundo […]

Imagen de 'CODIFICACION Y DECODIFICACION DE AUDIO'CODIFICACION Y DECODIFICACION DE AUDIO, del 26 de Mayo de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio que comprende: - medios para recibir una señal de audio de canal M donde M>2; - medios de mezclado descendente […]

Imagen de 'ESPACIALIZACION BINAURAL DE DATOS SONOROS CODIFICADOS EN COMPRESION'ESPACIALIZACION BINAURAL DE DATOS SONOROS CODIFICADOS EN COMPRESION, del 16 de Marzo de 2010, de FRANCE TELECOM: Procedimiento de tratamiento de datos sonoros para una restitución espacializada en tres dimensiones sobre dos vías de restitución para los oídos […]

Método y sistema para el procesamiento de sonido envolvente en un auricular, del 27 de Mayo de 2020, de Voyetra Turtle Beach, Inc: Un método, que comprende: en un auricular de audio que recibe una pluralidad de señales de audio correspondientes a una pluralidad de canales de sonido envolvente: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .