PROCEDIMIENTO Y APARATO PARA EL REALZADO DEL ESTEREO EN GRABACIONES DE AUDIO.

Procedimiento y aparato para el realzado del estéreo en grabaciones de audio.



La presente invención se enmarca dentro del campo de sistemas de procesado digital de la señal orientados al sonido, en concreto en aquellos que mejoran la sensación espacial sonora dentro de lo que se conoce como realzado estéreo. En particular, la presente invención consiste en un procedimiento y un aparato para mejorar la sensación de espacialidad sonora cuando se realiza una grabación estéreo mediante dos micrófonos cercanos

Tipo: Patente de Invención. Resumen de patente/invención. Número de Solicitud: P200802379.

Solicitante: UNIVERSIDAD POLITECNICA DE VALENCIA.

Nacionalidad solicitante: España.

Provincia: VALENCIA.

Inventor/es: COBOS SERRANO,MAXIMO, LOPEZ MONFORT,JOSE JAVIER.

Fecha de Solicitud: 31 de Julio de 2008.

Fecha de Publicación: .

Fecha de Concesión: 10 de Junio de 2010.

Clasificación Internacional de Patentes:

  • H04S1/00A
  • H04S1/00D

Clasificación PCT:

  • H04R1/20 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04R ALTAVOCES, MICROFONOS, CABEZAS DE LECTURA PARA GRAMOFONOS O TRANSDUCTORES ACUSTICOS ELECTROMECANICOS ANALOGOS; APARATOS PARA SORDOS; SISTEMAS PARA ANUNCIOS EN PUBLICO (producción de sonidos cuya frecuencia no está determinada por la frecuencia de alimentación G10K). › H04R 1/00 Detalles de los transductores (membranas H04R 7/00; caracterizado por la naturaleza del transductor, ver el grupo correspondiente de los grupos principales H04R 9/00 - H04R 23/00; montajes adaptados especialmente para equipos telefónicos H04M 1/02). › Disposiciones para obtener la frecuencia deseada o las características direccionales (para propositos de estereofonía H04R 5/00).
  • H04S1/00 H04 […] › H04S SISTEMAS ESTEREOFONICOS.Sistemas con dos canales (H04S 5/00, H04S 7/00 tienen prioridad).
  • H04S3/00 H04S […] › Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).

Fragmento de la descripción:

Procedimiento y aparato para el realzado del estéreo en grabaciones de audio.

Objeto de la invención

La presente invención se enmarca dentro del campo de sistemas de procesado digital de la señal orientados al sonido, en concreto en aquellos que mejoran la sensación espacial sonora dentro de lo que se conoce como realzado estéreo. En particular, la presente invención consiste en un procedimiento y un aparato para mejorar la sensación de espacialidad sonora cuando se realiza una grabación estéreo mediante dos micrófonos cercanos.

El uso de dos micrófonos omnidireccionales muy cercanos durante la grabación según técnicas del estado de la técnica produce una sensación estéreo muy pobre y aparece de forma muy evidente en los dispositivos móviles: cámaras fotográficas digitales, reproductores de MP3, teléfonos móviles, PDAs, etc. Con la aplicación de una solución técnica como la invención presentada en estos dispositivos se consigue una sensación estéreo de gran realismo, superando a los métodos existentes en el mercado actual.

Antecedentes de la invención

En el mundo del audio se ha trabajado ininterrumpidamente desde décadas en perfeccionar la calidad y naturalidad de los sistemas de reproducción de sonido. Actualmente, tras el despegue de los sistemas multimedia y de otros muchos campos relacionados con audio y vídeo, se sigue trabajando activamente en obtener sistemas de mejora de sonido que permitan aumentar la calidad en grabación-reproducción.

Una forma de aumentar la calidad subjetiva es sin duda conseguir lo que se denomina una mayor "espacialidad" sonora. En este sentido, el realzado estéreo persigue procesar una grabación sonora de 2 canales de forma que sea posible introducir una mayor sensación de espacio en la reproducción de sonido. De esta forma, la imagen sonora creada en la reproducción estéreo se amplía y consigue una mayor sensación de inmersión del oyente, enriqueciendo la experiencia auditiva. Esta sensación aumenta la calidad, profundidad y sentimiento de la música reproducida. Desde un punto de vista práctico, el realzado estéreo tiene como objetivo extender el campo estéreo hasta un arco de 180º frente al oyente.

En la actualidad hay muchos sistemas para el realzado estéreo de señales, la mayoría basadas en las siguientes manipulaciones:

Manipulación de Intensidad de los canales

Una forma de modificar la localización aparente de un sonido en el campo estéreo es alterar la intensidad de uno de los canales. De esta forma, el sonido parece venir de un punto cercano al canal de mayor ganancia.

Manipulación de retardos de los canales

Otra forma de alterar la localización aparente de un sonido en el campo estéreo es retrasar la llegada de la señal de un canal con respecto al otro. Esto se puede conseguir adelantando uno de los canales unos 10 ms con respecto al otro. El sonido que llega antes es el dominante y su localización será más próxima al altavoz en el que la señal está adelantada. Este efecto se conoce en la literatura como "efecto de precedencia" o "effecto Hass".

Manipulación de fase de los canales

Manipular la fase de los canales también puede resultar en una ampliación de la imagen estéreo. Si se invierte la fase de uno de los canales, el sonido puede incluso llegar a percibirse detrás del oyente.

Manipulación frecuencial de los canales

La ecualización de canales también es usada por otros procesadores para ampliar la imagen estéreo, por ejemplo, utilizando filtros donde las bajas frecuencias se envían hacia el canal izquierdo y las altas hacia el canal derecho. Sin embargo, el timbre de la grabación puede verse muy alterado.

A pesar de todas estas técnicas, no existen entre los sistemas de realzado estéreo, uno que combine estos efectos a partir de un análisis frecuencia a frecuencia de la señal estéreo y haciendo uso del conocimiento previo de la disposición de los micrófonos tal y como se consigue aplicando la presente invención.

La invención tiene la ventaja de procesar selectivamente el sonido captado por los dos micrófonos en tiempo y en frecuencia para modificar el campo estéreo atendiendo a la realidad en la que el sonido captado. Con ello se consigue una señal estéreo procesada resultante donde se han espacializado (dado sensación de distribución espacial) las fuentes sonoras captadas de forma totalmente realista y con una calidad resultante muy superior a los sistemas actuales.

Descripción de la invención

La presente invención consiste en un procedimiento para el realzado del estéreo en grabaciones de audio así como el aparato que es capaz de llevar a cabo dicho procedimiento. El procedimiento consta de las siguiente etapas esenciales:

a) Grabación con al menos dos medios de lectura de audio correspondiendo a dos puntos del espacio que se encuentran distantes entre sí.
Habitualmente estos medios de grabación serán dos micrófonos aunque no obstante, el procedimiento no se limita a este tipo de captura de la señal sino que puede aplicarse a señales previamente capturadas y almacenadas en formatos informáticos u otros analógicos.
b) Cada uno de los canales de lectura del audio se muestréa en el tiempo,
Esta es la etapa de transformación analógico/digital.
c) Aplicación de técnicas numéricas de transformada que transforman la señal leída en el tiempo a una señal expresada en el dominio frecuencial.
Los ejemplos de realización emplean la transformada rápida de Fourier.
d) Para cada punto de frecuencia se calcula la dirección de origen de la fuente sonora,
En el estado de la técnica no se lleva a cabo un tratamiento diferenciado por frecuencias. Frecuencias distintas pueden tener asociadas direcciones de procedencia también distintas. Puede ocurrir que con dos fuentes sonoras con un espectro de frecuencias, alguna de las frecuencias tratada de lugar a una dirección que no es la real sino la combinación de dos direcciones. En los experimentos llevados a cabo este efecto no es perceptible porque solo se da para una frecuencia. Una posible causa de la buena respuesta es que la combinación de las dos direcciones se perciban como resultado de un principio de superposición.
e) Para cada punto de frecuencia se lleva a cabo una amplificación diferenciada de cada canal en función de la dirección del origen de la fuente sonora.
Esta etapa es la que permite una reproducción ponderada para cada canal de salida en función de la dirección de origen de la fuente sonora. Aunque la distancia entre los medios de lectura sea muy pequeña, la detección de la dirección da lugar a un parámetro que posteriormente permite ampliar la apertura estéreo con el tratamiento sobre la señal.
f) Se genera una señal de salida estéreo aplicando una antitransformada que transforma la señal de salida modificada y expresada en el dominio frecuencial al dominio temporal.
Esta salida puede terminar almacenada, por ejemplo en un fichero informático, o bien siendo reproducida directamente en unos altavoces o auriculares.

En la exposición detallada de la invención se incorporan algunos detalles de mejora en un ejemplo de realización.

Las variantes del procedimiento que resultan de combinar las reivindicaciones dependientes 2 a 15 se consideran incorporadas por referencia en esta descripción.

Igualmente, el aparato de las reivindicaciones 16 a 19 se considera incorporado a esta descripción por referencia.

Descripción de los dibujos

Se complementa la presente memoria descriptiva, con un juego de planos, ilustrativos del ejemplo preferente y nunca limitativos de la invención.

La figura 1 muestra diversos ejemplos de dispositivos sobre los que es aplicable la invención.

La figura 2 es un esquema que permite determinar el cálculo de la dirección de llegada de un sonido desde su fuente sonora.

La figura 3 es un esquema del dispositivo que permite el procesado de las señales microfónicas.

La figura 4 es un esquema de representación para evaluar la relación entre dos...

 


Reivindicaciones:

1. Procedimiento para el realzado del estéreo en grabaciones de audio caracterizado porque consta de las siguiente etapas:

a) grabación con al menos dos medios de lectura de audio correspondiendo a dos puntos del espacio que se encuentran distantes entre sí,
b) cada uno de los canales de lectura del audio se muestréa en el tiempo,
c) aplicación de técnicas numéricas de transformada que transforman la señal leída en el tiempo a una señal expresada en el dominio frecuencial,
d) para cada punto de frecuencia se calcula la dirección de origen de la fuente sonora,
e) para cada punto de frecuencia se lleva a cabo una amplificación diferenciada de cada canal en función de la dirección del origen de la fuente sonora,
f) se genera una señal de salida estéreo aplicando una antitransformada que lleva la señal de salida modificada y expresada en el dominio frecuencial al dominio temporal.

2. Procedimiento según la reivindicación 1 caracterizado porque las señales tomadas para cada canal en la etapa b) se procesan por ventanas temporales.

3. Procedimiento según la reivindicación 2 caracterizado porque para cada ventana temporal se lleva a cabo un filtro que pondera los valores de la señal.

4. Procedimiento según la reivindicación 1 caracterizado porque la transformada utilizada es de Fourier.

5. Procedimiento según la reivindicación 1 caracterizado porque, dadas las señales X1(k,m) y X2(k,m) correspondientes a cada uno de los canales y expresadas en el dominio frecuencial, donde k es el índice de la transformada que corresponde a una frecuencia determinada y m indica la referencia temporal que corresponde a la ventana de tiempo sobre la que se expresa Xj(k,m) con j=1,2; el coseno D(k,m) que forma la dirección de llegada del sonido desde la fuente sonora (S) respecto a la linea que une los puntos del espacio sobre los que se lleva a cabo la lectura de audio se determina como donde el símbolo


donde el símbolo 13 denota el desfase entre uno y otro canal, N es el número de muestras en el dominio temporal, c es la velocidad de propagación del sonido, d es la distancia entre los puntos del espacio donde se lleva ca cabo la lectura de audio, y fs es la frecuencia de muestreo.

6. Procedimiento según la reivindicación 5 caracterizado porque los valores del coseno se limitan a [-1,1] cuando superan este rango.

7. Procedimiento según la reivindicación 6 caracterizado porque la amplificación diferenciada de la etapa e) para cada canal Xj(k,m) con j=1,2 en función de la dirección del origen de la fuente sonora para cada frecuencia se lleva a cabo utilizando una función de ganancia aj(k,m) para j=1,2 de tal modo que la salida en el dominio frecuencial para cada canal es


8. Procedimiento según la reivindicación 7 caracterizado porque la función de ganancia aj(k,m) para j=1,2 es una ley de panorámica de conservación de energía:


donde D'(k,m) es una transformación lineal del rango [-1,1] al rango [0,1] de la forma


9. Procedimiento según la reivindicación 7 caracterizado porque el valor del coseno del ángulo que determina la dirección de procedencia de la fuente sonora se modifica según un parámetro Ps para variar la sensación de apertura estéreo, incrementando la apertura o bien reduciendo la apertura.

10. Procedimiento según la reivindicación 9 caracterizado porque si Ps positivo incrementa la apertura estéreo, Ps negativo reduce la apertura estéreo, y Ps nulo no la modifica, entonces la relación entre el coseno D que corresponde a la dirección real de llegada del sonido desde la fuente sonora y el coseno Dm tomado tras la modificación es


donde sign(D) denota el signo de D y ?=1/Ps.

11. Procedimiento según la reivindicación 9 caracterizado porque el grado de modificación de la apertura estéreo se encuentra vinculado a la apertura que corresponde a la localización del punto central de lectura del audio situado desplazado una distancia z.

12. Procedimiento según la reivindicación 11 caracterizado porque la distancia z es la distancia entre el punto real de lectura del audio y el punto focal de una cámara de captura de imagen.

13. Procedimiento según la reivindicación 11 caracterizado porque la relación entre el valor del coseno del ángulo que determina la dirección de procedencia de la fuente sonora D se relaciona con el coseno del ángulo que determina la dirección de procedencia de la misma fuente en el punto central de lectura del audio situado desplazado una distancia z es


donde se considera que D=D(k,m) es el coseno del ángulo calculado, Dz=Dz(k,m) es el coseno del nuevo ángulo de llegada, y sign(D) es el signo de D.

14. Procedimiento según la reivindicación 13 caracterizado porque si el valor de la raíz cuadrada es negativo, el valor que se toma es sign(D).

15. Procedimiento según la reivindicación 8 y 14 caracterizado porque el valor de D'(k,m) es


16. Aparato para el realzado del estéreo en grabaciones de audio según cualquiera de los procedimientos anteriores caracterizado porque consta de:

• dos medios de lectura de audio situados separados a una distancia d que dan lugar a una señal de entrada para cada canal estéreo,
• un conversor analógico/digital de muestreo de la señal de entrada para cada canal estéreo,
• una unidad de cálculo de transformadas para generar una señal representada en el espacio frecuencial,
• una unidad de cálculo para determinar la dirección de procedencia de la fuente sonora para cada frecuencia,
• una unidad de cálculo para evaluar dos señales amplificadas según una ganancia selectiva,
• una unidad de cálculo de síntesis para la generación de una señal de audio en el dominio temporal

donde dos o más unidades de cálculo pueden estar integradas en una única unidad con capacidad de ejecución de más de una tarea.

17. Aparato según la reivindicación 16 caracterizado porque dispone de unos medios de entrada de un parámetro de ajuste del grado de apertura estéreo.

18. Aparato según la reivindicación 17 caracterizado los medios de entrada del parámetro de ajuste del grado de apertura estéreo se encuentran conectados a un segundo dispositivo de captura de imagen y vinculados en correspondencia con el grado de apertura visual de la imagen.

19. Aparato según cualquiera de las reivindicaciones 16 a 18 caracterizado porque dispone de unos medios de reproducción de la señal de salida de audio o de grabación del audio en un fichero informático.


 

Patentes similares o relacionadas:

MÉTODO, DISPOSITIVO, APARATO CODIFICADOR, APARATO DECODIFICADOR Y SISTEMA DE AUDIO, del 8 de Febrero de 2012, de Koninklijke Philips Electronics N.V. Dolby International AB: Método de procesamiento de una señal de mezcla descendente estéreo que comprende señales estéreo primera y segunda (L0, R0), codificando la señal de mezcla […]

SISTEMA Y PROCEDIMIENTO PARA LA TRANSMISIÓN INALÁMBRICA DE SEÑALES DE AUDIO DIGITALES, del 20 de Diciembre de 2011, de GRUNDIG MULTIMEDIA B.V.: Sistema para la transmisión inalámbrica de señales de audio digitales con una unidad central , con un dispositivo para la selección […]

Imagen de 'DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO…'DERIVACIÓN HÍBRIDA DE CANALES DE AUDIO DE SONIDO ENVOLVENTE COMBINANDO DE MANERA CONTROLABLE COMPONENTES DE SEÑAL DE SONIDO AMBIENTE Y CON DECODIFICACIÓN MATRICIAL, del 13 de Mayo de 2011, de DOLBY LABORATORIES LICENSING CORPORATION: Método para obtener dos canales de audio de sonido envolvente a partir de dos señales de audio de entrada, en el que dichas señales de audio de entrada pueden incluir componentes […]

Imagen de 'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA…'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AMPLIABLE PARA APLICACIONES DE BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 19 de Agosto de 2010, de CODING TECHNOLOGIES SWEDEN AB: Método para codificar una envolvente espectral de potencia de una señal de audio estereofónica o de una señal de audio multicanal que tiene dos canales, teniendo […]

Imagen de 'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA'CONTROL ADAPTATIVO DE COLA DE ECO PARA SINTESIS DE AUDIO PSEUDOESTEREOFONICA, del 13 de Mayo de 2010, de CODING TECHNOLOGIES AB: Unidad de reverberación para generar un primer canal y un segundo canal de una señal estereofónica o una señal multicanal, que comprende: un detector para detectar terminaciones […]

Imagen de 'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AJUSTABLE A ESCALA…'CODIFICACION ESTEREOFONICA PARAMETRICA EFICAZ Y AJUSTABLE A ESCALA PARA APLICACIONES DE CODIFICACION DE AUDIO A BAJA VELOCIDAD DE TRANSFERENCIA DE BITS, del 18 de Febrero de 2010, de DOLBY SWEDEN AB: Método para decodificar una envolvente espectral de potencia codificada de una señal estereofónica o una señal multicanal que tiene dos canales, teniendo los dos canales un […]

Imagen de 'PROCEDIMIENTO Y DISPOSITIVO DE ESPACIALIZACION SONORA BINAURAL…'PROCEDIMIENTO Y DISPOSITIVO DE ESPACIALIZACION SONORA BINAURAL EFICAZ EN EL DOMINIO TRANSFORMADO, del 7 de Diciembre de 2009, de FRANCE TELECOM: Procedimiento de espacialización sonora de una escena de audio que comprende un primer conjunto que comprende un número, superior o igual a la unidad, […]

DISPOSITIVO QUE TIENE UN MEDIO DE GENERACIÓN DE SONIDO PUNTUAL Y UNO ESPACIAL PARA PROPORCIONAR SENSACIÓN DE SONIDO ESTÉREO EN UN ÁREA GRANDE, del 11 de Julio de 2011, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Dispositivo que tiene un primer y un segundo medio de generación de sonido y una entrada para una señal estéreo (S) que comprende señales sonoras […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .