Control de una característica percibida del volumen sonoro de una señal de audio.

Un método para controlar una característica específica del volumen sonoro de una señal de audio,

en el cual lacaracterística específica del volumen sonoro es bien una aproximación del volumen sonoro específico, que es unamedida del volumen sonoro perceptivo como una función de la frecuencia y del tiempo, o bien una aproximación delvolumen sonoro específico parcial, que es una medida del volumen sonoro perceptivo de la señal en presencia de unaseñal secundaria de interferencia, como una función de la frecuencia y del tiempo, que comprende:

- calcular, como una función de la señal de audio, una aproximación a un volumen sonoro específico de destino, en elque dicha aproximación a un volumen sonoro específico de destino se obtiene usando un banco de filtros en el cual haymenos bandas de las que se obtendrían usando un banco de filtros en el cual las bandas estuvieran uniformementeespaciadas en la escala de ERB con un espaciado deseado de ERB de 1,

- obtener parámetros de modificación utilizables para modificar la señal de audio de manera variable en cuanto a lafrecuencia y/o al tiempo, a fin de reducir la diferencia entre su característica específica de volumen sonoro y laaproximación a un volumen sonoro específico de destino, y

a) aplicar los parámetros de modificación a la señal de audio para reducir la diferencia entre su característica específicade volumen sonoro y la aproximación a un volumen sonoro específico de destino, o

b) transmitir o almacenar los parámetros de modificación y la señal de audio para la aplicación, temporalmente y/oespacialmente separada, de los parámetros de modificación a la señal de audio, para reducir la diferencia entre sucaracterística específica de volumen sonoro y la aproximación a un volumen sonoro específico de destino.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/007946.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 PORTRERO AVENUE SAN FRANCISCO, CALIFORNIA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SEEFELDT,ALAN,JEFFREY.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
  • H03G3/32 ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03G CONTROL DE LA AMPLIFICACION (redes de impedancia, p. ej. atenuadores H03H; control de la transmisión en líneas H04B 3/04). › H03G 3/00 Control de la ganancia en los amplificadores o cambiadores de frecuencia (amplificadores controlados H03F 3/72; específicamente para los receptores de televisión H04N). › dependiendo el control del nivel de ruido ambiente o del nivel sonoro ambiental.
  • H03G5/16 H03G […] › H03G 5/00 Control de tono o control del ancho de banda de los amplificadores. › Control automático.
  • H03G9/00 H03G […] › Combinaciones de dos o más tipos de control, p. ej. control de ganancia y control de tono.
  • H03G9/02 H03G […] › H03G 9/00 Combinaciones de dos o más tipos de control, p. ej. control de ganancia y control de tono. › en amplificadores no sintonizados (controles de tono combinados para altas y bajas frecuencias H03G 5/00).
  • H04R25/00 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04R ALTAVOCES, MICROFONOS, CABEZAS DE LECTURA PARA GRAMOFONOS O TRANSDUCTORES ACUSTICOS ELECTROMECANICOS ANALOGOS; APARATOS PARA SORDOS; SISTEMAS PARA ANUNCIOS EN PUBLICO (producción de sonidos cuya frecuencia no está determinada por la frecuencia de alimentación G10K). › Aparatos para sordos.

PDF original: ES-2400160_T3.pdf

 

Control de una característica percibida del volumen sonoro de una señal de audio.

Fragmento de la descripción:

Control de una característica percibida del volumen sonoro de una señal de audio

Campo Técnico La invención se refiere al procesamiento de señales de audio. Más específicamente, la invención se refiere a la medición y control del volumen sonoro percibido y/o al equilibrio espectral percibido de una señal de audio. La invención es útil, por ejemplo, en uno o más de: control de volumen compensador del volumen sonoro, control de ganancia automático, control de gama dinámico (que incluye, por ejemplo, limitadores, compresores, expansores, etc.) , ecualización dinámica y compensación de la interferencia del ruido de fondo en un entorno de reproducción de audio. La invención incluye no solamente métodos, sino también los correspondientes programas de ordenador y aparatos.

Técnica anterior

Ha habido muchos intentos de desarrollar un método objetivo satisfactorio para medir el volumen sonoro. Fletcher y Munson determinaron en 1933 que el oído humano es menos sensible a frecuencias altas y bajas que a frecuencias medias (o de voz) . También hallaron que el cambio relativo en la sensibilidad disminuía según aumentaba el nivel del sonido. Un primitivo medidor del volumen sonoro consistía en un micrófono, un amplificador, un medidor y una combinación de filtros diseñados para imitar groseramente la respuesta de frecuencia del oído a niveles de sonido bajos, medios y altos.

Incluso aunque tales dispositivos proporcionaban una medición del volumen sonoro de un tono aislado, individual, de nivel constante, las mediciones de sonidos más complejos no coincidían muy bien con las impresiones subjetivas del

volumen sonoro. Los medidores del nivel sonoro de este tipo han sido estandarizados, pero se usan solamente para tareas específicas, tales como la monitorización y control del ruido industrial.

En los primeros años de la década de 1950, Zwicker y Stevens, entre otros, extendieron el trabajo de Fletcher y Munson al desarrollar un modelo más realista del proceso de percepción del volumen sonoro. Stevens publicó un método para el “Cálculo del volumen sonoro del ruido complejo” en la Revista de la Sociedad Acústica de América en 1956, y Zwicker publicó su artículo “Base psicológica y metodológica del volumen sonoro” en Acoustica en 1958. En 1959 Zwicker publicó un método gráfico para el cálculo del volumen sonoro, así como varios artículos similares poco después. Los métodos de Stevens y Zwicker fueron estandarizados como el estándar ISO 532, partes A y B (respectivamente) . Ambos métodos implican etapas similares.

En primer lugar, la distribución variable en el tiempo de la energía a lo largo de la membrana basilar del oído interno, denominada la excitación, es simulada haciendo pasar el audio a través de un banco de filtros auditivos de paso de banda, con frecuencias centrales separadas uniformemente en una escala crítica de velocidades de banda. Cada filtro auditivo está diseñado para simular la respuesta de frecuencia en una ubicación específica a lo largo de la membrana basilar del oído interno, correspondiendo la frecuencia central del filtro a esta ubicación. Un ancho de banda crítica se define como el ancho de banda de un filtro de ese tipo. Medida en unidades de Hercios, el ancho de banda crítica de estos filtros auditivos aumenta con la frecuencia central creciente. Por lo tanto, es útil definir una escala de frecuencia distorsionada de modo que el ancho de banda crítica para todos los filtros auditivos medidos en esta escala distorsionada sea constante. Una escala distorsionada de tal tipo se denomina la escala crítica de velocidades de banda, y es muy útil

para comprender y simular una amplia gama de fenómenos psicoacústicos. Véase, por ejemplo, Psicoacústica – Hechos y Modelos de E. Zwicker y H. Fastl, Springer-Verlag, Berlín, 1990. Los métodos de Stevens y Zwicker utilizan una escala crítica de velocidades de banda denominada la escala Bark, en la cual el ancho de banda crítica es constante por debajo de los 500 Hz y aumenta por encima de los 500 Hz. Más recientemente, Moore y Glasberg definieron una escala crítica de velocidades de banda, que llamaron la escala del Ancho de Banda Rectangular Equivalente (ERB) (B. C. J. Moore, B. Glasberg, T. Baer, “Un modelo para la predicción de umbrales, volumen sonoro y volumen sonoro parcial”, Revista de la Sociedad de Ingeniería de Audio, Vol. 45, Nº 4, Abril de 1997, págs. 224 a 240) . Mediante experimentos psicoacústicos, usando enmascaradores de ruido estriado, Moore y Glasberg demostraron que el ancho de banda crítica continúa disminuyendo por debajo de los 500 Hz, a diferencia de la escala Bark, donde el ancho de banda crítica permanece constante.

A continuación del cálculo de la excitación hay una función compresiva no lineal que genera una cantidad denominada “volumen sonoro específico”. El volumen sonoro específico es una medida del volumen sonoro perceptivo como una función de la frecuencia y del tiempo, y puede ser medido en unidades de volumen sonoro perceptivo por frecuencia unitaria, a lo largo de una escala crítica de velocidades de banda, tal como la escala Bark o ERB expuesta anteriormente. Idealmente, el volumen sonoro específico representa una distribución continua del volumen sonoro como una función de la frecuencia y del tiempo, y el “volumen sonoro total” variable en el tiempo se calcula integrando esta distribución con respecto a la frecuencia. En la práctica, una representación exacta del volumen sonoro específico se obtiene muestreando esta distribución uniformemente a lo largo de una escala crítica de velocidades de banda, mediante el uso, por ejemplo, de los filtros auditivos mencionados anteriormente. En este caso, el volumen sonoro total puede calcularse 65 sumando sencillamente el volumen sonoro específico proveniente de cada filtro. Para reducir la complejidad, algunas aplicaciones pueden calcular una aproximación más grosera al volumen sonoro específico, al precio de leves inexactitudes en la estimación y modificación del volumen sonoro percibido. Tales aproximaciones se expondrán en más detalle más adelante.

El volumen sonoro puede ser medido en unidad de phon. El volumen sonoro de un sonido dado en phon es el nivel de presión sonora (SPL) de un tono de 1 kHz con un volumen sonoro subjetivo igual al del sonido. Convencionalmente, los 0 dB de referencia para el SPL es una presión de raíces cuadradas mínimas de 2 x 10-5 Pascal, y esto también es, por lo tanto, el 0 phon de referencia. Usando esta definición al comparar el volumen sonoro de los tonos a frecuencias distintas a 1 kHz con el volumen sonoro a 1 kHz, puede determinarse un perfil de igual volumen sonoro para un nivel dado de phon. La Figura 11 muestra perfiles de igual volumen sonoro para frecuencias entre 20 Hz y 12, 5 kHz, y para niveles de phon entre 4, 2 phon (considerado el umbral de la audición) y 120 phon (ISO226: 1087 (E) , “Acústica – Perfiles normales de igual nivel de volumen sonoro”) . La medición en phon tiene en cuenta la sensibilidad variable del oído humano con la frecuencia, pero los resultados no permiten la evaluación de los relativos volúmenes sonoros subjetivos de los sonidos a niveles variables, porque no hay ningún intento de corregir la no linealidad del crecimiento del volumen sonoro con el SPL, es decir, el hecho de que la separación de los perfiles varía.

El volumen sonoro también puede medirse en unidades de “sone”. Hay una correlación de uno a uno entre las unidades de phon y las unidades de sone, según lo indicado en la figura 11. Un sone se define como el volumen sonoro de una onda sinusoidal pura de 40 dB (SPL) y 1kHz, y es equivalente a 40 phon. Las unidades de sone son tales que un aumento doble en los sone corresponde a una duplicación del volumen sonoro percibido. Por ejemplo, 4 sone son percibidos como el doble de sonoros que 2 sone. Así, expresar niveles de volumen sonoro en sone es más informativo. Dada la definición del volumen sonoro específico como una medida del volumen sonoro perceptivo como una función de la frecuencia y del tiempo, el volumen sonoro específico puede ser medido en unidades de sone por frecuencia unitaria. De ese modo, al usar la escala Bark, el volumen sonoro específico tiene unidades de sone por Bark y, análogamente, al usar la escala ERB, las unidades son sone por ERB.

Como se ha mencionado anteriormente, la sensibilidad del oído humano varía tanto con la frecuencia como con el nivel, un hecho bien documentado en la bibliografía de la psicoacústica. Uno de los resultados es que el espectro o timbre percibido de un sonido dado varía con el nivel acústico en el cual se oye el sonido.... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para controlar una característica específica del volumen sonoro de una señal de audio, en el cual la característica específica del volumen sonoro es bien una aproximación del volumen sonoro específico, que es una medida del volumen sonoro perceptivo como una función de la frecuencia y del tiempo, o bien una aproximación del volumen sonoro específico parcial, que es una medida del volumen sonoro perceptivo de la señal en presencia de una señal secundaria de interferencia, como una función de la frecuencia y del tiempo, que comprende:

- calcular, como una función de la señal de audio, una aproximación a un volumen sonoro específico de destino, en el

que dicha aproximación a un volumen sonoro específico de destino se obtiene usando un banco de filtros en el cual hay menos bandas de las que se obtendrían usando un banco de filtros en el cual las bandas estuvieran uniformemente espaciadas en la escala de ERB con un espaciado deseado de ERB de 1,

- obtener parámetros de modificación utilizables para modificar la señal de audio de manera variable en cuanto a la 15 frecuencia y/o al tiempo, a fin de reducir la diferencia entre su característica específica de volumen sonoro y la aproximación a un volumen sonoro específico de destino, y

a) aplicar los parámetros de modificación a la señal de audio para reducir la diferencia entre su característica específica de volumen sonoro y la aproximación a un volumen sonoro específico de destino, o b) transmitir o almacenar los parámetros de modificación y la señal de audio para la aplicación, temporalmente y/o espacialmente separada, de los parámetros de modificación a la señal de audio, para reducir la diferencia entre su característica específica de volumen sonoro y la aproximación a un volumen sonoro específico de destino.

2. Un método según la reivindicación 1, en el cual cada banda en dicho banco de filtros es mayor que 1 ERB.

3. Un método para controlar una característica específica del volumen sonoro de una señal de audio, en el cual la característica específica del volumen sonoro es bien una aproximación del volumen sonoro específico, que es una medida del volumen sonoro perceptivo como una función de la frecuencia y del tiempo, o bien una aproximación del

volumen sonoro específico parcial, que es una medida del volumen sonoro perceptivo de la señal de audio en presencia de una señal secundaria de interferencia como una función de la frecuencia y del tiempo, que comprende:

-recibir de una transmisión, o reproducir desde un medio de almacenamiento, la señal de audio y

a) parámetros de modificación para modificar la señal de audio, habiendo sido obtenidos los parámetros de modificación a partir de una aproximación a un volumen sonoro específico de destino que emplea un banco de filtros en el cual hay menos bandas de las que se obtendrían usando un banco de filtros en el cual las bandas estuvieran uniformemente espaciadas en la escala de ERB, con un espaciado deseado de ERB de 1, habiendo sido calculada dicha aproximación como una función de la señal de audio, o b) una aproximación a un volumen sonoro específico de destino que emplea un banco de filtros en el cual hay menos bandas de las que se obtendrían usando un banco de filtros en el cual las bandas estuvieran uniformemente espaciadas en la escala de ERB, con un espaciado deseado de ERB de 1, o una representación de la aproximación a ese volumen sonoro específico de destino, habiendo sido calculada dicha aproximación como una función de la señal de audio, y

- modificar, de manera variable en cuanto a la frecuencia y/o al tiempo, la señal de audio en respuesta a a) los parámetros de modificación recibidos o b) los parámetros de modificación obtenidos de dicha aproximación a un volumen sonoro específico de destino, o su representación, a fin de reducir la diferencia entre la característica específica del volumen sonoro de la señal de audio y la aproximación a un volumen sonoro específico de destino.

4. Un método según la reivindicación 3, en el cual cada banda en dicho banco de filtros que es empleada en la aproximación al volumen sonoro específico de destino es mayor que 1 ERB.

5. Un método según cualquiera de las reivindicaciones 1 a 4, en el cual las bandas en el banco de filtros están 55 espaciadas no uniformemente en una escala crítica de velocidades de banda.

6. Aparato adaptado para realizar todas las etapas del método de cualquiera de las reivindicaciones 1 a 5.

7. Un programa de ordenador, almacenado en un medio legible por ordenador, adaptado para hacer que un ordenador 60 realice todas las etapas del método de cualquiera de las reivindicaciones 1 a 5.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .