Sistema y método para generación de sonido dinámico.

Un sistema de manipulación del rango dinámico que comprende:

una primera entrada configurada para proporcionar una señal de audio;



una segunda entrada configurada para proporcionar una señal de indicación de ruido para ruido ambiental en una posición de reproducción; y

un procesador configurado para:

recibir la señal de audio y la señal de indicación de ruido,

tomar muestras en el tiempo de cada una de la señal de audio y de la señal de indicación de ruido, dividir las muestras en el tiempo de cada una de la señal de audio y de la señal de indicación de ruido en tramas, y transformar cada una de la señal de audio y de la señal de indicación de ruido en una pluralidad de sub-bandas de frecuencia,

para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de indicación de ruido, y determinar además una potencia de ruido suavizada y rastreada a partir de la potencia de ruido suavizada aplicando un filtro paso bajo a la potencia de ruido suavizada,

para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de audio,

para cada trama y para cada sub-banda de frecuencia, calcular un valor de codo de compresión a partir de la potencia de ruido suavizada y rastreada de acuerdo con la ecuación**Fórmula**

donde Ki es el valor de codo de compresión para la trama y la sub-banda de frecuencia actuales y Ni es la potencia de ruido suavizada y rastreada para la trama y la sub-banda de frecuencia actuales, para cada trama y para cada sub-banda de frecuencia, determinar una ganancia de compresión de acuerdo con la potencia de audio suavizada y curva de ganancia definida por**Fórmula**

en la cual Gi es la ganancia de compresión en forma logarítmica para la trama y la sub-banda de frecuencia actuales, Pi es la potencia de audio suavizada para la trama y la sub-banda de frecuencia actuales, y h y m son parámetros de ganancia de compresión, y

para cada trama y para cada sub-banda de frecuencia, aplicar la ganancia de compresión a la señal de audio para generar una señal de salida controlada en ganancia.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/042629.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: TAENZER,JON C.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L21/0208 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p.ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Filtración del ruido.
  • H03G3/32 SECCION H — ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03G CONTROL DE LA AMPLIFICACION (redes de impedancia, p. ej. atenuadores H03H; control de la transmisión en líneas H04B 3/04). › H03G 3/00 Control de la ganancia en los amplificadores o cambiadores de frecuencia (amplificadores controlados H03F 3/72; específicamente para los receptores de televisión H04N). › dependiendo el control del nivel de ruido ambiente o del nivel sonoro ambiental.
  • H03G9/00 H03G […] › Combinaciones de dos o más tipos de control, p. ej. control de ganancia y control de tono.
  • H03G9/02 H03G […] › H03G 9/00 Combinaciones de dos o más tipos de control, p. ej. control de ganancia y control de tono. › en amplificadores no sintonizados (controles de tono combinados para altas y bajas frecuencias H03G 5/00).

PDF original: ES-2548977_T3.pdf

 

Ver la galería de la patente con 7 ilustraciones.

Fragmento de la descripción:

Sistema y método para generación de sonido dinámico CAMPO TÉCNICO La presente descripción está relacionada con reproducción de audio, por ejemplo en sistemas de comunicación bidireccionales como por ejemplo teléfonos móviles y walkie-talkies.

ANTECEDENTES El ruido ambiental puede interferir a veces con el suministro de información de audio. En un sistema de comunicación bidireccional por ejemplo, en el cual el hablante de extremo lejano está en una posición alejada del oyente de extremo cercano, el hablante de extremo lejano, ignorante de las condiciones de ruido en la posición del oyente, puede no adoptar medidas para compensar el hecho de que se produzcan episodios de ruido disruptivos (instantáneos o sostenidos) . Por ejemplo, el hablante, no consciente de un coche que pasa por la posición del oyente, puede no elevar su voz para mantener la audibilidad para el oyente, y las palabras del hablante pueden no ser oídas o comprendidas por el oyente, incluso si el sistema fuera eléctricamente y mecánicamente capaz de manejar dicha compensación. La incapacidad del oyente de discernir el habla del hablante en dichas circunstancias es debida al fenómeno psicológico bien conocido llamado "enmascaramiento", que es cuando el ruido local, al ser suficientemente alto, cubre o enmascara, a la señal sonora de extremo lejano reproducida. Por supuesto, este problema no está limitado a los sistemas de comunicación bidireccionales, y el ruido ambiental puede interferir de manera similar con voces pregrabadas, o con cualquier información de audio prealmacenada que se esté reproduciendo. La Patente US 2003/0223597 A1 describe un método para control de la ganancia dinámica.

La Patente US 5.434.922 describe un sistema para compensar el nivel de ruido en el interior de un vehículo midiendo el nivel de la música y el nivel de ruido dentro del vehículo.

La Patente US 6.011.853 está relacionada con ecualización en un teléfono digital.

La Patente US 6.507.623 B1 describe un método para reducción de ruido.

La Patente US 2006/0034447 A1 describe un método para captura clara de señal.

Las Patentes US 5.907.823, US 4.887.299, JP 2000-196388 A, EP 2066025 A2 y JP H05-110362 A describen métodos para control del rango dinámico.

VISIÓN GLOBAL La invención está definida por las reivindicaciones independientes 1 y 9. En las reivindicaciones dependientes se describen realizaciones preferentes.

BREVE DESCRIPCIÓN DE LOS DIBUJOS Los dibujos adjuntos, los cuales están incorporados en esta especificación y constituyen una parte de la misma, ilustran uno o más ejemplos de realizaciones y, junto con la descripción de realizaciones de ejemplo, sirven para explicar los principios e implementaciones de las realizaciones.

En los dibujos: La Figura 1A es un diagrama de un sistema 100 de comunicación de audio bidireccional que permite que dos usuarios se comuniquen a distancia el uno con el otro. La Figura 1B es un diagrama de bloques de un dispositivo 102 de comunicación del sistema 100 de comunicación de la Figura 1A. La Figura 2 es un diagrama de bloques de un sistema de generación de sonido dinámico. La Figura 3 es un diagrama de bloques de un sistema 300 de manipulación del rango dinámico que puede constituir parte del procesador 202 de la Figura 2 (y del controlador 110 de la Figura 1B) . La Figura 4 es un diagrama de bloques relacionado con un proceso de transformada de Fourier de tiempo corto (STFT) estándar. La Figura 5 es un diagrama de flujo de un proceso de manipulación del rango dinámico. La Figura 6 es un diagrama de bloques de los módulos o circuitos de procesamiento utilizados en la implementación del proceso de la Figura 5. La Figura 7A es un gráfico de diferentes curvas de compresión/expansión. La Figura 7B es un gráfico de curvas de nivel de ganancia para una sub-banda. La Figura 7C es una curva de nivel del nivel de la señal de reproducción utilizada para excitar el altavoz 206.

DESCRIPCIÓN DE REALIZACIONES DE EJEMPLOS En este documento se describen realizaciones de ejemplo en el contexto de un sistema y método para generación de sonido dinámico. Las personas con experiencia ordinaria en la técnica se darán cuenta de que la descripción que sigue es sólo ilustrativa y que no tiene intención de ser limitativa de ninguna manera. Otras realizaciones se insinuarán rápidamente a dichas personas con experiencia en la técnica que se beneficien de esta descripción. Se

hará ahora referencia en detalle a implementaciones de las realizaciones de ejemplo como las ilustradas en los dibujos adjuntos. En la medida de lo posible, para hacer referencia a elementos iguales o similares se utilizarán los mismos indicadores de referencia en todos los dibujos y a lo largo de toda la descripción que sigue.

Para mayor claridad, no se muestran y se describen todos los rasgos rutinarios de las implementaciones descritas en este documento. Por supuesto, se observará que en el desarrollo de cualquier implementación real de este tipo, se deben tomar numerosas decisiones específicas de implementación para alcanzar los objetivos específicos del desarrollador, tales como el cumplimiento de restricciones relacionadas con la aplicación y con el negocio, y que estos objetivos específicos variarán de una implementación a otra y de un desarrollador a otro. Además, se observará que un esfuerzo de desarrollo como este podría ser complejo y de larga duración, pero que sin embargo sería una tarea rutinaria de ingeniería para las personas con experiencia ordinaria en la técnica que se beneficien de esta descripción.

De acuerdo con esta descripción, los componentes, etapas del proceso, y/o estructuras de datos descritos en este documento se pueden implementar utilizando diferentes tipos de sistemas operativos, plataformas informáticas, programas informáticos, y/o máquinas de propósito general. Además, las personas con experiencia ordinaria en la técnica reconocerán que también se pueden utilizar dispositivos que tengan una naturaleza de propósito menos general, tales como dispositivos conectados por cable, matrices de puertas programables in situ (FPGAs) , circuitos integrados específicos para aplicaciones (ASICs) , o similares, sin apartarse del alcance de los conceptos de la invención definidos por las reivindicaciones adjuntas.

En los casos en que un método que comprende una serie de etapas de proceso es implementado mediante un ordenador o una máquina y esas etapas de proceso se pueden almacenar como una serie de instrucciones que pueden ser leídas por la máquina, se pueden almacenar en un medio físico tal como un dispositivo informático de memoria (por ejemplo, una ROM (Memoria de Sólo Lectura) , una PROM (Memoria de Sólo Lectura Programable) , una EEPROM (Memoria de Sólo Lectura Programable con Borrado Eléctrico) , una Memoria FLASH, una memoria USB, y similares) , en un medio de almacenamiento magnético (por ejemplo, una cinta, un disco magnético, y similares) , en un medio de almacenamiento óptico (por ejemplo, un CD-ROM, un DVD-ROM, una tarjeta de papel, una cinta de papel y similares) y otros tipos de memoria de programa.

Las realizaciones de ejemplo descritas en este documento se presentan en el contexto de un proceso implementado utilizando un proceso de señal digital. Se reconocerá que cada etapa de proceso se puede conseguir con implementaciones alternativas, por ejemplo, utilizando circuitos analógicos. Aunque el hardware que soporta una implementación analógica parecería diferente a la implementación hardware en el dominio digital, la naturaleza fundamental de cada una de las correspondientes etapas de proceso es equivalente. De esta forma, los procesos descritos en este documento tienen el objetivo de ser aplicables a cualquier implementación hardware en el dominio analógico o digital.

La Figura 1A es un diagrama de un sistema 100 de comunicación de audio bidireccional que permite que dos usuarios se comuniquen a distancia el uno con el otro. Cada usuario está provisto de un dispositivo 102 de comunicación, mostrado con mayor detalle en el diagrama de bloques de la Figura 1B. Cada dispositivo 102 de comunicación incluye micrófono 104, altavoz 106, transmisor-receptor 108 y procesador o controlador 110. En un primer "circuito" de comunicación, la voz del usuario que se encuentra en una posición remota o de extremo lejano es recogida por un micrófono 104 del dispositivo 102 de comunicación en esa posición del usuario, y es transmitida, de forma inalámbrica o de otra forma, para que sea reproducida por un altavoz 106 del dispositivo 102 de comunicación en la posición del usuario local o de extremo cercano. De manera similar, en un segundo "circuito" de comunicación, la voz del usuario que se encuentra... [Seguir leyendo]

 


Reivindicaciones:

1. Un sistema de manipulación del rango dinámico que comprende:

una primera entrada configurada para proporcionar una señal de audio; una segunda entrada configurada para proporcionar una señal de indicación de ruido para ruido ambiental en una posición de reproducción; y un procesador configurado para:

recibir la señal de audio y la señal de indicación de ruido, tomar muestras en el tiempo de cada una de la señal de audio y de la señal de indicación de ruido, dividir las muestras en el tiempo de cada una de la señal de audio y de la señal de indicación de ruido en tramas, y transformar cada una de la señal de audio y de la señal de indicación de ruido en una pluralidad de sub-bandas de frecuencia, para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de indicación de ruido, y determinar además una potencia de ruido suavizada y rastreada a partir de la potencia de ruido suavizada aplicando un filtro paso bajo a la potencia de ruido suavizada, para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de audio, para cada trama y para cada sub-banda de frecuencia, calcular un valor de codo de compresión a partir de la potencia de ruido suavizada y rastreada de acuerdo con la ecuación

** (Ver fórmula) **

donde Ki es el valor de codo de compresión para la trama y la sub-banda de frecuencia actuales y Ni es la potencia de ruido suavizada y rastreada para la trama y la sub-banda de frecuencia actuales, para cada trama y para cada sub-banda de frecuencia, determinar una ganancia de compresión de acuerdo con la potencia de audio suavizada y curva de ganancia definida por

** (Ver fórmula) **

en la cual Gi es la ganancia de compresión en forma logarítmica para la trama y la sub-banda de frecuencia actuales, Pi es la potencia de audio suavizada para la trama y la sub-banda de frecuencia actuales, y y µ son parámetros de ganancia de compresión, y para cada trama y para cada sub-banda de frecuencia, aplicar la ganancia de compresión a la señal de audio para generar una señal de salida controlada en ganancia.

2. Sistema de acuerdo con la reivindicación 1, en el cual la determinación de potencia se realiza sobre dos subbandas para cada una de la señal de audio y de la señal de indicación de ruido.

3. Sistema de acuerdo con la reivindicación 2, en el cual las dos sub-bandas van respectivamente desde aproximadamente 50 Hz hasta aproximadamente 1 kHz, y desde aproximadamente 1 kHz hasta aproximadamente 3, 5 kHz.

4. Sistema de acuerdo con la reivindicación 1, en el cual la determinación de potencia se realiza en el dominio logarítmico para al menos una de la señal de audio y de la señal de indicación de ruido.

5. Sistema de acuerdo con la reivindicación 1, en el cual la señal de salida controlada en ganancia utiliza un valor de ganancia que es sometido a una función de suavizado.

6. Sistema de acuerdo con la reivindicación 1, en el cual la señal de salida controlada en ganancia es presentada por un altavoz de acuerdo con una señal de excitación de reproducción, y la señal de indicación de ruido es proporcionada por una fuente de señal de indicación de ruido basada en ruido ambiental en la posición del altavoz.

7. Sistema de acuerdo con la reivindicación 1, en el cual la señal de audio es información de audio pre-grabada.

8. Sistema de acuerdo con la reivindicación 1, en el cual la señal de audio es información de audio generada en tiempo real.

9. Un método para compensación de ruido ambiental en una posición de reproducción, que comprende:

recibir una señal de ruido ambiental indicativa del ruido ambiental, 11

recibir una señal de audio, tomar muestras en el tiempo de cada una de la señal de audio y de la señal de ruido ambiental, dividir las muestras en el tiempo de cada una de la señal de audio y de la señal de ruido ambiental en tramas, y transformar cada una de la señal de audio y de la señal de ruido ambiental en una pluralidad de sub-bandas de frecuencia, para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de ruido ambiental y determinar, además, una potencia de ruido suavizada y rastreada a partir de la potencia de ruido suavizada aplicando un filtro paso bajo a la potencia de ruido suavizada, para cada trama y para cada sub-banda de frecuencia, determinar una potencia de ruido suavizada a partir de la señal de audio, para cada trama y para cada sub-banda de frecuencia, calcular un valor de codo de compresión a partir de la potencia de ruido suavizada y rastreada de acuerdo con la ecuación

** (Ver fórmula) **

donde Ki es el valor de codo de compresión para la trama y la sub-banda de frecuencia actuales y Ni es la potencia de ruido suavizada y rastreada para la trama y la sub-banda de frecuencia actuales, para cada trama y para cada sub-banda de frecuencia, determinar una ganancia de compresión de acuerdo con la potencia de audio suavizada y con una curva de ganancia definida por

** (Ver fórmula) **

donde Gi es la ganancia de compresión en forma logarítmica para la trama y la sub-banda de frecuencia actuales, Pi es la potencia de audio suavizada para la trama y la sub-banda de frecuencia actuales, y y µ son parámetros de ganancia de compresión, y para cada trama y para cada sub-banda de frecuencia, aplicar la ganancia de compresión a la señal de audio para generar una señal de salida controlada en ganancia.

10. Método de acuerdo con la reivindicación 9, en el cual la determinación de potencia se realiza sobre dos subbandas para cada una de la señal de audio y de la señal de ruido ambiental.

11. Método de acuerdo con la reivindicación 10, en el cual las dos sub-bandas van respectivamente desde aproximadamente 50 Hz hasta aproximadamente 1 kHz, y desde aproximadamente 1 kHz hasta aproximadamente 3, 5 kHz.

12. Método de acuerdo con la reivindicación 9, en el cual la determinación de potencia se realiza en el dominio logarítmico para al menos una de la señal de audio y la señal de ruido ambiental.

13. Método de acuerdo con la reivindicación 9, que comprende además el suavizado de un valor de control de ganancia aplicado a la señal de salida.

14. Método de acuerdo con la reivindicación 9, que comprende además la generación de la señal de audio a partir de una fuente pre-grabada.

15. Método de acuerdo con la reivindicación 9, que comprende además la generación de la señal de audio en tiempo real.

 

Patentes similares o relacionadas:

Método y aparato para emitir señal de audio, y método de ajuste del volumen de la señal de audio, del 25 de Abril de 2018, de Gaonda Corporation: Un método para emitir una señal de audio, comprendiendo el método: (a) determinar un nivel de salida de una señal modulada a emitir para cada respectiva […]

Decodificador de audio con sonoridad y metadatos de límite de programa, del 19 de Octubre de 2016, de DOLBY LABORATORIES LICENSING CORPORATION: Un aparato para procesar una señal de audio, comprendiendo el aparato: un búfer de entrada para almacenar al menos una trama de un flujo […]

Codificador y decodificador de audio con metadatos de límite y sonoridad de programa, del 15 de Junio de 2016, de DOLBY LABORATORIES LICENSING CORPORATION: Una unidad de procesamiento de audio que comprende: una memoria intermedia para almacenar al menos una trama de un tren de bits de audio […]

Aparato y método para modificar una señal de audio de entrada, del 3 de Diciembre de 2014, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato para modificar una señal de audio de entrada, que comprende: un determinador de la excitación configurado para determinar un valor de un parámetro […]

Control de una característica percibida del volumen sonoro de una señal de audio, del 8 de Abril de 2013, de DOLBY LABORATORIES LICENSING CORPORATION: Un método para controlar una característica específica del volumen sonoro de una señal de audio, en el cual lacaracterística específica […]

CIRCUITO DE TRATAMIENTO DE SEÑALES CONMUTADAS., del 1 de Mayo de 2004, de THOMSON CONSUMER ELECTRONICS, INC.: Una disposición de tratamiento de señal de audio, que comprende: una fuente de una señal de entrada; una salida de señal; un primer circuito expansor […]

DESCODIFICADOR DSP PARA DESCODIFICAR SEÑALES DE AUDIO CODIFICADAS EN SR, ANALOGICAS., del 16 de Diciembre de 2001, de SONY PICTURES ENTERTAINMENT INC.: ESTE DESCODIFICADOR CAPAZ DE DESCODIFICAR SEÑALES DE AUDIO CODIFICADAS MEDIANTE TECNICAS ANALOGICAS DE REDUCCION DE RUIDO, PARTICULARMENTE DOLBY SR SE MATERIALIZA MEDIANTE […]

MICROFONO INALAMBRICO CON UN SISTEMA DE COMPASION DE AUDIO DE BANDA DIVIDIDA QUE PROPORCIONA REDUCCCION DE RUIDO Y CALIDAD DEL SONIDO MEJORADAS, del 5 de Marzo de 2010, de AUDIO-TECHNICA U.S., INC: Un sistema 32 de micrófono inalámbrico, que comprende, en combinación: un transmisor 40 dispuesto en una primera ubicación, teniendo dicho transmisor 40 un transductor […]

Otras patentes de DOLBY LABORATORIES LICENSING CORPORATION