MEDICIÓN ECONÓMICA DE LA INTENSIDAD DE UNA SEÑAL DE AUDIO CODIFICADA.

Procedimiento para medir la intensidad de una señal de audio codificada en una secuencia de bits,

que incluye datos a partir de los cuales puede derivarse una aproximación de un espectro de potencia de la señal de audio, sin decodificar completamente la señal de audio, incluyendo dichos datos representaciones toscas de la señal de audio y representaciones más finas de la señal de audio, siendo seleccionadas dichas representaciones toscas de entre un grupo que contiene factores de escala, envolventes espectrales y coeficientes predictivos lineales, comprendiendo el procedimiento derivar dicha aproximación del espectro de potencia de la señal de audio a partir de dichas representaciones toscas de la señal de audio en dicha secuencia de bits, sin decodificar completamente la señal de audio, y determinar una intensidad aproximada de la señal de audio en respuesta a la aproximación del espectro de potencia de la señal de audio

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/010823.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CALIFORNIA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SEEFELDT,ALAN,JEFFREY, CROCKETT,BRETT,GRAHAM, SMITHERS,MICHAEL,JOHN.

Fecha de Publicación: .

Fecha Solicitud PCT: 23 de Marzo de 2006.

Clasificación Internacional de Patentes:

  • H04S7/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

Clasificación PCT:

  • G10L11/00
  • H04S7/00 H04S […] › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.

PDF original: ES-2373741_T3.pdf

 


Fragmento de la descripción:

Medición económica de la intensidad de una señal de audio codificada.

Campo técnico

La invención se refiere al procesamiento de señales de audio. Más particularmente, se refiere a un cálculo económico de una medición objetiva de la intensidad de una señal de audio codificada con baja tasa de bits, tales como una señal de audio codificada con Dolby Digital (AC-3) , Dolby Digital Plus o Dolby E. "Dolby", "Dolby Digital", "Dolby Digital Plus" y "Dolby E" son marcas comerciales de Dolby Laboratories Licensing Corporation. Los aspectos de la invención también pueden ser usados en otros tipos de codificación de audio.

Antecedentes de la técnica Los detalles de la codificación Dolby Digital se exponen en las referencias siguientes:

ATSC Standard A52/A: Digital Audio Compression Standard (AC-3) , Revision A, Advanced Television Systems Committee, 20 Ag. 2001. El documento A/52A está disponible en la Web en la dirección http://www.atsc.org/standards.html. Flexible Perceptual Coding for Audio Transmission and Storage, " por Craig C. Todd, et al, 96ª Convención de la Audio Engineering Society, 26 Feb. 1994, Preprint 3796; "Design and Implementation of AC-3 Coders, " por Steve Vernon, IEEE Trans. Consumer Electronics, Vol. 41, No. 3, Ag. 1995. "The AC-3 Multichannel Coder" by Mark Davis, Audio Engineering Society Preprint 3774, 95ª Convención AES, Octubre, 1993. "High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications, " por Bosi et al, Audio Engineering Society Preprint 3365, 93ª Convención AES, Octubre, 1992.

Las patentes US Nos. 5.583.962, 5.632.005, 5.633.981, 5.727.119, 5.909.664 y 6.021.386.

Los detalles de la codificación Dolby Digital Plus se describen en "Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System, " Artículo de la convención AES 6196, 117ª Convención AES, 28 Oct, 2004.

Los detalles de la codificación Dolby E se describen en ""Efficient Bit Allocation, Quantization, and Coding in an Audio Distribution System", AES Preprint 5068, 107ª Conferencia AES, Agosto 1999 y "Professional Audio Coder Optimized for Use with Video", AES Preprint 5033, 107ª Conferencia AES Agosto 1999.

Una visión general de diversos codificadores perceptuales, incluyendo codificadores Dolby, codificadores MPEG, y otros, se describe en "Overview of MPEG Audio: Current and Future Standards for Low-Bit-Rate Audio Coding, " por Karlheinz Brandenburg y Marina Bosi, J. Audio Eng. Soc., Vol. 45, No. 1/2, Enero/Febrero 1997.

Existen muchos procedimientos para medir objetivamente la intensidad percibida de las señales de audio. Los ejemplos de procedimientos incluyen mediciones de potencia ponderada (tales como LeqA, LeqB, LeqC) , así como mediciones de intensidad basadas en psicoacústica, tales como "Acoustics – Method for Calculating Loudness Level”, ISO532 (1975) . Las mediciones ponderadas de intensidad de potencia procesan la señal de audio de entrada mediante la aplicación de un filtro predeterminado que enfatiza las frecuencias perceptiblemente más sensibles, mientras que resta importancia a las frecuencias perceptiblemente menos sensibles y, a continuación, promedian la potencia de la señal filtrada durante un período de tiempo predeterminado. Los procedimientos psicoacústicos son, típicamente, más complejos y su objetivo es modelar mejor el funcionamiento del oído humano. Esto se consigue dividiendo la señal de audio en bandas de frecuencia que imitan la respuesta de frecuencia y la sensibilidad del oído y, a continuación, manipulan e integran estas bandas, teniendo en cuenta fenómenos psicoacústicos, tales como el enmascaramiento temporal y de frecuencia, así como la percepción no lineal de la intensidad con intensidades diferentes de la señal. El objetivo de todos los procedimientos de medición objetiva de la intensidad es obtener una medición numérica de la intensidad que se ajuste estrechamente a la percepción subjetiva de la intensidad de una señal de audio.

La codificación perceptual o codificación de señal de audio a baja tasa de bits es usada, normalmente, para comprimir datos de señales de audio para un almacenamiento, una transmisión y un suministro eficiente en aplicaciones tales como emisión de televisión digital y la venta en línea de música por Internet. La codificación perceptual consigue su eficiencia transformando la señal de audio en un espacio de información, donde tanto las redundancias como los componentes de la señal que están enmascarados psicoacústicamente, pueden ser descartados fácilmente. La información restante es empaquetada en una secuencia o en un archivo de información digital. Típicamente, la medición de la intensidad de la señal de audio, representada por una señal de audio codificada a baja tasa de bits, requiere decodificar de nuevo la señal de audio al dominio temporal (por ejemplo, PCM) , lo que puede ser computacionalmente intensivo. Sin embargo, algunas

señales codificadas perceptualmente, a baja tasa de bits, contienen información que puede ser útil para un procedimiento de medición de intensidad, ahorrando, de esta manera, el costo computacional de decodificar totalmente la señal de audio. Dolby Digital (AC-3) , Dolby Digital Plus y Dolby E se encuentran entre estos sistemas de codificación de audio.

Los codificadores de audio perceptuales, de baja tasa de bits, Dolby Digital, Dolby Digital Plus y Dolby E dividen las señales de audio en segmentos de ventanas de tiempo, superpuestas (o bloques de codificación de audio) , que son transformados a una representación en el dominio de la frecuencia. La representación en el dominio de la frecuencia de los coeficientes espectrales es expresada mediante una notación exponencial que comprende conjuntos de un exponente y la mantisa asociada. Los exponentes, que funcionan como factores de escala, son empaquetados en la secuencia de audio codificada. Las mantisas representan los coeficientes espectrales después de haber sido normalizadas por los exponentes. A continuación, los exponentes son pasados a través de un modelo perceptual del oído y usados para cuantificar y empaquetar las mantisas en la secuencia de audio codificada. Tras la decodificación, los exponentes son desempaquetados desde la secuencia de audio codificada y, a continuación, son pasados a través del mismo modelo perceptual para determinar cómo desempaquetar las mantisas. A continuación, las mantisas son desempaquetadas, son combinadas con los exponentes para crear una representación en el dominio de la frecuencia de la señal de audio que, a continuación, es decodificada y convertida de nuevo a una representación en el dominio temporal.

Debido a que muchas mediciones de intensidad incluyen cálculos de potencia y del espectro de potencia, el ahorro computacional puede conseguirse decodificando solo parcialmente la señal de audio codificada a baja tasa de bits y pasando la información decodificada parcialmente (tal como el espectro de potencia) a la medición de intensidad. La invención es útil siempre que haya una necesidad de medir la intensidad, pero no de decodificar la señal de audio. Toma ventaja del hecho de que una medición de intensidad puede hacer uso de una versión aproximada de la señal de audio, no siendo dicha aproximación, normalmente, adecuada para ser escuchada. Un aspecto de la presente invención es el reconocimiento de que una representación tosca de la señal de audio, que está disponible, sin descodificar completamente una secuencia de bits, en muchos sistemas de codificación de audio, puede proporcionar una aproximación del espectro de audio que puede ser utilizada en la medición de la intensidad de la señal de audio. En la codificación de audio Dolby Digital, Dolby Digital Plus y Dolby E, los exponentes proporcionan una aproximación del espectro de potencia de la señal de audio. De manera similar, en ciertos sistemas de codificación diferentes, los factores de escala, envolventes espectrales y los coeficientes predictivos lineales pueden proporcionar una aproximación del espectro de potencia de la señal de audio. Estos y otros aspectos y ventajas de la invención se comprenderán mejor con la lectura y la comprensión del resumen y la descripción siguientes de la invención.

El documento US 2001/0027393 A1 divulga un sistema de audio conferencia compuesto por... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento para medir la intensidad de una señal de audio codificada en una secuencia de bits, que incluye datos a partir de los cuales puede derivarse una aproximación de un espectro de potencia de la señal de audio, sin decodificar completamente la señal de audio, incluyendo dichos datos representaciones toscas de la señal de audio y representaciones más finas de la señal de audio, siendo seleccionadas dichas representaciones toscas de entre un grupo que contiene factores de escala, envolventes espectrales y coeficientes predictivos lineales, comprendiendo el procedimiento derivar dicha aproximación del espectro de potencia de la señal de audio a partir de dichas representaciones toscas de la señal de audio en dicha secuencia de bits, sin decodificar completamente la señal de audio, y determinar una intensidad aproximada de la señal de audio en respuesta a la aproximación del espectro de potencia de la señal de audio.

2. Procedimiento según la reivindicación 1, en el que la señal de audio codificada en una secuencia de bits es una señal de audio codificada en sub-bandas que tiene una pluralidad de sub-bandas de frecuencia, teniendo cada sub-banda un factor de escala y datos de muestra asociados con el mismo, y en el que las representaciones toscas de la señal de audio comprenden factores de escala y las representaciones más finas asociadas de la señal de audio comprenden datos de muestra asociados con cada factor de escala.

3. Procedimiento según la reivindicación 2, en el que el factor de escala y los datos de muestra de cada sub-banda representan coeficientes espectrales en la sub-banda, por medio de una notación exponencial en la que el factor de escala comprende un exponente y los datos de muestra asociados comprenden mantisas.

4. Procedimiento según cualquiera de las reivindicaciones 1-3, en el que dicha secuencia de bits es una secuencia de bits con codificación AC-3.

5. Procedimiento según la reivindicación 1, en el que la señal de audio codificada en una secuencia de bits es una señal de audio con codificación predictiva lineal, en el que las representaciones toscas de la señal de audio comprenden coeficientes predictivos lineales y las representaciones más finas de la señal de audio comprenden información de excitación asociada con los coeficientes predictivos lineales.

6. Procedimiento según la reivindicación 1, en el que las representaciones toscas de la señal de audio comprenden al menos una envolvente espectral y las representaciones más finas de la señal de audio comprenden componentes espectrales asociados con dicha al menos una envolvente espectral.

7. Procedimiento según cualquiera de las reivindicaciones 1-6, en el que la determinación de una intensidad aproximada de la señal de audio en respuesta a la aproximación del espectro de frecuencia de la señal de audio incluye aplicar una medición de intensidad de potencia ponderada.

8. Procedimiento según la reivindicación 7, en el que la medición de intensidad de potencia ponderada emplea un filtro que resta importancia a las frecuencias menos perceptibles y realiza un promedio de la potencia de la señal de audio filtrada en el tiempo.

9. Procedimiento según cualquiera de las reivindicaciones 1-6, en el que la determinación de una intensidad aproximada de la señal de audio en respuesta a la aproximación del espectro de frecuencia de la señal de audio incluye aplicar una medición de intensidad psicoacústica.

10. Procedimiento según la reivindicación 9, en el que la medición de intensidad psicoacústica emplea un modelo del oído humano para determinar una intensidad específica en cada una de entre una pluralidad de bandas de frecuencia similares a las bandas críticas del oído humano.

11. Procedimiento según la reivindicación 9 y una cualquiera de las reivindicaciones 2 y 3, en el que dichas sub-bandas son similares a las bandas críticas del oído humano y la medición de intensidad psicoacústica emplea un modelo del oído humano para determinar una intensidad específica en cada una de dichas sub-bandas.

12. Aparato para medir la intensidad de una señal de audio codificada en una secuencia de bits que incluye datos a partir de los cuales puede derivarse una aproximación de un espectro de frecuencia de la señal de audio, sin decodificar completamente la señal de audio, incluyendo dichos datos representaciones toscas de la señal de audio y representaciones más finas asociadas de la señal de audio, siendo seleccionadas dichas representaciones toscas de entre un grupo que contiene factores de escala, envolventes espectrales y coeficientes predictivos lineales, comprendiendo el aparato

medios (502) para derivar dicha aproximación del espectro de potencia de la señal de audio a partir de las representaciones toscas de la señal de audio en dicha secuencia de bits, sin decodificar completamente la señal de audio, y medios (504) para determinar una intensidad aproximada de la señal de audio en respuesta a la aproximación del espectro de potencia de la señal de audio.

13. Aparato según la reivindicación 12, en el que la señal de audio codificada en una secuencia de bits es una señal de audio codificada en sub-bandas, que tiene una pluralidad de sub-bandas de frecuencia, teniendo cada sub-banda un factor de escala y datos de muestra asociados con el mismo, y en el que las representaciones toscas de la señal de audio comprenden factores de escala y las representaciones más finas asociadas de la señal de audio comprenden datos de muestra asociados con cada factor de escala.

14. Aparato según la reivindicación 13, en el que el factor de escala y los datos de muestra de cada sub-banda representan coeficientes espectrales en la sub-banda por medio de una notación exponencial en la que el factor de escala 15 comprende un exponente y los datos de muestra asociados comprenden mantisas.

15. Aparato según cualquiera de las reivindicaciones 12-14, en el que dicha secuencia de bits es una secuencia de bits con codificación AC-3.

16. Aparato según la reivindicación 12, en el que la señal de audio codificada en una secuencia de bits es una señal de audio con codificación predictiva lineal, en el que las representaciones toscas de la señal de audio comprenden coeficientes predictivos lineales y las representaciones más finas de la señal de audio comprenden información de excitación asociada con los coeficientes predictivos lineales.

17. Aparato según la reivindicación 12, en el que las representaciones toscas de la señal de audio comprenden al menos una envolvente espectral y las representaciones más finas de la señal de audio comprenden componentes espectrales asociados con dicha al menos una envolvente espectral.

18. Aparato según cualquiera de las reivindicaciones 12-17, en el que dichos medios para determinar una intensidad aproximada de la señal de audio, en respuesta a la aproximación del espectro de frecuencia de la señal de audio, incluyen medios (601) para aplicar una medición de intensidad de potencia ponderada.

19. Aparato según la reivindicación 18, en el que la medición de intensidad de potencia ponderada emplea un filtro que resta importancia a las frecuencias menos perceptibles y promedia la potencia de la señal de audio filtrada en el tiempo. 35

20. Aparato según cualquiera de las reivindicaciones 12-17, en el que dichos medios (504) para determinar una intensidad aproximada de la señal de audio, en respuesta a la aproximación del espectro de frecuencia de la señal de audio, incluyen medios para aplicar una medición de intensidad psicoacústica.

21. Aparato según la reivindicación 20, en el que la medición de intensidad psicoacústica emplea un modelo del oído humano para determinar una intensidad específica en cada una de entre una pluralidad de bandas de frecuencia similares a las bandas críticas del oído humano.

22. Aparato según la reivindicación 20 y una cualquiera de las reivindicaciones 13 y 14, en el que dichas sub-bandas son 45 similares a las bandas críticas del oído humano y la medición de intensidad psicoacústica emplea un modelo del oído humano para determinar una intensidad específica en cada una de dichas sub-bandas.

23. Aparato adaptado para realizar los procedimientos de una cualquiera de las reivindicaciones 1 a 11.

50 24. Programa de ordenador, almacenado en un medio que puede ser leído por ordenador, para hacer que un ordenador realice el procedimiento según una cualquiera de las reivindicaciones 1 a 11.


 

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .