TÉCNICAS DE CODIFICACIÓN MEJORADAS QUE UTILIZAN FASE Y MAGNITUD ESPECTRALES ESTIMADAS DERIVADAS DE COEFICIENTES MCDT (TRANSFORMACIONES DE COSENO DISCRETAS MODIFICADAS).

Un método de procesamiento de información que representa una señal fuente que transporta un contenido destinado al entendimiento humano,

comprendiendo el método: recibir unos primeros componentes espectrales (31) que fueron generados por la aplicación de una primera batería de filtros de análisis (3), y de una función ventana de análisis a la señal fuente, en el que los primeros componentes espectrales representan el contenido espectral de la señal fuente expresado en un primer subespacio de un espacio multidimensional; obtener unos componentes intermedios a partir de los primeros componentes espectrales de tres segmentos contiguos de la señal fuente, en el que los primeros componentes intermedios son derivados de los primeros componentes espectrales en un segmento central de los tres segmentos contiguos, y los segundos componentes espectrales son derivados de los primeros componentes espectrales en los segmentos anteriores y posteriores; obtener unos segundos componentes espectrales (37) a partir de la suma de operaciones de convolución de los primeros y segundos componentes intermedios con las respuestas de impulso (33) de filtros hipotéticos relacionadas con el efecto combinado de una batería de filtros de síntesis inversa a la primera batería de filtros de análisis, de una función ventana de síntesis asociada, de una segunda batería de filtros de análisis posterior a la batería de filtros de síntesis, y de la función ventana de análisis, en el que los segundos componentes espectrales representan el contenido espectral de la señal fuente expresado en un segundo subespacio del espacio multidimensional que incluye una parte del espacio multidimensional no incluida en el primer subespacio; obtener unas medidas estimadas de la magnitud o fase (38, 39) usando los primeros componentes espectrales (31) y los segundos componentes espectrales (37); y aplicar un proceso adaptativo a los primeros componentes espectrales (31) para generar la información procesada, en el que el proceso adaptativo es responsable de las medidas de magnitud o de fase (38, 39) estimadas

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2005/001499.

Solicitante: DOLBY LABORATORIES LICENSING CORPORATION.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 POTRERO AVENUE SAN FRANCISCO, CALIFORNIA 94103-4813 ESTADOS UNIDOS DE AMERICA.

Inventor/es: SMITHERS, MICHAEL, J., CHENG,Corey,I, LATHROP,David,N.

Fecha de Publicación: 28 de Febrero de 2012.

Fecha Solicitud PCT: 14 de Enero de 2005.

Clasificación PCT:

G06F17/14 FISICA. › G06 CALCULO; CONTEO. › G06F PROCESAMIENTO ELECTRICO DE DATOS DIGITALES (sistemas de computadores basados en modelos de cálculo específicos G06N). › G06F 17/00 Equipo o métodos de procesamiento de datos o de cálculo digital, especialmente adaptados para funciones específicas (recuperación de la información, estructuras de las bases de datos o estructuras de los sistemas de archivos G06F 16/00). › Transformaciones de Fourier, de Walsh o las transformaciones de espacios análogos.
G10L19/02 G […] › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.

Clasificación antigua:

G06F17/14 G06F 17/00 […] › Transformaciones de Fourier, de Walsh o las transformaciones de espacios análogos.
G10L19/02 G10L 19/00 […] › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania.

PDF original: ES-2375285_T3.pdf

Fragmento de la descripción:

Técnicas de codificación mejoradas que utilizan fase y magnitud espectrales estimadas derivadas de coeficientes MCDT (transformaciones de coseno discretas modificadas). CAMPO TÉCNICO El presente invento proporciona un proceso eficiente para la estimación exacta de la fase y magnitud espectrales a partir de la información espectral obtenida de diversos tipos de baterías de filtros de análisis que incluyen los aplicados por las Transformaciones de Coseno Discretas Modificadas y las Transformaciones de Seno Discretas Modificadas. Estas estimaciones exactas pueden ser usadas en diversas aplicaciones de procesamiento de señales tales como codificación de audio y codificación de vídeo. En la siguiente discusión se hace una mención más particular de aplicaciones de codificación de audio usando baterías de filtros aplicados por una Transformación de Coseno Discreta Modificada, aunque el presente invento también se puede aplicar a otras aplicaciones y a otras aplicaciones de baterías de filtros. TÉCNICA ANTERIOR Muchas aplicaciones de codificación intentan reducir la cantidad de información requerida para representar adecuadamente una señal fuente. Reduciendo los requerimientos de capacidad de información se puede transmitir una representación de la señal por canales que tienen una anchura de banda menor, o ser almacenada en medios que usan un menor espacio. La codificación puede reducir los requerimientos de capacidad de información de una señal fuente mediante la eliminación ya sea de componentes redundantes o de componentes irrelevantes en la señal. Los denominados métodos y sistemas de codificación perceptual a menudo usan baterías de filtros para reducir la redundancia descorrelacionando una señal fuente usando un conjunto base de componentes espectrales, y reducen la irrelevancia mediante la cuantificación adaptativa de los componentes espectrales de acuerdo criterios psicoperceptuales. Un proceso de codificación que adapta la resolución de cuantificación más basta puede reducir los requerimientos de información en una mayor medida pero también introduce unos mayores niveles de error de cuantificación o de ruido de cuantificación en la señal. Los sistemas de codificación perceptual intentan controlar el nivel de ruido de cuantificación de forma que el ruido sea enmascarado o hecho imperceptible por otro contenido espectral de la señal. Estos sistemas típicamente usan modelos perceptuales para predecir los niveles de ruido de cuantificación que pueden ser enmascarados por una señal dada. En sistemas de codificación perceptual de audio, por ejemplo, el ruido de cuantificación es a menudo controlado adaptando resoluciones de cuantificación de acuerdo con predicciones de audibilidad obtenidas a partir de modelos perceptuales basados en estudios psicoacústicos tal como el descrito en E. Zwicker, Psichoacoustics, 1981. Un ejemplo de un modelo perceptual que predice la audibilidad de los componentes espectrales en una señal se discute en M. Schroeder y otros: Optimizing Digital Speech Coders by Exploiting Masking Properties of the Human Ear (Optimización de codificadores de voz digitales mediante el aprovechamiento de las propiedades de enmascaramiento del oído humano), J. Acoust. Soc. Am., Diciembre 1979, pp 1.647 - 1.652. No es necesario incluir en la señal codificada los componentes espectrales que se consideran irrelevantes debido a que se ha predicho de ellos que son imperceptibles. Otros componentes espectrales considerados como relevantes pueden ser cuantificados usando una resolución de cuantificación que está adaptada para ser lo suficientemente precisa para asegurar que el ruido de cuantificación sea casi imperceptible por otros componentes espectrales en la señal fuente. Las predicciones exactas de perceptibilidad por un modelo perceptual permiten un sistema de codificación perceptual para adaptar la resolución de cuantificación de modo más óptimo, dando lugar a menos perturbaciones audibles. Un sistema de codificación que usa modelos conocidos para proporcionar predicciones no exactas de perceptibilidad no puede asegurar de forma fiable que el ruido de cuantificación sea hecho imperceptible a menos que se use una resolución de cuantificación más precisa, que la que de otro modo sería requerida si se pudiera disponer de una predicción más exacta. Muchos modelos perceptuales tales como el discutido por Schroeder y otros están basados en la magnitud del componente espectral, por lo que las predicciones exactas realizadas por estos modelos dependen de las medidas exactas de la magnitud del componente espectral. Las medidas exactas de la magnitud del componente espectral influyen también en la calidad de funcionamiento de otros tipos de procesos de codificación además de la cuantificación. En dos tipos de procesos de codificación conocidos como regeneración y acoplamiento un codificador reduce los requerimientos de información de las señales fuente mediante la exclusión de los componentes espectrales seleccionados a partir de una representación codificada de las señales fuente, y un decodificador sintetiza sustitutos para los componentes espectrales que faltan. En la regeneración espectral el codificador genera una representación de una parte de la banda de base de una 2 señal fuente que excluye otras partes del espectro. El decodificador sintetiza las partes del espectro que faltan usando la parte de la banda de base y la información colateral que transporta alguna medida de nivel espectral de las partes que faltan, y combina las dos partes para obtener una réplica imperfecta de la señal fuente original. Un ejemplo de un sistema de codificación de audio que usa la regeneración espectral está descrito en la solicitud de patente internacional Nº PCT/US03/08895 presentada el 21 de marzo de 2003, publicación Nº WO 03/083834 hecha pública el 9 de octubre de 2003. En el acoplamiento el codificador genera una representación compuesta de componentes espectrales de muchos canales de señales fuente, y el decodificador sintetiza los componentes espectrales de muchos canales usando la representación compuesta y la información colateral que transporta alguna medida de nivel espectral de cada canal de señal fuente. Un ejemplo de un sistema de codificación de audio que usa un acoplamiento se describe en documento del Advanced Television Systems Committee (ATSC) (Comisión de sistemas de televisión avanzados) A/52A titulado Revision A to Digital Audio Compression (AC-3) Standard (Revisión A de la norma de compresión (AC-3) de audio digital) hecha pública el 20 de agosto de 2001. El funcionamiento de estos sistemas de codificación puede ser mejorado si el decodificador es capaz de sintetizar los componentes espectrales que conservan las magnitudes de los componentes espectrales correspondientes en las señales fuente originales. El funcionamiento del acoplamiento puede también ser mejorado si se dispone de medidas de fase exactas de forma que puedan ser evitadas o compensadas las distorsiones causadas por el acoplamiento de señales fuera de fase. Desafortunadamente, algunos sistemas de codificación usan unos tipos particulares de baterías de filtros para derivar una expresión de componentes espectrales que hagan difícil obtener medidas exactas de la magnitud o de la fase del componente espectral. Dos tipos comunes de sistemas de codificación se denominan codificación de subbanda y codificación de transformación. Las baterías de filtros en ambos sistemas de codificación de subbanda y de codificación de transformación pueden ser aplicadas mediante varias técnicas de procesamiento de señales que incluyen diversas transformaciones de dominio temporal en dominio de frecuencia. Véase J. Tribolet y otros, Frequency Domain Coding of Speech (Codificación de voz en dominio de frecuencia), IEEE Trans. Acoust., Speech and Signal Proc., ASSP 27 de octubre de 1979, pp. 512-530. Algunas transformaciones tales como la Transformación de Fourier Discreta (DFT) o su aplicación eficiente, la Transformación de Fourier Rápida (FFT), proporcionan un conjunto de componentes espectrales o coeficientes de transformación a partir de los cuales se puede calcular fácilmente la magnitud y la fase de los componentes espectrales. Los componentes espectrales de la DFT, por ejemplo, son representaciones multidimensionales de una señal fuente. Específicamente, la DFT, que puede ser usada en aplicaciones de codificación de audio y de codificación de vídeo, proporciona un conjunto de coeficientes de valor complejo cuyas partes real e imaginaria pueden ser expresadas como coordenadas en un espacio bidimensional. La magnitud de cada componente espectral proporcionada por tal transformación puede ser obtenida fácilmente de cada coordenada del componente en el espacio multidimensional usando cálculos sobradamente conocidos. Sin embargo,... [Seguir leyendo]

Reivindicaciones:

1. Un método de procesamiento de información que representa una señal fuente que transporta un contenido destinado al entendimiento humano, comprendiendo el método: recibir unos primeros componentes espectrales (31) que fueron generados por la aplicación de una primera batería de filtros de análisis (3), y de una función ventana de análisis a la señal fuente, en el que los primeros componentes espectrales representan el contenido espectral de la señal fuente expresado en un primer subespacio de un espacio multidimensional; obtener unos componentes intermedios a partir de los primeros componentes espectrales de tres segmentos contiguos de la señal fuente, en el que los primeros componentes intermedios son derivados de los primeros componentes espectrales en un segmento central de los tres segmentos contiguos, y los segundos componentes espectrales son derivados de los primeros componentes espectrales en los segmentos anteriores y posteriores; obtener unos segundos componentes espectrales (37) a partir de la suma de operaciones de convolución de los primeros y segundos componentes intermedios con las respuestas de impulso (33) de filtros hipotéticos relacionadas con el efecto combinado de una batería de filtros de síntesis inversa a la primera batería de filtros de análisis, de una función ventana de síntesis asociada, de una segunda batería de filtros de análisis posterior a la batería de filtros de síntesis, y de la función ventana de análisis, en el que los segundos componentes espectrales representan el contenido espectral de la señal fuente expresado en un segundo subespacio del espacio multidimensional que incluye una parte del espacio multidimensional no incluida en el primer subespacio; obtener unas medidas estimadas de la magnitud o fase (38, 39) usando los primeros componentes espectrales (31) y los segundos componentes espectrales (37); y aplicar un proceso adaptativo a los primeros componentes espectrales (31) para generar la información procesada, en el que el proceso adaptativo es responsable de las medidas de magnitud o de fase (38, 39) estimadas. 2. El método de la reivindicación 1, en el que: los primeros componentes espectrales son coeficientes de transformación dispuestos en bloques de los coeficientes de transformación que fueron generados por aplicación de una o más transformaciones a segmentos de la señal fuente; y las respuestas de impulso están basadas en las características de respuesta de frecuencia de una o más transformaciones. 3. El método de la reivindicación 2, en el que las características de la frecuencia de respuesta de una o más transformaciones dependen de las características de una o más funciones ventana de análisis que fueron aplicadas con una o más transformaciones a los segmentos de la señal fuente. 4. El método de la reivindicación 3, en el que al menos una o más transformaciones aplican una batería de filtros de análisis que genera los primeros componentes espectrales con un solape del dominio temporal. 5. El método de la reivindicación 3, en el que al menos algunas de las una o más transformaciones generan unos primeros componentes espectrales que tienen valores reales expresados en el primer subespacio, y en el que los segundos valores espectrales tienen valores imaginarios expresados en el segundo subespacio. 6. El método de la reivindicación 5, en el que las transformaciones que generan unos primeros componentes espectrales que tienen valores reales expresados en el primer subespacio son Transformaciones de Coseno Discretas o Transformaciones de Coseno Discretas Modificadas. 7. El método de acuerdo con la reivindicación 1 que además comprende obtener medidas estimadas de la magnitud o la fase usando uno o más terceros componentes espectrales que son derivados de al menos algunos de los primeros componentes espectrales. 8. El método de acuerdo con la reivindicación 7, en el que: los primeros componentes espectrales son coeficientes de transformación dispuestos en bloques de coeficientes de transformación que fueron generados por la aplicación de una o más transformaciones a segmentos de la señal fuente; los terceros componentes espectrales son derivados de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de la magnitud o la fase de un respectivo segmento de la señal fuente se obtienen adaptativamente usando bien los terceros componentes espectrales o usando los componentes espectrales primero y segundo. 28 9. El método de acuerdo con la reivindicación 7, en el que: los primeros componentes espectrales son coeficientes de transformación dispuestos en bloques de coeficientes de transformación que fueron generados por aplicación de una o más transformaciones a segmentos de la señal fuente; los terceros componentes espectrales son derivados de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase de al menos algún contenido espectral de un respectivo segmento de la señal fuente son obtenidas usando los terceros componentes espectrales y las medidas estimadas de magnitud o fase de al menos algo del contenido espectral del respectivo segmento de la señal fuente se obtienen usando los componentes espectrales primero y segundo. 10. El método de acuerdo con cualquiera de las reivindicaciones 7 a 9 que comprende la obtención de medidas de magnitud o fase adaptativamente usando bien los terceros componentes espectrales o usando los componentes espectrales primero y segundo. 11. El método de acuerdo con cualquiera de las reivindicaciones 1 a 6, en el que solamente una parte de las respuestas de impulso se usan en la convolución, y el método comprende adaptar la parte de las respuestas de impulso en respuesta a una medida de significancia del componente espectral. 12. El método de la reivindicación 11, en el que la medida de la significancia del componente espectral está proporcionada por un modelo perceptual que valora la significancia perceptual del contenido espectral de la señal fuente. 13. El método de la reivindicación 11, en el que la medida de la significancia del componente espectral refleja el aislamiento en frecuencia de uno o más componentes espectrales. 14. El método de la reivindicación 1, en el que: los primeros componentes espectrales son coeficientes de transformación primeros dispuestos en bloques que fueron generados por la aplicación de una o más transformaciones a segmentos de la señal fuente, teniendo un bloque respectivo un primer número de los primeros coeficientes de transformación; los segundos componentes espectrales son segundos coeficientes de transformación; un segundo número de los segundos coeficientes de transformación son derivadas que representan el contenido espectral que también está representado por algunos de los primeros coeficientes de transformación en el bloque respectivo; y el segundo número es menor que el primer número. 15. El método de acuerdo con la reivindicación 1, 2, 8, 9 u 11, que comprende la aplicación del proceso adaptativo a los primeros componentes espectrales para generar los componentes espectrales sintetizados. 16. El método de acuerdo con la reivindicación 15, en el que al menos algunos de los componentes espectrales sintetizados son generados por la regeneración del componente espectral. 17. El método de acuerdo con la reivindicación 15, en el que al menos algunos de los componentes espectrales sintetizados son generados por la descomposición de unos primeros componentes espectrales y/o de unos segundos componentes espectrales que representan un compuesto de contenido espectral de una pluralidad de señales fuente. 18. El método de acuerdo con la reivindicación 15, en el que al menos algunos de los componentes espectrales sintetizados son generados por la descomposición de unos primeros componentes espectrales y/o de unos segundos componentes espectrales para proporcionar una representación compuesta de contenido espectral de una pluralidad de señales fuente. 19. El método de acuerdo con la reivindicación 1, 2, 8, 9 u 11, que comprende: generar los primeros componentes espectrales aplicando la primera batería de filtros de análisis a la señal fuente; aplicar el proceso adaptativo al primer componente espectral para generar una información codificada que representa al menos algunos de los primeros componentes espectrales; y generar una señal de salida que transporta la información codificada. 20. Un medio que transporte un programa de instrucciones que es ejecutable por un dispositivo para realizar el método de acuerdo con cualquiera de las reivindicaciones 1 a 19. 29 21. Un aparato que comprende unos medios para realizar todos los pasos del método de acuerdo con cualquiera de las reivindicaciones 1 a 19. 31 32 33

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]