APARATO Y MÉTODO PARA CALCULAR DATOS DE AMPLIACIÓN DE ANCHO DE BANDA UTILIZANDO UN ENCUADRE CONTROLADO POR PENDIENTE ESPECTRAL.

Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda,

en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada (210) con un segundo número de bits, el segundo número de bits es más pequeño que el primer número de bits, el cual comprende:

una calculadora de parámetros de ampliación de ancho de banda controlable (10) para calcular parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro, para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y

un detector de pendiente espectral (12) para detectar una pendiente espectral en una parte de tiempo de la señal de audio y para indicar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/004520.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V..

Nacionalidad solicitante: Alemania.

Dirección: HANSASTRASSE 27C 80686 MUNCHEN ALEMANIA.

Inventor/es: WABNIK,STEFAN, DISCH,SASCHA, NEUENDORF,Max, KRAEMER,Ulrich, NAGEL,Frederik.

Fecha de Publicación: .

Fecha Solicitud PCT: 23 de Junio de 2009.

Clasificación Internacional de Patentes:

  • G10L21/02A4E

Clasificación PCT:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2372014_T3.pdf

 


Fragmento de la descripción:

Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral La presente invención se refiere a la codificación/decodificación de audio y, particularmente, a la codificación/decodificación de audio en el contexto de la ampliación de ancho de banda (BWE, según sus siglas en inglés). Una implementación muy conocida de BWE es la replicación espectral de ancho de banda (SBR, según sus siglas en inglés), la cual se ha estandarizado dentro de MPEG (Grupo de Expertos en Imágenes en Movimiento, según sus siglas en inglés). El documento WO 00/45378 divulga una eficiente codificación de envolvente espectral utilizando tiempo variable/resolución de frecuencia y conmutación de tiempo/frecuencia. Una señal de entrada analógica se introduce en un convertidor A/D, formando una señal digital. La señal de audio digital se introduce en un codificador perceptual de audio, donde se lleva a cabo la codificación fuente. Adicionalmente, la señal digital se introduce en un detector de transitorios y en un banco de filtros de análisis, la cual divide la señal en su representación espectral (señales de sub banda). El detector de transitorios utiliza las señales de subbanda desde el banco de análisis o utiliza directamente las muestras de dominio en tiempo digital. El detector de transitorios divide la señal en gránulos y determina si los sub gránulos dentro de los gránulos tienen que ser marcados como transitorios. Esta información se envía a un bloque de agrupamiento de envolvente, el cual especifica la cuadrícula de tiempo/frecuencia a utilizar para el gránulo actual. De acuerdo con la cuadrícula, el bloque combina señales de subbanda uniformemente muestreadas a fin de obtener valores de envolvente no uniformemente muestreados. Dichos valores podrían ser el promedio o, alternativamente, la energía máxima para las muestras de subbanda que han sido combinadas. Los valores de envolvente se introducen, junto con la información de agrupamiento, en el bloque codificador de envolvente. Este bloque decide en cuál dirección (tiempo o frecuencia) codificar los valores de envolvente. Las señales resultantes, la señal de salida del codificador de audio, la información de envolvente de ancho de banda, y las señales de control se introducen en un multiplexor, formando una corriente de bits en serie que se transmite o almacena. Del lado del decodificador, un desmultiplexor restaura las señales e introduce la energía de salida del codificador perceptual de audio en un decodificador de audio, el cual produce una señal de audio digital de banda baja. La información de envolvente se introduce desde el desmultiplexor en el bloque decodificador de envolvente, el cual, mediante el uso de los datos de control, determina en cuál dirección se codifica la envolvente actual y decodifica los datos. La señal de banda baja desde el decodificador de audio se envía a un módulo de transposición, el cual genera un cálculo aproximado de la señal de banda alta original que consiste en uno o varios armónicos de la señal de banda baja. La señal de banda alta se introduce en un banco de filtros de análisis, el cual es del mismo tipo que el del lado codificador. Las señales de subbanda se combinan en una unidad de agrupamiento de factor de escala. Mediante el uso de datos de control provenientes del desmultiplexor se adopta el mismo tipo de combinación y distribución de tiempo/frecuencia de las muestras de subbanda correspondientes al lado codificador. La información de envolvente proveniente del desmultiplexor y la información proveniente de la unidad de agrupamiento de factor de escala se procesan en un módulo de control de ganancia. El módulo calcula los factores de ganancia a aplicar a las muestras de subbanda antes de la reconstrucción utilizando un bloque de banco de filtros de síntesis. Por lo tanto, la energía de salida del banco de filtros de síntesis es una señal de audio de banda alta ajustada a la envolvente. La señal se agrega a la energía de salida de una unidad de retardo, la cual se introduce con la señal de audio de banda baja. El retardo compensa el tiempo de procesamiento de la señal de banda alta. Por último, la señal de ancho de banda digital obtenida se convierte en una señal de audio analógica en un convertidor digital a analógico. Cuando los acordes sostenidos se combinan con transitorios bruscos que tienen principalmente contenidos de alta frecuencia, los acordes tienen alta energía en la banda baja y la energía transitoria es baja, por cuanto lo opuesto se aplica en la banda alta. Los datos de envolvente que se generan durante los intervalos de tiempo en los que hay transitorios están dominados por la energía transitoria alta intermitente. Los codificadores típicos funcionan en base a bloques, donde cada bloque representa un intervalo de tiempo fijo. Se emplea un detector de transitorios de anticipación en el lado codificador a fin de que se puedan procesar los datos de envolvente que se extienden a través de los límites de los bloques. Esto permite una selección más flexible de resoluciones de tiempo/frecuencia. El estándar internacional ISO/IEC 144963 divulga una cuadrícula de tiempo/frecuencia en el Artículo 4.6.18.3.3, el cual describe el número de envolventes de SBR y los pisos de ruido así como también el segmento de tiempo asociado a cada envolvente de SBR y piso de ruido. Cada segmento de tiempo está definido por un límite de tiempo de inicio y un límite de tiempo de parada. La ranura de tiempo indicada por el límite de tiempo de inicio está incluida en el segmento de tiempo, la ranura de tiempo indicada por el límite de tiempo de parada está excluida del segmento de tiempo. El límite de tiempo de parada de un segmento equivale al límite de tiempo de inicio del segmento siguiente en la secuencia de segmentos. En consecuencia, los límites de tiempo de los envolventes de SBR dentro de un cuadro de SBR cuadro son decodificables en un lado decodificador. La cuadrícula de tiempo/cuadrícula de frecuencia correspondiente está determinada por el codificador. La Patente de EEUU Nº 6.453.282 B1 divulga un método y dispositivo para detectar un transitorio en una señal de audio de tiempo discreto. Un codificador comprende un dispositivo de transformación de tiempo/frecuencia, un dispositivo de cuantificación/codificación y un dispositivo de formateo de corriente de bits. La etapa de cuantificación/codificación es 2   controlada por una etapa de modelo psicoacústico. La etapa de transformación de tiempo/frecuencia es controlada por un detector de transitorios, en el cual la transformación de tiempo/frecuencia es controlada para conmutar desde una ventana larga a una ventana corta en caso de un transitorio detectado. En el detector de transitorios, la energía de una señal de audio filtrada en tiempo discreto en el segmento actual se compara con la energía de la señal de audio filtrada en tiempo discreto en un segmento anterior o bien, se forma una relación actual entre la energía de la señal de audio filtrada en tiempo discreto en el segmento actual y la energía de la señal de audio no filtrada en tiempo discreto en el segmento actual y dicha relación actual se compara con una relación anterior correspondiente. La existencia de una transitorio en la señal de audio en tiempo discreto se detecta utilizando una y/o la otra de dichas comparaciones. La codificación de señales de frecuencia vocal es particularmente difícil debido al hecho de que la frecuencia vocal comprende no solo vocales, las cuales tienen un contenido predominantemente armónico, en el cual la mayor parte de la energía total se concentra en la parte inferior del espectro, pero también contiene una cantidad significativa de sibilantes. Un sibilante es un tipo de consonante fricativa o africada, que se forma dirigiendo una porción de aire a través de un canal angosto en el tracto vocal hacia el borde filoso de los dientes. El término sibilante a menudo se considera un sinónimo del término estridente. El término sibilante tiende a tener una definición articulatoria o aerodinámica que implica la producción de un ruido periódico ante un obstáculo. El término estridente se refiere a la calidad perceptual de intensidad determinada por las características de amplitud y frecuencia del sonido resultante (es decir, una definición auditiva o posiblemente acústica). Los sibilantes son más altos que sus contrapartes no sibilantes, la mayor parte de su energía acústica ocurre a frecuencias superiores a los fricativos no sibilantes. La letra [s] tiene la máxima fuerza acústica a alrededor de 8.000 Hz, pero puede alcanzar un valor máximo de 10.000 Hz. La letra [] tiene el volumen de su energía acústica a alrededor de 4.000 Hz, pero puede extenderse hasta alrededor de 8.000 Hz. Para los sibilantes... [Seguir leyendo]

 


Reivindicaciones:

1. Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada (210) con un segundo número de bits, el segundo número de bits es más pequeño que el primer número de bits, el cual comprende: una calculadora de parámetros de ampliación de ancho de banda controlable (10) para calcular parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro, para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y un detector de pendiente espectral (12) para detectar una pendiente espectral en una parte de tiempo de la señal de audio y para indicar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio. 2. Aparato de acuerdo con la reivindicación 1, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio del cuadro, cuando un signo de una pendiente espectral de la parte de tiempo de la señal de audio es distinta de un signo de la pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio. 3. Aparato de acuerdo con las reivindicaciones 1 o 2, en el cual el detector de pendiente espectral (12) es operativo para llevar a cabo un análisis LPC de la parte de tiempo para estimar uno o más coeficientes LPC de orden bajo y para analizar dicho uno o más coeficientes LPC de orden bajo a fin de determinar, si la parte de la señal de audio tiene una pendiente espectral positiva o negativa. 4. Aparato de acuerdo con la reivindicación 3, en el cual el detector de pendiente espectral (12) es operativo sólo para calcular el primer coeficiente LPC y no para calcular coeficientes LPC adicionales y para analizar un signo del primer coeficiente LPC y para señalar un instante de tiempo de inicio del cuadro dependiendo del signo del primer coeficiente LPC. 5. Aparato de acuerdo con la reivindicación 4, en el cual el detector de pendiente espectral (12) está configurado a fin de determinar la pendiente espectral como una pendiente espectral negativa, en el cual una energía espectral disminuye de frecuencias inferiores a frecuencias superiores, cuando el primer coeficiente LPC tiene un signo positivo, y para detectar la pendiente espectral como una pendiente espectral positiva, en el cual la energía espectral aumenta de frecuencias inferiores a frecuencias superiores, cuando el primer coeficiente LPC tiene un signo negativo. 6. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para calcular uno o más de los siguientes parámetros para el cuadro: parámetros de envolvente espectral, parámetros de ruido, parámetros de filtrado inverso, o parámetros armónicos faltantes. 7. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para fijar el instante de tiempo de inicio de un cuadro dependiendo de un instante de tiempo de inicio de la parte de tiempo de la señal de audio, sobre el cual se basa la detección de pendiente espectral. 8. Aparato de acuerdo con la reivindicación 7, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para fijar el instante de tiempo de inicio del cuadro idéntico al instante de tiempo de inicio de la parte de tiempo, en el cual el cambio de pendiente espectral ha sido detectado. 9. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) o el detector de pendiente espectral (12) están configurados para procesar cuadros o partes de tiempo que se superponen. 10. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) es operativa para fijar un instante de tiempo de parada de un cuadro en respuesta al detector de pendiente espectral (12) o en respuesta a un evento independiente en una pendiente espectral de la señal de audio. 11. Aparato de acuerdo con la reivindicación 10, en el cual el evento utilizado por la calculadora de parámetros de ampliación de ancho de banda controlable (10) es la existencia de un instante de tiempo que es un período fijo de tiempo posterior al instante de tiempo de inicio. 12   12. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para llevar a cabo un procesamiento selectivo de frecuencia de la señal de audio (320) en la segunda banda espectral con una resolución de frecuencia, y en el cual el detector de pendiente espectral (12) es operativo para procesar la parte de tiempo en el dominio temporal o en una forma selectiva de frecuencia con una resolución de frecuencia que es más pequeña que la resolución de frecuencia utilizada por la calculadora de parámetros de ampliación de ancho de banda controlable (10). 13. Aparato de acuerdo con una de las reivindicaciones anteriores, el cual además comprende: un detector de transitorios (14) para controlar la calculadora de parámetros de ampliación de ancho de banda controlable (10) para fijar el instante de tiempo de inicio, cuando se detecta un transitorio, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable está configurada para fijar un instante de tiempo de inicio, cuando el detector de pendiente espectral (12) o el detector de transitorios (14) ha producido una señal instantánea de tiempo de inicio. 14. Aparato de acuerdo con una de las reivindicaciones anteriores, el cual además comprende un detector de música/lenguaje (15), siendo el detector de lenguaje/música operativo para activar el detector de pendiente espectral (12) en una parte de lenguaje de la señal de audio y para desactivar el detector de pendiente espectral (12) en una parte de música de la señal de audio. 15. Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual el detector de pendiente espectral (12) está configurado a fin de determinar, si la parte de tiempo comprende un sibilante de una parte de lenguaje o un no sibilante de una parte de lenguaje, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio para el cuadro, cuando se detecta un cambio de un no sibilante a un sibilante. 16. Aparato de acuerdo con la reivindicación 13, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para aplicar la secuencia de cuadros con una resolución temporal superior en respuesta a una señal desde el detector de pendiente espectral (12) en comparación con una resolución temporal aplicada, cuando la calculadora de parámetros de ampliación de ancho de banda controlable (10) ha recibido una señal desde el detector de transitorios (14) en una parte de tiempo de la señal de audio, para la cual el detector de pendiente espectral (12) no ha señalado un instante de tiempo de inicio. 17. Aparato de acuerdo con la reivindicación 1, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio del cuadro, cuando una diferencia entre un valor de pendiente espectral de la parte de tiempo de la señal de audio y un valor de pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio es mayor que un valor de umbral predeterminado. 18. Método para calcular la ampliación de los datos de ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada (210) con un segundo número de bits que es más pequeño que el primer número de bits, el cual comprende: calcular (10) los parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y detectar (12) una pendiente espectral en una parte de tiempo de la señal de audio y señalar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio. 19. Programa informático que tiene un código de programa para llevar a cabo, cuando se ejecuta en una computadora, el método para calcular la ampliación de los datos de ancho de banda de acuerdo con la reivindicación 18. 13   14     16   17   18   19  

 

Patentes similares o relacionadas:

Imagen de 'MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN…'MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN DE RUIDO, del 14 de Marzo de 2011, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento de decodificación de una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento […]

Imagen de 'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA…'APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA UNA SEÑAL DE VOZ, del 7 de Junio de 2010, de QUALCOMM INCORPORATED: Un aparato, que comprende: un banco (A110) de filtros, que contiene A) una trayectoria de procesamiento de banda baja configurada para recibir una señal de voz de banda […]

Imagen de 'METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION…'METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION DE BANDA ESPECTRAL E INTERPOLACION DE FACTORES DE ESCALA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por […]

Imagen de 'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA…'APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA SEÑAL RECONSTRUIDA DE ALTA FRECUENCIA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación […]

Imagen de 'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA…'SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA DEL ANCHO DE BANDA, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para expandir las señales de voz de banda estrecha a señales de voz de banda ancha, comprendiendo el procedimiento: determinar la información del tipo […]

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .