Método y aparato para estimar la energía de banda alta en un sistema de extensión de ancho de banda.
Un método que comprende:
recibir una señal de audio digital que comprende una señal dentro de una primera banda de frecuencia;
procesar la señal de audio digital de entrada a través de una operación de sobre muestreo, o mediante un sistema de ganancia unitaria simple para el cual la salida es igual a la entrada, para generar una señal de audio digital procesada;
estimar un nivel de energía en una segunda banda de frecuencia para la señal de audio digital de entrada, en base a una energía de una banda de transición de la señal de audio digital procesada dentro de una gama de frecuencia superior predeterminada de la primera banda de frecuencia, la segunda banda de frecuencia que está por encima de la primera banda de frecuencia en el espectro de frecuencia;
generar una segunda señal de audio digital en base a al menos el nivel de energía y una envolvente espectral estimada correspondiente al nivel de energía; y
combinar la señal de audio digital de entrada y la segunda señal de audio digital para generar una señal de audio digital resultante que tiene un ancho de banda de señal extendido.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2009/032256.
Solicitante: Motorola Mobility, Inc.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 600 North US Highway 45 Libertyville, IL 60048 ESTADOS UNIDOS DE AMERICA.
Inventor/es: RAMABADRAN, TENKASI V.,, JASIUK, MARK A.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L11/00
- G10L21/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
PDF original: ES-2384084_T3.pdf
Fragmento de la descripción:
Método y aparato para estimar la energía de banda alta en un sistema de extensión de ancho de banda.
Solicitud Relacionada Esta solicitud está relacionada con el número de solicitud de patente U.S. en tramitación y de co-propiedad, titulada 11/946.978 y clasificada el 29 de noviembre de 2007.
Campo técnico
Esta invención se refiere generalmente a reproducir contenido audible y más particularmente a técnicas de extensión de ancho de banda.
Antecedentes La reproducción audible de contenido audio de una representación digital comprende un área conocida de esfuerzo. En algunos ajustes de la solicitud la representación digital comprende un ancho de banda correspondiente completo que pertenece a una muestra de audio original. En tal caso, la reproducción audible puede comprender una salida de sonido altamente precisa y natural. Tal planteamiento, no obstante, requiere considerables recursos de sobredimensionamiento para acomodar la cantidad de datos correspondiente. En muchos ajustes de la aplicación, tales como, por ejemplo, ajustes de comunicación inalámbrica, tal cantidad de información no siempre se puede soportar adecuadamente.
Para acomodar tal limitación, las denominadas técnicas de habla de banda estrecha pueden servir para limitar la cantidad de información limitando, a su vez, la representación a menos que el ancho de banda completo correspondiente que pertenece a una muestra de audio original. Pero como un ejemplo en este sentido, mientras el habla natural incluye componentes significativos hasta 8kHz (o mayores) , una representación de banda estrecha puede proporcionar solamente información con respecto, digamos, a la gama de 300 - 3.400 Hz. El contenido resultante, cuando se reproduce audible, típicamente es suficientemente inteligible para soportar las necesidades funcionales de la comunicación basada en habla. Desafortunadamente, no obstante, el procesamiento de habla de banda estrecha también tiende a producir habla que suena apagada y puede incluso haber reducido la inteligibilidad comparado con el habla de banda completa.
Para cumplir esta necesidad, las técnicas de extensión de ancho de banda son a veces empleadas. Una artificialmente genera la información que se omite en las bandas más altas y/o más bajas en base a la información de banda estrecha disponible así como otra información para seleccionar la información que puede ser añadida al contenido de banda estrecha para sintetizar por ello una señal de banda pseudo ancha (o completa) . Usando tales técnicas, por ejemplo, uno puede transformar el habla de banda estrecha en la gama de 300 - 3400 Hz para habla de banda ancha, digamos, en la gama de 100 - 8000 Hz. Con este fin, una pieza crítica de información que es requerida es la envoltura espectral en la banda alta (3400 - 8000 Hz) . Si se estima la envolvente espectral de banda ancha, la envolvente espectral de banda alta entonces puede normalmente ser fácilmente extraída de ella. Uno puede pensar de la envolvente espectral de banda alta como comprendida de una forma y una ganancia (o equivalentemente, energía) .
Mediante un planteamiento, por ejemplo, la forma de envolvente espectral de banda alta es estimada estimando la envolvente espectral de banda ancha a partir de la envolvente espectral de banda estrecha a través de la asignación del libro de códigos. La energía de banda alta entonces se estima ajustando la energía dentro de la sección de banda estrecha de la envolvente espectral de banda ancha para hacer coincidir la energía de la envolvente espectral de banda estrecha. En este planteamiento, la forma de la envolvente espectral de banda alta determina la energía de banda alta y cualquier error en la estimación de la forma también afectará correspondientemente las estimaciones de la energía de banda alta.
En otro planteamiento, la forma de la envolvente espectral de banda alta y la energía de banda alta se estiman separadamente, y la envolvente espectral de banda alta que finalmente se usa es ajustada para hacer coincidir la energía de banda alta estimada. Mediante un planteamiento relacionado la energía de banda alta estimada es usada, junto con otros parámetros, para determinar la forma de la envolvente espectral de banda alta. No obstante, la envolvente espectral de banda alta resultante no se asegura necesariamente que tenga la energía de banda alta apropiada. Un paso adicional se requiere por lo tanto para ajustar la energía de la envolvente espectral de banda alta al valor estimado. A menos que se tenga especial cuidado, este planteamiento provocará una discontinuidad en la envolvente espectral de banda ancha en el límite entre la banda estrecha y la banda alta. Aunque los planteamientos existentes para extensión de ancho de banda, y, en particular, para estimación de envolvente de banda alta son razonablemente exitosos, no necesariamente producen habla resultante de calidad adecuada en al menos algunos ajustes de aplicaciones.
Para generar habla de ancho de banda extendido de calidad aceptable, el número de artefactos en tal habla debería ser minimizado. Se conoce que sobre estimación de energía de banda alta provoca artefactos molestos. La estimación incorrecta de la forma de envolvente espectral de banda alta también puede conducir a artefactos pero estos artefactos son normalmente más leves y son fácilmente enmascarados por el habla de banda estrecha.
De acuerdo con el documento de la técnica anterior US 7.181.402 B2, se conoce un método de estimación de energía de banda alta basado en la energía de la banda estrecha entera la cual podría causar una sobreestimación potencial de la energía.
Breve descripción de los dibujos Las necesidades anteriores se cumplen al menos parcialmente a través del suministro del método y aparato para estimar energía de banda alta en un sistema de extensión de ancho de banda descrito en la siguiente descripción detallada. Las figuras anexas donde números referencia similares se refieren a elementos idénticos o funcionalmente similares en todas las vistas separadas y las cuales junto con la descripción detallada de más adelante son incorporadas en y forman parte de la especificación, sirven para ilustrar además diversas realizaciones y para explicar diversos principios y ventajas todas de acuerdo con la presente invención.
La FIG. 1 comprende un diagrama de flujo como se configura de acuerdo con diversas realizaciones de la invención;
La FIG. 2 comprende un gráfico como se configura de acuerdo con diversas realizaciones de la invención;
La FIG. 3 comprende un diagrama de bloques como se configura de acuerdo con diversas realizaciones de la invención;
La FIG. 4 comprende un diagrama de bloques como se configura de acuerdo con diversas realizaciones de la invención;
La FIG. 5 comprende un diagrama de bloques como se configura de acuerdo con diversas realizaciones de la invención; y La FIG. 6 comprende un gráfico como se configura de acuerdo con diversas realizaciones de la invención.
Los técnicos expertos apreciarán que los elementos en las figuras son ilustrados por simplicidad y claridad y no han sido necesariamente dibujados a escala. Por ejemplo, las dimensiones y/o posicionamiento relativo de algunos de los elementos en las figuras pueden ser exageradas en relación con otros elementos para ayudar a mejorar la comprensión de diversas realizaciones de la presente invención. También, elementos comunes pero bien entendidos que son útiles o necesarios en una realización factible comercialmente a menudo no se representan para facilitar una vista menos obstruida de estas diversas realizaciones de la presente invención. Se apreciará además que ciertas acciones y/o pasos pueden ser descritos o representados en un orden particular de ocurrencia mientras que aquellos expertos en la técnica entenderán que tal especificidad con respecto a la secuencia no es realmente requerida. También se entenderá que los términos y expresiones usados aquí dentro tienen el significado técnico habitual como es acordado para tales términos y expresiones por las personas expertas en el campo técnico como se establece en adelante anteriormente excepto donde se han establecido de otra manera aquí dentro diferentes significados específicos.
Resumen de la invención La invención se define por el método según la reivindicación 1 y el aparato según la reivindicación 8.
Descripción detallada Las enseñanzas tratadas aquí dentro están dirigidas a un método y sistema rentables... [Seguir leyendo]
Reivindicaciones:
1. Un método que comprende:
recibir una señal de audio digital que comprende una señal dentro de una primera banda de frecuencia;
procesar la señal de audio digital de entrada a través de una operación de sobre muestreo, o mediante un sistema de ganancia unitaria simple para el cual la salida es igual a la entrada, para generar una señal de audio digital procesada;
estimar un nivel de energía en una segunda banda de frecuencia para la señal de audio digital de entrada, en base a una energía de una banda de transición de la señal de audio digital procesada dentro de una gama de frecuencia superior predeterminada de la primera banda de frecuencia, la segunda banda de frecuencia que está por encima de la primera banda de frecuencia en el espectro de frecuencia;
generar una segunda señal de audio digital en base a al menos el nivel de energía y una envolvente espectral estimada correspondiente al nivel de energía; y combinar la señal de audio digital de entrada y la segunda señal de audio digital para generar una señal de audio digital resultante que tiene un ancho de banda de señal extendido.
2. El método de la reivindicación 1, en el que el procesamiento comprende sobre muestrear la señal de audio digital de entrada para generar la señal de audio digital procesada.
3. El método de la reivindicación 1, en el que la estimación comprende calcular un nivel de energía de la señal de audio digital procesada calculando un espectro de frecuencia de la señal de audio digital procesada y sumando las energías de las componentes espectrales dentro de la banda de transición.
4. El método de la reivindicación 1, en el que la estimación comprende además utilizar al menos un parámetro de habla predeterminado, basado en la señal de audio digital de entrada, para generar un espacio de parámetros.
5. El método de la reivindicación 4, en el que el parámetro de habla predeterminado es al menos uno de un parámetro de cruce por cero, un parámetro de medida de uniformidad espectral, un parámetro de pendiente espectral de banda de transmisión, y un parámetro de forma de envolvente espectral de banda de transición.
6. El método de la reivindicación 4, en el que la estimación además comprende partir el espacio de parámetros en regiones y asignar coeficientes para cada región para estimar el nivel de energía.
7. El método de la reivindicación 1, en el que la señal dentro de la primera banda de frecuencia tiene un ancho de banda de alrededor de 300 - 3400 Hz.
8. Un aparato, que comprende:
una entrada configurada y dispuesta para recibir una señal de audio digital de entrada que comprende una señal dentro de una primera banda de frecuencia;
un procesador operable acoplado con la entrada y que se configura y dispone para:
procesar la señal de audio digital de entrada a través de una operación de sobre muestreo, o mediante un sistema de ganancia unitaria simple para el cual la salida es igual a la entrada, para generar una señal de audio digital procesada;
estimar un nivel de energía en una segunda banda de frecuencia para la señal de audio digital de entrada, en base a una energía de una banda de transición de la señal de audio digital procesada dentro de una gama de frecuencia superior predeterminada de la primera banda de frecuencia, la segunda banda de frecuencia que está por encima de la primera banda de frecuencia en el espectro de frecuencia;
generar una segunda señal de audio digital en base a al menos al nivel de energía y una envolvente espectral estimada correspondiente al nivel de energía; y combinar la señal de audio digital de entrada y la segunda señal de audio digital para generar una señal de audio digital resultante que tiene un ancho de banda de señal extendido.
Patentes similares o relacionadas:
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]
Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]
Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]
Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]
Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]
Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]