Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta.
Un procedimiento de generación de una señal (S120) de excitación de banda alta,
comprendiendo dichoprocedimiento:
ensanchar armónicamente el espectro de una señal que se basa en una señal (S80) de excitación debanda baja;
calcular una envolvente de dominio temporal de una señal que se basa en la señal (S80) de excitación debanda baja;
modular una señal de ruido según la envolvente de dominio temporal; y
combinar (A) una señal (S160) ensanchada armónicamente con base en un resultado de dichoensanchamiento armónico y (B) una señal modulada (S170) de ruido con base en un resultado de dichamodulación, incluyendo dicha combinación el cálculo de una suma ponderada de la señal (S160)ensanchada armónicamente y la señal modulada (S170) de ruido, incluyendo dicho cálculo de una sumaponderada la ponderación de la señal (S160) ensanchada armónicamente según un primer factor deponderación y la ponderación de la señal modulada (S170) de ruido según un segundo factor deponderación, comprendiendo dicho procedimiento el cálculo de al menos uno entre los factores deponderación primero y segundo según al menos uno entre (A) una medida de periodicidad de una señal devoz y (B) un grado vocal de una señal de voz,
en el que la señal de excitación de banda alta se basa en la suma ponderada.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/012234.
Solicitante: QUALCOMM INCORPORATED.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 5775 MOREHOUSE DRIVE SAN DIEGO, CA 92121 ESTADOS UNIDOS DE AMERICA.
Inventor/es: VOS,KOEN,BERNARD, KANDHADAI,ANANTHAPADMANABHAN,A.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G01L21/02 FISICA. › G01 METROLOGIA; ENSAYOS. › G01L MEDIDA DE FUERZAS, TENSIONES, PARES, TRABAJO, POTENCIA MECANICA, RENDIMIENTO MECANICO O DE LA PRESION DE LOS FLUIDOS (pesado G01G). › G01L 21/00 Indicadores de vacío. › que tienen una cámara de compresión en la cual el gas, del que debe medirse la presión, está comprimido.
PDF original: ES-2391292_T3.pdf
Fragmento de la descripción:
Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta
Solicitudes relacionadas
La presente solicitud reivindica el beneficio de la solicitud provisional de patente estadounidense nº 60/667.901, titulada “CODING THE HIGH-FREQUENCY BAND OF WIDEBAND SPEECH”, presentada el 1 de abril de 2005. La presente solicitud también reivindica el beneficio de la solicitud provisional de patente estadounidense nº 60/673.965, titulada “PARAMETER CODING IN A HIGH-BAND SPEECH CODER”, presentada el 22 de abril de 2005.
Campo de la invención
La presente invención se refiere a procesamiento de señales.
Antecedentes
Las comunicaciones de voz a través de la red telefónica pública conmutada (RTPC) se han limitado tradicionalmente en ancho de banda al intervalo de frecuencia de 300-3400 kHz. Las nuevas redes para comunicaciones de voz, tales como telefonía celular y voz sobre IP (protocolo de Internet, VoIP) pueden no tener los mismos límites de ancho de banda, y puede ser deseable transmitir y recibir comunicaciones de voz que incluyan un intervalo de frecuencias de banda ancha a través de tales redes. Por ejemplo, puede ser deseable soportar un intervalo de frecuencias de audio que se extienda desde 50 Hz y/o hasta 7 u 8 kHz. También puede ser deseable soportar otras aplicaciones, tales como conferencia de audio o audio/vídeo de alta calidad, que pueden tener contenido de voz de audio en intervalos fuera de los límites de la RTPC tradicional.
El ensanchamiento del intervalo soportado por un codificador de voz a frecuencias superiores puede mejorar la inteligibilidad. Por ejemplo, la información que diferencia fricativas tales como ‘s' y ‘f' está en gran parte en las frecuencias altas. El ensanchamiento de la banda alta también puede mejorar otras cualidades del habla, tal como la presencia. Por ejemplo, incluso una vocal vocalizada puede tener energía espectral muy por encima del límite de la RTPC.
Un enfoque con respecto a la codificación de voz de banda ancha implica ajustar a escala una técnica de codificación de voz de banda estrecha (por ejemplo, una configurada para codificar el intervalo de 0-4 kHz) para cubrir el espectro de banda ancha. Por ejemplo, una señal de voz puede muestrearse a una tasa superior para incluir componentes a frecuencias altas, y una técnica de codificación de banda estrecha puede volver a configurarse para usar más coeficientes de filtro para representar esta señal de banda ancha. Sin embargo, las técnicas de codificación de banda estrecha tales como CELP (predicción lineal excitada por código) son muy exigentes en lo que al cálculo se refiere, y un codificador CELP de banda ancha puede consumir demasiados ciclos de procesamiento como para ser práctico para muchas aplicaciones móviles y otras aplicaciones integradas. La codificación de todo el espectro de una señal de banda ancha a una calidad deseada usando tal técnica puede conducir a un aumento inaceptablemente grande en el ancho de banda. Además, se requeriría la transcodificación de una señal codificada de este tipo antes incluso de que su parte de banda estrecha pudiera transmitirse hacia un sistema que solo soporte codificación de banda estrecha y/o ser decodificada por él.
Otro enfoque con respecto a la codificación de voz de banda ancha implica extrapolar la envolvente espectral de banda alta a partir de la envolvente espectral de banda estrecha codificada. Aunque puede implementarse un enfoque de este tipo sin ningún aumento en el ancho de banda y sin necesidad de transcodificación, la envolvente espectral aproximada o estructura formante de la porción de banda alta de una señal de voz generalmente no puede predecirse con precisión a partir de la envolvente espectral de la parte de banda estrecha.
Puede ser deseable implementar la codificación de voz de banda ancha de tal manera que al menos la porción de banda estrecha de la señal codificada puede enviarse a través de un canal de banda estrecha (tal como un canal de RTPC) sin transcodificación u otra modificación significativa. También puede ser deseable la eficacia de la extensión de codificación de banda ancha, por ejemplo, para evitar una reducción significativa en el número de usuarios a los que puede darse2servicio en aplicaciones tales como telefonía celular inalámbrica y difusión a través de canales inalámbricos y por cable. Se llama la atención, además, sobre el documento WO 03/044777, que versa acerca de un sistema de transmisión que comprende un transmisor para transmitir a un receptor una señal de audio de banda estrecha por medio de un canal de transmisión. El receptor comprende un ensanchador del ancho de banda para generar una señal de audio de banda ancha a partir de la señal de audio de banda estrecha. El ensanchador del ancho de banda comprende medios de plegado espectral para generar una señal de audio plegada espectralmente plegando espectralmente al menos parte de la señal de audio de banda estrecha. El ensanchador de ancho de banda del sistema de transmisión comprende un conformador de ruido para generar una señal conformada de ruido conformando una señal de ruido según al menos parte de la señal de audio plegada espectralmente, comprendiendo el ensanchador de ancho de banda un combinador para combinar la señal conformada de ruido y la señal de audio plegada espectralmente en la señal de audio de banda ancha.
Resumen
En la presente invención se proporcionan un procedimiento de generación de una señal de excitación de banda alta, según se expone en la reivindicación 1, un medio de almacenamiento de datos, según se expone en la reivindicación 17, y un aparato, según se expone en la reivindicación 18. En las reivindicaciones dependientes se reivindican realizaciones adicionales.
En una realización, un procedimiento de generación de una señal de excitación de banda alta incluye ensanchar armónicamente el espectro de una señal que se basa en una señal de excitación de banda baja; calcular una envolvente de dominio temporal de una señal que se basa en la señal de excitación de banda baja; y modular una señal de ruido según la envolvente de dominio temporal. El procedimiento también incluye combinar (A) una señal ensanchada armónicamente con base en un resultado del ensanchamiento armónico y (B) una señal modulada de ruido con base en un resultado de la modulación. En este procedimiento, la señal de excitación de banda alta está basada en un resultado de la combinación.
En otra realización, un aparato incluye un ensanchador de espectro configurado para llevar a cabo un ensanchamiento armónico del espectro de una señal que se basa en una señal de excitación de banda baja; un calculador de envolvente configurado para calcular una envolvente de dominio temporal de una señal que se basa en la señal de excitación de banda baja; un primer combinador configurado para llevar a cabo una modulación de una señal de ruido según la envolvente de dominio temporal; y un segundo combinador configurado para calcular una suma de (A) una señal ensanchada armónicamente con base en un resultado del ensanchamiento armónico y
(B) una señal modulada de ruido con base en un resultado de la modulación. La señal de excitación de banda alta está basada en un resultado de la suma.
En otra realización, un aparato incluye medios para ensanchar armónicamente el espectro de una señal que se basa en una señal de excitación de banda baja; medios para calcular una envolvente de dominio temporal de una señal que se basa en la señal de excitación de banda baja; medios para modular una señal de ruido según la envolvente de dominio temporal; y medios para combinar (A) una señal ensanchada armónicamente con base en un resultado de dicho ensanchamiento armónico y (B) una señal modulada de ruido con base en un resultado de dicha modulación. En este aparato, la señal de excitación de banda alta está basada en un resultado de dicha combinación.
En otra realización, un procedimiento de generación de una señal de excitación de banda alta incluye calcular una señal ensanchada armónicamente aplicando una función no lineal a una señal de excitación de banda baja derivada de una porción de baja frecuencia de una señal de voz; y mezclar la señal ensanchada armónicamente con una señal modulada de ruido para generar una señal de excitación de banda alta.
Breve descripción de... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento de generación de una señal (S120) de excitación de banda alta, comprendiendo dicho procedimiento:
ensanchar armónicamente el espectro de una señal que se basa en una señal (S80) de excitación de
banda baja; calcular una envolvente de dominio temporal de una señal que se basa en la señal (S80) de excitación de banda baja; modular una señal de ruido según la envolvente de dominio temporal; y combinar (A) una señal (S160) ensanchada armónicamente con base en un resultado de dicho
ensanchamiento armónico y (B) una señal modulada (S170) de ruido con base en un resultado de dicha modulación, incluyendo dicha combinación el cálculo de una suma ponderada de la señal (S160) ensanchada armónicamente y la señal modulada (S170) de ruido, incluyendo dicho cálculo de una suma ponderada la ponderación de la señal (S160) ensanchada armónicamente según un primer factor de ponderación y la ponderación de la señal modulada (S170) de ruido según un segundo factor de
ponderación, comprendiendo dicho procedimiento el cálculo de al menos uno entre los factores de ponderación primero y segundo según al menos uno entre (A) una medida de periodicidad de una señal de voz y (B) un grado vocal de una señal de voz, en el que la señal de excitación de banda alta se basa en la suma ponderada.
2. El procedimiento según la reivindicación 1 en el que dicho ensanchamiento armónico comprende aplicar una 20 función no lineal a una señal que se basa en la señal (S80) de excitación de banda baja.
3. El procedimiento según la reivindicación 2 en el que dicha aplicación de una función no lineal comprende aplicar la función no lineal en el dominio temporal.
4. El procedimiento según la reivindicación 2 en el que la función no lineal es una función no lineal sin memoria.
5. El procedimiento según la reivindicación 2 en el que la función no lineal es invariante en el tiempo.
6. El procedimiento según la reivindicación 2 en el que la función no lineal comprende al menos una de la función de valor absoluto, la función de elevación al cuadrado y una función de recorte.
7. El procedimiento según la reivindicación 2 en el que la función no lineal es la función de valor absoluto.
8. El procedimiento según la reivindicación 1 en el que dicho cálculo de una envolvente de dominio temporal de una señal que se basa en la señal (S80) de excitación de banda baja incluye calcular una envolvente de
dominio temporal entre la señal (S80) de excitación de banda baja y la señal (S160) ensanchada armónicamente.
9. El procedimiento según la reivindicación 1 en el que dicho ensanchamiento armónico incluye ensanchar armónicamente el espectro de una señal sobremuestreada que se basa en la señal (S80) de excitación de banda baja.
10. El procedimiento según la reivindicación 1, comprendiendo dicho procedimiento aplanar espectralmente la señal ensanchada armónicamente antes de dicha combinación.
11. El procedimiento según la reivindicación 10 en el que dicho aplanamiento espectral comprende:
calcular una pluralidad de coeficientes de filtro con base en una señal que ha de ser aplanada espectralmente; y 40 filtrar la señal que ha de ser aplanada espectralmente con un filtro blanqueador configurado según la pluralidad de coeficientes de filtro.
12. El procedimiento según la reivindicación 1, comprendiendo dicho procedimiento la generación de la señal de ruido según una función determinista de información dentro de una señal codificada de voz.
13. El procedimiento según la reivindicación 1, comprendiendo dicho procedimiento la obtención de la señal (S80)
45 de excitación de banda baja y un valor de ganancia de altura tonal a partir de una representación cuantificada de un resto (S50) de banda baja, y comprendiendo dicho procedimiento calcular uno entre los factores de ponderación primero y segundo según al menos el valor de ganancia de altura tonal.
14. El procedimiento según la reivindicación 1, comprendiendo dicho procedimiento al menos uno de (i) codificar
una señal de voz de banda alta según la señal (S120) de excitación de banda alta y (ii) decodificar una señal 50 de voz de banda alta según la señal (S120) de excitación de banda alta.
15. Un medio de almacenamiento de datos que contiene instrucciones ejecutables por máquina para llevar a cabo el procedimiento de procesamiento de señales según la reivindicación 1.
16. Un aparato (A302) que comprende:
un medio para ensanchar armónicamente el espectro de una señal que se basa en una señal (S80) de
excitación de banda baja; un medio para calcular una envolvente de dominio temporal de una señal que se basa en la señal (S80) de excitación de banda baja; un medio para modular una señal de ruido según la envolvente de dominio temporal; y un medio para combinar (A) una señal (S160) ensanchada armónicamente con base en un resultado de
dicho ensanchamiento armónico y (B) una señal modulada (S170) de ruido con base en un resultado de dicha modulación, incluyendo dicho medio de combinación un medio de cálculo de una suma ponderada de la señal (S160) ensanchada armónicamente y la señal modulada (S170) de ruido, estando configurado dicho medio de combinación para ponderar la señal (S160) ensanchada armónicamente según un primer factor de ponderación y para ponderar la señal modulada (S170) de ruido según un segundo factor de
ponderación, estando configurado dicho medio de combinación para calcular al menos uno entre los factores de ponderación primero y segundo según al menos uno entre (A) una medida de periodicidad de una señal de voz y (B) un grado vocal de una señal de voz, en el que la señal (S120) de excitación de banda alta se basa en la suma ponderada.
17. El aparato (A302) de la reivindicación 16 en el que:
el medio para ensanchar armónicamente el espectro de una señal es un ensanchador (A400) de espectro; el medio para calcular una envolvente de dominio temporal de una señal es un calculador (460) de envolvente; el medio para modular una señal de ruido es un primer combinador (470) ; y el medio para combinar (A) y (B) es un segundo combinador (490) .
18. El aparato (A302) según la reivindicación 17 en el que dicho ensanchador (A400) de espectro está configurado para aplicar una función no lineal para llevar a cabo el ensanchamiento armónico del espectro de una señal que se basa en la señal (S80) de excitación de banda baja.
19. El aparato (A302) según la reivindicación 18 en el que la función no lineal comprende al menos una de la función de valor absoluto, la función de elevación al cuadrado y una función de recorte.
20. El aparato (A302) según la reivindicación 18 en el que la función no lineal es la función de valor absoluto.
21. El aparato (A302) según la reivindicación 17 en el que dicho calculador (460) de envolvente está configurado para calcular la envolvente de dominio temporal con base en una entre la señal (S80) de excitación de banda baja y la señal (S160) ensanchada armónicamente.
22. El aparato (A302) según la reivindicación 17 en el que dicho ensanchador (A400) de espectro está configurado
para llevar a cabo un ensanchamiento armónico del espectro de una señal sobremuestreada que se basa en la señal (S80) de excitación de banda baja.
23. El aparato (A302) según la reivindicación 17, comprendiendo dicho aparato un aplanador espectral configurado para aplanar espectralmente la señal ensanchada armónicamente.
24. El aparato (A302) según la reivindicación 23 en el que dicho aplanador espectral está configurado para calcular
una pluralidad de coeficientes de filtro con base en una señal que ha de ser aplanada espectralmente y filtrar la señal que ha de ser aplanada espectralmente con un filtro blanqueador configurado según la pluralidad de coeficientes de filtro.
25. El aparato (A302) según la reivindicación 17, comprendiendo dicho aparato un generador de ruido configurado
para generar la señal de ruido según una función determinista de información dentro de una señal codificada 45 de voz.
26. El aparato (A302) según la reivindicación 16, incluyendo dicho aparato un descuantificador configurado para obtener la señal (S80) de excitación de banda baja y un valor de ganancia de altura tonal a partir de una representación cuantificada de un resto (S50) de banda baja, y estando configurado dicho segundo combinador
(490) para calcular al menos uno entre los factores de ponderación primero y segundo según al menos el valor 50 de ganancia de altura tonal.
27. El aparato (A302) según la reivindicación 17, incluyendo dicho aparato al menos uno de (i) un codificador de voz de banda alta configurado para codificar una señal de voz de banda alta según la señal de excitación de banda alta y (ii) un decodificador de voz de banda alta configurado para decodificar una señal de voz de banda alta según la señal de excitación de banda alta.
2828. El aparato (A302) según la reivindicación 17, comprendiendo dicho aparato un teléfono celular.
Patentes similares o relacionadas:
Audífono con ganancia dependiente del nivel y de la frecuencia, del 28 de Octubre de 2019, de Meyer Sound Laboratories, Incorporated: Un audífono de oído abierto para compensar la pérdida de audición en el oído humano que comprende: medios de entrada para captar el sonido incidente que […]
METODO Y APARATO DECODIFICADOR AUDIO., del 16 de Septiembre de 2006, de MATSUSHITA ELECTRIC INDUSTRIAL CO., LTD. NEC CORPORATION: Un aparato decodificador audio para decodificar una señal audio de banda ancha de un tren de bits conteniendo información codificada para una señal audio de banda estrecha, […]