Sistemas, procedimientos y aparato para limitar el factor de ganancia.

Un procedimiento de codificación de una señal (S10) vocal de banda ancha que incluye generar un valor (S60b) de factor de ganancia cuantizado,

comprendiendo dicho procedimiento:

calcular un valor (TQ10) de factor de ganancia basado en una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor (TQ20) del factor de ganancia;

caracterizado porque el procedimiento comprende adicionalmente:

determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor (TQ30, TQ32) calculado del factor de ganancia; y

si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y usar el segundo índice como el valor (TQ50, TQ52) cuantizado del factor de ganancia; o

si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia, usar el primer índice como el valor cuantizado del factor de ganancia.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/074794.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: Attn: International IP Administration 5775 Morehouse Drive San Diego, CA 92121 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KANDHADAI,ANANTHAPADMANABHAN,A, KRISHNAN,VENKATESH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L21/02 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2460893_T3.pdf

 


Fragmento de la descripción:

Sistemas, procedimientos y aparato para limitar el factor de ganancia Campo La presente revelación se refiere a la codificación vocal.

Antecedentes Las comunicaciones de voz por la red telefónica conmutada pública (PSTN) han estado tradicionalmente limitadas en el ancho de banda a la gama de frecuencias entre 300 y 3.400 kHz. Las nuevas redes para las comunicaciones de voz, tales como la telefonía celular y la voz sobre IP (Protocolo de Internet, VoIP) , pueden no tener los mismos límites del ancho de banda, y puede ser deseable transmitir y recibir comunicaciones de voz que incluyan una gama de frecuencias de banda ancha por tales redes. Por ejemplo, puede ser deseable dar soporte a una gama de frecuencias de audio que se extienda hacia abajo hasta los 50 Hz y / o hacia arriba hasta los 7 u 8 kHz. También puede ser deseable dar soporte a otras aplicaciones, tales como el audio de alta calidad o las conferencias de audio / vídeo, que puedan tener contenido vocal de audio en gamas fuera de los tradicionales límites de la PSTN.

La extensión de la gama con soporte en un codificador vocal, hacia frecuencias mayores, puede mejorar la inteligibilidad. Por ejemplo, la información que diferencia a las fricativas tales como la ‘s’ y la ‘f’ está mayormente en las altas frecuencias. La extensión de la banda alta también puede mejorar otras cualidades vocales, tales como la presencia. Por ejemplo, incluso una vocal sonora puede tener energía espectral muy por encima del límite de la PSTN.

Un enfoque para la codificación vocal de banda ancha implica ajustar a escala una técnica de codificación vocal de banda estrecha (p. ej., una configurada para codificar la gama entre los 0 y los 4 kHz) para cubrir el espectro de banda ancha. Por ejemplo, una señal vocal puede ser muestreada a una tasa superior para incluir componentes en altas frecuencias, y una técnica de codificación de banda estrecha puede ser reconfigurada para usar más coeficientes de filtro para representar esta señal de banda ancha. Las técnicas de codificación de banda estrecha tales como la CELP (predicción lineal excitada de libro de códigos) son intensivas en términos de cálculo, sin embargo, y un codificador de CELP de banda ancha puede consumir demasiados ciclos de procesamiento para ser práctico para muchas aplicaciones móviles y otras aplicaciones empotradas. La codificación del espectro entero de una señal de banda ancha en una calidad deseada, usando una técnica de ese tipo, también puede llevar a un aumento inaceptablemente grande en el ancho de banda. Además, la transcodificación de una señal codificada de ese tipo sería requerida incluso antes de que su parte de banda estrecha pudiera ser transmitida hacia, y / o descodificada por, un sistema que solamente dé soporte a la codificación de banda estrecha.

Puede ser deseable implementar la codificación vocal de banda ancha de modo que al menos la parte de banda estrecha de la señal codificada pueda ser enviada a través de un canal de banda estrecha (tal como un canal de la PSTN) sin transcodificación u otra modificación significativa. La eficacia de la extensión de codificación de banda ancha también puede ser deseable, por ejemplo, para evitar una reducción significativa en el número de usuarios que pueden ser servidos en aplicaciones tales como la telefonía celular inalámbrica y la difusión por canales cableados e inalámbricos.

Otro enfoque para la codificación vocal de banda ancha implica codificar la banda estrecha y partes de la banda alta de una señal vocal como sub-bandas separadas. En un sistema de este tipo, puede ser realizada una eficacia aumentada con la obtención de una excitación para el filtro de síntesis de banda alta, a partir de información ya disponible en el descodificador, tal como la señal de excitación de banda estrecha. La calidad puede ser aumentada en un sistema de ese tipo incluyendo en la señal codificada una serie de factores de ganancia que indiquen una relación variable en el tiempo entre un nivel de la señal original de banda alta y un nivel de la señal sintetizada de banda alta.

Como ilustración, el documento U. S. 2005 / 0004793 A1 (Ojala et al.) del 6 de enero de 2005 (06.01.2005) revela un procedimiento de codificación vocal de banda ancha que codifica por separado la banda estrecha y la señal vocal de banda alta, y en el cual un factor de ganancia es determinado en base a la relación entre las energías de una señal basada en una señal de banda alta de la señal vocal de banda ancha, y una señal basada en la señal de excitación obtenida de una señal de banda estrecha de la señal vocal de banda ancha. El factor de ganancia determinado, y posiblemente ajustado, es finalmente cuantizado y transmitido al extremo receptor.

Sumario Un procedimiento de codificación de una señal vocal de banda ancha según una configuración incluye calcular un factor de ganancia en base a una relación entre (A) una parte en el tiempo de una primera señal de banda alta de una señal vocal de banda ancha y (B) una parte correspondiente en el tiempo de una segunda señal basada en una señal de excitación codificada, obtenida de una señal de banda estrecha de la señal vocal de banda ancha, según la reivindicación 1.

Un aparato para el procesamiento vocal según otra configuración incluye un aparato de acuerdo a la reivindicación 8.

Breve descripción de los dibujos La FIGURA 1a muestra un diagrama de bloques de un codificador A100 vocal de banda ancha.

La FIGURA 1b muestra un diagrama de bloques de una implementación A102 del codificador A100 vocal de banda ancha. La FIGURA 2a muestra un diagrama de bloques de un descodificador B100 vocal de banda ancha. La FIGURA 2b muestra un diagrama de bloques de una implementación B102 del codificador B100 vocal de banda

ancha.

La FIGURA 3a muestra la cobertura del ancho de banda de las bandas baja y alta para un ejemplo del banco A110 de filtros. La FIGURA 3b muestra la cobertura del ancho de banda de las bandas baja y alta para otro ejemplo del banco A110 de

filtros.

La FIGURA 4a muestra un ejemplo de un gráfico de la frecuencia con respecto al logaritmo de la amplitud para una señal vocal. La FIGURA 4b muestra un diagrama de bloques de un sistema de codificación de predicción lineal básica. La FIGURA 5 muestra un diagrama de bloques de una implementación A122 del codificador A120 de banda estrecha. La FIGURA 6 muestra un diagrama de bloques de una implementación B112 del descodificador B110 de banda

estrecha.

La FIGURA 7a muestra un ejemplo de un gráfico de la frecuencia con respecto al logaritmo de la amplitud para una señal residual para el habla sonora. La FIGURA 7b muestra un ejemplo de un gráfico del tiempo con respecto al logaritmo de la amplitud para una señal

residual para el habla sonora.

La FIGURA 8 muestra un diagrama de bloques de un sistema de codificación de predicción lineal básica que también realiza la predicción a largo plazo. La FIGURA 9 muestra un diagrama de bloques de una implementación A202 del codificador A200 de banda alta. La FIGURA 10 muestra un diagrama de flujo para un procedimiento M10 de codificación de una parte de banda alta. La FIGURA 11 muestra un diagrama de flujo para una tarea T200 de cálculo de ganancia. La FIGURA 12 muestra un diagrama de flujo para una implementación T210 de la tarea T200 de cálculo de ganancia. La FIGURA 13a muestra un diagrama de una función de formación de ventanas. La FIGURA 13b muestra una aplicación de una función de formación de ventanas, como se muestra en la FIGURA 13a,

a las sub-tramas de una señal vocal.

La FIGURA 14a muestra un diagrama de bloques de una implementación A232 del calculador A230 del factor de ganancia de banda alta. La FIGURA 14b muestra un diagrama de bloques de una disposición que incluye el calculador A232 del factor de

ganancia de banda alta.

La FIGURA 15 muestra un diagrama de bloques de una implementación A234 del calculador A232 del factor de ganancia de banda alta. La FIGURA 16 muestra un diagrama de bloques de otra implementación A236 del calculador A232 del factor de

ganancia de banda alta.

La FIGURA 17 muestra un ejemplo de una correlación unidimensional, como puede ser realizada por un cuantizador escalar. La FIGURA 18 muestra un ejemplo sencillo de una correlación multidimensional, según lo realizado por un cuantizador

vectorial. La FIGURA 19a muestra otro ejemplo de una correlación unidimensional, como puede ser realizada por un cuantizador escalar.

La FIGURA 19b muestra un ejemplo de una correlación de un espacio de entrada con regiones de cuantización de distintos... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación de una señal (S10) vocal de banda ancha que incluye generar un valor (S60b) de factor de ganancia cuantizado, comprendiendo dicho procedimiento:

calcular un valor (TQ10) de factor de ganancia basado en una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor (TQ20) del factor de ganancia;

caracterizado porque el procedimiento comprende adicionalmente:

determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor (TQ30, TQ32) calculado del factor de ganancia; y

si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y usar el segundo índice como el valor (TQ50, TQ52) cuantizado del factor de ganancia; o si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia, usar el primer índice como el valor cuantizado del factor de ganancia.

2. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende la determinación de si el valor de cuantización indicado por el primer índice supera o no el valor (TQ30) del factor de ganancia.

3. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una cantidad específica.

4. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende la determinación de si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una proporción específica del valor (TQ32) del factor de ganancia.

5. El procedimiento según la reivindicación 1, en el cual el primer índice seleccionado entre el conjunto ordenado de valores de cuantización que corresponde al valor del factor de ganancia es el índice que indica el valor de cuantización, entre el conjunto ordenado, que está más cerca del valor del factor de ganancia.

6. El procedimiento según la reivindicación 5, en el cual el segundo índice es el índice en el conjunto ordenado que tiene el próximo valor mínimo de cuantización comparado con el valor de cuantización para el primer índice (TQ52) .

7. Un producto de programa de ordenador, que comprende un medio legible por ordenador que incluye código de programa para implementar el procedimiento de una cualquiera de las reivindicaciones precedentes.

8. Un aparato de codificación de una señal (S10) vocal de banda ancha, que incluye generar un valor cuantizado (S60b) del factor de ganancia, comprendiendo dicho aparato:

un medio (A230) para calcular un valor del factor de ganancia en base a una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha, y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada en una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

un medio (430) para seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor del factor de ganancia;

caracterizado por:

un medio (L10) para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia;

un medio (L10) para seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y seleccionar el segundo índice como el valor cuantizado del factor de ganancia; y

un medio (L10) para seleccionar el primer índice como el valor cuantizado del factor de ganancia si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia.

9. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización H, indicado por el

primer índice, no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia.

10. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una cantidad específica.

11. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una proporción específica del valor del factor de ganancia.

12. El aparato según la reivindicación 8, en el cual el primer índice seleccionado entre el conjunto ordenado de valores de cuantización que corresponde al valor del factor de ganancia es el índice que indica el valor de cuantización, entre el conjunto ordenado, que esté más cerca del valor del factor de ganancia.

13. El aparato según la reivindicación 12, en el cual el segundo índice es el índice en el conjunto ordenado que tiene el próximo valor mínimo de cuantización comparado con el valor de cuantización para el primer índice.


 

Patentes similares o relacionadas:

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]

Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]

Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]

Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]

Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .