Sistemas, procedimientos y aparato para limitar el factor de ganancia.

Un procedimiento de codificación de una señal (S10) vocal de banda ancha que incluye generar un valor

(S60b) de factor de ganancia cuantizado, comprendiendo dicho procedimiento:

calcular un valor (TQ10) de factor de ganancia basado en una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor (TQ20) del factor de ganancia;

caracterizado porque el procedimiento comprende adicionalmente:

determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor (TQ30, TQ32) calculado del factor de ganancia; y

si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y usar el segundo índice como el valor (TQ50, TQ52) cuantizado del factor de ganancia; o

si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia, usar el primer índice como el valor cuantizado del factor de ganancia.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2007/074794.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: Attn: International IP Administration 5775 Morehouse Drive San Diego, CA 92121 ESTADOS UNIDOS DE AMERICA.

Inventor/es: KANDHADAI,ANANTHAPADMANABHAN,A, KRISHNAN,VENKATESH.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/02 (Mejora de la inteligibilidad de la voz, p.ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08))

PDF original: ES-2460893_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Sistemas, procedimientos y aparato para limitar el factor de ganancia Campo La presente revelación se refiere a la codificación vocal.

Antecedentes Las comunicaciones de voz por la red telefónica conmutada pública (PSTN) han estado tradicionalmente limitadas en el ancho de banda a la gama de frecuencias entre 300 y 3.400 kHz. Las nuevas redes para las comunicaciones de voz, tales como la telefonía celular y la voz sobre IP (Protocolo de Internet, VoIP) , pueden no tener los mismos límites del ancho de banda, y puede ser deseable transmitir y recibir comunicaciones de voz que incluyan una gama de frecuencias de banda ancha por tales redes. Por ejemplo, puede ser deseable dar soporte a una gama de frecuencias de audio que se extienda hacia abajo hasta los 50 Hz y / o hacia arriba hasta los 7 u 8 kHz. También puede ser deseable dar soporte a otras aplicaciones, tales como el audio de alta calidad o las conferencias de audio / vídeo, que puedan tener contenido vocal de audio en gamas fuera de los tradicionales límites de la PSTN.

La extensión de la gama con soporte en un codificador vocal, hacia frecuencias mayores, puede mejorar la inteligibilidad. Por ejemplo, la información que diferencia a las fricativas tales como la ‘s’ y la ‘f’ está mayormente en las altas frecuencias. La extensión de la banda alta también puede mejorar otras cualidades vocales, tales como la presencia. Por ejemplo, incluso una vocal sonora puede tener energía espectral muy por encima del límite de la PSTN.

Un enfoque para la codificación vocal de banda ancha implica ajustar a escala una técnica de codificación vocal de banda estrecha (p. ej., una configurada para codificar la gama entre los 0 y los 4 kHz) para cubrir el espectro de banda ancha. Por ejemplo, una señal vocal puede ser muestreada a una tasa superior para incluir componentes en altas frecuencias, y una técnica de codificación de banda estrecha puede ser reconfigurada para usar más coeficientes de filtro para representar esta señal de banda ancha. Las técnicas de codificación de banda estrecha tales como la CELP (predicción lineal excitada de libro de códigos) son intensivas en términos de cálculo, sin embargo, y un codificador de CELP de banda ancha puede consumir demasiados ciclos de procesamiento para ser práctico para muchas aplicaciones móviles y otras aplicaciones empotradas. La codificación del espectro entero de una señal de banda ancha en una calidad deseada, usando una técnica de ese tipo, también puede llevar a un aumento inaceptablemente grande en el ancho de banda. Además, la transcodificación de una señal codificada de ese tipo sería requerida incluso antes de que su parte de banda estrecha pudiera ser transmitida hacia, y / o descodificada por, un sistema que solamente dé soporte a la codificación de banda estrecha.

Puede ser deseable implementar la codificación vocal de banda ancha de modo que al menos la parte de banda estrecha de la señal codificada pueda ser enviada a través de un canal de banda estrecha (tal como un canal de la PSTN) sin transcodificación u otra modificación significativa. La eficacia de la extensión de codificación de banda ancha también puede ser deseable, por ejemplo, para evitar una reducción significativa en el número de usuarios que pueden ser servidos en aplicaciones tales como la telefonía celular inalámbrica y la difusión por canales cableados e inalámbricos.

Otro enfoque para la codificación vocal de banda ancha implica codificar la banda estrecha y partes de la banda alta de una señal vocal como sub-bandas separadas. En un sistema de este tipo, puede ser realizada una eficacia aumentada con la obtención de una excitación para el filtro de síntesis de banda alta, a partir de información ya disponible en el descodificador, tal como la señal de excitación de banda estrecha. La calidad puede ser aumentada en un sistema de ese tipo incluyendo en la señal codificada una serie de factores de ganancia que indiquen una relación variable en el tiempo entre un nivel de la señal original de banda alta y un nivel de la señal sintetizada de banda alta.

Como ilustración, el documento U. S. 2005 / 0004793 A1 (Ojala et al.) del 6 de enero de 2005 (06.01.2005) revela un procedimiento de codificación vocal de banda ancha que codifica por separado la banda estrecha y la señal vocal de banda alta, y en el cual un factor de ganancia es determinado en base a la relación entre las energías de una señal basada en una señal de banda alta de la señal vocal de banda ancha, y una señal basada en la señal de excitación obtenida de una señal de banda estrecha de la señal vocal de banda ancha. El factor de ganancia determinado, y posiblemente ajustado, es finalmente cuantizado y transmitido al extremo receptor.

Sumario Un procedimiento de codificación de una señal vocal de banda ancha según una configuración incluye calcular un factor de ganancia en base a una relación entre (A) una parte en el tiempo de una primera señal de banda alta de una señal vocal de banda ancha y (B) una parte correspondiente en el tiempo de una segunda señal basada en una señal de excitación codificada, obtenida de una señal de banda estrecha de la señal vocal de banda ancha, según la reivindicación 1.

Un aparato para el procesamiento vocal según otra configuración incluye un aparato de acuerdo a la reivindicación 8.

Breve descripción de los dibujos La FIGURA 1a muestra un diagrama de bloques de un codificador A100 vocal de banda ancha.

La FIGURA 1b muestra un diagrama de bloques de una implementación A102 del codificador A100 vocal de banda ancha. La FIGURA 2a muestra un diagrama de bloques de un descodificador B100 vocal de banda ancha. La FIGURA 2b muestra un diagrama de bloques de una implementación B102 del codificador B100 vocal de banda

ancha.

La FIGURA 3a muestra la cobertura del ancho de banda de las bandas baja y alta para un ejemplo del banco A110 de filtros. La FIGURA 3b muestra la cobertura del ancho de banda de las bandas baja y alta para otro ejemplo del banco A110 de

filtros.

La FIGURA 4a muestra un ejemplo de un gráfico de la frecuencia con respecto al logaritmo de la amplitud para una señal vocal. La FIGURA 4b muestra un diagrama de bloques de un sistema de codificación de predicción lineal básica. La FIGURA 5 muestra un diagrama de bloques de una implementación A122 del codificador A120 de banda estrecha. La FIGURA 6 muestra un diagrama de bloques de una implementación B112 del descodificador B110 de banda

estrecha.

La FIGURA 7a muestra un ejemplo de un gráfico de la frecuencia con respecto al logaritmo de la amplitud para una señal residual para el habla sonora. La FIGURA 7b muestra un ejemplo de un gráfico del tiempo con respecto al logaritmo de la amplitud para una señal

residual para el habla sonora.

La FIGURA 8 muestra un diagrama de bloques de un sistema de codificación de predicción lineal básica que también realiza la predicción a largo plazo. La FIGURA 9 muestra un diagrama de bloques de una implementación A202 del codificador A200 de banda alta. La FIGURA 10 muestra un diagrama de flujo para un procedimiento M10 de codificación de una parte de banda alta. La FIGURA 11 muestra un diagrama de flujo para una tarea T200 de cálculo de ganancia. La FIGURA 12 muestra un diagrama de flujo para una implementación T210 de la tarea T200 de cálculo de ganancia. La FIGURA 13a muestra un diagrama de una función de formación de ventanas. La FIGURA 13b muestra una aplicación de una función de formación de ventanas, como se muestra en la FIGURA 13a,

a las sub-tramas de una señal vocal.

La FIGURA 14a muestra un diagrama de bloques de una implementación A232 del calculador... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento de codificación de una señal (S10) vocal de banda ancha que incluye generar un valor (S60b) de factor de ganancia cuantizado, comprendiendo dicho procedimiento:

calcular un valor (TQ10) de factor de ganancia basado en una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor (TQ20) del factor de ganancia;

caracterizado porque el procedimiento comprende adicionalmente:

determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor (TQ30, TQ32) calculado del factor de ganancia; y

si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y usar el segundo índice como el valor (TQ50, TQ52) cuantizado del factor de ganancia; o si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia, usar el primer índice como el valor cuantizado del factor de ganancia.

2. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende la determinación de si el valor de cuantización indicado por el primer índice supera o no el valor (TQ30) del factor de ganancia.

3. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una cantidad específica.

4. El procedimiento según la reivindicación 1, en el cual la determinación de si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende la determinación de si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una proporción específica del valor (TQ32) del factor de ganancia.

5. El procedimiento según la reivindicación 1, en el cual el primer índice seleccionado entre el conjunto ordenado de valores de cuantización que corresponde al valor del factor de ganancia es el índice que indica el valor de cuantización, entre el conjunto ordenado, que está más cerca del valor del factor de ganancia.

6. El procedimiento según la reivindicación 5, en el cual el segundo índice es el índice en el conjunto ordenado que tiene el próximo valor mínimo de cuantización comparado con el valor de cuantización para el primer índice (TQ52) .

7. Un producto de programa de ordenador, que comprende un medio legible por ordenador que incluye código de programa para implementar el procedimiento de una cualquiera de las reivindicaciones precedentes.

8. Un aparato de codificación de una señal (S10) vocal de banda ancha, que incluye generar un valor cuantizado (S60b) del factor de ganancia, comprendiendo dicho aparato:

un medio (A230) para calcular un valor del factor de ganancia en base a una razón o una diferencia entre (A) un envolvente temporal de una parte en el tiempo de una primera señal (S30) de banda alta de la señal (S10) vocal de banda ancha, y (B) un envolvente temporal de una parte correspondiente en el tiempo de una segunda señal basada en una señal (S50) codificada de excitación, obtenida a partir de una señal (S20) de banda estrecha de la señal (S10) vocal de banda ancha;

un medio (430) para seleccionar un primer índice entre un conjunto ordenado de valores de cuantización correspondientes al valor del factor de ganancia;

caracterizado por:

un medio (L10) para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia;

un medio (L10) para seleccionar un segundo índice entre el conjunto ordenado de valores de cuantización si el valor de cuantización indicado por el primer índice es mayor que el valor basado en el valor calculado del factor de ganancia, teniendo el segundo índice un valor de cuantización inferior al del primer índice, y seleccionar el segundo índice como el valor cuantizado del factor de ganancia; y

un medio (L10) para seleccionar el primer índice como el valor cuantizado del factor de ganancia si el valor de cuantización indicado por el primer índice no es mayor que el valor basado en el valor calculado del factor de ganancia.

9. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización H, indicado por el

primer índice, no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia.

10. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una cantidad específica.

11. El aparato según la reivindicación 8, en el cual el medio para determinar si el valor de cuantización indicado por el primer índice no es mayor que un valor basado en el valor calculado del factor de ganancia comprende un medio para determinar si el valor de cuantización indicado por el primer índice supera o no el valor del factor de ganancia en una proporción específica del valor del factor de ganancia.

12. El aparato según la reivindicación 8, en el cual el primer índice seleccionado entre el conjunto ordenado de valores de cuantización que corresponde al valor del factor de ganancia es el índice que indica el valor de cuantización, entre el conjunto ordenado, que esté más cerca del valor del factor de ganancia.

13. El aparato según la reivindicación 12, en el cual el segundo índice es el índice en el conjunto ordenado que tiene el próximo valor mínimo de cuantización comparado con el valor de cuantización para el primer índice.