Método y dispositivo de codificación.

Método de codificación relativo al procesamiento de audio o voz que comprende:

dividir

(401) una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar (402) la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia; y

codificar (403) la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CN2011/081114.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: Huawei Administration Building, Bantian Longgang District, Shenzhen, Guangdong 518129 CHINA.

Inventor/es: MIAO,LEI, TALEB,Anisse, LIU,ZEXIN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))

PDF original: ES-2531575_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método y dispositivo de codificación.

Campo de la invención La presente invención se refiere al campo de las tecnologías de voz y audio y, en particular, a métodos y dispositivos de codificación.

Antecedentes de la invención En las tecnologías de procesamiento de audio y voz ya está apareciendo una tecnología de expansión de ancho de banda, esto es, una señal de banda de alta frecuencia es codificada utilizando un número pequeño de bits para expandir un rango de banda de frecuencia de una señal de voz/audio. La tecnología de expansión de ancho de banda se ha desarrollado rápidamente en los últimos años y ha sido aplicada comercialmente en algunos codificadores y descodificadores. Un ejemplo de un enfoque de expansión del ancho de banda está descrito, por ejemplo, en el documento US 2005/0004793 A1.

La tecnología de expansión del ancho de banda adoptada actualmente es básicamente una tecnología de expansión del ancho de banda multimodo, en la que de acuerdo con las características de señal de una señal de banda de alta frecuencia en una señal de entrada, es determinada una clase de señal de la señal de banda de alta frecuencia, y son adoptados diferentes algoritmos de codificación y descodificación para diferentes clases de señal. De acuerdo con las características de señal de las señales de banda de alta frecuencia, las señales de banda de alta frecuencia se clasifican en cuatro clases: una clase transitoria (Transitoria) , una clase armónica (Armónica) , una clase de ruido (Ruido) y una clase normal (Normal) . Un proceso de clasificación específico incluye: dividir una señal en el dominio del tiempo de la banda de alta frecuencia de una cierta trama en varias subtramas, obtener una envolvente en el dominio del tiempo de cada subtrama, y cuando la energía de una cierta subtrama es mayor que un cierto número de veces la energía de una subtrama anterior y la energía de la subtrama es mayor que un cierto número de veces la energía media de todas las subtramas en la trama completa, determinar que la señal de banda de alta frecuencia de la trama es de la clase transitoria; si la trama no es de la clase transitoria, dividir una señal en el dominio de la frecuencia de la banda de alta frecuencia de la trama en varias subbandas, obtener una razón de pico a promedio de cada subbanda, donde la razón de pico a promedio es una razón de la energía o amplitud pico de la subbanda respecto a la energía o amplitud media de la subbanda, y cuando el número de subbandas que tienen una razón de pico a promedio mayor que un umbral es mayor que un cierto número, determinar que la señal de banda de alta frecuencia de la trama es de la clase armónica; cuando el número de subbandas que tienen una razón de pico a promedio menor que un umbral es mayor que un cierto número, determinar que la señal de banda de alta frecuencia de la trama es ruido; de lo contrario, determinar que la señal de banda de alta frecuencia de la trama es de la clase normal.

La técnica anterior tiene las siguientes desventajas.

En la técnica anterior, durante la clasificación de la señal para una señal de banda de alta frecuencia de una cierta trama, solo se consideran características de la señal de banda de alta frecuencia de la trama, lo que tiene como consecuencia un resultado de clasificación de señal inexacto para la señal de banda de alta frecuencia de la trama.

Sumario de la invención Según un primer aspecto de la presente invención un método de codificación relativo al procesamiento de audio o voz incluye:

dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, indicando el valor de atenuación de energía la atenuación de energía de la señal de banda de baja frecuencia provocada por la codificación de la señal de banda de baja frecuencia; y codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

De acuerdo con un segundo aspecto de la presente invención, un dispositivo de descodificación relativo al procesamiento de audio o voz incluye:

una unidad de división, configurada para dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

una unidad de corrección, configurada para atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de

energía de la señal de banda de baja frecuencia, donde el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia de la trama actual; y una unidad de codificación, configurada para codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

Realizaciones preferidas están expuestas en las reivindicaciones dependientes.

Una señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia es atenuado de acuerdo con un valor de atenuación de energía de una señal de banda de baja frecuencia de una trama actual, y un resultado de atenuación es codificado y enviado a un descodificador, de manera que la energía de la señal de banda de alta frecuencia obtenida por el descodificador por descodificación es atenuada correspondientemente, consiguiéndose así un mejor efecto después de que la señal de banda de alta frecuencia es combinada con la señal de banda de baja frecuencia.

Breve descripción de los dibujos Para ilustrar más claramente las soluciones técnicas según la presente invención, los dibujos adjuntos que describen realizaciones de la presente invención son introducidos brevemente en lo siguiente. Evidentemente, los dibujos adjuntos en la siguiente descripción muestran solamente algunas realizaciones de la presente invención.

Fig. 1, es un diagrama de flujo de un método de clasificación de la señal previsto en un ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Figs. 2A y 2B, es un diagrama de flujo de un método de clasificación de la señal previsto en otro ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Fig. 3, es un diagrama estructural de un dispositivo de clasificación de la señal previsto en un ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Fig. 4, es un diagrama de flujo de un método de codificación previsto en una realización de la presente invención;

Fig. 5, es un diagrama de flujo de otro método de codificación previsto en una realización de la presente invención;

Fig. 6, es un diagrama de flujo de un método de descodificación previsto en un ejemplo;

Fig. 7, es un diagrama de flujo de otro método de descodificación previsto en un ejemplo;

Fig. 8, es un diagrama estructural de un dispositivo de codificación previsto en una realización de la presente invención; y Fig. 9, es un diagrama estructural de un dispositivo de descodificación previsto en un ejemplo.

Descripción detallada de las realizaciones Las siguientes realizaciones de la presente invención tienen en cuenta las características de codificación/descodificación... [Seguir leyendo]

 


Reivindicaciones:

1. Método de codificación relativo al procesamiento de audio o voz que comprende:

dividir (401) una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar (402) la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia; y codificar (403) la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

2. Método según la reivindicación 1, en el que el método comprende además: determinar una clase de señal de la señal de banda de alta frecuencia; y la etapa de atenuación (402) de la señal de banda de alta frecuencia o del parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía de la señal de banda de baja frecuencia comprende:

atenuar la señal de banda de alta frecuencia o el parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia.

3. Método según la reivindicación 2, en el que la etapa de atenuación (402) de la señal de banda de alta frecuencia o del parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia comprende:

cuando la clase de señal de la señal banda de alta frecuencia es una clase transitoria, atenuar una señal en el dominio del tiempo de la banda de alta frecuencia o una envolvente en el dominio del tiempo a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía; y/o, cuando la clase de señal de la señal de banda de alta frecuencia es una clase fricativa, una clase armónica o una clase normal, atenuar una señal en el dominio de la frecuencia de la banda de alta frecuencia o una envolvente en el dominio de la frecuencia a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía.

4. Método según la reivindicación 1, en el que el método comprende además:

codificar (501) la señal de banda de baja frecuencia y descodificar localmente un resultado de codificación de la señal de banda de baja frecuencia; y usar (501) una razón de la energía de la señal de banda de baja frecuencia respecto a la energía de una señal obtenida por la descodificación local como el valor de atenuación de energía.

5. Método según la reivindicación 1, en el que el valor de atenuación de energía es un valor preestablecido, y el valor de atenuación de energía es obtenido de acuerdo con razones de energía de múltiples señales de banda de baja frecuencia de una trama de la misma clase respecto a la energía de señales obtenidas descodificando resultados de codificación de las señales de banda de baja frecuencia de la trama de la misma clase, donde la trama de la misma clase es una trama de datos de la misma clase de señal que la señal de banda de alta frecuencia de la trama actual.

6. Dispositivo de codificación relativo al procesamiento de audio o voz que comprende:

una unidad de división (100) , configurada para dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

una unidad de corrección (200) , configurada para atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia de la trama actual; y una unidad de codificación (300) , configurada para codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

7. Dispositivo según la reivindicación 6, que comprende además:

una unidad de determinación de la clase de señal, configurada para determinar una clase de señal de la señal de banda de alta frecuencia; en el que 22

la unidad de corrección (200) está configurada para atenuar la señal de banda de alta frecuencia o el parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia.

8. Dispositivo según la reivindicación 7, en el que la unidad de corrección (200) está configurada para atenuar una señal en el dominio del tiempo de la banda de alta frecuencia o una envolvente en el dominio del tiempo a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía cuando la clase de señal de la señal de banda de alta frecuencia es una clase transitoria; y/o, la unidad de corrección (200) está configurada para atenuar una señal en el dominio de la frecuencia de la banda de alta frecuencia o una envolvente en el dominio de la frecuencia a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía cuando la clase de señal de la señal de banda de alta frecuencia es una clase fricativa, una clase armónica o una clase normal.

9. Dispositivo según la reivindicación 6, en el que una unidad de obtención del valor de atenuación de energía (500) está configurada para codificar la señal de banda de baja frecuencia y descodificar localmente un resultado de codificación de la señal de banda de baja frecuencia; y utilizar una razón de la energía de la señal de banda de baja frecuencia respecto a la energía de una señal obtenida por descodificación local como valor de atenuación de energía.

10. Dispositivo según la reivindicación 6, que comprende además: una unidad de ajuste del valor de atenuación de energía (600) que está configurada para ajustar el valor de atenuación de energía, en el que el valor de atenuación de energía es obtenido de acuerdo con razones de energía de múltiples señales de banda de baja frecuencia de una trama de la misma clase respecto a la energía de señales obtenidas por decodificación de resultados de codificación de señales de banda de baja frecuencia de la trama de la misma clase, siendo la trama de la misma clases una trama de datos de la misma clase de señal que la señal de banda de alta frecuencia de la trama actual.