Método y dispositivo de codificación.

Método de codificación relativo al procesamiento de audio o voz que comprende:



dividir (401) una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar (402) la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia; y

codificar (403) la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CN2011/081114.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: Huawei Administration Building, Bantian Longgang District, Shenzhen, Guangdong 518129 CHINA.

Inventor/es: MIAO,LEI, TALEB,Anisse, LIU,ZEXIN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2531575_T3.pdf

 


Fragmento de la descripción:

Método y dispositivo de codificación.

Campo de la invención La presente invención se refiere al campo de las tecnologías de voz y audio y, en particular, a métodos y dispositivos de codificación.

Antecedentes de la invención En las tecnologías de procesamiento de audio y voz ya está apareciendo una tecnología de expansión de ancho de banda, esto es, una señal de banda de alta frecuencia es codificada utilizando un número pequeño de bits para expandir un rango de banda de frecuencia de una señal de voz/audio. La tecnología de expansión de ancho de banda se ha desarrollado rápidamente en los últimos años y ha sido aplicada comercialmente en algunos codificadores y descodificadores. Un ejemplo de un enfoque de expansión del ancho de banda está descrito, por ejemplo, en el documento US 2005/0004793 A1.

La tecnología de expansión del ancho de banda adoptada actualmente es básicamente una tecnología de expansión del ancho de banda multimodo, en la que de acuerdo con las características de señal de una señal de banda de alta frecuencia en una señal de entrada, es determinada una clase de señal de la señal de banda de alta frecuencia, y son adoptados diferentes algoritmos de codificación y descodificación para diferentes clases de señal. De acuerdo con las características de señal de las señales de banda de alta frecuencia, las señales de banda de alta frecuencia se clasifican en cuatro clases: una clase transitoria (Transitoria) , una clase armónica (Armónica) , una clase de ruido (Ruido) y una clase normal (Normal) . Un proceso de clasificación específico incluye: dividir una señal en el dominio del tiempo de la banda de alta frecuencia de una cierta trama en varias subtramas, obtener una envolvente en el dominio del tiempo de cada subtrama, y cuando la energía de una cierta subtrama es mayor que un cierto número de veces la energía de una subtrama anterior y la energía de la subtrama es mayor que un cierto número de veces la energía media de todas las subtramas en la trama completa, determinar que la señal de banda de alta frecuencia de la trama es de la clase transitoria; si la trama no es de la clase transitoria, dividir una señal en el dominio de la frecuencia de la banda de alta frecuencia de la trama en varias subbandas, obtener una razón de pico a promedio de cada subbanda, donde la razón de pico a promedio es una razón de la energía o amplitud pico de la subbanda respecto a la energía o amplitud media de la subbanda, y cuando el número de subbandas que tienen una razón de pico a promedio mayor que un umbral es mayor que un cierto número, determinar que la señal de banda de alta frecuencia de la trama es de la clase armónica; cuando el número de subbandas que tienen una razón de pico a promedio menor que un umbral es mayor que un cierto número, determinar que la señal de banda de alta frecuencia de la trama es ruido; de lo contrario, determinar que la señal de banda de alta frecuencia de la trama es de la clase normal.

La técnica anterior tiene las siguientes desventajas.

En la técnica anterior, durante la clasificación de la señal para una señal de banda de alta frecuencia de una cierta trama, solo se consideran características de la señal de banda de alta frecuencia de la trama, lo que tiene como consecuencia un resultado de clasificación de señal inexacto para la señal de banda de alta frecuencia de la trama.

Sumario de la invención Según un primer aspecto de la presente invención un método de codificación relativo al procesamiento de audio o voz incluye:

dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, indicando el valor de atenuación de energía la atenuación de energía de la señal de banda de baja frecuencia provocada por la codificación de la señal de banda de baja frecuencia; y codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

De acuerdo con un segundo aspecto de la presente invención, un dispositivo de descodificación relativo al procesamiento de audio o voz incluye:

una unidad de división, configurada para dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

una unidad de corrección, configurada para atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de

energía de la señal de banda de baja frecuencia, donde el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia de la trama actual; y una unidad de codificación, configurada para codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

Realizaciones preferidas están expuestas en las reivindicaciones dependientes.

Una señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia es atenuado de acuerdo con un valor de atenuación de energía de una señal de banda de baja frecuencia de una trama actual, y un resultado de atenuación es codificado y enviado a un descodificador, de manera que la energía de la señal de banda de alta frecuencia obtenida por el descodificador por descodificación es atenuada correspondientemente, consiguiéndose así un mejor efecto después de que la señal de banda de alta frecuencia es combinada con la señal de banda de baja frecuencia.

Breve descripción de los dibujos Para ilustrar más claramente las soluciones técnicas según la presente invención, los dibujos adjuntos que describen realizaciones de la presente invención son introducidos brevemente en lo siguiente. Evidentemente, los dibujos adjuntos en la siguiente descripción muestran solamente algunas realizaciones de la presente invención.

Fig. 1, es un diagrama de flujo de un método de clasificación de la señal previsto en un ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Figs. 2A y 2B, es un diagrama de flujo de un método de clasificación de la señal previsto en otro ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Fig. 3, es un diagrama estructural de un dispositivo de clasificación de la señal previsto en un ejemplo que no comprende todas las características necesarias para implementar la presente invención;

Fig. 4, es un diagrama de flujo de un método de codificación previsto en una realización de la presente invención;

Fig. 5, es un diagrama de flujo de otro método de codificación previsto en una realización de la presente invención;

Fig. 6, es un diagrama de flujo de un método de descodificación previsto en un ejemplo;

Fig. 7, es un diagrama de flujo de otro método de descodificación previsto en un ejemplo;

Fig. 8, es un diagrama estructural de un dispositivo de codificación previsto en una realización de la presente invención; y Fig. 9, es un diagrama estructural de un dispositivo de descodificación previsto en un ejemplo.

Descripción detallada de las realizaciones Las siguientes realizaciones de la presente invención tienen en cuenta las características de codificación/descodificación de las diferentes clases de señal durante la clasificación de la señal, y para hacer más claras las soluciones técnicas de acuerdo con las realizaciones de la presente invención, se describirán brevemente en lo que sigue las características de los algoritmos de codificación/descodificación para diferentes clases de señal.

1. Cuando la clase de una señal de banda de alta frecuencia de una trama actual es una clase de ruido, el proceso de codificación/descodificación de la señal de banda de alta frecuencia de la trama actual incluye: durante la codificación, un codificador necesita obtener razones de envolventes en el dominio de la frecuencia de subbandas de la señal de banda de alta frecuencia respecto a envolventes en el dominio de la frecuencia de subbandas correspondientes de una señal de banda de baja frecuencia, y enviar las razones a un descodificador. De esta manera, el codificador y el descodificador predeterminan una relación de correspondencia entre... [Seguir leyendo]

 


Reivindicaciones:

1. Método de codificación relativo al procesamiento de audio o voz que comprende:

dividir (401) una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

atenuar (402) la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica la atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia; y codificar (403) la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

2. Método según la reivindicación 1, en el que el método comprende además: determinar una clase de señal de la señal de banda de alta frecuencia; y la etapa de atenuación (402) de la señal de banda de alta frecuencia o del parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía de la señal de banda de baja frecuencia comprende:

atenuar la señal de banda de alta frecuencia o el parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia.

3. Método según la reivindicación 2, en el que la etapa de atenuación (402) de la señal de banda de alta frecuencia o del parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia comprende:

cuando la clase de señal de la señal banda de alta frecuencia es una clase transitoria, atenuar una señal en el dominio del tiempo de la banda de alta frecuencia o una envolvente en el dominio del tiempo a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía; y/o, cuando la clase de señal de la señal de banda de alta frecuencia es una clase fricativa, una clase armónica o una clase normal, atenuar una señal en el dominio de la frecuencia de la banda de alta frecuencia o una envolvente en el dominio de la frecuencia a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía.

4. Método según la reivindicación 1, en el que el método comprende además:

codificar (501) la señal de banda de baja frecuencia y descodificar localmente un resultado de codificación de la señal de banda de baja frecuencia; y usar (501) una razón de la energía de la señal de banda de baja frecuencia respecto a la energía de una señal obtenida por la descodificación local como el valor de atenuación de energía.

5. Método según la reivindicación 1, en el que el valor de atenuación de energía es un valor preestablecido, y el valor de atenuación de energía es obtenido de acuerdo con razones de energía de múltiples señales de banda de baja frecuencia de una trama de la misma clase respecto a la energía de señales obtenidas descodificando resultados de codificación de las señales de banda de baja frecuencia de la trama de la misma clase, donde la trama de la misma clase es una trama de datos de la misma clase de señal que la señal de banda de alta frecuencia de la trama actual.

6. Dispositivo de codificación relativo al procesamiento de audio o voz que comprende:

una unidad de división (100) , configurada para dividir una trama actual en una señal de banda de baja frecuencia y una señal de banda de alta frecuencia;

una unidad de corrección (200) , configurada para atenuar la señal de banda de alta frecuencia o un parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con un valor de atenuación de energía de la señal de banda de baja frecuencia, en el que el valor de atenuación de energía indica atenuación de energía de la señal de banda de baja frecuencia causado por la codificación de la señal de banda de baja frecuencia de la trama actual; y una unidad de codificación (300) , configurada para codificar la señal de banda de alta frecuencia atenuada o el parámetro característico a ser codificado atenuado de la señal de banda de alta frecuencia.

7. Dispositivo según la reivindicación 6, que comprende además:

una unidad de determinación de la clase de señal, configurada para determinar una clase de señal de la señal de banda de alta frecuencia; en el que 22

la unidad de corrección (200) está configurada para atenuar la señal de banda de alta frecuencia o el parámetro característico a ser codificado de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía y la clase de señal de la señal de banda de alta frecuencia.

8. Dispositivo según la reivindicación 7, en el que la unidad de corrección (200) está configurada para atenuar una señal en el dominio del tiempo de la banda de alta frecuencia o una envolvente en el dominio del tiempo a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía cuando la clase de señal de la señal de banda de alta frecuencia es una clase transitoria; y/o, la unidad de corrección (200) está configurada para atenuar una señal en el dominio de la frecuencia de la banda de alta frecuencia o una envolvente en el dominio de la frecuencia a ser codificada de la señal de banda de alta frecuencia de acuerdo con el valor de atenuación de energía cuando la clase de señal de la señal de banda de alta frecuencia es una clase fricativa, una clase armónica o una clase normal.

9. Dispositivo según la reivindicación 6, en el que una unidad de obtención del valor de atenuación de energía (500) está configurada para codificar la señal de banda de baja frecuencia y descodificar localmente un resultado de codificación de la señal de banda de baja frecuencia; y utilizar una razón de la energía de la señal de banda de baja frecuencia respecto a la energía de una señal obtenida por descodificación local como valor de atenuación de energía.

10. Dispositivo según la reivindicación 6, que comprende además: una unidad de ajuste del valor de atenuación de energía (600) que está configurada para ajustar el valor de atenuación de energía, en el que el valor de atenuación de energía es obtenido de acuerdo con razones de energía de múltiples señales de banda de baja frecuencia de una trama de la misma clase respecto a la energía de señales obtenidas por decodificación de resultados de codificación de señales de banda de baja frecuencia de la trama de la misma clase, siendo la trama de la misma clases una trama de datos de la misma clase de señal que la señal de banda de alta frecuencia de la trama actual.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .