METODO Y APARATO PARA OBTENER UN FACTOR DE ATENUACION.

Un método para tratar una señal de voz sintetizada en ocultación de pérdida de paquetes,

cuyo método comprende:

obtener una tendencia al cambio de la señal de voz, que comprende obtener una relación entre la energía de la última señal de voz tonal periódica y la energía de una señal de voz tonal periódica previa, de la señal de voz;

obtener un factor de atenuación de acuerdo con la tendencia al cambio de la señal; y

obtener una trama perdida, reconstruida después de atenuación de acuerdo con el factor de atenuación

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E08168328.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: HUAWEI ADMINISTRATION BUILDING BANTIAN,LONGGANG DISTRICT, SHENZHEN GU.

Inventor/es: YANG, YI, WANG, JING, XU,JIANFENG, MIAO,LEI, HU,CHEN, ZHANG,QING, DU,ZHENGZHONG, QI,FENGYAN, ZHAN,WUZHOU, WANG,DONGQI, TU,YONGFENG.

Fecha de Publicación: .

Fecha Solicitud PCT: 5 de Noviembre de 2008.

Fecha Concesión Europea: 17 de Febrero de 2010.

Clasificación Internacional de Patentes:

  • G10L19/00E

Clasificación PCT:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

METODO Y APARATO PARA OBTENER UN FACTOR DE ATENUACION.

Fragmento de la descripción:

Método y aparato para obtener un factor de atenuación.

Esta solicitud reivindica la prioridad de la solicitud de patente china núm. 200710169618.0, titulada "Método y aparato para obtener un factor de atenuación", presentada el 5 de Noviembre de 2007, en la Oficina Estatal de la Propiedad Intelectual de la RPC.

Campo del invento

El presente invento se refiere al campo del tratamiento de señales y, en particular, a un método y a un aparato para obtener un facto de atenuación.

Antecedentes del invento

De una transmisión de datos de voz se exige que se ejecute en tiempo real y que sea fiable en un sistema de comunicación de voz en tiempo real, por ejemplo, un sistema VoIP (voz por IP). Debido a las características nada fiables de un sistema de red, los paquetes de datos pueden perderse o no llegar a tiempo a su destino en un procedimiento de transmisión, desde un extremo de envío a un extremo de recepción. Estas dos clases de situaciones son consideradas, por el extremo de recepción, como pérdidas de paquetes de red. Es inevitable que se produzca pérdida de paquetes de red. Además, la pérdida de paquetes de red es uno de los factores más importantes que influyen sobre la calidad de la voz. Por tanto, se necesita un método robusto para ocultar la pérdida de paquetes con el fin de recuperar los paquetes de datos perdidos en el sistema de comunicación en tiempo real de forma que se siga obteniendo una buena calidad del habla en la situación de pérdida de paquetes de la red.

En la tecnología de comunicación por voz en tiempo real existente, en el extremo de envío un codificador divide la voz en banda ancha en una sub-banda alta y una sub-banda baja, y hace uso de ADPCM (modulación por código de impulsos diferencial, adaptable) para codificar las dos sub-bandas, respectivamente, y las envía juntas por la red al extremo de recepción. En el extremo de recepción, las dos sub-bandas son descodificadas, respectivamente, por el descodificador ADPCM y, luego, la señal final es sintetizada utilizando un filtro de síntesis QMF (filtro especular en cuadratura).

Para dos sub-bandas diferentes, se adoptan diferentes métodos de ocultación de la pérdida de paquetes (PLC). Para una sub-banda baja, en la situación en que no existe pérdida de paquetes, una señal de reconstrucción no sufre ningún cambio durante el Desvanecimiento cruzado. En la situación en que existe pérdida de paquetes, para la primera trama perdida se analiza la señal histórica (la señal histórica es una señal de voz previa a la trama perdida en el documento de la presente solicitud) utilizando un predictor a corto plazo y un predictor a largo plazo, y se extrae información sobre la clasificación de la voz. La señal de trama perdida es reconstruida utilizando LPC (codificación predictiva lineal) basada en el método de repetición tonal, el predictor y la información sobre la clasificación. El estado de ADPCM será actualizado, también, síncronamente hasta que se encuentre una trama buena. Además, no sólo ha de generarse la señal correspondiente a la trama perdida sino que, también, hay que generar una sección de señal que se adapte al Desvanecimiento cruzado. De este modo, una vez recibida una trama buena, se ejecuta el Desvanecimiento cruzado para tratar la señal de trama buena y la sección de señal. Ha de observarse que esta clase de Desvanecimiento cruzado solamente ocurre después de que el extremo de recepción pierde una trama y recibe la primera trama buena.

Durante el proceso de puesta en práctica del presente invento, el inventor encontró, al menos, los siguientes problemas en la técnica anterior. En la técnica anterior, la energía de la señal sintetizada se controla utilizando un factor de atenuación estático, auto-adaptable. Si bien el factor de atenuación definido cambia gradualmente, su velocidad de atenuación, es decir, el valor del factor de atenuación es el mismo en relación con la misma clasificación de la voz. Sin embargo, las voces humanas son diferentes. Si el factor de atenuación no coincide con la característica de las voces humanas, en la señal de reconstrucción aparecerá un ruido incómodo, particularmente en el final de las vocales estables. El factor de atenuación estático auto-adaptable no puede adaptarse a la característica de diversas voces humanas.

Se toma como ejemplo la situación mostrada en la figura 1, en la que T0 es el período tonal de la señal histórica. La señal superior corresponde a una señal original, es decir, un diagrama esquemático de forma de onda en la situación en la que no existe pérdida de paquetes. La señal inferior representada con línea de trazos es una señal sintetizada de acuerdo con la técnica anterior. Como puede verse en la figura, la señal sintetizada no mantiene la misma velocidad de atenuación que la señal original. Si existen demasiadas veces la misma repetición tonal, la señal sintetizada producirá un ruido musical evidente de forma que la diferencia entre la situación de la señal sintetizada y la situación deseable, es grande.

El documento EP 1 291 851 A2 describe un método y un sistema para la atenuación de formas de onda de tramas de velocidad corrompida por errores.

Sumario

Con el fin de conseguir el objeto antes mencionado, una realización del presente invento proporciona un método para tratar una señal de voz sintetizada en ocultación de pérdida de paquetes como se define en la reivindicación 1.

Una realización del presente invento proporciona, también, un aparato para tratar una señal de voz sintetizada en ocultación de pérdida de paquetes de acuerdo con la reivindicación 11.

Una realización del presente invento proporciona, también, un descodificador de voz de acuerdo con la reivindicación 14.

Una realización del presente invento proporciona, además, un producto de programa de ordenador como se define en la reivindicación 15.

En comparación con la técnica anterior, las realizaciones del presente invento presentan las siguientes ventajas:

Un factor de atenuación auto-adaptable se ajusta dinámicamente empleando la tendencia al cambio de una señal histórica. La transición suave de los datos históricos a los datos recibidos en último lugar se realiza de manera que la velocidad de atenuación entre la señal compensada y la señal original se mantenga tan consistente como resulte posible para adaptar la característica de varias voces humanas.

Breve descripción de los dibujos

La figura 1 es un diagrama esquemático que ilustra la señal original y la señal sintetizada de acuerdo con la técnica anterior;

la figura 2 es una gráfica de proceso que ilustra un método para obtener un factor de atenuación de acuerdo con la realización 1 del presente invento;

la figura 3 es un diagrama esquemático que ilustra los principios del codificador;

la figura 4 es un diagrama esquemático que ilustra el módulo de una LPC basada en la sub-unidad de repetición tonal de la unidad descodificadora de banda baja;

la figura 5 es un diagrama esquemático que ilustra una señal de salida después de adoptar el método de atenuación dinámica de acuerdo con la realización 1 del presente invento;

las figuras 6A y 6B son diagramas esquemáticos que ilustran la estructura del aparato para obtener un factor de atenuación de acuerdo con la realización 2 del presente invento;

la figura 7 es un diagrama esquemático que ilustra la escena de aplicación del aparato para obtener un factor de atenuación de acuerdo con la realización 2 del presente invento;

las figuras 8A y 8B son diagramas esquemáticos que ilustran la estructura del aparato para el tratamiento de señales de acuerdo con la realización 3 del presente invento;

la figura 9 es un diagrama esquemático que ilustra el módulo del descodificador de voz de acuerdo con la realización 4 del presente invento;

la figura 10 es un diagrama esquemático que ilustra el módulo de la unidad descodificadora de banda baja del descodificador de voz de acuerdo con la realización 4 del presente invento;

la figura 11 es un diagrama esquemático que ilustra el módulo de la LPC basada en una sub-unidad de repetición tonal, de acuerdo con la realización 4 del presente invento.

Descripción detallada

El presente invento se describirá con mayor detalle con referencia a los dibujos y a las realizaciones.

Un método para obtener un factor de...

 


Reivindicaciones:

1. Un método para tratar una señal de voz sintetizada en ocultación de pérdida de paquetes, cuyo método comprende:

obtener una tendencia al cambio de la señal de voz, que comprende obtener una relación entre la energía de la última señal de voz tonal periódica y la energía de una señal de voz tonal periódica previa, de la señal de voz;

obtener un factor de atenuación de acuerdo con la tendencia al cambio de la señal; y

obtener una trama perdida, reconstruida después de atenuación de acuerdo con el factor de atenuación.

2. El método de acuerdo con la reivindicación 1, en el que antes de obtener el factor de atenuación de acuerdo con la tendencia al cambio de la señal, el método comprende, además: obtener el factor de atenuación de acuerdo con la relación, cuando la relación es menor que 1.

3. El método de acuerdo con la reivindicación 1, en el que antes de obtener el factor de atenuación de acuerdo con la tendencia al cambio de la señal, el método comprende, además: obtener el factor de atenuación de acuerdo con la relación cuando la energía de la última señal de voz tonal periódica sea mayor que un valor límite prefijado.

4. El método de acuerdo con la reivindicación 1, en el que la relación entre la energía de la última señal de voz tonal periódica y la energía de la señal de voz tonal periódica previa, de la señal de voz, es R= sqrt{E1/E2}; donde E1 es la energía de la última señal de voz tonal periódica, y E2 es la energía de la señal de voz tonal periódica previa.

5. El método de acuerdo con la reivindicación 4, en el que el factor de atenuación obtenido de acuerdo con la relación es 1-C*(n+1), siendo n=0,...,N-1,

donde C es el coeficiente de atenuación, C=(1-R)/T0, N es la longitud de la señal de voz sintetizada y T0 es la longitud de un período tonal.

6. El método de acuerdo con la reivindicación 5, en el que el factor de atenuación 1-C*(n+1)=0 se establece cuando el factor de atenuación 1-C*(n+1)<0.

7. El método de acuerdo con la reivindicación 5, en el que se fija previamente un valor límite superior para el coeficiente de atenuación C, y se hace que el coeficiente de atenuación C sea igual al límite superior cuando el valor de C*(n+1) obtenido de acuerdo con C=(1-R)/T0, supera un valor límite.

8. El método de acuerdo con la reivindicación 5, en el que el coeficiente de atenuación C se reduce cuando la velocidad de atenuación es demasiado alta.

9. El método de acuerdo con la reivindicación 8, en el que la reducción del coeficiente de atenuación C se logra:

prefijando la señal de voz para que se atenúe hasta 0 después de M muestras; y

estableciendo un coeficiente de atenuación ajustado, C=V/M, donde V es un factor de atenuación corriente.

10. El método de acuerdo con la reivindicación 1, en el que la trama perdida reconstruida después de la atenuación obtenida de acuerdo con la relación, es:


donde ylpre(n) es una señal de voz con trama perdida reconstruida, N es la longitud de la señal de voz sintetizada, C es el coeficiente de atenuación, C=(1-R)/T0, y T0 es la longitud del período tonal.

11. Un aparato para tratar una señal de voz sintetizada en ocultación de pérdida de paquetes, cuyo aparato comprende:

una unidad de obtención de una tendencia al cambio, que comprende una sub-unidad de obtención de energía, destinada a obtener energía de una última señal de voz tonal periódica y energía de una señal de voz tonal periódica previa, de la señal de voz;

una sub-unidad de obtención de una relación energética, destinada a obtener una relación entre la energía de la última señal de voz tonal periódica y la energía de la señal de voz tonal periódica previa, de la señal de voz;

una unidad de obtención de un factor de atenuación, destinada a obtener el factor de atenuación de acuerdo con la relación obtenida por la sub-unidad de obtención de una relación energética; y

una unidad de reconstrucción de tramas perdidas, destinada a obtener una trama perdida, reconstruida después de atenuación de acuerdo con el factor de atenuación.

12. El aparato de acuerdo con la reivindicación 11, en el que la unidad de obtención del factor de atenuación comprende:

una sub-unidad de obtención del coeficiente de atenuación destinada a generar un coeficiente de atenuación de acuerdo con la relación obtenida por la sub-unidad de obtención de la relación energética; y

una sub-unidad de obtención de factor de atenuación destinada a obtener el factor de atenuación de acuerdo con el coeficiente de atenuación generado por la sub-unidad de obtención del factor de atenuación.

13. El aparato de acuerdo con la reivindicación 12, en el que la sub-unidad de obtención del factor de atenuación comprende, además:

una sub-unidad de ajuste del factor de atenuación destinada a ajustar el valor del coeficiente de atenuación obtenido por la sub-unidad de obtención del coeficiente de atenuación de modo que tenga un valor determinado cuando se satisface una condición dada;

en el que la condición dada comprende, al menos, una de las siguientes condiciones:

que el valor del coeficiente de atenuación supera un cierto valor límite;

que exista una situación de pérdida continua de tramas; y

que la velocidad de atenuación sea demasiado elevada.

14. Un descodificador de voz, que comprende: una unidad descodificadora de banda baja, una unidad descodificadora de banda alta y una unidad de filtrado especular en cuadratura, en el que:

la unidad descodificadora de banda baja está destinada a descodificar una señal de voz de descodificación de banda baja recibida, y a compensar una señal de voz de banda baja perdida;

la unidad descodificadora de banda alta está destinada a descodificar una señal de voz de descodificación de banda alta recibida, y a compensar una señal de voz de banda alta perdida;

la unidad de filtrado especular en cuadratura está destinada a obtener una señal de voz de salida final sintetizando la señal de voz de descodificación de banda baja y la señal de voz de descodificación en banda alta;

la unidad descodificadora de banda baja comprende una sub-unidad de descodificación de banda baja, una sub-unidad de codificación predictiva lineal basada en la repetición tonal y una sub-unidad de desvanecimiento cruzado;

en el que la sub-unidad de descodificación de banda baja está destinada a descodificar una señal de voz de flujo de banda baja recibida;

la sub-unidad de codificación predictiva lineal (LPC) basada en la repetición tonal, está destinada a generar una señal de voz sintetizada correspondiente a una trama perdida;

la sub-unidad de desvanecimiento cruzado está destinada a aplicar el desvanecimiento cruzado a la señal de voz tratada por la sub-unidad de descodificación de banda baja y la señal de voz sintetizada correspondiente a la trama perdida generada por la sub-unidad de LPC basada en la repetición tonal;

la sub-unidad de LPC basada en la repetición tonal comprende un módulo analizador y un aparato de acuerdo con las reivindicaciones 11 a 13, en el que el módulo analizador está destinado a analizar una señal de voz histórica, y a generar una señal de voz con trama perdida reconstruida.

15. Un producto programa de ordenador que comprende códigos de programa de ordenador que permiten que un ordenador ejecute las operaciones de una cualquiera de las reivindicaciones 1 a 10, cuando los códigos de programa de ordenador son ejecutados por el ordenador.


 

Patentes similares o relacionadas:

MÉTODO DE TRATAMIENTO DE SEÑALES, APARATO DE TRATAMIENTO Y DESCODIFICADOR DE VOZ, del 13 de Febrero de 2012, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de tratamiento de señales para tratar una señal sintetizada en ocultación de pérdida de paquetes, que comprende: recibir una trama buena a continuación de una […]

SÍNTESIS DE BLOQUES PERDIDOS DE UNA SEÑAL AUDIO-DIGITAL, del 26 de Julio de 2011, de FRANCE TELECOM: Método de síntesis de una señal audio-digital representado por bloques sucesivos de muestras, en donde, a la recepción de dicha señal, para sustituir al menos un bloque no […]

Imagen de 'ALISAMIENTO DE DISCONTINUIDADES ENTRE TRAMAS DE HABLA'ALISAMIENTO DE DISCONTINUIDADES ENTRE TRAMAS DE HABLA, del 1 de Junio de 2011, de QUALCOMM INCORPORATED: Un procedimiento para suavizar la discontinuidad entre una trama de habla perdida y una trama de habla actual en un dispositivo de comunicación, que comprende: […]

Imagen de 'FLUJO REDUNDANTE DE BITS DE AUDIO Y MÉTODOS DE PROCESAMIENTO…'FLUJO REDUNDANTE DE BITS DE AUDIO Y MÉTODOS DE PROCESAMIENTO DE FLUJO DE BITS DE AUDIO, del 6 de Mayo de 2011, de MICROSOFT CORPORATION: Un flujo de bits que representa una señal de audio, que comprende información principal codificada para una trama actual que hace referencia […]

Imagen de 'PROCEDIMIENTO Y DISPOSITIVO DE RECONSTRUCCION ESPECTRAL DE UNA…'PROCEDIMIENTO Y DISPOSITIVO DE RECONSTRUCCION ESPECTRAL DE UNA SEÑAL DE AUDIO, del 24 de Septiembre de 2010, de FRANCE TELECOM: Procedimiento de codificación de una señal de audio, en el que una parte del espectro de frecuencia de la señal de audio es codificada con un codificador de limitación de banda […]

Imagen de 'METODO Y DISPOSITIVO PARA REALIZAR UNA OCULTACION DE TRAMAS BORRADAS…'METODO Y DISPOSITIVO PARA REALIZAR UNA OCULTACION DE TRAMAS BORRADAS EN UNA SEÑAL DE BANDA SUPERIOR, del 16 de Noviembre de 2009, de HUAWEI TECHNOLOGIES CO., LTD.: Método para realizar una ocultación de tramas borradas en una señal de banda superior, que comprende: calcular una intensidad periódica de la señal de banda […]

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .