Métodos y adaptaciones en una red de telecomunicaciones.

Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla,

el método que comprende los pasos de:

- medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador,

- determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y

- transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12183033.

Solicitante: TELEFONAKTIEBOLAGET L M ERICSSON (PUBL).

Nacionalidad solicitante: Suecia.

Dirección: Torshamnsgatan 21-23 164 83 Stockholm SUECIA.

Inventor/es: GRANCHAROV,VOLODYA.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/26 SECCION G — FISICA.G10 INSTRUMENTOS DE MUSICA; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACION O DESCODIFICACION DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › prefiltrado o postfiltrado.
  • G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p.ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00  tiene prioridad). › Mejora de la inteligibilidad de la voz, p.ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

PDF original: ES-2533626_T3.pdf

 


Fragmento de la descripción:

Métodos y adaptaciones en una red de telecomunicaciones Campo técnico

La presente invención se refiere a algoritmos post filtro, usados en codificación de habla y audio. En particular la presente invención se refiere a métodos y adaptaciones para proporcionar un post filtro mejorado.

Antecedentes

En una red de comunicación que transmite habla o audio, el habla original 100 o audio se codifica por un codificador 101 en el transmisor y un flujo de bits codificados 102 se transmite al receptor como se ¡lustra por la figura 3. En un receptor, el flujo de bits codificado 102 se descodifica por un descodificador 103 que reconstruye la señal de habla y audio original en una señal de habla (o audio) reconstruida 104. La codificación de habla y audio introduce ruido de cuantificación que deteriora la calidad del habla reconstruida. Por lo tanto se introducen los algoritmos post filtro 105. Los algoritmos post filtro de última tecnología 105 forman el ruido de cuantificación de manera que llega a ser menos audible. De esta manera los post filtros existentes mejoran la calidad percibida de la señal de habla reconstruida por el descodificador de manera que se proporciona una señal de habla mejorada 106. Una visión general de las técnicas post filtro se puede encontrar en J.H. Chen y A. Gersho, "Post filtrado adaptativo para mejora de calidad de habla codificada", IEEE Trans. Proceso de Audio de Habla, vol. 3, páginas 58-71, 1985.

Todos los post filtros existentes explotan el concepto de enmascaramiento de señal. Es un fenómeno importante en un sistema auditivo humano. Ello significa que un sonido es inaudible en presencia de un sonido más fuerte. En general el umbral de enmascaramiento tiene un pico en la frecuencia del tono, y disminuye monotónicamente en ambos lados del pico. Esto significa que las componentes del ruido cerca de la frecuencia del tono (formantes de habla) se permite que tengan intensidades más altas que otras componentes de ruido que están más lejos (valles de espectro). Eso es porque los post filtros existentes se adaptan en una forma de trama a los formantes y/o estructuras de tono en el habla, en forma de coeficientes auto regresivos (AR) y/o periodo de tono.

Los post filtros más populares son el post filtro de formante (corto plazo) y el post filtro de tono (largo plazo). Un post filtro de formante reduce el efecto del ruido de cuantificación enfatizando las frecuencias de formantes y desenfatizando los valles espectrales. Esto se ilustra en la figura 1, en la que la línea continua muestra una envolvente auto regresiva de una señal antes del post filtrado y la línea discontinua muestra una envolvente auto regresiva de una señal después del post filtrado. El post filtrado de tono enfatiza las componentes de frecuencia en picos armónicos de tono, lo cual se ¡lustra en la figura 2. La línea continua de la figura 2 muestra el espectro de una señal antes del post filtrado mientras que la línea discontinua muestra el espectro de una señal después del post filtrado. Los gráficos de las figuras 1 y 2 conciernen a bloques de 30 ms de una señal de banda estrecha. Se debería señalar también que los gráficos de las figuras 1 y 2 no representan los parámetros de post filtro reales, sino sólo el concepto de post filtrado.

Los formantes y/o el tono indica(n) cómo se distribuye la energía en una trama que implica que las partes de la señal que se enmascaran (que son menos audibles o completamente audibles) están Indicadas. Por lo tanto, la adaptación de parámetro de post filtro existente explota el concepto de enmascaramiento de señal, y por lo tanto se adapta a las estructuras de habla como frecuencias de formantes y picos armónicos de tono. Estos son todos rasgos en la trama (tal como el periodo de tono que da picos armónicos de tono y coeficientes auto regresivos que determinan los formantes), calculados bajo la suposición de que el habla es estacionarla para la trama actual (por ejemplo, habla de 20 ms).

Además de enmascarar la señal, un fenómeno pslcoacústlco Importante es que si la dinámica de la señal es alta, entonces la distorsión es menos objetable. Ello significa que el ruido se enmascara auditivamente mediante cambios rápidos en la señal de habla. Este concepto de enmascarar de manera auditiva el ruido mediante cambios rápidos en la señal de habla está ya en uso para codificación de habla en H. Knagenhjelm y W.B. Kleijn, "La dinámica espectral es más importante que la distorsión espectral", ICASSP, vol. 1, páginas 732-735, 1995 y para mejora en T. Quateri y R.Dunn, "Mejora de habla en base al cambio espectral auditivo", ICASSP, vol. 1, páginas 257-260, 2002. En la adaptación de H. Knagenhjelm y W.B. Kleijn a la dinámica espectral se usa en la cuantificación de frecuencias espectrales en línea (LSF). En la adaptación de T. Quateri y R.Dunn a la dinámica espectral se usa en un pre-procesador para atenuación de ruido de fondo.

Otra técnica relacionada en el campo técnico se revela en la WO 98/39768, que se refiere a un post filtro de base sinusoidal. El post filtro puede calcular alguna medida que Implica una dinámica de señal para suavizar la función de transferencia del filtro, en que el propósito de la suavlzaclón es evitar que un nuevo estado de filtro se desvíe demasiado del estado del filtro previo.

Resumen

No obstante, las soluciones de post filtro existente no tienen en consideración el hecho de que se debería realizar menos supresión cuando el contenido de la información de habla es alto, y se debería realizar más supresión

cuando la señal está en un modo de estado estable.

De esta manera un objeto con la presente invención es mejorar la calidad percibida del habla reconstruida.

Este objeto se logra por la presente invención por medio del parámetro de control de post filtro mejorado, en el que un coeficiente determinado en base a la estacionariedad de señal se aplica a un parámetro de control de post filtro convencional para lograr el parámetro de control de post filtro mejorado.

De acuerdo con un primer aspecto de la presente invención se proporciona un método para controlar un post filtro como se define en la reivindicación 1. El método mejora la calidad percibida de habla reconstruida en un descodificador de habla y comprende los pasos de medir la estacionariedad de una señal de habla reconstruida en un decodificador, determinando un coeficiente a un parámetro de control de post filtro basado en la estacionariedad medida, y transmitiendo el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.

De acuerdo con un segundo aspecto de la presente invención se proporciona un método de post filtrado para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación

5. El método comprende los pasos de recibir un coeficiente determinado al post filtro, y procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en el descodificador.

De acuerdo con un tercer aspecto de la presente invención se proporciona un control de post filtro a estar asociado con un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 9. El control de post filtro comprende medios para medir la estacionariedad de una señal de habla reconstruida en un descodificador, medios para determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.

De acuerdo con un cuarto aspecto de la presente invención se proporciona una adaptación que comprende un control de post filtro y un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 13. El post filtro comprende medios para recibir un coeficiente determinado al post filtro, y un procesador para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:

- medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador,

- determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y

- transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.

2. El método de acuerdo con la reivindicación 1, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.

3. El método de acuerdo con cualquiera de las reivindicaciones 1-2, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, 0Suave de las tramas pasadas.

4. El método de acuerdo con la reivindicación 1, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.

5. Un método de post filtrado para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:

- recibir (404) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y

- procesar (405) la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.

6. El método de acuerdo con la reivindicación 5, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.

7. El método de acuerdo con cualquiera de las reivindicaciones 5-6, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, 0SUave de las tramas pasadas.

8. El método de acuerdo con la reivindicación 5, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.

9. Un control de post filtro (300) a ser asociado con un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el control de post filtro comprende medios para medir la estacionariedad (301) de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, medios para determinar (302) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y medios para transmitir (303) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.

10. El control de post filtro de acuerdo con la reivindicación 9, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.

11. El control de post filtro de acuerdo con cualquiera de las reivindicaciones 9-10, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, 0SUave de las tramas pasadas.

12. El control de post filtro de acuerdo con la reivindicación 9, en el que el parámetro de control de atenuación de

post filtro es una función de una correlación de tono normalizado.

13. Una adaptación que comprende un post filtro (304) y un control de post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el post filtro comprende medios para recibir (306) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el

coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad, que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y un procesador (305) para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales 10 lineales.

14. El post filtro de acuerdo con la reivindicación 13, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.

15. El post filtro de acuerdo con cualquiera de las reivindicaciones 13-14, en la que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la

previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, 0Suave, de las tramas pasadas.

16. El post filtro de acuerdo con la reivindicación 13, en la que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.


 

Patentes similares o relacionadas:

Mejora paramétrica de la voz, del 14 de Febrero de 2019, de DOLBY LABORATORIES LICENSING CORPORATION: Un método en un decodificador de audio, que comprende: recibir una señal de audio que comprende contenido de audio mixto en una representación de canal […]

Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega, del 30 de Enero de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una señal de banda ancha que utiliza una señal de alimentación de banda baja y un primer juego de parámetros […]

Teléfono móvil y método para procesar señal de llamadas del mismo, del 23 de Enero de 2019, de Huizhou Tcl Mobile Communication Co., Ltd: Un método para procesar una señal de llamada de un teléfono móvil, comprendiendo el teléfono móvil un micrófono principal , un submicrófono , un […]

Método y aparato para procesar una señal de audio, decodificador de audio y codificador de audio, del 15 de Octubre de 2018, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para procesar una señal de audio , comprendiendo el método: usar filtrado predictivo lineal para eliminar (S102, S104, S300-S308, […]

Método de realce de sonido, dispositivo, programa y medio de grabación, del 14 de Marzo de 2018, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de realce de sonido de obtención de una señal de salida en el dominio de frecuencia en el que un sonido de una posición deseada determinada por una dirección […]

Extracción de Señal Ciega, del 18 de Octubre de 2017, de EXAUDIO AB: Un procedimiento adaptativo de extracción de al menos una de señales de ondas electro magnéticas y señales de ondas acústicas deseadas de […]

Supresión de ruido en señales de voz, del 4 de Octubre de 2017, de Stichting VUmc: Un aparato de procesamiento de voz que comprende - un filtro configurado para ajustar una señal de voz de entrada con un factor de […]

Aparato y método para procesar una señal de audio usando un filtro posterior de armónicos, del 7 de Junio de 2017, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para procesar una señal de audio que tiene asociada con la misma una información de desfase de tono y una información de ganancia, que comprende: un conversor […]

Otras patentes de TELEFONAKTIEBOLAGET L M ERICSSON (PUBL)