Métodos y adaptaciones en una red de telecomunicaciones.
Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en undescodificador de habla,
el método que comprende los pasos de:
- medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramasadyacentes de la señal de habla reconstruida en el descodificador,
- determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a laestacionariedad medida, y
- transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señalde habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtropara obtener una señal de habla mejorada.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2007/061796.
Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).
Nacionalidad solicitante: Suecia.
Dirección: 164 83 STOCKHOLM SUECIA.
Inventor/es: GRANCHAROV,VOLODYA.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/14
PDF original: ES-2394515_T3.pdf
Fragmento de la descripción:
Métodos y adaptaciones en una red de telecomunicaciones
Campo técnico
La presente invención se refiere a algoritmos post filtro, usados en codificación de habla y audio. En particular la presente invención se refiere a métodos y adaptaciones para proporcionar un post filtro mejorado.
Antecedentes En una red de comunicación que transmite habla o audio, el habla original 100 o audio se codifica por un codificador 101 en el transmisor y un flujo de bits codificados 102 se transmite al receptor como se ilustra por la figura 3. En un receptor, el flujo de bits codificado 102 se descodifica por un descodificador 103 que reconstruye la señal de habla y audio original en una señal de habla (o audio) reconstruida 104. La codificación de habla y audio introduce ruido de cuantificación que deteriora la calidad del habla reconstruida. Por lo tanto se introducen los algoritmos post filtro 105. Los algoritmos post filtro de última tecnología 105 forman el ruido de cuantificación de manera que llega a ser menos audible. De esta manera los post filtros existentes mejoran la calidad percibida de la señal de habla reconstruida por el descodificador de manera que se proporciona una señal de habla mejorada 106. Una visión general de las técnicas post filtro se puede encontrar en J.H. Chen y A. Gersho, “Post filtrado adaptativo para mejora de calidad de habla codificada”, IEEE Trans. Proceso de Audio de Habla, vol. 3, páginas 58-71, 1985.
Todos los post filtros existentes explotan el concepto de enmascaramiento de señal. Es un fenómeno importante en un sistema auditivo humano. Ello significa que un sonido es inaudible en presencia de un sonido más fuerte. En general el umbral de enmascaramiento tiene un pico en la frecuencia del tono, y disminuye monotónicamente en ambos lados del pico. Esto significa que las componentes del ruido cerca de la frecuencia del tono (formantes de habla) se permite que tengan intensidades más altas que otras componentes de ruido que están más lejos (valles de espectro) . Eso es porque los post filtros existentes se adaptan en una forma de trama a los formantes y/o estructuras de tono en el habla, en forma de coeficientes auto regresivos (AR) y/o periodo de tono.
Los post filtros más populares son el post filtro de formante (corto plazo) y el post filtro de tono (largo plazo) . Un post filtro de formante reduce el efecto del ruido de cuantificación enfatizando las frecuencias de formantes y desenfatizando los valles espectrales. Esto se ilustra en la figura 1, en la que la línea continua muestra una envolvente auto regresiva de una señal antes del post filtrado y la línea discontinua muestra una envolvente auto regresiva de una señal después del post filtrado. El post filtrado de tono enfatiza las componentes de frecuencia en picos armónicos de tono, lo cual se ilustra en la figura 2. La línea continua de la figura 2 muestra el espectro de una señal antes del post filtrado mientras que la línea discontinua muestra el espectro de una señal después del post filtrado. Los gráficos de las figuras 1 y 2 conciernen a bloques de 30 ms de una señal de banda estrecha. Se debería señalar también que los gráficos de las figuras 1 y 2 no representan los parámetros de post filtro reales, sino sólo el concepto de post filtrado.
Los formantes y/o el tono indica (n) cómo se distribuye la energía en una trama que implica que las partes de la señal que se enmascaran (que son menos audibles o completamente audibles) están indicadas. Por lo tanto, la adaptación de parámetro de post filtro existente explota el concepto de enmascaramiento de señal, y por lo tanto se adapta a las estructuras de habla como frecuencias de formantes y picos armónicos de tono. Estos son todos rasgos en la trama (tal como el periodo de tono que da picos armónicos de tono y coeficientes auto regresivos que determinan los formantes) , calculados bajo la suposición de que el habla es estacionaria para la trama actual (por ejemplo, habla de 20 ms) .
Además de enmascarar la señal, un fenómeno psicoacústico importante es que si la dinámica de la señal es alta, entonces la distorsión es menos objetable. Ello significa que el ruido se enmascara auditivamente mediante cambios rápidos en la señal de habla. Este concepto de enmascarar de manera auditiva el ruido mediante cambios rápidos en la señal de habla está ya en uso para codificación de habla en H. Knagenhjelm y W.B. Kleijn, “La dinámica espectral es más importante que la distorsión espectral”, ICASSP, vol. 1, páginas 732-735, 1995 y para mejora en T. Quateri y R.Dunn, “Mejora de habla en base al cambio espectral auditivo”, ICASSP, vol. 1, páginas 257-260, 2002. En la adaptación de H. Knagenhjelm y W.B. Kleijn a la dinámica espectral se usa en la cuantificación de frecuencias espectrales en línea (LSF) . En la adaptación de T. Quateri y R.Dunn a la dinámica espectral se usa en un preprocesador para atenuación de ruido de fondo.
Otra técnica relacionada en el campo técnico se revela en la WO 98/39768, que se refiere a un post filtro de base sinusoidal. El post filtro puede calcular alguna medida que implica una dinámica de señal para suavizar la función de transferencia del filtro, en que el propósito de la suavización es evitar que un nuevo estado de filtro se desvíe demasiado del estado del filtro previo.
Resumen No obstante, las soluciones de post filtro existente no tienen en consideración el hecho de que se debería realizar menos supresión cuando el contenido de la información de habla es alto, y se debería realizar más supresión cuando la señal está en un modo de estado estable.
De esta manera un objeto con la presente invención es mejorar la calidad percibida del habla reconstruida.
Este objeto se logra por la presente invención por medio del parámetro de control de post filtro mejorado, en el que un coeficiente determinado en base a la estacionariedad de señal se aplica a un parámetro de control de post filtro convencional para lograr el parámetro de control de post filtro mejorado.
De acuerdo con un primer aspecto de la presente invención se proporciona un método para controlar un post filtro como se define en la reivindicación 1. El método mejora la calidad percibida de habla H reconstruida en un descodificador de habla y comprende los pasos de medir la estacionariedad de una señal de habla reconstruida en un decodificador, determinando un coeficiente a un parámetro de control de post filtro basado en la estacionariedad medida, y transmitiendo el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un segundo aspecto de la presente invención se proporciona un método de post filtrado para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 6. El método comprende los pasos de recibir un coeficiente determinado al post filtro, y procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en el descodificador.
De acuerdo con un tercer aspecto de la presente invención se proporciona un control de post filtro a estar asociado con un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 11. El control de post filtro comprende medios para medir la estacionariedad de una señal de habla reconstruida en un descodificador, medios para determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un cuarto aspecto de la presente invención se proporciona una adaptación que comprende un control de post filtro y un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 16. El post filtro comprende medios para recibir un coeficiente determinado al post filtro, y un procesador para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad... [Seguir leyendo]
Reivindicaciones:
1. Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:
- medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador,
- determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y
- transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada.
2. El método de acuerdo con la reivindicación 1, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
3. El método de la reivindicación 1, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
4. El método de acuerdo con cualquiera de las reivindicaciones 1-3, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia
espectral de paso bajo, ( suave de las tramas pasadas.
5. El método de acuerdo con la reivindicación 1, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
6. Un método de post filtrado para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:
- recibir (404) un coeficiente determinado a un parámetro de control de atenuación de post filtro, en el que el coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y
- procesar (405) la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada.
7. El método de acuerdo con la reivindicación 6, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
8. El método de la reivindicación 6, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
9. El método de acuerdo con cualquiera de las reivindicaciones 6-8, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia
espectral de paso bajo, ( suave de las tramas pasadas.
10. El método de acuerdo con la reivindicación 6, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
11. Un control de post filtro (300) a ser asociado con un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el control de post filtro comprende medios para medir la estacionariedad
(301) de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, medios para determinar (302) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y medios para transmitir (303) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada.
12. El control de post filtro de acuerdo con la reivindicación 11, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
13. El control de post filtro de acuerdo con la reivindicación 11, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
14. El control de post filtro de acuerdo con cualquiera de las reivindicaciones 11-13, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a
una distancia espectral de paso bajo, ( suave de las tramas pasadas.
15. El control de post filtro de acuerdo con la reivindicación 11, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
16. Una adaptación que comprende un post filtro (304) y un control de post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el control de post filtro comprende medios para medir la estacionariedad (301) de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, medios para determinar (302) un coeficiente para un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y medios para transmitir (303) el coeficiente determinado a un post filtro, el post filtro que comprende medios para recibir (306) el coeficiente determinado desde el control de post filtro, y un procesador (305) para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada.
17. La adaptación de acuerdo con la reivindicación 16, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
18. La adaptación de acuerdo con la reivindicación 16, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
19. La adaptación de acuerdo con cualquiera de las reivindicaciones 16-18, en la que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia
espectral de paso bajo, ( suave, de las tramas pasadas.
20. La adaptación de acuerdo con la reivindicación 16, en la que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
Patentes similares o relacionadas:
Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]
Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]
Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]
Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]
Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]
Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]
Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]
Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]