Post-filtro no causal.
Un dispositivo descodificador que comprende:
una entrada de receptor (40) dispuesta para recibir parámetros (4) de señales codificadas a base de unidades deinformación;
un descodificador (20) conectado a dicho circuito receptor de entrada (40) dispuesto para proporcionar unidadesde información de señales de audio descodificadas (5; 54) sobre la base de dichos parámetros;
un post-filtro (30; 30A; 30B) conectado a una salida de dicho descodificador (20) y dispuesto para proporcionaruna señal de salida (6) basada en dichas unidades de información de señales de audio descodificadas (5; 54) yuna salida (60) dispuesta para producir dicha señal de salida (6),caracterizado porque:
al menos uno entre la entrada de receptor (40) y dicho descodificador (20) se dispone para establecer unadiferencia de tiempo entre el momento en que están disponibles los parámetros de una primera unidad deinformación en dicha entrada de receptor (40) y el momento en el que está disponible una señal de audiodescodificada de dicha primera unidad de información en dicha salida de dicho descodificador (20),correspondiendo la diferencia de tiempo a al menos una unidad de información;
estando conectado dicho post-filtro (30; 30A; 30B) a dicha entrada de receptor (40) yestando dispuesto dicho post-filtro (30; 30A; 30B) para proporcionar un filtrado de dichas unidades deinformación de señales de audio descodificadas (5; 54) en la señal de salida (6) en respuesta a dichosparámetros (4) de una unidad de información posterior respectiva.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2007/051000.
Solicitante: TELEFONAKTIEBOLAGET LM ERICSSON (PUBL).
Nacionalidad solicitante: Suecia.
Dirección: 164 83 STOCKHOLM SUECIA.
Inventor/es: BRUHN, STEFAN.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/04 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando técnicas de predicción.
- G10L19/08 G10L 19/00 […] › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.
- G10L19/12 G10L 19/00 […] › Determinación o codificación de una excitación de código, p. ej. en codificadores vocales de predicción lineal excitados por código [CELP].
- G10L19/14
- G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
PDF original: ES-2383365_T3.pdf
Fragmento de la descripción:
Post-filtro no causal
Campo técnico
La presente invención se refiere, en general, a la codificación y descodificación de señales de audio y/o de voz y, en particular, a la reducción del ruido de codificación.
Antecedentes
En general, la codificación de señales de audio y, de manera específica, la codificación de señales de voz, implica establecer una correspondencia entre una señal de entrada de audio o de voz analógica y una representación digital en un dominio de codificación y después otra correspondencia con una señal analógica de salida de audio o de voz. La representación digital va acompañada de la cuantización o discretización de los valores o parámetros que representan la señal de audio o de voz (transformación de valores continuos en valores discretos) . Se puede considerar que la cuantización o discretización modifica o perturba los valores verdaderos de los parámetros con un "ruido de codificación". La técnica de la codificación de las señales de voz y audio consiste en realizar la codificación de tal manera que el efecto del ruido de codificación en la voz descodificada a una tasa de bits dada sea tan pequeño como sea posible. Sin embargo, la tasa de bits dada a la cual se codifica el habla define un límite inferior teórico al cual se puede reducir como máximo el ruido de codificación en el mejor de los casos. El objetivo es al menos hacer que el ruido de codificación sea tan inaudible como sea posible.
Un punto de vista adecuado acerca del ruido de codificación es suponer que sea un ruido coloreado o blanco aditivo. Hay una clase de métodos de mejora o realce que, tras descodificar la señal de audio o de conversación en el descodificador, modifican el ruido de codificación de tal forma que éste deviene menos audible, lo cual, por lo tanto, da como resultado, que la calidad de la señal de audio o de conversación resulte mejorada. Normalmente se denomina a tal tecnología "post-filtrado", lo cual quiere decir que la señal de audio o de conversación mejorada se deriva de algún procesado posterior después del descodificador real. Hay muchas publicaciones relacionadas con la mejora de las señales de voz mediante post-filtros. Algunos de los documentos fundamentales en ese sentido son los de las referencias (1-4) .
El principio de trabajo básico de los post-filtros de pitch (o altura tonal) es eliminar al menos partes del ruido de codificación que anega los valles espectrales entre armónicos de la voz. Esto se consigue, en general, mediante la superposición ponderada de la señal de voz descodificada con versiones suyas desplazadas en el tiempo, de modo que el desplazamiento temporal corresponde al retraso de tono o período del habla. Esto da como resultado una atenuación del ruido de codificación no correlacionado respecto de la señal de voz deseada especialmente entre los armónicos de voz. El efecto descrito se puede obtener tanto mediante de estructuras de filtros repetitivas como no repetitivas. En la práctica se prefieren estructuras de filtros no repetitivas En el contexto de la invención son pertinentes los post-filtros de pitch o de estructura fina. Su principio de trabajo básico es eliminar al menos partes del ruido de codificación que inunda los valles espectrales entre armónicos de la conversación con voces. Esto se consigue, en general, mediante la superposición ponderada de la señal de voz descodificada con versiones suyas desplazadas en el tiempo, de modo que el desplazamiento temporal corresponde al retraso de pitch o período del habla o de la conversación. Preferentemente, también se incluyen versiones desplazadas en el tiempo en las muestras futuras de la señal de voz. Se describe en la referencia (5) un método de post-filtro de pitch no recurrente más reciente, en el cual los parámetros del pitch en la codificación de la señal se reutilizan en el post-filtrado de la muestra de la señal correspondiente. El método de post-filtro de pitch no iterativo de (5) se aplica también en los estándares de codificación de audio y de voz 3GPP AMR-WB+: 3GPP TS 26.290 "Audio codec processing functions: Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec: Transcoding functions" ("Funciones de procesado de programa de codificación y descodificación: códec de banda ancha y velocidad variable de adaptación ampliada: funciones de transcodificación") y 3GPP VMR-WB: 3GPP2 C.S0052-A, "Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) , Service Options 62 y 63 for Spread Spectrum Systems" ("Programa de codificación y descodificación de voz de banda ancha multimodal de velocidad variable controlado por la fuente (VMR-WB) , opciones de servicio 62 y 63 para sistemas de espectro ampliado") . En la referencia (6) se especifica un método de post-filtro de pitch. Esta patente describe el uso de voz sintetizada pasada y futura dentro de uno y de la misma unidad de información.
Un problema con los post-filtros de pitch que evalúan señales de voz futuras es que necesitan acceso a un período de pitch futuro de la señal de audio o de conversación descodificada. Generalmente es posible hacer que esta señal futura esté disponible para el post-filtro amplificando la señal de audio o de conversación descodificada. En aplicaciones del programa de codificación y descodificación (códec) de voz o de audio para conversaciones esto es, sin embargo, indeseable, puesto que aumenta el retraso algorítmico del programa códec y, por tanto, afectaría a la calidad de la comunicación y, en particular a su interactividad.
Compendio Un objeto de la presente invención es proporcionar calidad de voz o audio mejorada a partir de dispositivos descodificadores. Un objeto adicional de la presente invención es proporcionar montajes o dispositivos de post-filtros eficaces para usarlos con dispositivos descodificadores escalables, que no contribuyen de manera considerable a cualquier retraso adicional de la señal de audio o de conversación.
Los objetos anteriores se consiguen mediante dispositivos y métodos según las reivindicaciones de la patente adjuntas. En términos generales, según un primer aspecto, un dispositivo descodificador comprende un circuito de entrada del receptor para parámetros de señales codificadas en grupos o unidades de información y un descodificador conectado al circuito de entrada del receptor, dispuesto para proporcionar bloques de información de señales de audio descodificadas sobre la base de los parámetros. El circuito de entrada del receptor y/o el descodificador se disponen de tal forma que se establezca una diferencia de tiempo entre el momento en que los parámetros de una primera unidad de información están disponibles en el circuito de entrada del receptor y el momento en el que una señal de audio descodificada de la primera unidad de información está disponible en el circuito de salida del descodificador, de tal modo que la diferencia de tiempo corresponde a al menos una unidad de información. Se conecta un post-filtro al circuito de salida del descodificador y al circuito de entrada del receptor. El post-filtro se monta de modo que filtre las unidades de información de las señales de audio descodificadas para proporcionar una señal de salida en respuesta a los parámetros de la unidad de información posterior respectiva. El dispositivo descodificador comprende también un circuito de salida para la señal de salida, conectado al post-filtro.
Según un segundo aspecto, un método de descodificación comprende recibir parámetros de señales codificadas en base a unidades de información y descodificar los parámetros en unidades de información de señales de audio descodificadas. La recepción y/o la descodificación provocan una diferencia de tiempo entre el momento en que los parámetros de una primera unidad de información están disponibles tras la recepción y el momento en el que una señal de audio descodificada de la primera unidad de información está disponible tras la descodificación, diferencia de tiempo que corresponde a al menos una unidad de información. Las unidades de información de las señales de audio descodificadas se postfiltran para dar una señal de salida en respuesta a parámetros de una unidad de información posterior respectiva. El método comprende también producir la señal de salida.
Una ventaja que tiene la presente invención es que es posible mejorar la calidad de la señal de reconstrucción de los códecs de audio y de voz. Las mejoras se obtienen sin ninguna penalización en forma de retraso adicional, por ejemplo si el códec es un códec de audio y de voz escalable o si se usa en una aplicación VoIP (voz sobre protocolo... [Seguir leyendo]
Reivindicaciones:
1. Un dispositivo descodificador que comprende:
una entrada de receptor (40) dispuesta para recibir parámetros (4) de señales codificadas a base de unidades de información;
un descodificador (20) conectado a dicho circuito receptor de entrada (40) dispuesto para proporcionar unidades de información de señales de audio descodificadas (5; 54) sobre la base de dichos parámetros;
un post-filtro (30; 30A; 30B) conectado a una salida de dicho descodificador (20) y dispuesto para proporcionar una señal de salida (6) basada en dichas unidades de información de señales de audio descodificadas (5; 54) y una salida (60) dispuesta para producir dicha señal de salida (6) , caracterizado porque:
al menos uno entre la entrada de receptor (40) y dicho descodificador (20) se dispone para establecer una diferencia de tiempo entre el momento en que están disponibles los parámetros de una primera unidad de información en dicha entrada de receptor (40) y el momento en el que está disponible una señal de audio descodificada de dicha primera unidad de información en dicha salida de dicho descodificador (20) , correspondiendo la diferencia de tiempo a al menos una unidad de información;
estando conectado dicho post-filtro (30; 30A; 30B) a dicha entrada de receptor (40) y estando dispuesto dicho post-filtro (30; 30A; 30B) para proporcionar un filtrado de dichas unidades de información de señales de audio descodificadas (5; 54) en la señal de salida (6) en respuesta a dichos parámetros (4) de una unidad de información posterior respectiva.
2. El dispositivo descodificador según la reivindicación 1, en el que dicho circuito receptor de entrada (40) comprende un almacenamiento (41) para parámetros de al menos dos unidades de información consecutivas, por lo cual se proporcionan a dicho descodificador (20) parámetros (4A) de una primera unidad de información y teniendo acceso dicho post-filtro (30; 30A; 30B) a parámetros (4B) de una segunda unidad de información posterior.
3. El dispositivo descodificador según la reivindicación 1, en el que dicho descodificador (20) comprende medios que retardan (51; 53) dichas unidades de información de señales de audio descodificadas antes de que se hagan salir hacia dicho post-filtro (30; 30A; 30B) .
4. El dispositivo descodificador según una cualquiera de las reivindicaciones 1 a 3, en el que dicho post-filtro (30; 30A; 30B) comprende un post-filtro de pitch en el que el parámetro de pitch usado en dicho post-filtro de pitch se basa en el parámetro de pitch de dicha unidad de información posterior.
5. El dispositivo descodificador según la reivindicación 4, en el que dicho post-filtro de pitch de dicho post-filtro (30; 30A; 30B) se disponen para determinar, para una subunidad de información que sigue a la unidad de información presente, un valor de un índice de tiempo reducido en un valor de pitch para dicha subunidad de información y tomar, si dicho valor determinado es mayor o igual al índice de tiempo de la unidad de información presente, dicho valor de pitch para dicha subunidad de información como parámetro conductor de pitch para dicha unidad de información presente.
6. El dispositivo descodificador según las reivindicaciones 4 o 5, que comprende un detector de características de audio, una salida del cual se conecta a dicho post-filtro (30; 30A; 30B) ; estando dicho post-filtro (30; 30A; 30B) dispuesto para adaptar el grado en el cual dicho parámetro de pitch usado en dicho post-filtro de pitch se basa en dicho parámetro de pitch de dicha unidad de información posterior dependiendo de la medida de la importancia del cambio de las características de audio entre una unidad de información presente y al menos una entre unidades de información previa o posterior.
7. El dispositivo descodificador según la reivindicación 6, en el que dicho detector de características de audio es al menos uno entre un detector de actividad de voz o un detector de sonorización y en el que dicho post-filtro se dispone para basar dicho parámetro de pitch usado en dicho post-filtro de pitch en dicho parámetro de pitch de dicha unidad de información posterior en el caso de un comienzo de conversaciones con voces detectado.
8. El dispositivo descodificador según una cualquiera de las reivindicaciones 1 a 7, en el que dicho post-filtro (30; 30A; 30B) se dispone para tener también acceso a una señal descodificada de dicha unidad de información posterior.
9. El dispositivo descodificador según una cualquiera de las reivindicaciones 1 a 8, en el que dicho descodificador
(20) es un descodificador escalable (120) o una parte de un descodificador escalable, en el que un descodificador secundario (25) de dicho descodificador escalable tiene un retardo mayor que un descodificador primario (21) de dicho descodificador escalable.
10. Un dispositivo descodificador que comprende un descodificador escalable (120) y al menos dos dispositivos descodificadores según la reivindicación 7.
11. Un método de descodificación que comprende las etapas de:
recibir (210) parámetros de señales codificadas basadas en unidades de información;
descodificar (212) dichos parámetros en unidades de información de señales de audio descodificadas, caracterizado porque al menos una de dichas etapas de recibir y de descodificar provoca una diferencia de tiempo entre el momento en que están disponibles los parámetros de una primera unidad de información tras la recepción y el momento en el que está disponible una señal de audio descodificada de una primera unidad de información tras la descodificación, correspondiendo dicha diferencia de tiempo a al menos una unidad de información;
post-filtrar (214) dichas unidades de información de señales de audio descodificadas para producir una señal de salida en respuesta a dichos parámetros de la unidad de información posterior respectiva y producir (216) dicha señal de salida.
12. El método de descodificación según la reivindicación 11, que comprende la etapa de:
almacenar parámetros de al menos dos unidades de información consecutivas en cada instante, por lo que dicha etapa de descodificación se lleva a cabo con parámetros de una primera unidad de información y dicho postfiltrado se lleva a cabo con acceso a los parámetros de una segunda unidad de información posterior.
13. El método de descodificación según la reivindicación 11, que comprende la etapa de:
retardar dichas unidades de información de señales de audio descodificadas antes de realizar dicha etapa de post-filtrado.
14. El método de descodificación según cualquiera de las reivindicaciones 11 a 13, en el que dicha etapa de postfiltrado (214) comprende realizar un post-filtrado de pitch, de modo que el parámetro de pitch usado en dicho postfiltrado de pitch se basa en un parámetro de pitch de dicha unidad de información posterior.
15. El método de descodificación según la reivindicación 11, en el que dicho post-filtrado de pitch en dicha etapa de post-filtrado (214) comprende:
determinar (224) , para una subunidad de información de una unidad de información presente, un valor de un índice de tiempo reducido en un valor de pitch para dicha subunidad de información y tomar (226) , si dicho valor determinado es mayor o igual a un índice de tiempo de la unidad de información presente, dicho valor de pitch para dicha subunidad de información como parámetro conductor de pitch para dicha unidad de información presente.
16. El método de descodificación según las reivindicaciones 14 o 15, que comprende la etapa de detectar características de audio de dichas señales codificadas basadas en unidades de información;
de modo que dicha etapa de post-filtrado adapta el grado en el cual dicho parámetro de pitch usado en dicho post-filtro de pitch se basa en dicho parámetro de pitch de dicha unidad de información posterior dependiendo de la medida de la importancia del cambio de las características de audio entre una unidad de información presente y al menos una entre unidad de información previa y unidad de información posterior.
17. El método de descodificación según la reivindicación 16, en el que la etapa de detección comprende la detección de al menos uno entre un detector de actividad de voz o un detector de sonorización y en el que dicha etapa de postfiltrado se basa en dicho parámetro de pitch de dicha unidad de información posterior siguiente solo en el caso de un comienzo de conversaciones con voces detectado.
18. El método de descodificación según una cualquiera de las reivindicaciones 11 a 17, en el que dicha etapa de post-filtrado (214) se lleva a cabo también en respuesta a una señal descodificada de dicha unidad de información posterior respectiva
19. El método de descodificación según una cualquiera de las reivindicaciones 11 a 18, en el que dicha etapa de descodificación (212) supone descodificar en un descodificador escalable, en el cual un descodificador secundario de dicho descodificador escalable implica un retardo mayor que un descodificador primario de dicho descodificador escalable.
20. Un método de descodificación que comprende al menos dos métodos de descodificación según la reivindicación
19.
Patentes similares o relacionadas:
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]
Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]
Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]
Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]
Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]
Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]