Procedimiento y dispositivo para la ocultación eficiente de un borrado de trama en códecs de voz.
Un procedimiento para ocultar borrados de tramas causados por las tramas de una señal de sonido codificadaborradas durante la transmisión desde un codificador (700) a un decodificador (300) y para recuperar eldecodificador (300) después de los borrados de trama,
comprendiendo el procedimiento:en el codificador (700), la determinación (707) de los parámetros de ocultación/recuperación, incluyendo almenos información de fase relacionada con las tramas de la señal de sonido codificada, en el que lainformación de fase comprende una posición de un pulso (Γq) glótico en cada trama de la señal de sonidocodificada, determinada midiendo (707) el pulso (Γq) glótico como un pulso de amplitud máxima en un ciclo defrecuencia fundamental predeterminado de la trama de la señal de sonido codificada y determinando (707) laposición del pulso de amplitud máxima;
transmitir (213) al decodificador (300) los parámetros de ocultación/recuperación determinados en elcodificador (700); y
en el decodificador (300), realizar una ocultación de borrado de trama en respuesta a los parámetros deocultación/recuperación recibidos, en el que la ocultación de borrado de tramas comprende resincronizar(900), en respuesta a la información de fase recibida, las tramas cuyo borrado se oculta con las tramascorrespondientes de la señal de sonido codificada en el codificador (700);
caracterizado por que esa resincronización de una trama cuyo borrado se oculta con una tramacorrespondiente de la señal de sonido codificada comprende:
decodificar (910) la posición del pulso (Γq) glótico de dicha trama de la señal de sonido codificada;determinar (912), en la trama cuyo borrado se oculta, una posición de un pulso de amplitud máxima máscercano a la posición de dicho pulso (Γq) glótico de dicha trama correspondiente de dicha señal de sonidocodificada; y
alinear (920) la posición del puso de amplitud máxima en la trama cuyo borrado se oculta con la posición delpulso (Γq) glótico de la trama correspondiente de la señal de sonido codificada.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CA2006/002146.
Solicitante: VOICEAGE CORPORATION.
Nacionalidad solicitante: Canadá.
Dirección: Suite 200, 750, chemin Lucerne Ville Mont-Royal Quebec H3R 2H6 CANADA.
Inventor/es: SALAMI, REDWAN, JELINEK,MILAN, GOURNAY,PHILIPPE, VAILLANCOURT,TOMMY.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
PDF original: ES-2434947_T3.pdf
Fragmento de la descripción:
Procedimiento y dispositivo para la ocultación eficiente de un borrado de trama en códecs de voz
Campo de la invención La presente invención se refiere a una técnica para codificar digitalmente una señal de sonido, en particular, pero no exclusivamente, una señal de voz, para transmitir y/o sintetizar esta señal de sonido. Más específicamente, la presente invención se refiere a una codificación y decodificación robusta de señales de sonido para mantener un buen rendimiento en el caso de la trama o tramas borradas, debido, por ejemplo, a errores de canal en los sistemas inalámbricos o paquetes perdidos en aplicaciones de voz sobre red por paquetes.
Antecedentes de la invención La demanda de técnicas digitales eficaces de codificación de voz de banda estrecha y banda ancha con un buen compromiso entre la calidad subjetiva y la tasa de bits está aumentando en varias áreas de aplicación, tales como teleconferencia, multimedia y comunicaciones inalámbricas. Hasta hace poco, se ha usado principalmente un ancho de banda telefónico restringido a un intervalo de 200-3.400 Hz para aplicaciones de codificación de voz. Sin embargo, las aplicaciones de voz de banda ancha proporcionan una mayor inteligibilidad y naturalidad en la comunicación en comparación con el ancho de banda telefónico convencional. Se ha encontrado que un ancho de banda en el intervalo de 50-7.000 Hz es suficiente para proporcionar una buena calidad dando una impresión de una comunicación cara a cara. Para las señales de audio en general, este ancho de banda proporciona una calidad subjetiva aceptable, pero es todavía inferior a la calidad de la radio FM o del CD que funcionan en intervalos de 20
16.000 Hz y 20-20.000 Hz, respectivamente.
Un codificador de voz convierte una señal de voz a un flujo de bits digital que es transmitido a través de un canal de comunicación o es almacenado en un medio de almacenamiento. La señal de voz es digitalizada, es decir, muestreada y cuantificada normalmente con 16 bits por muestra. El codificador de voz tiene el papel de representar estas muestras digitales con un menor número de bits, mientras mantiene una buena calidad de voz subjetiva. El decodificador de voz o sintetizador opera sobre el flujo de bits transmitido o almacenado y lo convierte de nuevo a una señal de sonido.
La codificación Predicción Lineal con Excitación por Código (Code-Excited Linear Prediction, CELP) es una de las mejores técnicas disponibles para conseguir un buen compromiso entre la calidad subjetiva y la tasa de bits. Esta técnica de codificación es una base de diversos estándares de codificación de voz, tanto en aplicaciones inalámbricas como por cable. En la codificación CELP, la señal de voz muestreada es procesada en bloques sucesivos de L muestras denominados, normalmente tramas, donde L es un número predeterminado que corresponde, típicamente, a 10-30 ms de la señal de voz. Un filtro de predicción lineal (LP) es calculado y transmitido cada trama. Típicamente, el cálculo del filtro LP necesita una anticipación, un segmento de voz de 5-15 ms de la trama subsiguiente. La trama de L muestras es dividida en bloques más pequeños denominados subtramas. Normalmente, el número de subtramas es de tres o cuatro, lo que da como resultado subtramas de 4-10 ms. En cada subtrama, generalmente se obtiene una señal de excitación a partir de dos componentes, la excitación pasada y la excitación innovadora, con un libro de códigos fijo. El componente formado a partir de la excitación pasada se conoce frecuentemente como el libro de códigos adaptativo o excitación de frecuencia fundamental. Los parámetros que caracterizan la señal de excitación se codifican y transmiten al decodificador, donde la señal de excitación reconstruida se usa como la entrada del filtro LP.
Debido a que las principales aplicaciones de codificación de voz de baja tasa de bits son sistemas de comunicaciones móviles inalámbricas y de voz a través de redes de paquetes, entonces, el aumento de la robustez de los códecs de voz en caso de borrado de tramas adquiere una importancia significativa. En los sistemas celulares inalámbricos, la energía de la señal recibida puede exhibir desvanecimientos graves frecuentes que resultan en altas tasas de error de bit y esto se hace más evidente en los límites de las celdas. En este caso, el decodificador de canal no consigue corregir los errores en la trama recibida y, como consecuencia, el detector de errores usado normalmente después del decodificador de canal declarará la trama como borrada. En aplicaciones de voz sobre redes de paquetes, la señal de voz es empaquetada de manera que, normalmente, cada paquete corresponde a 20-40 ms de la señal de sonido. En las comunicaciones de conmutación de paquetes, puede producirse una eliminación de paquetes en un router si el número de paquetes se hace muy grande, o el paquete puede llegar al receptor después de un largo retardo y debe ser declarado como perdido si su retardo es mayor que la longitud de una memoria intermedia anti-fluctuaciones en el lado del receptor. En estos sistemas, típicamente el códec es sometido a tasas de borrado de trama del 3 al 5%. Además, el uso de codificación de voz de banda ancha es un activo de estos sistemas para permitir que puedan competir con la PSTN (red telefónica pública conmutada) tradicional que usa las señales de voz de banda estrecha heredadas.
En CLP el libro de códigos adaptativo o el predictor de frecuencia fundamental desempeña un papel en el 2
mantenimiento de una alta calidad de voz a bajas tasas de bits. Sin embargo, debido a que el contenido del libro de códigos adaptativo está basado en la señal de las tramas pasadas, esto hace que el modelo de códec sea sensible a la pérdida de tramas. En el caso de tramas borradas o perdidas, el contenido del libro de códigos adaptativo en el decodificador es diferente de su contenido en el codificador. De esta manera, después de que una trama perdida es ocultada y se reciben tramas buenas subsiguientes, la señal sintetizada en las tramas buenas recibidas es diferente de la señal de síntesis deseada ya que la contribución del libro de códigos adaptativo ha sido modificada. El impacto de una trama perdida depende de la naturaleza del segmento de voz en el que ocurrió el borrado. Si el borrado ocurre en un segmento estacionario de la señal, entonces puede realizarse una ocultación eficiente del borrado de trama y puede minimizarse el Impacto sobre las tramas buenas subsiguientes. Por otro lado, si el borrado ocurre en un inicio o una transición de la voz, el efecto del borrado puede propagarse a lo largo de varias tramas. Por ejemplo, si se pierde el principio de un segmento sonoro, entonces faltará el primer periodo fundamental del contenido del libro de códigos adaptativo. Esto tendrá un severo efecto sobre el predictor de frecuencia fundamental en las tramas buenas subsiguientes, resultando en un tiempo más largo antes de que la señal de síntesis converja a la señal deseada en el codificador.
Sumario de la invención Más específicamente, según un primer aspecto de la presente invención, se proporciona un procedimiento para ocultar borrados de tramas causados por tramas de una señal de sonido codificada que han sido borradas durante la transmisión desde un codificador a un decodificador y para la recuperación del decodificador después de los borrados de tramas, según la reivindicación 1.
Según un segundo aspecto de la presente invención, se proporciona un procedimiento alternativo para ocultar borrados de tramas causados por tramas de una señal de sonido codificada que han sido borradas durante la transmisión desde un codificador a un decodificador y para la recuperación del decodificador después de los borrados según la reivindicación 24.
Según un tercer aspecto de la presente invención, se proporciona un dispositivo para ocultar borrados de tramas causados por tramas de una señal de sonido codificada que han sido borradas durante la transmisión desde un codificador a un decodificador y para la recuperación del decodificador después de los borrados de tramas según la reivindicación 34.
Según un cuarto aspecto de la presente invención, se proporciona un dispositivo alternativo para ocultar borrados de tramas causados por las tramas de una señal de sonido codificada que han sido borradas durante la transmisión desde un codificador a un decodificador y para la recuperación del decodificador después de los borrados de tramas según la reivindicación 48.
Lo indicado anteriormente y otros objetos, ventajas y características de la presente invención serán más evidentes tras la lectura de la siguiente descripción no restrictiva de una realización ilustrativa de... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento para ocultar borrados de tramas causados por las tramas de una señal de sonido codificada borradas durante la transmisión desde un codificador (700) a un decodificador (300) y para recuperar el decodificador (300) después de los borrados de trama, comprendiendo el procedimiento:
en el codificador (700) , la determinación (707) de los parámetros de ocultación/recuperación, incluyendo al menos información de fase relacionada con las tramas de la señal de sonido codificada, en el que la información de fase comprende una posición de un pulso (Tq) glótico en cada trama de la señal de sonido codificada, determinada midiendo (707) el pulso (Tq) glótico como un pulso de amplitud máxima en un ciclo de frecuencia fundamental predeterminado de la trama de la señal de sonido codificada y determinando (707) la posición del pulso de amplitud máxima;
transmitir (213) al decodificador (300) los parámetros de ocultación/recuperación determinados en el codificador (700) ; y
en el decodificador (300) , realizar una ocultación de borrado de trama en respuesta a los parámetros de ocultación/recuperación recibidos, en el que la ocultación de borrado de tramas comprende resincronizar (900) , en respuesta a la información de fase recibida, las tramas cuyo borrado se oculta con las tramas correspondientes de la señal de sonido codificada en el codificador (700) ;
caracterizado por que esa resincronización de una trama cuyo borrado se oculta con una trama correspondiente de la señal de sonido codificada comprende:
decodificar (910) la posición del pulso (Tq) glótico de dicha trama de la señal de sonido codificada;
determinar (912) , en la trama cuyo borrado se oculta, una posición de un pulso de amplitud máxima más cercano a la posición de dicho pulso (Tq) glótico de dicha trama correspondiente de dicha señal de sonido codificada; y
alinear (920) la posición del puso de amplitud máxima en la trama cuyo borrado se oculta con la posición del pulso (Tq) glótico de la trama correspondiente de la señal de sonido codificada.
2. Procedimiento según se define en la reivindicación 1, en el que la determinación de los parámetros de ocultación/recuperación comprenden determinar (707) , como la información de fase, una posición y un signo de un último pulso (Tq) glótico en cada trama de la señal de sonido codificada.
3. Procedimiento según se define en la reivindicación 1, que comprende además cuantificar la posición del pulso glótico antes de transmitir la posición del pulso glótico al decodificador.
4. Procedimiento según se define en la reivindicación 2, que comprende además cuantificar (707) la posición y el signo del último pulso (Tq) glótico antes de transmitir (213) la posición y el signo del último pulso glótico al decodificador (300) .
5. Procedimiento según se define en la reivindicación 1, que comprende además codificar (707) una posición cuantificada del pulso glótico en un trama futura de la señal de sonido codificada.
6. Procedimiento según se define en la reivindicación 1, que comprende además determinar (707) , como la información de fase, un signo del pulso (Tq) glótico midiendo un signo del pulso de amplitud máxima.
7. Procedimiento según se define en la reivindicación 2, en el que la determinación de la posición del último pulso glótico comprende:
medir (707) el último pulso (Tq) glótico como un pulso de amplitud máxima en cada trama de la señal de sonido codificada; y
determinar (707) la posición del pulso de amplitud máxima.
8. Procedimiento según se define en la reivindicación 7, en el que la determinación del signo del último pulso (Tq) glótico comprende:
medir (707) una señal del pulso de amplitud máxima.
9. Procedimiento según se define en la reivindicación 8, en el que la resincronización (900) de una trama cuyo borrado se oculta con una trama correspondiente de la señal de sonido codificada comprende:
decodificar (910) la posición y el signo del último pulso (Tq) glótico de dicha trama correspondiente de la señal de sonido codificada;
determinar (912) , en la trama cuyo borrado se oculta una posición de un pulso de amplitud máxima que tiene un signo similar al signo del último pulso (Tq) glótico de la trama correspondiente de la señal de sonido codificada, más cercana a la posición de dicho último pulso (Tq) glótico de dicha trama correspondiente de dicha señal de sonido codificada; y
alinear (920) la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta con la posición del último pulso (Tq) glótico de la trama correspondiente de la señal de sonido codificada.
10. Procedimiento según se define en la reivindicación 1, en el que la alineación de la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta con la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada comprende:
determinar (916) un desplazamiento entre la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta y la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada; e insertar/eliminar (1008) , en la trama cuyo borrado se oculta, un número de muestras correspondientes al desplazamiento determinado.
11. Procedimiento según se define en la reivindicación 10, en el que la inserción/eliminación del número de muestras comprende:
determinar (1002; 1004) al menos una región de energía mínima en la trama cuyo borrado se oculta; y
distribuir (1006) el número de muestras a insertar/eliminar alrededor de la al menos una región de energía mínima.
12. Procedimiento según se define en la reivindicación 11, en el que la distribución del número de muestras a insertar/eliminar alrededor de la al menos una región de energía mínima comprende distribuir (1006) el número de muestras alrededor de la al menos una región de energía mínima usando la relación siguiente:
en la que Nmin es el número de regiones de energía mínima, y Te es el desplazamiento entre la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta y la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada.
13. Procedimiento según se define en la reivindicación 12, en el que R (i) está en orden creciente, de manera que las muestras se añaden/eliminan (1008) principalmente hacia un final de la trama cuyo borrado se oculta.
14. Procedimiento según se define en la reivindicación 1, en el que la realización de la ocultación de borrado de tramas en respuesta a los parámetros de ocultación/recuperación recibidos comprende, para las tramas borradas sonoras:
construir una parte periódica de una señal de excitación en la trama cuyo borrado se oculta en respuesta a los parámetros de ocultación/recuperación recibidos; y
construir una parte innovadora aleatoria de la señal de excitación mediante la generación aleatoria de una señal innovadora, no periódica.
15. Procedimiento según se define en la reivindicación 1, en el que la realización de la ocultación del borrado de tramas en respuesta a los parámetros de ocultación/recuperación recibidos comprende, para las tramas borradas sordas, construir una parte innovadora aleatoria de una señal de excitación mediante la generación aleatoria de una señal innovadora, no periódica.
16. Procedimiento según se define en la reivindicación 1, en el que los parámetros de ocultación/recuperación incluyen además la clasificación (705) de las señales.
17. Procedimiento según se define en la reivindicación 16, en el que la clasificación de la señal comprende clasificar
(705) tramas sucesivas de la señal de sonido codificada como sorda, transición sorda, transición sonora, sonora o inicio.
18. Procedimiento según se define en la reivindicación 17, en el que la clasificación de una trama perdida es estimada en base a la clasificación de una trama futura y una última trama buena recibida.
19. Procedimiento según se define en la reivindicación 18, en el que la clasificación de la trama perdida se establece como sonora si la trama futura es sonora y la última trama buena recibida es de inicio.
20. Procedimiento según se define en la reivindicación 19, en el que la clasificación de la trama perdida se establece como transición sorda si la trama futura es sorda y la última trama buena recibida es sonora.
21. Procedimiento según se define en la reivindicación 1, en el que:
la señal de sonido es una señal de voz;
la determinación, en el codificador (700) , de los parámetros de ocultación/recuperación incluye determinar (705; 707) la información de fase y clasificar la señal de las tramas sucesivas de la señal de sonido codificada;
la realización de la ocultación de borrado de tramas en respuesta a los parámetros de ocultación/recuperación comprende, cuando se pierde un trama de inicio, lo que se indica por la presencia de una trama sonora que sigue a un borrado de trama y una trama sorda antes del borrado de trama, reconstruir artificialmente la trama de inicio perdida; y
volver a sincronizar (900) la trama de inicio perdida, cuyo borrado se oculta, en respuesta a la información de fase con la trama de inicio correspondiente de la señal de sonido codificada.
22. Procedimiento según se define en la reivindicación 21, en el que la reconstrucción de manera artificial de la trama de inicio perdida comprende reconstruir, de manera artificial, un último pulso (Tq) glótico en la trama de inicio perdida como un pulso con un filtrado de paso bajo.
23. Procedimiento según se define en la reivindicación 21, que comprende además escalar la trama de inicio perdida reconstruida por una ganancia.
24. Un procedimiento para ocultar borrados de tramas causados por tramas de una señal de sonido codificada borradas durante la transmisión desde un codificador (700) a un decodificador (300) y para la recuperación del decodificador (300) después de los borrados de tramas, en el que el procedimiento comprende, en el decodificador (300) :
estimar una información de fase de cada trama de la señal de sonido codificada que ha sido borrada durante la transmisión desde el codificador (700) al decodificador (300) ; y
realizar la ocultación de borrado de tramas en respuesta a la información de fase estimada, en el que la ocultación de borrado de tramas comprende volver a sincronizar (900) , en respuesta a la información de fase estimada, cada trama cuyo borrado se oculta con un trama correspondiente de la señal de sonido codificada en el codificador (700) ;
caracterizado por que la información de fase estimada es una posición estimada de un pulso (Tq) glótico de cada trama de la señal de sonido codificada que ha sido borrada;
la estimación de la posición del pulso glótico de cada trama de la señal de sonido codificada que ha sido borrada comprende un pulso (Tq) glótico de un valor de frecuencia fundamental pasado;
la resincronización una trama cuyo borrado se oculta con la trama correspondiente de la señal de sonido codificada comprende determinar (912) un pulso de amplitud máxima en la trama cuyo borrado se oculta, y alinear (920) el pulso de amplitud máxima en la trama cuyo borrado se oculta con el pulso (Tq) glótico estimado.
25. Procedimiento según se define en la reivindicación 24, en el que la estimación de la posición del último pulso glótico de cada trama de la señal de sonido codificada que ha sido borrada comprende:
interpolar el pulso glótico estimado con el valor de frecuencia fundamental pasado para determinar los retardos de frecuencia fundamental estimados.
26. Procedimiento según se define en la reivindicación 25, en el que la alineación de la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta con la posición estimada del pulso (Tq) glótico comprende:
calcular los ciclos de frecuencia fundamental en la trama cuyo borrado se oculta;
determinar un desplazamiento entre los retardos de frecuencia fundamental estimados y los ciclos de frecuencia fundamental en la trama cuyo borrado se oculta, e insertar/eliminar (1008) una serie de muestras correspondientes al desplazamiento determinado en la trama cuyo borrado se oculta.
27. Procedimiento según se define en la reivindicación 26, en el que la inserción/eliminación del número de muestras comprende:
determinar (1002; 1004) al menos una región de energía mínima en la trama cuyo borrado se oculta; y
distribuir (1006) el número de muestras a insertar/eliminar alrededor de la al menos una región de energía mínima.
28. Procedimiento según se define en la reivindicación 27, en el que la distribución del número de muestras a insertar/eliminar alrededor de la al menos una región de energía mínima comprende distribuir (1006) el número de muestras alrededor de la al menos una región de energía mínima usando la relación siguiente:
en la que Nmin es el número de regiones de energía mínima y Te es el desplazamiento entre los retardos de frecuencia fundamental estimada y los ciclos de frecuencia fundamental en la trama cuyo borrado se oculta.
29. Procedimiento según se define en la reivindicación 28, en el que R (i) está en orden creciente, de manera que las muestras se insertan/eliminan (1008) , en su mayoría, hacia el final de la trama cuyo borrado se oculta.
30. Procedimiento según se define en la reivindicación 24, que comprende atenuar (924) una ganancia de cada trama cuyo borrado se oculta, de una manera lineal, desde el inicio hasta el final de la trama cuyo borrado se oculta.
31. Procedimiento según se define en la reivindicación 30, en el que la ganancia de cada trama cuyo borrado se oculta es atenuada (924) hasta que se alcanza el valor a, en el que a es un factor para controlar una velocidad de convergencia de la recuperación del decodificador (300) después del borrado de tramas.
32. Procedimiento según se define en la reivindicación 31, en el que el factor a depende de la estabilidad de un filtro LP para tramas sordas.
33. Procedimiento según se define en la reivindicación 32, en el que el factor a tiene en cuenta además una evolución de la energía de los segmentos sonoros.
34. Un dispositivo para ocultar borrados de tramas causados por tramas de una señal sonora codificada borradas durante la transmisión desde un codificador (700) a un decodificador (300) y para recuperar el decodificador (300) después de los borrados de tramas, en el que el dispositivo comprende:
en el codificador (700) , medios (707) para determinar los parámetros de ocultación/recuperación, incluyendo al menos información de fase relacionada con tramas de la señal de sonido codificada, en el que la información de fase comprende una posición de un pulso (Tq) glótico en cada trama de la señal de sonido codificada, determinado por medios para medir (707) el pulso (Tq) glótico como un pulso de amplitud máxima en un ciclo de frecuencia fundamental predeterminado de la trama de la señal de sonido codificada y por medios para determinar (707) la posición del pulso de amplitud máxima;
medios (213) para transmitir al decodificador (300) los parámetros de ocultación/recuperación determinados en el codificador (700) ; y
en el decodificador (300) , medios para realizar la ocultación del borrado de tramas en respuesta a los parámetros de ocultación/recuperación recibidos, en el que los medios para realizar la ocultación del borrado de tramas comprenden medios (900) para volver a sincronizar, en respuesta a la información de fase recibida, las tramas de cuyo borrado se oculta con tramas correspondientes de la señal de sonido codificada en el codificador (700) .
caracterizado por que los medios (900) para resincronizar las tramas cuyo borrado se oculta con tramas correspondientes de la señal de sonido codificada en el codificador (700) comprenden:
medios (912) para determinar en cada trama cuyo borrado se oculta, una posición de un pulso de amplitud máxima más cercano a la posición del pulso (Tq) glótico en una trama correspondiente de la señal de sonido codificada; y
medios (920) para alinear la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta con la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada.
35. Dispositivo según se define en la reivindicación 34, en el que los medios para determinar los parámetros de ocultación/recuperación comprenden además medios (707) para determinar, como la información de fase, una posición y un signo de un último pulso (Tq) glótico en cada trama de la señal de sonido codificada.
36. Dispositivo según se define en la reivindicación 34, que comprende además medios (707) para cuantificar la posición del pulso glótico antes de la transmisión de la posición del pulso glótico al decodificador, a través de los medios (213) de transmisión.
37. Dispositivo según se define en la reivindicación 35, que comprende además medios (707) para cuantificar la posición y el signo del último pulso (Tq) glótico antes de la transmisión de la posición y el signo del último pulso (Tq) glótico al decodificador (300) , a través de los medios (213) de transmisión.
38. Dispositivo según se define en la reivindicación 36, que comprende además un codificador de la posición cuantificada del pulso glótico en una trama futura de la señal de sonido codificada.
39. Dispositivo según se define en la reivindicación 35, en el que los medios (707) para determinar la posición y el signo del último pulso glótico determinan, como la posición y el signo del último pulso (Tq) glótico, una posición y un signo de un pulso de amplitud máxima en cada trama de la señal de sonido codificada.
40. Dispositivo según se define en la reivindicación 34, en el que los medios (707) para determinar la posición y el signo del pulso glótico determinan, como información de fase, un signo del pulso (Tq) glótico, como un signo del pulso de amplitud máxima.
41. Dispositivo según se define en la reivindicación 34, en el que los medios (900) de resincronización comprenden:
medios para determinar (916) un desplazamiento entre la posición del pulso de amplitud máxima en cada trama cuyo borrado se oculta y la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada; y
en el que los medios para alinear la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta insertan/eliminan (1008) un número de muestras correspondiente al desplazamiento determinado en cada trama cuyo borrado se oculta.
42. Dispositivo según se define en la reivindicación 35, en el que los medios (900) de resincronización:
determinan (912) , en cada trama cuyo borrado se oculta, una posición de un pulso de amplitud máxima que tiene un signo similar al signo del pulso (Tq) glótico más cercano a la posición del último pulso glótico en una trama correspondiente de la señal de sonido codificada;
determinan (916) un desplazamiento entre la posición del pulso de amplitud máxima en cada trama cuyo borrado se oculta y la posición del último pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada; y
insertan/eliminan (1008) un número de muestras correspondientes al desplazamiento determinado en cada trama cuyo borrado se oculta para alinear la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta con la posición del último pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada.
43. Dispositivo según se define en la reivindicación 41, en el que, además, los medios (900) de resincronización:
determinan (1002; 1004) al menos una región de energía mínima en cada trama cuyo borrado se oculta usando una ventana deslizante; y
distribuyen (1006) el número de muestras a insertar/eliminar alrededor de al menos una región de energía mínima.
44. Dispositivo según se define en la reivindicación 43, en el que los medios (900) de resincronización usan la relación siguiente para distribuir (1006) el número de muestras a insertar/eliminar alrededor de la al menos una región de energía mínima:
en la que Nmin es el número de regiones de energía mínima, y Te es el desplazamiento entre la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta y la posición del pulso (Tq) glótico en la trama correspondiente de la señal de sonido codificada.
45. Dispositivo según se define en la reivindicación 44, en el que R (i) está en orden creciente, de manera que las muestras se insertan/eliminan (1008) , en su mayoría, hacia un final de la trama cuyo borrado se oculta.
46. Dispositivo según se define en la reivindicación 34, en el que los medios para realizar la ocultación del borrado de tramas, a los que se suministran los parámetros de ocultación/recuperación recibidos, comprenden, para las tramas sonoras borradas:
medios para construir una parte periódica de una señal de excitación en cada trama cuyo borrado se oculta en respuesta a los parámetros de ocultación/recuperación recibidos; y
medios para construir una parte innovadora aleatoria, no periódica, de la señal de excitación.
47. Dispositivo según se define en la reivindicación 34, en el que los medios para realizar la ocultación de borrado de tramas, a los que se suministran los parámetros de ocultación/recuperación recibidos, comprenden medios para construir, para tramas borradas sordas, una parte innovadora aleatoria, no periódica, de una señal de excitación.
48. Un dispositivo para ocultar los borrados de tramas causados por las tramas de una señal sonora codificada borradas durante la transmisión desde un codificador (700) a un decodificador (300) y para recuperar el decodificador (300) después de los borrados de tramas, en el que el dispositivo comprende:
medios para estimar, en el decodificador (300) , una información de fase de cada trama de la señal de sonido codificada que ha sido borrada durante la transmisión desde el codificador (700) al decodificador (300) ; y
medios para realizar la ocultación del borrado de tramas en respuesta a la información de fase estimada, en el que los medios para realizar la ocultación del borrado de tramas que comprenden medios para resincronizar (900) , en respuesta a la información de fase estimada, cada trama cuyo borrado se oculta con una trama correspondiente de la señal de sonido codificada en el codificador (700) ;
caracterizado por que: los medios para estimar la información de fase comprenden medios para estimar una posición de un pulso (Tq) glótico en cada trama de la señal de sonido codificada;
los medios para estimar la posición del pulso glótico estiman el pulso glótico a partir de un valor de frecuencia fundamental pasado; y
los medios de resincronización comprenden medios para determinar un pulso de amplitud máxima en la trama cuyo borrado se oculta, y medios para alinear el pulso de amplitud máxima en la trama cuyo borrado se oculta con el pulso glótico estimado.
49. Dispositivo según se define en la reivindicación 48, en el que los medios para estimar la información de fase estiman, a partir de un valor de frecuencia fundamental pasado, una posición y un signo de un último pulso glótico en cada trama de la señal de sonido codificada, e interpolan el pulso glótico estimado con el valor de frecuencia fundamental pasado para determinar los retardos de frecuencia fundamental estimados.
50. Dispositivo según se define en la reivindicación 49, en el que los medios de resincronización comprenden:
medios para determinar los ciclos de frecuencia fundamental en cada trama cuyo borrado se oculta;
medios para determinar un desplazamiento entre los ciclos de frecuencia fundamental en cada trama cuyo borrado se oculta y los retardos de frecuencia fundamental estimados en la trama correspondiente de la señal de sonido codificada; y
en el que los medios para alinear la posición del pulso de amplitud máxima en la trama cuyo borrado se oculta insertan/eliminan (1008) un número de muestras correspondientes al desplazamiento determinado en cada trama cuyo borrado se oculta con el fin de alinear el pulso de amplitud máxima en la trama cuyo borrado se oculta con el último pulso glótico estimado.
51. Dispositivo según se define en la reivindicación 50, en el que los medios de resincronización además:
determinan (1002; 1004) al menos una región de energía mínima usando una ventana deslizante; y
distribuyen (1006) el número de muestras alrededor de la al menos una región de energía mínima.
52. Dispositivo según se define en la reivindicación 51, en el que los medios de resincronización usan la relación 25 siguiente para distribuir (1006) el número de muestras alrededor de la al menos una región de energía mínima:
en la que Nmin es el número de regiones de energía mínima, y Te es el desplazamiento entre los ciclos de frecuencia fundamental en cada trama cuyo borrado se oculta y los retardos de frecuencia fundamental estimados en la trama 35 correspondiente de la señal de sonido codificada.
53. Dispositivo según se define en la reivindicación 52, en el que R (i) está en orden creciente, de manera que las muestras se insertan/eliminan (1008) , en su mayoría, hacia un final de la trama cuyo borrado se oculta.
54. Dispositivo según se define en la reivindicación 49, que comprende además medios (924) para atenuar una
ganancia de cada trama cuyo borrado se oculta, de una manera lineal, desde un inicio a un final de la trama cuyo 40 borrado se oculta.
55. Dispositivo según se define en la reivindicación 54, en el que los medios (924) de atenuación atenúan la ganancia de cada trama cuyo borrado se oculta hasta a, en el que a es un factor para controlar una velocidad de convergencia de la recuperación del decodificador después del borrado de tramas.
56. Dispositivo según se define en la reivindicación 55, en el que el factor a depende de la estabilidad de un filtro LP
para tramas sordas.
57. Dispositivo según se define en la reivindicación 56, en el que el factor a tiene en cuenta además una evolución de la energía de los segmentos sonoros.
58. Procedimiento según se define en la reivindicación 1, que comprende, cuando la información de fase no está
disponible en el momento de ocultar una trama borrada, actualizar el contenido de un libro de códigos adaptativo del decodificador con la información de fase cuando está disponible antes de decodificar una trama siguiente, no borrada, recibida.
59. Procedimiento según se define en la reivindicación 58, en el que:
la actualización del libro de códigos adaptativo comprende resincronizar el pulso glótico en el libro de códigos 10 adaptativo.
60. Dispositivo según se define en la reivindicación 34, en el que el decodificador (300) actualiza, cuando la información de fase no está disponible en el momento de ocultar una trama borrada, el contenido de un libro de códigos adaptativo del decodificador con la información de fase cuando esté disponible antes de decodificar una trama siguiente, no borrada, recibida.
61. Dispositivo según se define en la reivindicación 60, en el que:
el decodificador, para actualizar el libro de códigos adaptativo, resincroniza el pulso glótico en el libro de códigos adaptativo.
Patentes similares o relacionadas:
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]
Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]
Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]
Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]
Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]
Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]