APARATO Y PROCEDIMIENTO PARA CODIFICAR MEDIANTE BANDA DIVIDIDA UNA SEÑAL DE VOZ.
Un aparato, que comprende:
un banco (A110) de filtros, que contiene
A) una trayectoria de procesamiento de banda baja configurada para recibir una señal de voz de banda ancha y para generar una señal de voz de banda baja en función de una parte de baja frecuencia de la señal de voz de banda ancha,
y
B) una trayectoria de procesamiento de banda alta configurada para recibir la señal de voz de banda ancha y para generar una señal de voz de banda alta en función de una parte de alta frecuencia de la señal de voz de banda ancha, donde una banda de paso de la trayectoria de procesamiento de banda baja se solapa con una banda de paso de la trayectoria de procesamiento de banda alta, donde el solapamiento se considera como la distancia del punto en el que la respuesta de frecuencia del filtro de banda alta desciende hasta -20 dB desde el punto en el que la respuesta de frecuencia del filtro de banda baja desciende hasta -20 dB;
un primer codificador (A120) de voz configurado para codificar la señal de voz de banda baja en al menos una señal de excitación de banda baja codificada y una pluralidad de parámetros de filtro de banda baja; y
un segundo codificador (A200) de voz configurado para generar una señal de excitación de banda alta en función de la señal de excitación de banda baja codificada y para codificar la señal de banda alta, según la señal de excitación de banda alta, en al menos una pluralidad de parámetros de filtro de banda alta,
caracterizado porque la banda de paso de la trayectoria de procesamiento de banda baja se solapa con la banda de paso de la trayectoria de procesamiento de banda alta entre 400 y 1000 Hz aproximadamente
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/012230.
Solicitante: QUALCOMM INCORPORATED.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: 5775 MOREHOUSE DRIVE,SAN DIEGO, CA 92121.
Inventor/es: VOS,KOEN,BERNARD, KANDHADAI,ANANTHAPADMANABHAN,A.
Fecha de Publicación: .
Fecha Concesión Europea: 3 de Marzo de 2010.
Clasificación Internacional de Patentes:
- G10L21/02A4E
Clasificación PCT:
- G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
- G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
Fragmento de la descripción:
Aparato y procedimiento para codificar mediante banda dividida una señal de voz.
Campo de la invención
Esta invención se refiere al procesamiento de señales.
Antecedentes
Tradicionalmente, las comunicaciones de voz a través de la red telefónica pública conmutada (PSTN) han tenido limitado el ancho de banda al intervalo de frecuencias comprendido entre 300 y 3400 kHz. Las nuevas redes de comunicaciones de voz, tales como telefonía celular y voz sobre IP (protocolo de Internet, VoIP), pueden tener otros límites de ancho de banda diferentes y puede ser deseable transmitir y recibir comunicaciones de voz que incluyan un intervalo de frecuencias de banda ancha en tales redes. Por ejemplo, puede ser deseable soportar un intervalo de frecuencias de audio con un valor inferior de 50 Hz y/o con un valor superior de 7 u 8 kHz. También puede ser deseable soportar otras aplicaciones, tales como conferencias de audio o de audio/vídeo de alta calidad, que puedan tener contenido de voz y audio en intervalos fuera de los límites PSTN tradicionales.
La ampliación del intervalo soportado por un codificador de voz en frecuencias superiores puede mejorar la inteligibilidad. Por ejemplo, la información que diferencia sonidos fricativos tales como "s" y "f" está presente principalmente en las altas frecuencias. La ampliación de banda alta también puede mejorar otras características de la voz, tales como la presencia. Por ejemplo, incluso una vocal sonora puede presentar energía espectral muy por encima del límite PSTN.
Un enfoque a la codificación de voz de banda ancha requiere escalar una técnica de codificación de voz de banda estrecha (por ejemplo, una técnica configurada para codificar el intervalo comprendido entre 0 y 4 kHz) para cubrir el espectro de banda ancha. Por ejemplo, una señal de voz puede muestrearse a una tasa superior para incluir componentes a altas frecuencias, y una técnica de codificación de banda estrecha puede reconfigurarse para utilizar más coeficientes de filtro para representar esta señal de banda ancha. Sin embargo, las técnicas de codificación de banda estrecha tales como CELP (predicción lineal excitada por libro de códigos) requieren un gran esfuerzo computacional y un codificador CELP de banda ancha puede consumir demasiados ciclos de procesamiento para que resulte práctico en muchas aplicaciones móviles y en otras aplicaciones embebidas. La codificación de todo el espectro de una señal de banda ancha en una calidad deseada utilizando una técnica de este tipo también puede dar lugar a un incremento inaceptablemente grande del ancho de banda. Además, la transcodificación de una señal codificada de este tipo sería necesaria incluso antes de que su parte de banda estrecha pudiera transmitirse a y/o descodificarse por un sistema que solo soporte codificación de banda estrecha.
Otro enfoque a la codificación de voz de banda ancha requiere extrapolar la envolvente espectral de banda alta a partir de la envolvente espectral de banda estrecha codificada.
Aunque un enfoque de este tipo puede implementarse sin aumentar el ancho de banda y sin necesidad de transcodificación, la envolvente espectral aproximada o la estructura de formante de la parte de banda alta de una señal de voz no pueden predecirse generalmente de manera precisa a partir de la envolvente espectral de la parte de banda estrecha.
Puede ser deseable implementar la codificación de voz de banda ancha de manera que al menos la parte de banda estrecha de la señal codificada pueda enviarse a través de un canal de banda estrecha (tal como un canal PSTN) sin transcodificación u otra modificación significativa. La eficacia de la extensión de codificación de banda ancha también puede ser deseable, por ejemplo, para evitar una reducción significativa del número de usuarios que pueden recibir servicio en aplicaciones tales como telefonía celular inalámbrica y radiodifusión a través de canales cableados y canales inalámbricos.
Para compensar las diferencias en la intensidad sonora percibida entre la parte de banda baja y la parte de banda alta en la señal sintetizada, se conoce un procedimiento a partir del documento US 2005/0004793 A1 para ajustar de manera adaptativa la señal de banda alta codificada en función del algoritmo de codificación de banda baja.
El objeto de la invención es proporcionar un procedimiento simplificado y, en particular, mejorado para evitar fenómenos transitorios audibles en la señal.
Resumen
La invención proporciona un aparato que comprende las características de la reivindicación 1 y un procedimiento según la reivindicación 22. Realizaciones preferidas adicionales resultarán evidentes a partir de las reivindicaciones dependientes.
Breve descripción de los dibujos
La Figura 1a muestra un diagrama de bloques de un codificador A100 de voz de banda ancha según una realización.
La Figura 1b muestra un diagrama de bloques de una implementación A102 del codificador A100 de voz de banda ancha.
La Figura 2a muestra un diagrama de bloques de un descodificador B100 de voz de banda ancha según una realización.
La Figura 2b muestra un diagrama de bloques de una implementación B102 del codificador B100 de voz de banda ancha.
La Figura 3a muestra un diagrama de bloques de una implementación A112 de un banco A110 de filtros.
La Figura 3b muestra un diagrama de bloques de una implementación B122 de un banco B120 de filtros.
La Figura 4a muestra una cobertura de ancho de banda de una banda alta y de una banda baja de un ejemplo del banco A110 de filtros.
La Figura 4b muestra una cobertura de ancho de banda de una banda alta y de una banda baja de otro ejemplo del banco A110 de filtros.
La Figura 4c muestra un diagrama de bloques de una implementación A114 de un banco A112 de filtros.
La Figura 4d muestra un diagrama de bloques de una implementación B124 de un banco B122 de filtros.
La Figura 5a muestra un ejemplo de una representación gráfica de la amplitud logarítmica frente a la frecuencia de una señal de voz.
La Figura 5b muestra un diagrama de bloques de un sistema de codificación básico de predicción lineal.
La Figura 6 muestra un diagrama de bloques de una implementación A122 de un codificador A120 de banda estrecha.
La Figura 7 muestra un diagrama de bloques de una implementación B112 de un descodificador B110 de banda estrecha.
La Figura 8a muestra un ejemplo de una representación gráfica de la amplitud logarítmica frente a la frecuencia de una señal residual de voz sonora.
La Figura 8b muestra un ejemplo de una representación gráfica de la amplitud logarítmica frente al tiempo de una señal residual de un voz sonora.
La Figura 9 muestra un diagrama de bloques de un sistema de codificación básico de predicción lineal que también lleva a cabo una predicción a largo plazo.
La Figura 10 muestra un diagrama de bloques de una implementación A202 de un codificador A200 de banda alta.
La Figura 11 muestra un diagrama de bloques de una implementación A302 de un generador A300 de excitación de banda alta.
La Figura 12 muestra un diagrama de bloques de una implementación A402 de un ensanchador A400 de espectro.
La Figura 12a muestra representaciones gráficas de espectros de señales en varios puntos en un ejemplo de una operación de ensanchamiento espectral.
La Figura 12b muestra representaciones gráficas de espectros de señales en varios puntos en otro ejemplo de una operación de ensanchamiento espectral.
La Figura 13 muestra un diagrama de bloques de una implementación A304 de un generador A302 de excitación de banda alta.
La Figura 14 muestra un diagrama de bloques de una implementación A306 del generador A302 de excitación de banda alta.
La Figura 15 muestra un diagrama de flujo de una tarea T100 de cálculo de envolvente.
La Figura 16 muestra un diagrama de bloques de una implementación 492 de un combinador 490.
La Figura 17 muestra un enfoque para calcular una medida de periodicidad de una señal S30 de banda alta.
La Figura 18 muestra un diagrama de bloques de una implementación A312 del generador A302 de excitación de banda alta.
La Figura 19 muestra un diagrama de bloques de una implementación A314 del generador A302 de excitación de...
Reivindicaciones:
1. Un aparato, que comprende:
caracterizado porque la banda de paso de la trayectoria de procesamiento de banda baja se solapa con la banda de paso de la trayectoria de procesamiento de banda alta entre 400 y 1000 Hz aproximadamente.
2. El aparato según la reivindicación 1, en el que dicho segundo codificador de voz está configurado para generar la señal de excitación de banda alta aplicando una función no lineal a una señal que está basada en la señal de excitación de banda baja codificada para generar una señal ensanchada en el espectro, y en el que la señal de excitación de banda alta está basada en la señal ensanchada en el espectro.
3. El aparato según la reivindicación 1, en el que el segundo codificador de voz está configurado para codificar una envolvente de ganancia de la señal de banda alta.
4. El aparato según la reivindicación 3, en el que el segundo codificador de voz está configurado para generar una señal de banda alta sintetizada según la señal de excitación de banda alta y la pluralidad de parámetros de filtro de banda alta, y en el que el segundo codificador de voz está configurado para codificar la envolvente de ganancia en función de la señal de banda alta sintetizada.
5. El aparato según la reivindicación 4, en el que el segundo codificador está configurado para codificar la envolvente de ganancia en función de una relación entre la señal de banda alta y la señal de banda alta sintetizada.
6. El aparato según la reivindicación 1, en el que la banda de paso de la trayectoria de procesamiento de banda baja se solapa con la banda de paso de la trayectoria de procesamiento de banda alta en 500 Hz aproximadamente.
7. El aparato según la reivindicación 1, en el que la banda de paso de la trayectoria de procesamiento de banda baja se solapa con la banda de paso de la trayectoria de procesamiento de banda alta entre 400 y 600 Hz aproximadamente.
8. El aparato según la reivindicación 1, en el que el solapamiento incluye al menos una parte del intervalo de frecuencias comprendido entre 2000 Hz aproximadamente y 5000 Hz aproximadamente.
9. El aparato según la reivindicación 1, en el que el solapamiento incluye al menos una parte del intervalo de frecuencias comprendido entre 3000 Hz aproximadamente y 4000 Hz aproximadamente.
10. El aparato según la reivindicación 1, en el que la señal de voz de banda baja y la señal de voz de banda alta tienen diferentes tasas de muestreo.
11. El aparato según la reivindicación 1, en el que una suma de las tasas de muestreo de la señal de voz de banda baja y de la señal de voz de banda alta no es mayor que la tasa de muestreo de la señal de banda ancha.
12. El aparato según la reivindicación 1, comprendiendo dicho aparato un teléfono celular.
13. El aparato según la reivindicación 1, comprendiendo dicho aparato un dispositivo configurado para transmitir una pluralidad de paquetes compatibles con una versión del protocolo de Internet, donde la pluralidad de paquetes describe la señal de excitación de banda baja codificada, la pluralidad de parámetros de filtro de banda baja y la pluralidad de parámetros de filtro de banda alta.
14. El aparato según la reivindicación 1, en el que:
en el que la segunda parte incluye la parte de la señal de banda ancha entre 4000 y 6000 Hz, y
tanto la señal de voz de banda baja como la señal de voz de banda alta están basadas en una tercera parte del contenido de frecuencia de la señal de banda ancha, incluyendo la tercera parte una parte de la señal de banda ancha entre 3000 y 4000 Hz que presenta un ancho de al menos 400 Hz.
15. El aparato según la reivindicación 14, en el que la señal de voz de banda baja incluye contenido de frecuencia de la primera parte y contenido de frecuencia de la tercera parte, y en el que la señal de voz de banda alta incluye contenido de frecuencia de la segunda parte y contenido de frecuencia de la tercera parte.
16. El aparato según la reivindicación 14, en el que la señal de voz de banda baja y la señal de voz de banda alta presentan diferentes tasas de muestreo.
17. El aparato según la reivindicación 14, en el que una suma de las tasas de muestreo de la señal de voz de banda baja y de la señal de voz de banda alta no es mayor que la tasa de muestreo de la señal de banda ancha.
18. El aparato según la reivindicación 14, comprendiendo dicho aparato un teléfono celular.
19. El aparato según la reivindicación 14, en el que el primer codificador de voz está configurado para codificar la señal de voz de banda baja en al menos una señal de excitación de banda baja codificada y una pluralidad de parámetros de filtro de banda baja, y en el que el segundo codificador de voz está configurado para generar una señal de excitación de banda alta en función de la señal de excitación de banda baja codificada y para codificar la señal de banda alta, según la señal de excitación de banda alta, en al menos una pluralidad de parámetros de filtro de banda alta.
20. El aparato según la reivindicación 19, en el que el segundo codificador de voz está configurado para codificar la señal de banda alta en al menos una pluralidad de parámetros de filtro de banda alta y una pluralidad de factores de ganancia.
21. El aparato según la reivindicación 19, comprendiendo dicho aparato un dispositivo configurado para transmitir una pluralidad de paquetes compatibles con una versión del protocolo de Internet, en el que la pluralidad de paquetes describe la señal de excitación de banda baja codificada, la pluralidad de parámetros de filtro de banda baja y la pluralidad de parámetros de filtro de banda alta.
22. Un procedimiento de procesamiento de señales, comprendiendo dicho procedimiento:
en el que dicha generación de una señal de voz de banda baja incluye generar la señal de voz de banda baja en función de
23. El procedimiento según la reivindicación 22, en el que la primera parte de la señal de banda ancha incluye la parte de la señal de banda ancha entre 1000 y 3000 Hz, y
en el que la segunda parte de la señal de banda ancha incluye la parte de la señal de banda ancha entre 4000 y 6000 Hz, y
en el que la tercera parte incluye una parte de la señal de banda ancha entre 3000 y 4000 Hz que presenta un ancho de al menos 250 Hz.
24. El procedimiento según la reivindicación 22, en el que la señal de voz de banda baja incluye contenido de frecuencia de la primera parte y contenido de frecuencia de la tercera parte, y
en el que la señal de voz de banda alta incluye contenido de frecuencia de la segunda parte y contenido de frecuencia de la tercera parte.
25. El procedimiento según la reivindicación 22, en el que la señal de voz de banda baja y la señal de voz de banda alta presentan diferentes tasas de muestreo.
26. El aparato según la reivindicación 22, en el que una suma de las tasas de muestreo de la señal de voz de banda baja y de la señal de voz de banda alta no es mayor que la tasa de muestreo de la señal de banda ancha.
27. El procedimiento según la reivindicación 22, en el que el primer codificador de voz está configurado para codificar la señal de voz de banda baja en al menos una señal de excitación de banda baja codificada y una pluralidad de parámetros de filtro de banda baja, y en el que el segundo codificador de voz está configurado para generar una señal de excitación de banda alta en función de la señal de excitación de banda baja codificada y para codificar la señal de banda alta, según la señal de excitación de banda alta, en al menos una pluralidad de parámetros de filtro de banda alta.
28. El procedimiento según la reivindicación 22, en el que el segundo codificador de voz está configurado para codificar la señal de banda alta en al menos una pluralidad de parámetros de filtro de banda alta y una pluralidad de factores de ganancia.
Patentes similares o relacionadas:
APARATO Y MÉTODO PARA CALCULAR DATOS DE AMPLIACIÓN DE ANCHO DE BANDA UTILIZANDO UN ENCUADRE CONTROLADO POR PENDIENTE ESPECTRAL, del 13 de Enero de 2012, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda […]
MEJORA DE LA CALIDAD DE AUDIO DECODIFICADO MEDIANTE LA ADICIÓN DE RUIDO, del 14 de Marzo de 2011, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Procedimiento de decodificación de una señal de audio a partir de parámetros (b2) de transformación y una señal (b1) de código generada según un procedimiento […]
METODO Y APARATO PARA DECODIFICAR UNA SEÑAL USANDO REPLICACION DE BANDA ESPECTRAL E INTERPOLACION DE FACTORES DE ESCALA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por […]
APARATO Y METODO PARA AJUSTAR LA ENVOLVENTE ESPECTRAL DE UNA SEÑAL RECONSTRUIDA DE ALTA FRECUENCIA, del 9 de Marzo de 2010, de CODING TECHNOLOGIES AB: Aparato para mejorar un decodificador de fuente, generando el decodificador de fuente una señal decodificada decodificando una señal codificada obtenida por codificación […]
SISTEMA Y PROCEDIMIENTO PARA LA EXPANSION ARTIFICIAL MEJORADA DEL ANCHO DE BANDA, del 20 de Noviembre de 2009, de NOKIA CORPORATION: Un procedimiento para expandir las señales de voz de banda estrecha a señales de voz de banda ancha, comprendiendo el procedimiento: determinar la información del tipo […]
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]