PROCEDIMIENTO Y APARATO PARA LA CUANTIFICACIÓN VECTORIAL DE UNA REPRESENTACIÓN DE ENVOLVENTE ESPECTRAL.

Un procedimiento para un procesamiento de señales, comprendiendo dicho procedimiento:

codificar una primera trama y una segunda trama de una señal de voz para producir vectores correspondientes primero y segundo, en el que el primer vector representa una envolvente espectral de la señal de voz durante la primera trama y el segundo vector representa una envolvente espectral de la señal de voz durante la segunda trama; generar un primer vector cuantificado, incluyendo dicha generación cuantificar un tercer vector que está basado en el primer vector, calcular un error de cuantificación del primer vector cuantificado; calcular un cuarto vector, incluyendo dicho cálculo añadir una versión a escala del error de cuantificación al segundo vector; y cuantificar el cuarto vector

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2006/012227.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5775 MOREHOUSE DRIVE SAN DIEGO, CA 92121 ESTADOS UNIDOS DE AMERICA.

Inventor/es: VOS,KOEN,BERNARD C/O QUALCOMM INCORPORATED.

Fecha de Publicación: 14 de Febrero de 2011.

Fecha Solicitud PCT: 3 de Abril de 2006.

Clasificación PCT:

G10L19/06 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Determinación o codificación de las características del espectro, p. ej. de los coeficientes de predicción a corto plazo.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.

Fragmento de la descripción:

CAMPO DE LA INVENCIÓN

La presente invención versa acerca un procesamiento de señales.

ANTECEDENTES

Un codificador de voz envía una caracterización de la envolvente espectral de una señal de voz a un decodificador en forma de un vector de frecuencias espectrales de línea (LSF) o una representación similar. Para una transmisión eficaz, se cuantifican estas LSF.

“Error Spectrum Shaping and Vector Quantization”, de Jon Dattorro y Christine Law, publicado en octubre de 1997, demuestra en forma de informe experimental que la información de retorno del error de truncamiento no tiene éxito en la cuantificación de imágenes fijas.

RESUMEN

En un aspecto de la invención, se proporciona un procedimiento para un procesamiento de señales como se expone en la reivindicación 1.

En un aspecto adicional de la invención, se proporciona un aparato para un procesamiento de señales como se expone en la reivindicación 8. También se proporciona un medio legible por ordenador como se expone en la reivindicación 18.

Un cuantificador, según una realización, está configurado para cuantificar un valor aplanado de un valor de entrada (tal como un vector de frecuencias espectrales de línea o una porción de las mismas) para producir un valor correspondiente de salida, basándose el valor aplanado en un factor de escala y en un error de cuantificación de un valor de salida anterior.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La FIGURA 1a muestra un diagrama de bloques de un codificador E100 de voz según una realización.

La FIGURA 1b muestra un diagrama de bloques de un codificador E200 de voz.

La FIGURA 2 muestra un ejemplo de una correspondencia unidimensional llevada a cabo normalmente por medio de un cuantificador escalar.

La FIGURA 3 muestra un ejemplo sencillo de una correspondencia multidimensional según se lleva a cabo por medio de un cuantificador vectorial.

La FIGURA 4a muestra un ejemplo de una señal unidimensional, y la FIGURA 4b muestra un ejemplo de una versión de esta señal después de ser cuantificada.

La FIGURA 4c muestra un ejemplo de la señal de la FIGURA 4a según es cuantificada por un cuantificador 230b, como se muestra en la FIGURA 6.

La FIGURA 4d muestra un ejemplo de la señal de la FIGURA 4a según es cuantificada por un cuantificador 230a, como se muestra en la FIGURA 5.

La FIGURA 5 muestra un diagrama de bloques de una implementación 230a de un cuantificador 230 según una realización.

La FIGURA 6 muestra un diagrama de bloques de una implementación 230b de un cuantificador 230 según una realización.

La FIGURA 7a muestra un ejemplo de un gráfico de amplitud logarítmica en función de la frecuencia para una señal de voz.

La FIGURA 7b muestra un diagrama de bloques de un sistema de codificación de predicción lineal básica.

La FIGURA 8 muestra un diagrama de bloques de una implementación A122 de un codificador A 120 de banda estrecha.

La FIGURA 9 muestra un diagrama de bloques de una implementación B112 de un decodificador B110 de banda estrecha.

La FIGURA 10a es un diagrama de bloques de un codificador A100 de voz de banda ancha.

La FIGURA 10b es un diagrama de bloques de una implementación A102 de un codificador A 100 de voz de banda ancha.

La FIGURA 11a es un diagrama de bloques de un decodificador B100 de voz de banda ancha correspondiente al codificador A100 de voz de banda ancha.

La FIGURA 11b es un ejemplo de un decodificador B102 de voz de banda ancha correspondiente al codificador A102 de voz de banda ancha.

DESCRIPCIÓN DETALLADA

Debido al error de cuantificación, la envolvente espectral reconstruida en el decodificador puede exhibir fluctuaciones excesivas. Estas fluctuaciones pueden producir una calidad “vibrada” inaceptable en la señal decodificada. Las realizaciones incluyen sistemas, procedimientos, y aparatos configurados para llevar a cabo una codificación de alta calidad de voz de banda ancha utilizando una cuantificación de formación de ruido temporal de parámetros de envolvente espectral. Las características incluyen un aplanamiento fijo o adaptable de representaciones de coeficientes, tales como LSF de banda alta. Las aplicaciones particulares descritas en el presente documento incluyen un codificador de voz de banda ancha que combina una señal de banda estrecha con una señal de banda alta.

A no ser que se limite expresamente por su contexto, el término “calcular” se utiliza en el presente documento para indicar cualquiera de sus significados normales, tal como calcular, generar, y seleccionar de una lista de valores. Cuando se utiliza el término “comprender” en la presente invención y en las reivindicaciones, no excluye otros elementos u operaciones. Se utiliza la expresión “A está basado en B” para indicar cualquiera de sus significados normales, incluyendo los casos (i) “A es igual a B” y (ii) “A está basado al menos en B”. La expresión “Protocolo de Internet” incluye la versión 4, según se describe en el IETF (Internet Engineering Task Force) RFC (Request for Comments) 791, y versiones subsiguientes como la versión 6.

Se puede implementar un codificador de voz según un modelo de fuente-filtro que codifica la señal de voz de entrada como un conjunto de parámetros que describen un filtro. Por ejemplo, una envolvente espectral de una señal de voz se caracteriza por un número de picos que representan resonancias del aparato vocal y son denominados formantes. La FIGURA 7a muestra un ejemplo de tal envolvente espectral. La mayoría de los codificadores de voz codifican al menos esta estructura espectral grosera como un conjunto de parámetros, tal como coeficientes del filtro.

La FIGURA 1a muestra un diagrama de bloques de un codificador E100 de voz según una realización. Como se muestra en este ejemplo, se puede implementar el módulo de análisis como un módulo 210 de análisis de codificación de predicción lineal (LPC) que codifica la envolvente espectral de la señal S1 de voz como un conjunto de coeficientes de predicción lineal (LP) (por ejemplo, coeficientes de un filtro todo polos 1/A(z)). Normalmente, el módulo de análisis procesa la señal de entrada como una serie de tramas no solapantes, calculándose un nuevo conjunto de coeficientes para cada trama. En general, el periodo de la trama es un periodo durante el cual se puede esperar que la señal sea estacionaria localmente; un ejemplo común es de 20 milisegundos (equivalente a 160 muestras a una tasa de muestreo de 8 kHz). Un ejemplo de un módulo de análisis de la LPC de banda baja (como se muestra, por ejemplo, en la FIGURA 8 como el módulo 210 de análisis de la LPC) está configurado para calcular un conjunto de diez coeficientes de filtro de LP para caracterizar la estructura formante de cada trama de 20 milisegundos de la señal S20 de banda estrecha, y un ejemplo de un módulo de análisis de la LPC de banda alta (como se muestra, por ejemplo, en la FIGURA 10a como el codificador A200 de banda alta) está configurado para calcular un conjunto de seis (de forma alternativa, ocho) coeficientes de filtro de LP para caracterizar la estructura formante de cada trama de 20 milisegundos de la señal S30 de banda alta. También es posible implementar el módulo de análisis para procesar la señal de entrada como una serie de tramas solapantes.

El módulo de análisis puede estar configurado para analizar las muestras de cada trama directamente, o se pueden ponderar las muestras en primer lugar según una función de ventanas (por ejemplo, una ventana de Hamming). También se puede llevar a cabo el análisis en una ventana que es mayor que la trama, tal como una ventana de 30 mseg. Esta ventana puede ser simétrica (por ejemplo, 5-20-5, de forma que incluya los 5 milisegundos inmediatamente antes y después de la trama de 20 milisegundos) o ser asimétrica (por ejemplo, 10-20, de forma que incluya los últimos 10 milisegundos de la trama precedente). Normalmente, hay un módulo de análisis de LPC configurado para calcular los coeficientes de filtro de LP utilizando una recursión de Levinson-Durbin o el algoritmo de Leroux-Gueguen. En otra implementación, el módulo de análisis puede estar configurado para calcular un conjunto de coeficientes cepstrales para cada trama en vez de un...

Reivindicaciones:

1. Un procedimiento para un procesamiento de señales, comprendiendo dicho procedimiento:

2. El procedimiento según la reivindicación 1, en el que dicho cálculo de un error de cuantificación incluye calcular una diferencia entre el primer vector cuantificado y el tercer vector.

3. El procedimiento según la reivindicación 1, en el que dicho cálculo de un error de cuantificación incluye calcular una diferencia entre el primer vector cuantificado y al menos una porción del primer vector.

4. El procedimiento según la reivindicación 1, incluyendo dicho procedimiento calcular el error de cuantificación a escala, comprendiendo dicho cálculo multiplicar el error de cuantificación por un factor de escala, en el que el factor de escala está basado en una distancia entre al menos una porción del primer vector y una porción correspondiente del segundo vector.

5. El procedimiento según la reivindicación 4, en el que cada uno de entre los vectores primero y segundo incluye una pluralidad de frecuencias espectrales de línea.

6. El procedimiento según la reivindicación 1, en el que cada uno de entre los vectores

primero y segundo incluye una representación de una pluralidad de coeficientes de filtro de predicción lineal.

7. El procedimiento según la reivindicación 1, en el que cada uno de entre los vectores primero y segundo incluye una pluralidad de frecuencias espectrales de línea.

8. Un aparato que comprende:

un medio para codificar una primera trama y una segunda trama de una señal de voz para producir vectores primero y segundo correspondientes, en el que el primer vector representa una envolvente espectral de la señal de voz durante la primera trama y el segundo vector representa una envolvente espectral de la señal de voz durante la segunda trama; un medio para generar un primer vector cuantificado, incluyendo dicha generación cuantificar un tercer vector que está basado en el primer vector; un medio para calcular un error de cuantificación del primer vector cuantificado; y un medio para calcular un cuarto vector, incluyendo dicho cálculo añadir una versión a escala del error de cuantificación al segundo vector, en el que dicho medio para generar un primer vector cuantificado está configurado para cuantificar el cuarto vector.

9. El aparato según la reivindicación 8, en el que:

dicho medio para codificar comprende un codificador de voz; dicho medio para generar comprende un cuantificador; dicho medio para calcular un error de cuantificación del primer vector cuantificado comprende un primer sumador; y dicho medio para calcular un cuarto vector comprende un segundo sumador.

10. El aparato según la reivindicación 9, en el que dicho primer sumador está configurado para calcular el error de cuantificación en base a la diferencia entre el primer vector cuantificado y el tercer vector.

11. El aparato según la reivindicación 9, en el que dicho primer sumador está configurado para calcular el error de cuantificación en base a una diferencia entre el primer vector

cuantificado y al menos una porción del primer vector.

12. El aparato según la reivindicación 9, incluyendo dicho aparato un multiplicador configurado para calcular el error de cuantificación a escala en base a un producto del error de cuantificación y a un factor de escala, en el que dicho aparato incluye lógica configurada para calcular el factor de escala en base a una distancia entre al menos una porción del primer vector y una porción correspondiente del segundo vector.

13. El aparato según la reivindicación 12, en el que cada uno de entre los vectores primero y segundo incluye una pluralidad de frecuencias espectrales de línea.

14. El aparato según la reivindicación 9, en el que cada uno de entre los vectores primero y segundo incluye una representación de una pluralidad de coeficientes de filtro de predicción lineal.

15. El aparato según la reivindicación 9, en el que cada uno de entre los vectores primero y segundo incluye una pluralidad de frecuencias espectrales de línea.

16. El aparato según la reivindicación 9, comprendiendo dicho aparato un dispositivo para comunicaciones inalámbricas.

17. El aparato según la reivindicación 9, comprendiendo dicho aparato un dispositivo configurado para transmitir una pluralidad de paquetes compatibles con una versión del Protocolo de Internet, en el que la pluralidad de paquetes describe el primer vector cuantificado.

18. Un medio legible por ordenador que comprende instrucciones que, tras ser ejecutadas en un procesador, hacen que el procesador lleve a cabo las etapas del procedimiento de una cualquiera de las reivindicaciones 1 a 6.

19. El procedimiento según la reivindicación 1, en el que la segunda trama sigue inmediatamente a la primera trama en la señal de voz.

20. El procedimiento según la reivindicación 1, en el que cada uno de los vectores primero y

segundo representa una envolvente espectral aplanada de forma adaptable.

21. El procedimiento según la reivindicación 1, en el que dicho procedimiento comprende:

descuantificar el cuarto vector; y calcular una señal de excitación en base al cuarto vector descuantificado.

22. El procedimiento según la reivindicación 1, en el que dicho procedimiento comprende filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, y en el que el primer vector representa una envolvente espectral de la señal de voz de banda estrecha durante la primera trama, y en el que el segundo vector representa una envolvente espectral de la señal de voz de banda estrecha durante la segunda trama.

23. El procedimiento según la reivindicación 1, en el que dicho procedimientos comprende filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, y en el que el primer vector representa una envolvente espectral de la señal de voz de banda alta durante la primera trama, y en el que el segundo vector representa una envolvente espectral de la señal de voz de banda alta durante la segunda trama.

24. El procedimiento según la reivindicación 1, en el que dicho procedimiento comprende:

filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, en el que (A) el primer vector representa una envolvente espectral de la señal de voz de banda estrecha durante la primera trama y (B) el segundo vector representa una envolvente espectral de la señal de voz de banda estrecha durante la segunda trama; descuantificar el cuarto vector; en base al cuarto vector descuantificado, calcular una señal de excitación para la señal de voz de banda estrecha; y, en base a la señal de excitación para la señal de voz de banda estrecha, derivar una señal de excitación para la señal de voz de banda alta.

25. El procedimiento según la reivindicación 1, en el que dicha cuantificación del cuarto

vector comprende llevar a cabo una cuantificación del vector de separadores del cuarto vector.

26. El aparato según la reivindicación 8 o 9, en el que la segunda trama sigue inmediatamente a la primera trama en la señal de voz.

27. El aparato según la reivindicación 8 o 9, en el que cada uno de entre los vectores primero y segundo representa una envolvente espectral aplanada de forma adaptable.

28. El aparato según la reivindicación 8 o 9, en el que dicho aparato comprende:

un medio para descuantificar el cuarto vector; y un medio para calcular una señal de excitación en base al cuarto vector descuantificado.

29. El aparato según la reivindicación 8 o 9, en el que dicho aparato comprende un medio para filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, y en el que el primer vector representa una envolvente espectral de la señal de voz de banda estrecha durante la primera trama, y en el que el segundo vector representa una envolvente espectral de la señal de voz de banda estrecha durante la segunda trama.

30. El aparato según la reivindicación 8 o 9, en el que dicho aparato comprende un medio para filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, y en el que el primer vector representa una envolvente espectral de la señal de voz de banda alta durante la primera trama, y en el que el segundo vector representa una envolvente espectral de la señal de voz de banda alta durante la segunda trama.

31. El aparato según la reivindicación 8 o 9, en el que dicho aparato comprende:

un medio para filtrar una señal de voz de banda ancha para obtener una señal de voz de banda estrecha y una señal de voz de banda alta, en el que (A) el primer vector representa una envolvente espectral de la señal de voz de banda estrecha durante la primera trama y (B) el segundo vector representa una envolvente

espectral de la señal de voz de banda estrecha durante la segunda trama; un medio para descuantificar el cuarto vector; un medio para calcular una señal de excitación para la señal de voz de banda estrecha en base al cuarto vector descuantificado; y un medio para derivar una señal de excitación para la señal de voz de banda alta en base a la señal de excitación parra la señal de voz de banda estrecha.

32. El aparato según la reivindicación 8 o 9, en el que dicho medio para generar un primer

vector cuantificado está configurado para cuantificar el cuarto vector al llevar a cabo una 10 cuantificación del vector de separadores del cuarto vector.

Patentes similares o relacionadas:

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Aparato, método, programa y soporte de registro de análisis predictivo lineal, del 13 de Mayo de 2020, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que se puede convertir en un coeficiente predictivo lineal correspondiente a una señal de la serie temporal […]

Aparato de análisis predictivo lineal, método, programa y soporte de registro, del 22 de Abril de 2020, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que puede convertirse en un coeficiente predictivo lineal correspondiente a una señal de serie […]

Predicción basada en modelo en un banco de filtros, del 1 de Enero de 2020, de DOLBY INTERNATIONAL AB: Un método en un decodificador para estimar una muestra de una señal de subbanda a partir de dos o más muestras anteriores de […]

Codificador y método para codificar una señal de audio con ruido de fondo reducido que utiliza codificación predictiva lineal, del 11 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio (8') con ruido de fondo reducido utilizando codificación predictiva lineal, comprendiendo el codificador : […]

Codificación de una señal acústica, del 20 de Noviembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un procedimiento de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un […]

Aparato, método, programa y soporte de registro de análisis predictivo lineal, del 13 de Noviembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de análisis predictivo lineal para obtener un coeficiente que se puede convertir en un coeficiente predictivo lineal correspondiente a una […]

Codificación y descodificación de una señal de sonido, del 25 de Septiembre de 2019, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un dispositivo de codificación de señales de sonido, que comprende: una primera unidad de codificación que está adaptada para obtener un primer […]