CLASIFICACION DE SEÑALES DE AUDIO.

Un codificador (200) que comprende una entrada (201) para el ingreso de tramas de una señal de audio en una banda de frecuencia,

al menos un primer bloque (206) de excitación para llevar a cabo una primera excitación para una señal de audio similar al habla, y un segundo bloque (207) de excitación para llevar a cabo una segunda excitación para una señal de audio similar a la música, caracterizado porque el codificador (200) comprende adicionalmente un filtro (300) para dividir la banda de frecuencia en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, y un bloque (203) de selección de excitación para seleccionar un bloque de excitación entre al menos dicho primer bloque (206) de excitación y dicho segundo bloque (207) de excitación, para llevar a cabo la excitación para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FI2005/050035.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4,02150 ESPOO.

Inventor/es: MAKINEN, JARI, VAINIO, JANNE, OJALA, PASI, MIKKOLA, HANNU.

Fecha de Publicación: .

Fecha Concesión Europea: 27 de Enero de 2010.

Clasificación Internacional de Patentes:

  • G10L19/14A1C

Clasificación PCT:

  • G10L19/08 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.
  • G10L19/14

Clasificación antigua:

  • G10L19/08 G10L 19/00 […] › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.
  • G10L19/14
CLASIFICACION DE SEÑALES DE AUDIO.

Fragmento de la descripción:

Clasificación de señales de audio.

Campo de la invención

La invención se refiere a la codificación de habla y audio, en la cual la modalidad de codificación cambia según que la señal de entrada sea una señal similar al habla o la música. La presente invención se refiere a un codificador que comprende una entrada para ingresar tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque de excitación, para llevar a cabo una primera excitación para una señal de audio similar a la del habla, y un segundo bloque de excitación para llevar a cabo una segunda excitación, para una señal de audio, no de habla. La invención también se refiere a un dispositivo que comprende un codificador, que comprende una entrada para ingresar tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque de excitación para llevar a cabo una primera excitación, para una señal de audio similar al habla, y un segundo bloque de excitación para llevar a cabo una segunda excitación para una señal de audio no de habla. La invención también se refiere a un sistema que comprende un codificador, que comprende una entrada para ingresar tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque de excitación para llevar a cabo una primera excitación para una señal de audio similar al habla, y un segundo bloque de excitación para llevar a cabo una segunda excitación, para una señal de audio no de habla. La invención se refiere adicionalmente a un procedimiento para comprimir señales de audio en una banda de frecuencia, en la cual se utiliza una primera excitación para una señal de audio similar al habla, y una segunda excitación se utiliza para una señal de audio no de habla. La invención se refiere a un módulo para clasificar tramas de una señal de audio en una banda de frecuencia, para la selección de una excitación entre al menos una primera excitación para una señal de audio similar al habla, y una segunda excitación para una señal de audio no de habla. La invención se refiere a un producto de programa de ordenador que comprende etapas ejecutables en una máquina, para comprimir señales de audio en una banda de frecuencia, en el cual se utiliza una primera excitación para una señal de audio similar al habla, y se utiliza una segunda excitación para una señal de audio no de habla.

Antecedentes de la invención

En muchas aplicaciones de procesamiento de audio, las señales de audio se comprimen para reducir los requisitos de potencia de procesamiento al procesar la señal de audio. Por ejemplo, en sistemas de comunicación digital, la señal de audio se captura, habitualmente, como una señal analógica, se digitaliza en un convertidor de analógico a digital (A/D), y se codifica luego antes de la transmisión por una interfaz aérea inalámbrica entre un equipo de usuario, tal como una estación móvil, y una estación base. El propósito de la codificación es comprimir la señal digitalizada y transmitirla por la interfaz aérea, con la cantidad mínima de datos, manteniendo a la vez un nivel aceptable de calidad de señal. Esto es especialmente importante, ya que la capacidad del canal de radio, por la interfaz aérea inalámbrica, está limitada en una red de comunicación celular. También hay aplicaciones en las cuales la señal de audio digitalizada se almacena en un medio de almacenamiento para la reproducción posterior de la señal de audio.

La compresión puede ser con pérdida o sin pérdida. En la compresión con pérdida se pierde alguna información durante la compresión, en donde no es posible reconstruir totalmente la señal original a partir de la señal comprimida. En la compresión sin pérdida, normalmente, no se pierde ninguna información. Por ello, la señal original puede usualmente reconstruirse completamente a partir de la señal comprimida.

La señal terminal de audio se concibe normalmente como una señal que contiene habla, música (no habla), o ambas. La distinta naturaleza del habla y de la música dificulta en cierto grado diseñar un algoritmo de compresión que funcione lo bastante bien tanto para el habla como la música, p. ej., el documento de E. Paksoy et al., "Variable Rate Speech Coding With Phonetic Segmentation" ["Codificación del Habla de Velocidad Variable Con Segmentación Fonética"], Proc. of ICASSP, New York, EE UU, 1993, revela una clasificación de habla/no habla de un códec de habla de velocidad variable. Por lo tanto, el problema se resuelve a menudo diseñando distintos algoritmos tanto para la música como para el habla, y utilizando alguna clase de procedimiento de reconocimiento, para reconocer si la señal de audio es similar al habla o similar a la música, y seleccionar el algoritmo adecuado según el reconocimiento.

En general, distinguir simplemente entre señales de habla, y de música, y no vocales, es una tarea difícil. La precisión requerida depende en gran medida de la aplicación. En algunas aplicaciones la precisión es más crítica, como en el reconocimiento de voz, o en el archivo exacto con fines de almacenamiento y recuperación. Sin embargo, la situación es un poco distinta si la clasificación se emplea para seleccionar el procedimiento óptimo de compresión para la señal de entrada. En este caso, puede ocurrir que no exista un procedimiento de compresión que sea siempre óptimo para el habla y otro procedimiento que sea siempre óptimo para la música y las señales no vocales. En la práctica, puede ser que un procedimiento de compresión para entidades transitorias del habla sea también muy eficiente para entidades transitorias de la música. También es posible que una compresión musical para componentes tonales fuertes pueda ser buena para segmentos de habla vocalizados. Así, en estos casos, los procedimientos para clasificar simplemente entre habla y música no crean el algoritmo más óptimo para seleccionar el mejor procedimiento de compresión.

A menudo el habla puede considerarse como limitada a una banda entre, aproximadamente, 200 Hz y 3400 Hz. La tasa típica de muestreo utilizada por un convertidor A/D (analógico a digital), para convertir una señal analógica de habla en una señal digital es bien de 8 kHz o bien de 16 kHz. La música o las señales no vocales pueden contener componentes de frecuencia bien por encima del ancho de banda del habla normal. En algunas aplicaciones, el sistema de audio debería poder asimilar una banda de frecuencias entre alrededor de 20 Hz y 20.000 kHz. La velocidad de muestreo para esa clase de señales debería ser de al menos 40.000 kHz, para evitar la generación de alias. Debería observarse aquí que los valores anteriormente mencionados son sólo ejemplos no limitadores. Por ejemplo, en algunos sistemas el límite superior para señales de música puede ser de alrededor de 10.000 kHz, o incluso menos de eso.

La señal digital muestreada se codifica luego, usualmente trama a trama, dando como resultado un flujo de datos digitales con una tasa de bits que está determinada por un códec utilizado para la codificación. Cuanto mayor sea la tasa de bits, más datos se codifican, lo que da como resultado una representación más precisa de la trama de entrada. La señal de audio codificada puede descodificarse luego, y pasar a través de un convertidor de digital a analógico (D/A) para reconstruir una señal que esté tan cerca de la señal original como sea posible.

Un códec ideal codificará la señal de audio con tan pocos bits como sea posible, optimizando por ello la capacidad del canal, produciendo a la vez una señal de audio descodificada que suene tan similar a la señal de audio original como sea posible. En la práctica, hay habitualmente una compensación entre la tasa de bits del códec y la calidad del audio descodificado.

Actualmente hay numerosos códecs distintos, tales como el códec adaptable de velocidades múltiples (AMR) y el códec adaptable de velocidades múltiples y banda ancha (AMR-WB), que están desarrollados para comprimir y codificar señales de audio. El códec AMR fue desarrollado por el Proyecto de Asociación de 3ª Generación (3GPP) para las redes de comunicación GSM/EDGE y WCDMA. Además, también se ha vislumbrado que el códec AMR se utilizará en redes conmutadas por paquetes. El códec AMR se basa en la codificación de Predicción Lineal Excitada de Código Algebraico (ACELP). Los códecs de AMR y AMR WB consisten en 8 y 9 tasas activas de bits, respectivamente, y también incluyen funcionalidad de detección de actividad vocal (VAD) y de transmisión discontinua (DTX). De momento, la tasa de muestreo en el códec AMR es de 8 kHz, y en el códec AMR WB la tasa de muestreo es...

 


Reivindicaciones:

1. Un codificador (200) que comprende una entrada (201) para el ingreso de tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque (206) de excitación para llevar a cabo una primera excitación para una señal de audio similar al habla, y un segundo bloque (207) de excitación para llevar a cabo una segunda excitación para una señal de audio similar a la música, caracterizado porque el codificador (200) comprende adicionalmente un filtro (300) para dividir la banda de frecuencia en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, y un bloque (203) de selección de excitación para seleccionar un bloque de excitación entre al menos dicho primer bloque (206) de excitación y dicho segundo bloque (207) de excitación, para llevar a cabo la excitación para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas.

2. El codificador (200) según la reivindicación 1, caracterizado porque dicho filtro (300) comprende un bloque (301) de filtrado para producir información que indica las energías (E(n)) de señal de una trama actual de la señal de audio al menos en una subbanda, y porque dicho bloque (203) de selección de excitación comprende medios de determinación de energía para determinar la información de energía de la señal de al menos una subbanda.

3. El codificador (200) según la reivindicación 2, caracterizado porque están definidos al menos un primero y un segundo grupo de subbandas, conteniendo dicho segundo grupo subbandas de frecuencias mayores que dicho primer grupo, porque está definida una relación (LPH) entre la energía de señal normalizada (LevL) de dicho primer grupo de subbandas y la energía de señal normalizada (LevH) de dicho segundo grupo de subbandas, para las tramas de la señal de audio, y porque dicha relación (LPH) está dispuesta para ser empleada en la selección del bloque (206, 207) de excitación.

4. El codificador (200) según la reivindicación 3, caracterizado porque una o más subbandas de las subbandas disponibles se dejan fuera de dichos grupos primero y segundo de subbandas.

5. El codificador (200) según la reivindicación 4, caracterizado porque la subbanda de las menores frecuencias se deja fuera de dichos grupos primero y segundo de subbandas.

6. El codificador (200) según la reivindicación 3, 4 o 5, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número mayor que dicho primer número, porque dicho bloque (203) de selección de excitación comprende medios de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio utilizando las energías de señal del primer número de tramas, incluyendo la trama actual en cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio utilizando las energías de señal del segundo número de tramas, incluyendo la trama actual en cada subbanda.

7. El codificador (200) según cualquiera de las reivindicaciones 1 a 6, caracterizado porque dicho filtro (300) es un banco de filtrado de un detector (202) de actividad vocal.

8. El codificador (200) según cualquiera de las reivindicaciones 1 a 7, caracterizado porque dicho codificador (200) es un códec de banda ancha adaptable de múltiples velocidades (AMR-WB).

9. El codificador (200) según cualquiera de las reivindicaciones 1 a 8, caracterizado porque dicha primera excitación es una excitación de Predicción Lineal Excitada de Código Algebraico (ACELP) y dicha segunda excitación es una excitación codificada de transformación (TCX).

10. Un dispositivo (700) que comprende un codificador (200) que comprende una entrada (201) para el ingreso de tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque (206) de excitación para llevar a cabo una primera excitación para una señal de audio similar al habla, y un segundo bloque (207) de excitación para llevar a cabo una segunda excitación para una señal de audio similar a la música, caracterizado porque dicho codificador (200) comprende un filtro (300) para dividir la banda de frecuencia en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, porque el dispositivo (700) también comprende un bloque (203) de selección de excitación para seleccionar un bloque de excitación entre al menos dicho primer bloque (206) de excitación y dicho segundo bloque (207) de excitación, para llevar a cabo la excitación para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas.

11. El dispositivo (700) según la reivindicación 10, caracterizado porque dicho filtro (300) comprende un bloque (301) de filtrado para producir información que indica las energías (E(n)) de señal de una trama actual de la señal de audio de al menos una subbanda, y porque dicho bloque (203) de selección de excitación comprende medios de determinación de energía para determinar la información de energía de señal de al menos una subbanda.

12. El dispositivo (700) según la reivindicación 11, caracterizado porque están definidos al menos un primer y un segundo grupo de subbandas, conteniendo dicho segundo grupo subbandas de mayores frecuencias que dicho primer grupo, porque se define una relación (LPH) entre la energía de señal normalizada (LevL) de dicho primer grupo de subbandas y la energía de señal normalizada (LevH) de dicho segundo grupo de subbandas, para las tramas de la señal de audio, y porque dicha relación (LPH) está dispuesta para ser empleada en la selección del bloque (206, 207) de excitación.

13. El dispositivo (700) según la reivindicación 12, caracterizado porque una o más subbandas de las subbandas disponibles se dejan fuera de dichos grupos primero y segundo de subbandas.

14. El dispositivo (700) según la reivindicación 13, caracterizado porque la subbanda de las frecuencias más bajas se deja fuera de dichos grupos primero y segundo de subbandas.

15. El dispositivo (700) según las reivindicaciones 12, 13 o 14, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número mayor que dicho primer número, porque dicho bloque (203) de selección de excitación comprende medios de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio utilizando energías de señal del primer número de tramas, incluyendo la trama actual en cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio utilizando energías de señal del segundo número de tramas, incluyendo la trama actual en cada subbanda.

16. El dispositivo (700) según cualquiera de las reivindicaciones 10 a 15, caracterizado porque dicho filtro (300) es un banco de filtrado de un detector (202) de actividad vocal.

17. El dispositivo (700) según cualquiera de las reivindicaciones 10 a 16, caracterizado porque dicho codificador (200) es un códec de banda ancha adaptable de múltiples velocidades (AMR-WB).

18. El dispositivo (700) según cualquiera de las reivindicaciones 10 a 17, caracterizado porque dicha primera excitación es una excitación de Predicción Lineal Excitada de Código Algebraico (ACELP) y porque dicha segunda excitación es la excitación codificada de transformación (TCX).

19. El dispositivo (700) según cualquiera de las reivindicaciones 10 a 18, caracterizado porque es un dispositivo de comunicación móvil.

20. El dispositivo (700) según cualquiera de las reivindicaciones 10 a 19, caracterizado porque comprende un transmisor para transmitir tramas que incluyen parámetros producidos por el bloque (206, 207) de excitación seleccionado, por un canal de baja velocidad de bits.

21. Un sistema que comprende un codificador (200) que comprende una entrada (201) para el ingreso de tramas de una señal de audio en una banda de frecuencia, al menos un primer bloque (206) de excitación para llevar a cabo una primera excitación para una señal de audio similar al habla, y un segundo bloque (207) de excitación para llevar a cabo una segunda excitación para una señal de audio similar a la música, caracterizado porque dicho codificador (200) comprende adicionalmente un filtro (300) para dividir la banda de frecuencias en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, porque el sistema también comprende un bloque (203) de selección de excitación para seleccionar un bloque de excitación entre al menos dicho primer bloque (206) de excitación y dicho segundo bloque (207) de excitación, para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas.

22. El sistema según la reivindicación 21, caracterizado porque dicho filtro (300) comprende un bloque (301) de filtrado para producir información que indica las energías (E(n)) de señal de una trama actual de la señal de audio de al menos una subbanda, y porque dicho bloque (203) de selección de excitación comprende medios de determinación de energía para determinar la información de energía de señal de al menos una subbanda.

23. El sistema según la reivindicación 22, caracterizado porque se definen al menos un primer y un segundo grupo de subbandas, conteniendo dicho segundo grupo subbandas de frecuencias mayores que dicho primer grupo, porque se define una relación (LPH) entre la energía de señal normalizada (LevL) de dicho primer grupo de subbandas y la energía de señal normalizada (LevH) de dicho segundo grupo de subbandas para las tramas de la señal de audio, y porque dicha relación (LPH) está dispuesta para ser utilizada en la selección del bloque (206, 207) de excita- ción.

24. El sistema según la reivindicación 23, caracterizado porque una o más subbandas de las subbandas disponibles se dejan fuera de dichos grupos primero y segundo de subbandas.

25. El sistema según la reivindicación 24, caracterizado porque la subbanda de las frecuencias inferiores se deja fuera de dichos grupos primero y segundo de subbandas.

26. El sistema según las reivindicaciones 23, 24 o 25, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número mayor que dicho primer número, porque dicho bloque (203) de selección de excitación comprende medios de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio, utilizando energías de señal del primer número de tramas, incluyendo la trama actual de cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio, utilizando energías de señal del segundo número de tramas, incluyendo la trama actual en cada subbanda.

27. El sistema según cualquiera de las reivindicaciones 21 a 26, caracterizado porque dicho filtro (300) es un banco de filtrado de un detector (202) de actividad vocal.

28. El sistema según cualquiera de las reivindicaciones 21 a 27, caracterizado porque dicho codificador (200) es un códec de banda ancha adaptable de múltiples velocidades (AMR-WB).

29. El sistema según cualquiera de las reivindicaciones 21 a 28, caracterizado porque dicha primera excitación es una excitación de Predicción Lineal Excitada de Código Algebraico (ACELP) y dicha segunda excitación es una excitación codificada de transformación (TCX).

30. El sistema según cualquiera de las reivindicaciones 21 a 29, caracterizado porque es un dispositivo de comunicación móvil.

31. El sistema según cualquiera de las reivindicaciones 21 a 30, caracterizado porque comprende un transmisor para transmitir tramas que incluyen parámetros producidos por el bloque (206, 207) de excitación seleccionado, por un canal de baja velocidad de bits.

32. Un procedimiento para comprimir señales de audio en una banda de frecuencia, en el cual se utiliza una primera excitación para una señal de audio similar al habla, y se utiliza una segunda excitación para una señal de audio similar a la música, caracterizado porque la banda de frecuencia se divide en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, y porque se selecciona una excitación entre al menos dicha primera excitación y dicha segunda excitación para llevar a cabo la excitación para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas.

33. El procedimiento según la reivindicación 32, caracterizado porque dicho filtro (300) comprende un bloque (301) de filtrado para producir información que indica las energías (E(n)) de señal de una trama actual de la señal de audio de al menos una subbanda, y porque dicho bloque (203) de selección de excitación comprende medios de determinación de energía para determinar la información de energía de señal de al menos una subbanda.

34. El procedimiento según la reivindicación 33, caracterizado porque se definen al menos un primer y un segundo grupo de subbandas, conteniendo dicho segundo grupo subbandas de frecuencias mayores que dicho primer grupo, porque se define una relación (LPH) entre la energía de señal normalizada (LevL) de dicho primer grupo de subbandas y la energía de señal normalizada (LevH) de dicho segundo grupo de subbandas, para las tramas de la señal de audio, y porque dicha relación (LPH) está dispuesta para ser utilizada en la selección del bloque (206, 207) de excita- ción.

35. El procedimiento según la reivindicación 34, caracterizado porque una o más subbandas de las subbandas disponibles se dejan fuera de dichos grupos primero y segundo de subbandas.

36. El procedimiento según la reivindicación 35, caracterizado porque la subbanda de frecuencias más bajas se deja fuera de dichos grupos primero y segundo de subbandas.

37. El procedimiento según las reivindicaciones 34, 35 o 36, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número mayor que dicho primer número, porque dicho bloque (203) de selección de excitación comprende medios de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio, utilizando energías de señal del primer número de tramas, incluyendo la trama actual en cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio, utilizando energías de señal del segundo número de tramas, incluyendo la trama actual en cada subbanda.

38. El procedimiento según cualquiera de las reivindicaciones 32 a 37, caracterizado porque dicho filtro (300) es un banco de filtrado de un detector (202) de actividad vocal.

39. El procedimiento según cualquiera de las reivindicaciones 32 a 38, caracterizado porque dicho codificador (200) es un códec de banda ancha adaptable de múltiples velocidades (AMR-WB).

40. El procedimiento según cualquiera de las reivindicaciones 32 a 39, caracterizado porque dicha primera excitación es una excitación de Predicción Lineal Excitada de Código Algebraico (ACELP) y dicha segunda excitación es una excitación codificada de transformación (TCX).

41. El procedimiento según cualquiera de las reivindicaciones 32 a 40, caracterizado porque las tramas que incluyen parámetros producidos por la excitación seleccionada se transmiten por un canal de baja velocidad de bits.

42. Un módulo para clasificar tramas de una señal de audio en una banda de frecuencia, para la selección de una excitación entre el menos una primera excitación para una señal de audio similar al habla, y una segunda excitación para una señal de audio similar a la música, caracterizado porque el módulo comprende adicionalmente una entrada para ingresar información que indica la banda de frecuencia, dividida en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, y un bloque (203) de selección de excitación para seleccionar un bloque de excitación entre al menos dicho primer bloque (206) de excitación y dicho segundo bloque (207) de excitación, para llevar a cabo la excitación para una trama de la señal de audio, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas.

43. El módulo según la reivindicación 42, caracterizado porque se definen al menos un primer y un segundo grupo de subbandas, conteniendo dicho segundo grupo subbandas de mayores frecuencias que dicho primer grupo, porque se define una relación (LPH) entre la energía de señal normalizada (LevL) de dicho primer grupo de subbandas y la energía de señal normalizada (LevH) de dicho segundo grupo de subbandas, para las tramas de la señal de audio, y porque dicha relación (LPH) está dispuesta para ser utilizada en la selección del bloque (206, 207) de excitación.

44. El módulo según la reivindicación 43, caracterizado porque una o más subbandas de las subbandas disponibles se dejan fuera de dichos grupos primero y segundo de subbandas.

45. El módulo según la reivindicación 44, caracterizado porque la subbanda de frecuencias inferiores se deja fuera de dichos grupos primero y segundo de subbandas.

46. El módulo según las reivindicaciones 43, 44 o 45, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número mayor que dicho primer número, porque dicho bloque (203) de selección de excitación comprende medios de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio, utilizando energías de señal del primer número de tramas, incluyendo la trama actual en cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio, utilizando energías de señal del segundo número de tramas, incluyendo la trama actual de cada subbanda.

47. Un producto de programa de ordenador que comprende etapas ejecutables por máquina, para comprimir señales de audio en una banda de frecuencia, en el cual se utiliza una primera excitación para una señal de audio similar al habla, y se utiliza una segunda excitación para una señal de audio similar a la música, caracterizado porque el producto de programa de ordenador comprende adicionalmente etapas ejecutables por máquina para dividir la banda de frecuencia en una pluralidad de subbandas, teniendo cada una un ancho de banda más estrecho que dicha banda de frecuencia, y etapas ejecutables por máquina para seleccionar una excitación entre al menos dicha primera excitación y dicha segunda excitación, sobre la base de las propiedades de la señal de audio de al menos una de dichas subbandas, para llevar a cabo la excitación para una trama de la señal de audio.

48. El producto de programa de ordenador según la reivindicación 47, caracterizado porque comprende adicionalmente etapas ejecutables por máquina para producir información que indica las energías (E(n)) de señal de una trama actual de la señal de audio de al menos una subbanda, y etapas ejecutables por máquina para determinar la información de energía de señal de al menos una subbanda.

49. El producto de programa de ordenador según la reivindicación 48, caracterizado porque se definen un primer número de tramas y un segundo número de tramas, siendo dicho segundo número de tramas mayor que dicho primer número, porque el producto de programa de ordenador comprende adicionalmente etapas ejecutables por máquina de un medio de cálculo para calcular un primer valor (stdpcorta) de desviación estándar promedio, utilizando energías de señal del primer número de tramas, incluyendo la trama actual en cada subbanda, y para calcular un segundo valor (stdplarga) de desviación estándar promedio, utilizando energías de señal del segundo número de tramas, incluyendo la trama actual en cada subbanda.

50. El producto de programa de ordenador según cualquiera de las reivindicaciones 47 a 49, caracterizado porque comprende adicionalmente etapas ejecutables por máquina para llevar a cabo la excitación de Predicción Lineal Excitada de Código Algebraico (ACELP) como dicha primera excitación, y etapas ejecutables por máquina para llevar a cabo la excitación codificada de transformación (TCX) como dicha segunda excitación.


 

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Imagen de 'Codificador y decodificador de audio para codificar tramas de…'Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .