PROCEDIMIENTO PARA LA INTEROPERACIÓN ENTRE CODECS DE LA VOZ DE BANDA ANCHA TASA MÚLTIPLE ADAPTATIVO (AMR-WR) Y DE BANDA ANCHA, TASA DE BITS VARIABLE MODO MÚLTIPLE (VMR-WB).

Un procedimiento para la codificación de una señal de voz usando un códec de banda ancha en modo múltiple tasa de bits variable controlado el origen para la interoperación con un códec de banda ancha de tasa múltiple adaptativo,

comprendiendo el procedimiento: (i) la recepción de una señal de voz de entrada; (ii) la aplicación de una trama de voz derivada de la señal de voz de entrada a una función de detección de la actividad de voz para determinar si la trama de voz es una trama de voz activa que contiene voz activa o una trama de voz inactiva que no contiene voz activa; (iii) cuando se determina que la trama de voz de entrada es una trama de voz inactiva, la determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; (iv) cuando se determina que la trama de voz inactiva se ha de codificar como una trama descriptora del silencio, la codificación de la trama de voz inactiva usando un algoritmo de codificación generador de ruido de confort en cuarto de tasa permitiendo de ese modo a la trama de voz inactiva que se determina que ha de ser codificada como una trama descriptora del silencio sea decodificado por el códec de banda ancha tasa múltiple adaptativo; (v) cuando se determina que la trama de voz inactiva no se ha de codificar como una trama descriptora del silencio, la codificación de la trama de voz inactiva usando un algoritmo de codificación generador de ruido de confort en octavo de tasa por lo que se disminuye una tasa de datos promedio

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CA2003/001572.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4 02150 ESPOO FINLANDIA.

Inventor/es: SALAMI, REDWAN, JELINEK,MILAN.

Fecha de Publicación: .

Fecha Solicitud PCT: 10 de Octubre de 2003.

Clasificación Internacional de Patentes:

  • G10L19/14T

Clasificación PCT:

  • G10L19/14

Clasificación antigua:

  • G10L19/14

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

PDF original: ES-2361154_T3.pdf

 


Fragmento de la descripción:

La presente invención se refiere a la codificación digital de una señal de voz, con vistas a la transmisión y sintetizado de esta señal de sonido.

La demanda de técnicas digitales eficientes para la codificación de la voz en banda estrecha y banda ancha con un buen compromiso entre la calidad subjetiva y la tasa de bits está aumentando en varias áreas de aplicación tales como la teleconferencia, multimedia y comunicaciones inalámbricas. Hasta recientemente, se ha usado principalmente el ancho de banda telefónico restringido a un intervalo de 200-3400 Hz en aplicaciones de codificaciones de la voz. Sin embargo, las aplicaciones de la voz de banda ancha proporcionan una inteligibilidad y naturalidad incrementada en la comunicación comparada con el ancho de banda telefónico convencional. Un ancho de banda en el intervalo 50-7000 Hz se ha hallado como suficiente para proporcionar una buena calidad dando una impresión de comunicación cara a cara. Para señales de audio generales, este ancho de banda da una calidad subjetiva aceptable pero aún es más bajo que la calidad de la radio FM o del CD que funcionan con intervalos de 20

16.000 Hz y 20-20.000 Hz, respectivamente.

Un codificador de la voz convierte una señal de voz en una transmisión digital de bits, que se transmite continuamente a través de un canal de comunicación o se almacena en un medio de almacenamiento. La señal de voz se digitaliza, esto es, se muestrea y cuantifica normalmente con 16 bits por muestra. El codificador de voz tiene el papel de representar estas muestras digitales con un número más pequeño de bits en tanto que mantiene una buena calidad subjetiva de la voz. El decodificador de la voz o sintetizador funciona sobre la transmisión continua de bits transmitida o almacenada y la convierte de vuelta a una señal de sonido.

La Codificación de Predicción Lineal con Excitación por Código (CELP) es una técnica bien conocida que permite conseguir un buen compromiso entre la calidad subjetiva y la tasa de bits. Esta técnica de codificación es una base para varias normas de codificación de la voz tanto en aplicaciones inalámbricas como por línea de cable. En la codificación CELP, la señal de voz muestreada se procesa en bloques sucesivos de L muestras normalmente denominadas tramas, en las que L es un número predeterminado que corresponde típicamente a 10-30 ms. Se calcula un filtro de predicción lineal (LP) y se transmite cada trama. El cálculo del filtro LP necesita típicamente una anticipación, un segmento de voz de 5-15 ms de la trama posterior. La trama de muestra L se divide en bloques más pequeños denominados subtramas. Normalmente el número de subtramas es tres o cuatro dando como resultado subtramas de 4-10 ms. En cada subtrama, se obtiene normalmente una señal de excitación a partir de dos componentes, la excitación pasada y la excitación innovadora, de libro de códigos fijo. El componente formado a partir de la excitación pasada se denomina a menudo como de libro de códigos adaptativo o excitación de tono. Los parámetros que caracterizan a la señal de excitación se codifican y transmiten al decodificador, en donde se usa la señal de excitación reconstruida como la entrada del filtro LP.

En sistemas inalámbricos que usan la tecnología de acceso múltiple por división de código (CDMA), el uso de una codificación de la voz de tasa de bits variable (VBR) controlada en origen mejora significativamente la capacidad del sistema. En la codificación VBR controlada en origen, el códec funciona a varias tasas de bits y se usa el módulo de selección de la tasa para determinar la tasa de bits utilizada para codificar cada trama de la voz en base a la naturaleza de la trama de voz (por ejemplo, sonoro, insonoro, transitorio, ruido de fondo). El objetivo es conseguir la mejor calidad de la voz con una tasa de bits media dada, también denominada, la tasa de datos media (ADR). El códec puede funcionar en diferentes modos mediante el ajuste del módulo de selección de tasa para conseguir diferentes ADR en los diferentes modos, en los que el rendimiento del códec se mejora con ADR incrementados. El modo de funcionamiento se impone por el sistema dependiendo de las condiciones del canal. Esto habilita al códec con un mecanismo de compromiso entre la calidad de la voz y la capacidad del sistema.

Típicamente, en la codificación VBR para sistemas CDMA, se usa un octavo de la tasa para codificar tramas sin actividad de voz (tramas de silencio o sólo con ruido). Cuando la trama es sonora de modo fijo o insonoro fijo, se usa media tasa o cuarto de tasa dependiendo del modo de funcionamiento. Si se puede usar media tasa, se usa el modelo CELP sin el libro de códigos de tono en el caso no sonorizado y se usa la modificación de la señal para mejorar la periodicidad y reducir el número de bits para los índices de tono en el caso sonorizado. Si el modo operativo impone un cuarto de tasa, no es posible normalmente un ajuste de la forma de onda dado que el número de bits es insuficiente y se aplica en general alguna codificación paramétrica. Se usa la tasa completa para las tramas de comienzo, transitorios y tramas sonoras de mezcla (se usa normalmente un modelo CELP típico). Además de la operación del códec controlado en origen en sistemas CDMA, el sistema puede limitar la tasa de bits máxima en alguna trama de la voz para enviar la información de señalización de la banda (denominada señalización dim-and-burst) o durante malas condiciones en el canal (tal como cerca de los límites de la célula) para mejorar la robustez del códec. Esta se denomina como la máxima media tasa. Cuando el módulo de selección de tasa elige la trama para ser codificada como una trama de tasa completa y el sistema impone por ejemplo una trama HR, el rendimiento de la voz se degrada dado que los modos de HR dedicados no son capaces de codificar eficientemente señales de comienzo y transitorias. Se puede proporcionar otro modelo de codificación HR (o de cuarto de tasa (QR)) para manejar estos casos especiales.

Como se puede ver a partir de la descripción anterior, la clasificación de la señal y la determinación de la tasa son muy esenciales para una codificación VBR eficiente. La selección de la tasa es una parte clave para conseguir la tasa de datos media más baja con la mejor calidad posible.

Se ha seleccionado recientemente un códec de voz de banda ancha de tasa múltiple adaptativo (AMR-WB) por la ITU-T (Unión de Telecomunicaciones Internacional - Sector de Normalización de las Telecomunicaciones) para varios servicios y telefonía de voz en banda ancha y por el 3GPP (proyecto de asociación para la tercera generación) para GSM y sistemas inalámbricos de tercera generación W-CDMA. El códec AMR-WB consiste en 9 tasas de bits, concretamente 6,6, 8,85, 12,65, 14,25, 15,85, 18,25, 19,85, 23,05 y 23,85 kbits/s. Es deseable por ello la interoperación entre los códecs CDMA-WB y AMR-WB.

El documento WO-A-01/22402 y la Recomendación G. 722.2 del ITU-T se refieren a la codificación de la voz.

Un objetivo de la presente invención es proporcionar unos procedimientos de clasificación de la señal y de selección de tasa mejorados para una codificación de la voz en banda ancha de tasa variable en general y en particular para proporcionar unos procedimientos de clasificación de la señal y de selección de tasa mejorados para una codificación de la voz en banda ancha modo múltiple tasa variable adecuados para sistemas CDMA. Otro objetivo es proporcionar técnicas para una interoperación eficiente entre el códec VBR de banda ancha para sistemas CDMA y el códec AMR-WB estándar.

La invención se define por las reivindicaciones.

Otros objetivos, ventajas y características de la presente invención serán más evidentes tras la lectura de la siguiente descripción no limitativa de las realizaciones ilustrativas de la misma, dada a modo de ejemplo solamente, con referencia a los dibujos adjuntos.

En los dibujos adjuntos:

la Figura 1 es un diagrama de bloques de un sistema de comunicaciones de voz que ilustra el uso de un dispositivo de codificación y decodificación de la voz de acuerdo con un primer aspecto de la presente invención;

la Figura 2 es un diagrama de flujo que ilustra un procedimiento para la codificación digital de una señal de sonido de acuerdo con una primera realización ilustrativa de un segundo aspecto de la presente invención;

la Figura 3 es un diagrama de flujo que ilustra un procedimiento para discriminar una trama insonora de acuerdo con una realización... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento para la codificación de una señal de voz usando un códec de banda ancha en modo múltiple tasa de bits variable controlado el origen para la interoperación con un códec de banda ancha de tasa múltiple adaptativo, comprendiendo el procedimiento:

(i) la recepción de una señal de voz de entrada;

(ii) la aplicación de una trama de voz derivada de la señal de voz de entrada a una función de detección de la actividad de voz para determinar si la trama de voz es una trama de voz activa que contiene voz activa o una trama de voz inactiva que no contiene voz activa;

(iii) cuando se determina que la trama de voz de entrada es una trama de voz inactiva, la determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo;

(iv) cuando se determina que la trama de voz inactiva se ha de codificar como una trama descriptora del silencio, la codificación de la trama de voz inactiva usando un algoritmo de codificación generador de ruido de confort en cuarto de tasa permitiendo de ese modo a la trama de voz inactiva que se determina que ha de ser codificada como una trama descriptora del silencio sea decodificado por el códec de banda ancha tasa múltiple adaptativo;

(v) cuando se determina que la trama de voz inactiva no se ha de codificar como una trama descriptora del silencio, la codificación de la trama de voz inactiva usando un algoritmo de codificación generador de ruido de confort en octavo de tasa por lo que se disminuye una tasa de datos promedio.

2. Un procedimiento de acuerdo con la reivindicación 1, en el que el algoritmo de codificación generador de ruido de confort en cuarto de tasa se dispone para producir tramas de voz codificadas en cuarto de tasa que tienen un cierto primer número predeterminado de bits menor que el número de bits usados para representar una trama descriptora del silencio para su uso por dicho códec de banda ancha tasa múltiple adaptativo y en el que el algoritmo de codificación del generador de ruido de confort en octavo de tasa se dispone para producir tramas de voz codificadas en octavo de tasa que tienen un cierto segundo número predeterminado de bits menor que el número de bits usados para representar una trama descriptora del silencio para su uso por dicho códec de banda ancha tasa múltiple adaptativo y cuando se determina que la trama de voz inactiva se ha de codificar como una trama descriptora del silencio, la trama de voz inactiva se codifica con un número de bits compatible con una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativa y se transmite como una trama de voz codificada en cuarto de tasa.

3. Un procedimiento de acuerdo con la reivindicación 2, en el que el códec de banda ancha modo múltiple tasa de bits variable comprende un modo de codificación de tasa completa dispuesto para producir tramas de voz codificadas en tasa completa que comprenden un tercer número de bits y un modo de codificación en tasa media dispuesto para producir tramas de voz codificadas en tasa media que tienen un cuarto número de bits menor que dicho tercer número de bits en el que dicho primer número de bits es menor que dicho cuarto número de bits y el segundo número de bits es menor que dicho primer número de bits.

4. Un procedimiento de acuerdo con cualquiera de las reivindicaciones precedentes, en el que el códec de banda ancha en modo múltiple tasa de bits variable se ajusta o bien al conjunto de tasas 1 de CDMA o bien al conjunto de tasas 2 de CDMA.

5. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 3, en el que el códec de banda ancha en modo múltiple tasa de bits variable se ajusta al conjunto de tasas 1 de CDMA.

6. Un procedimiento de acuerdo con cualquiera de las reivindicaciones precedentes, en el que el códec de banda ancha en modo múltiple tasa de bits variable se define de acuerdo con la norma de codificación de voz VMR-WB y el códec de banda ancha tasa múltiple adaptativo se define de acuerdo con la norma de codificación de voz AMR-WB.

7. Un procedimiento de acuerdo con la reivindicación 2, en el que dicho primer número predeterminado de bits es 54 y dicho segundo número predeterminado de bits es 20.

8. Un procedimiento de acuerdo con la reivindicación 3, en el que dicho primer número de bits es 54, dicho segundo número de bits es 20, dicho tercer número de bits es 266 y dicho cuarto número de bits es 124.

9. Un procedimiento de acuerdo con la reivindicación 7, en el que dicho primer número predeterminado de bits corresponde a una tasa de bits de 2,7 kbit/s y dicho segundo número predeterminado de bits corresponde a una tasa de bits de 1,0 kbit/s.

10. Un procedimiento de acuerdo con la reivindicación 3, en el que dicho primer número de bits corresponde a una tasa de bits de 2,7 kbit/s, dicho segundo número de bits corresponde a una tasa de bits de 1,0 kbit/s, dicho tercer número de bits corresponde a una tasa de bits de 13,3 kbit/s y dicho cuarto número de bits corresponde a una tasa de bits de 6,2 kbit/s.

11. Un procedimiento de acuerdo con la reivindicación 7 o la reivindicación 8, en el que cuando se determina que la

trama de voz inactiva se ha de codificar como una trama descriptora del silencio, la trama de voz inactiva se codifica con 35 bits, dejando 19 bits de dicha trama de voz codificada en cuarto de tasa sin usar.

12. Un procedimiento de acuerdo con la reivindicación 2 o la reivindicación 3, en el que el número de bits usado para representar una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo se corresponde a 1,75 kbit/s.

13. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que, cuando tramas de voz de entrada consecutivas que siguen a un periodo de voz activa se determina que son tramas de voz inactivas, formando por lo tanto una secuencia de tramas de voz inactivas, dicha determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio especificando que la primera trama de voz inactiva de dicha secuencia, la cuarta trama de voz inactiva y posteriormente cada octava trama de voz inactiva de dicha secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo.

14. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que cuando tramas de voz de entrada consecutivas que siguen a un periodo de voz activo se determina que son tramas de voz inactivas, formando por lo tanto una secuencia de tramas de voz inactivas, dicha determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio especificando que:

a) la primera trama de voz inactiva de dicha secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; b) las siguientes dos tramas de voz inactivas de dicha secuencia se han de codificar usando el algoritmo de codificación generador de ruido de confort en octavo de tasa; c) la cuarta trama de voz inactiva de dicha secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; d) las siguientes siete tramas de voz inactivas se han de codificar usando dicho algoritmo de codificación generador de ruido de confort en octavo de tasa y la siguiente trama de voz inactiva se ha de codificar como una trama descriptora del silencio y d) se ha de repetir hasta que se detecte una trama de voz activa.

15. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que cuando tramas de voz de entrada consecutivas que siguen a un periodo de voz activa se determina que son tramas de voz inactivas, formando por lo tanto una secuencia de tramas de voz inactivas, dicha determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio especificando que la primera trama de voz inactiva de dicha secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo y posteriormente cada octava trama de voz inactiva de dicha secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo.

16. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que cuando tramas de voz de entrada consecutivas se determina que son tramas de voz inactivas, formando por lo tanto una secuencia de tramas de voz inactivas, dicha determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio especificando que:

a) la primera trama de voz inactiva de dicha secuencia sea de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; y b) las siguientes k tramas de voz inactivas de dicha secuencia se han de codificar usando el algoritmo de codificación de generación de ruido de confort en octavo de tasa y la siguiente trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; y b) se ha de repetir hasta que se detecte una trama de voz activa.

17. Un procedimiento de acuerdo con la reivindicación 16, en el que k es igual a 7.

18. Un procedimiento de acuerdo con cualquiera de las reivindicaciones 1 a 12, en el que cuando tramas de voz de entrada consecutivas que siguen a un periodo de voz activa se determina que son tramas de voz inactivas, formando por lo tanto una secuencia de tramas de voz inactivas, dicha determinación de si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo especificando que una trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo cuando cambian las características del ruido.

19. Un aparato para la codificación de una señal de voz usando un códec de banda ancha en modo múltiple tasa de bit variable controlado en origen para la interoperación con un códec de banda ancha de tasa múltiple adaptativo, comprendiendo el aparato:

- una entrada configurada para recibir una señal de voz;

- un detector de actividad de voz configurado para determinar si una trama de voz derivada de dicha señal de voz se puede clasificar como una trama de voz activa que contiene voz activa o una trama de voz inactiva que

no contiene voz activa;

- una unidad de procesamiento de la trama de voz inactiva configurada para determinar si la trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; y

- una unidad de codificación que responde a la operación de determinación realizada por dicha unidad de procesamiento de la trama inactiva, configurada para codificar la trama de voz inactiva usando un algoritmo de codificación generador del ruido de confort en cuarto de tasa permitiendo de este modo a la trama de voz inactiva que se determina que se ha de codificar como una trama descriptora del silencio que sea codificada por el códec de banda ancha tasa múltiple adaptativo y configurado para codificar la trama de voz inactiva usando un algoritmo de codificación generador de ruido de confort en octavo de tasa cuando se determina que la trama de voz inactiva no se ha de codificar como una trama descriptora del silencio para de ese modo disminuir la tasa de datos promedio.

20. Un aparato de acuerdo con la reivindicación 19, en el que el algoritmo de codificación generador de ruido de confort en cuarto de tasa se configura para producir tramas de voz codificadas en cuarto de tasa que comprenden un cierto primer número predeterminado de bits mayor que el número de bits configurados para representar una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo y en el que el algoritmo de codificación de generador de ruido de confort en octavo de tasa se configura para producir tramas de voz codificadas en octavo de tasa que comprenden un cierto segundo número predeterminado de bits menor que el número de bits configurado para representar una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo, y

la unidad de codificación se configura, en respuesta a una determinación de que la trama de voz inactiva se ha de codificar como una trama descriptora del silencio, para codificar la trama de voz inactiva con un número de bits compatible con una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo y para codificar la trama de voz inactiva para ser transmitida como una trama de voz codificada en cuarto de tasa.

21. Un aparato de acuerdo con una cualquiera de las reivindicaciones 19 y 21, en el que el códec de banda ancha en modo múltiple tasa de bits variable se define de acuerdo con la norma de codificación de la voz VMR-WB y el códec de banda ancha tasa múltiple adaptativo se define de acuerdo con la norma de codificación de la voz AMRWB.

22. Un aparato de acuerdo con cualquiera de las reivindicaciones 19 a 20, en el que la unidad de procesamiento de la trama de voz inactiva se configura además para determinar que la primera trama de voz inactiva de una secuencia de tramas de voz inactivas, la cuarta trama de voz inactiva y posteriormente cada octava trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo.

23. Un aparato de acuerdo con cualquiera de las reivindicaciones 19 a 21, en el que la unidad de procesamiento de la trama de voz inactiva se configura además, en respuesta a una determinación de que una secuencia de tramas de voz de entrada consecutivas que siguen a un período de voz activa son tramas de voz inactivas, para realizar una operación de determinación sobre una trama de voz inactiva de la secuencia para especificar que la trama de voz inactiva se ha de codificar de acuerdo con la siguiente regla:

a) una primera trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; b) las siguientes dos tramas de voz inactivas de la secuencia se han de codificar usando el algoritmo de codificación generador de ruido de confort en octavo de tasa; c) una cuarta trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; d) las siete siguientes tramas de voz inactivas se han de codificar usando el algoritmo de codificación generador de ruido de confort en octavo de tasa y la trama de voz inactiva siguiente se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; y d) se ha de repetir hasta que se detecte una trama de voz activa.

24. Un aparato de acuerdo con cualquiera de las reivindicaciones 19 a 21, en el que la unidad de procesamiento de la trama de voz inactiva se configura además, en respuesta a una determinación de que una secuencia de tramas de voz de entrada consecutivas que siguen a un período de voz activa se determina que son tramas de voz inactivas, para realizar una operación de determinación sobre una trama de voz inactiva de la secuencia para especificar que la trama de voz inactiva se ha de codificar de acuerdo con la siguiente regla:

la primera trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo y posteriormente cada octava trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo.

25. Un aparato de acuerdo con cualquiera de las reivindicaciones 19 a 21, en el que la unidad de procesamiento de la trama de voz inactiva se configura además, en respuesta a una determinación de que una secuencia de tramas de voz de entrada consecutivas se determina que son tramas de voz inactivas, para realizar una operación de determinación sobre una trama de voz inactiva de la secuencia para especificar que la trama de voz inactiva se ha

5 de codificar de acuerdo con la siguiente regla:

a) una primera trama de voz inactiva de la secuencia se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; b) las siguientes k tramas de voz inactivas de la secuencia se han de codificar usando el algoritmo de codificación generador de ruido de confort en octavo de tasa y la siguiente trama de voz inactiva se ha de codificar como una trama descriptora del silencio para su uso por el códec de banda ancha tasa múltiple adaptativo; y b) se ha de repetir hasta que se detecte una trama de voz activa.


 

Patentes similares o relacionadas:

Imagen de 'MEJORAMIENTO DE AUDIO EN DOMINIO CODIFICADO'MEJORAMIENTO DE AUDIO EN DOMINIO CODIFICADO, del 21 de Abril de 2010, de NOKIA CORPORATION: Un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio de señales de audio que comprenden […]

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Imagen de 'Codificador y decodificador de audio para codificar tramas de…'Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .