Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Un soporte de almacenamiento legible por ordenador que comprende códigos de programa informático que, cuando se ejecutan por un procesador informático, hacen que el procesador informático realice las etapas que consisten en:

obtener

(21) una orden de predicción de Codificación de Predicción Lineal, LPC, y una frecuencia fundamental de una señal;

eliminar el número de muestras de orden de predicción LPC en la cabecera de la señal y el número de muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción LPC en la cabecera de la señal y

dividir (23) muestras restantes de la señal en varias sub-tramas para una síntesis de LTP.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12185319.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: B1-3A, Bantian, Longgang District, Shenzhen Guangdong 518129 CHINA.

Inventor/es: XU,JIANFENG, MIAO,LEI, ZHANG,QING, QI,FENGYAN, ZHANG,DEJUN, LI,LIXIONG, MA,FUWEI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/04 (utilizando técnicas de predicción)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/08 (Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/005 (Corrección de errores producidos por el canal de transmisión, si se refieren al algoritmo de codificación)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/09 (Predicción a largo plazo, p. ej. Eliminando redundancias periódicas, p. ej. utilizando un libro de códigos adaptable o predictor del tono)

PDF original: ES-2509817_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.
Ilustración 2 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.
Ilustración 3 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.
Ilustración 4 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.
Ver la galería de la patente con 9 ilustraciones.
Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Fragmento de la descripción:

Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas CAMPO DE LA INVENCIÓN

La presente Invención se refiere a tecnologías de codificación de la voz y en particular, a un método de asignación de tramas y el aparato asociado.

ANTECEDENTES DE LA INVENCIÓN

Cuando es objeto de procesamiento, la señal de voz se suele establecer en tramas para reducir la complejidad de cálculo de la codificación-decodificación, códec y el retardo del procesamiento. La señal vocal permanece estable en un segmento temporal después del establecimiento de la señal en tramas y los parámetros cambian con lentitud. Por lo tanto, los requisitos, tales como precisión de la cuantificación, pueden cumplirse solamente si la señal se procesa en función de la longitud de trama en la predicción a corto plazo para la señal. Además, cuando alguien realiza una fluctuación de un sonido, la glotis vibra a una determinada frecuencia y dicha frecuencia es la frecuencia fundamental. Cuando la frecuencia fundamental es baja, si la longitud de trama seleccionada es demasiado larga, pueden existir múltiples frecuencias fundamentales diferentes en una trama de señal vocal de una trama. En consecuencia, la frecuencia fundamental calculada es Inexacta. Por lo tanto, una trama necesita dividirse en subtramas por término medio.

En algunos campos de comprensión sin pérdidas o con pérdidas, para reducir el impacto causado por las pérdidas de paquetes en la red sobre la calidad del sonido, la trama actual necesita ser independiente de la trama anterior. A modo de ejemplo, la norma G.711 Codificación Sin Pérdidas (LLC) especifica que no están permitidos los datos en la memoria intermedia de registro histórico para predecir la señal de la trama actual. Por lo tanto, la primera parte de la señal en la trama actual se utiliza para predecir la parte Izquierda de la señal en la trama actual. SI la técnica anterior que divide la trama de señal completa en varias sub-tramas, por término medio, se sigue aplicando, pocos datos en las diversas sub-tramas en la cabecera de la señal se someten a la síntesis de Predicción a Largo Plazo (LTP). Según se ¡lustra en la Figura 1, para la frecuencia de muestreo de 8 kHz y la longitud de trama de 20 ms, una trama se divide en cuatro sub-tramas por término medio y cada sub-trama tiene 40 muestras. Suponiendo que la frecuencia fundamental de la primera sub-trama es T[0] = 34, el número de muestras para síntesis mediante el algoritmo de LTP, en la primera sub-trama es solamente 40 - 34 = 6. Las primeras 34 muestras se tratan como una memoria intermedia de registro histórico de las sub-tramas posteriores. De este modo, la ganancia de la primera sub-trama cambia, de forma brusca, con respecto a las sub-tramas posteriores y la ganancia calculada de la primera sub-trama es bruscamente distinta de la que tienen las sub-tramas posteriores, con lo que se llega a la inconveniencia en el procesamiento posterior. Si T[0] es mayor que la longitud de sub-trama (tal como T[0] = 60) incluso resulta impactada la segunda sub-trama.

El documento US 2008/215317 A1 da a conocer un codificador-decodificador de audio sin pérdidas que codifica/decodifica un flujo de bits de tasa binaria variable (VBR) sin pérdidas con capacidad de puntos de acceso aleatorio (RAP) para iniciar la decodificación, sin pérdidas en un segmento especificado dentro de una trama y/o capacidad de establecimiento de parámetros de predicción múltiples (MPPS) para mitigar los efectos transitorios. Esta operación se realiza por una técnica de segmentación adaptativa que fija los puntos de segmentos sobre la base de las restricciones impuestas por la existencia de un RAP deseado y/o transitorios detectados en la trama y selecciona una duración de segmento óptima en cada trama para reducir la carga útil de tramas codificadas sometida a una restricción de carga útil de segmentos codificados. En general, las restricciones límite especifican que un RAP deseado o transitorio detectado debe estar dentro de un determinado número de bloques de análisis de un punto de inicio de segmento. En una forma de realización, a modo de ejemplo, en donde los segmentos dentro de una trama son de la misma duración y una potencia de dos de la duración del bloque de análisis, las restricciones de RAP y/o transitorios establecen una duración de segmento máxima para garantizar las condiciones deseadas.

SUMARIO DE LA INVENCIÓN

La presente invención da a conocer un método de establecimiento de tramas y su aparato asociado para resolver el problema causado por la formación de tramas de promedio simple en la técnica anterior en el que las ganancias entre sub-tramas son incoherentes.

Según el primer aspecto de la idea inventiva, el soporte de almacenamiento legible por ordenador, que comprende códigos de programa informático que cuando se ejecutan por un procesador informático hacen que el procesador informático realice las etapas como sigue:

la obtención (21) de un orden de predicción de Codificación de Predicción Lineal (LPC) y una frecuencia fundamental de una señal;

la eliminación del número de muestras de orden de predicción de LPC en la cabecera de la señal y el número de

muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción de LPC en la cabecera de la señal y

la división (23) de las muestras restantes de la señal en varias sub-tramas.

Lo descrito anteriormente es un método de formación de tramas y su aparato asociado bajo la presente invención. Aunque la invención ha sido descrita a través de varias formas de realización, a modo de ejemplo, la invención no está limitada a dichas formas de realización.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Para hacer más evidentes las características de la solución técnica bajo la presente invención, se describe a continuación los dibujos adjuntos para ilustrar las formas de realización de la presente invención. Evidentemente, los dibujos adjuntos son para fines ilustrativos, a modo de ejemplo, solamente.

La Figura 1 ilustra un método de formación de tramas en promedio según una forma de realización de la presente invención;

La Figura 2 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención;

La Figura 3 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención;

La Figura 4 ilustra una instancia del método de formación de tramas ilustrado en la Figura 3;

La Figura 5 es un diagrama de flujo de otro método de formación de tramas según una forma de

presente invención;

La Figura 6 ilustra una instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 7 ilustra otra instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 8 es un diagrama de flujo de otro método de formación de tramas según una forma de presente invención;

La Figura 9 ilustra una instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 10 ilustra una estructura de un aparato de formación de tramas según una forma de presente invención;

La Figura 11 ilustra una estructura de otro aparato de formación de tramas según una forma de presente invención;

La Figura 12 ilustra una estructura de otro aparato de formación de tramas según una forma de presente invención y

La Figura 13 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

La solución técnica bajo la presente invención se describe, a continuación, haciendo referencia a los dibujos... [Seguir leyendo]

 


Reivindicaciones:

1. Un soporte de almacenamiento legible por ordenador que comprende códigos de programa informático que, cuando se ejecutan por un procesador informático, hacen que el procesador informático realice las etapas que consisten en:

obtener (21) una orden de predicción de Codificación de Predicción Lineal, LPC, y una frecuencia fundamental de una señal;

eliminar el número de muestras de orden de predicción LPC en la cabecera de la señal y el número de muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción LPC en la cabecera de la señal y

dividir (23) muestras restantes de la señal en varias sub-tramas para una síntesis de LTP.

2. El soporte de almacenamiento legible por ordenador según la reivindicación 1, en donde la división de las muestras restantes de la señal en varias sub-tramas comprende:

determinar (53) el número S de sub-tramas a dividir en función de la longitud de la señal;

dividir (54) el número muestras restantes de la señal por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas y

sustraer (55) la longitud total de las primeras S-1 sub-tramas de las muestras restantes de la señal para obtener una diferencia como la longitud de la S-ésima sub-trama.

3. El soporte de almacenamiento legible por ordenador según la reivindicación 1, que comprende la realización de la preformación de tramas antes de obtener la frecuencia fundamental de la señal;

en donde la obtención de la frecuencia fundamental de la señal es obtener una frecuencia fundamental de la primera sub-trama después de la preformación de tramas.

4. El soporte de almacenamiento legible por ordenador según la reivindicación 3, en donde la preformación de tramas comprende:

la utilización de una frecuencia fundamental de la señal completa como la frecuencia fundamental de la primera sub- trama para dividir la trama, de forma adaptativa, para obtener la longitud de la primera sub-trama y

la determinación de la frecuencia fundamental de la primera sub-trama mediante la búsqueda dentro del margen de fluctuación de la frecuencia fundamental de la señal.

5. El soporte de almacenamiento legible por ordenador según la reivindicación 1, después de dividir las muestras restantes de la señal en varias sub-tramas, comprende, además:

la búsqueda de la frecuencia fundamental de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y la determinación de la frecuencia fundamental de la primera sub-trama; y

la determinación del punto de inicio y del punto final de cada sub-trama de nuevo en función del orden de predicción de LPC, de la frecuencia fundamental de la primera sub-trama y de la longitud de cada sub-trama.

6. El soporte de almacenamiento legible por ordenador según cualquiera de las reivindicaciones 1 a 5, después de dividir las muestras restantes de la señal en varias sub-tramas, que comprende, además:

la búsqueda de la frecuencia fundamental de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y la determinación de la frecuencia fundamental de la primera sub-trama;

la eliminación de las muestras inaplicables a la síntesis de LTP de nuevo en función del orden de predicción de LPC y de la frecuencia fundamental de la primera sub-trama y

la división de las muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas.

7. El soporte de almacenamiento legible por ordenador según la reivindicación 1, después de dividir (143) las muestras restantes de la señal en varias sub-tramas que comprende, además:

la búsqueda (144) de la frecuencia fundamental de la primera sub-trama en función de la longitud de la primera sub- trama entre las diversas sub-tramas y la determinación de la frecuencia fundamental de la primera sub-trama;

la determinación (145) del punto de inicio y del punto final de cada sub-trama de nuevo en función del orden de predicción de LPC, de la frecuencia fundamental de la primera sub-trama y de la longitud de cada sub-trama;

la eliminación de las muestras de la señal que son inaplicables a la síntesis de predicción a largo plazo, LTP, en conformidad con el orden de predicción de LPC y la frecuencia fundamental de la primera sub-trama y

la división de las muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas.

8. El soporte de almacenamiento legible por ordenador según la reivindicación 7, en donde la eliminación (142) de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo (LTP) de nuevo comprende:

la eliminación del primer número de muestras del orden de predicción de LPC en la cabecera de la señal y la eliminación de la frecuencia fundamental siguiente del primer número de muestras de sub-trama que sigue al primer número de muestras de orden de predicción de LPC en la cabecera de la señal.

9. El soporte de almacenamiento legible por ordenador según la reivindicación 7 u 8, en donde la división de muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas comprende:

la determinación del número S de sub-tramas a dividir en función de la longitud de la señal;

la división del número de muestras restantes, recientemente obtenidas, de la señal por el número S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y

la sustracción de la longitud total de las S-1 primeras sub-tramas de las muestras restantes, recientemente obtenidas de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.