Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Un soporte de almacenamiento legible por ordenador que comprende códigos de programa informático que,

cuando se ejecutan por un procesador informático, hacen que el procesador informático realice las etapas que consisten en:

obtener (21) una orden de predicción de Codificación de Predicción Lineal, LPC, y una frecuencia fundamental de una señal;

eliminar el número de muestras de orden de predicción LPC en la cabecera de la señal y el número de muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción LPC en la cabecera de la señal y

dividir (23) muestras restantes de la señal en varias sub-tramas para una síntesis de LTP.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E12185319.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: B1-3A, Bantian, Longgang District, Shenzhen Guangdong 518129 CHINA.

Inventor/es: XU,JIANFENG, MIAO,LEI, ZHANG,QING, QI,FENGYAN, ZHANG,DEJUN, LI,LIXIONG, MA,FUWEI.

Fecha de Publicación: 23 de Julio de 2014.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/005 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Corrección de errores producidos por el canal de transmisión, si se refieren al algoritmo de codificación.
G10L19/02 G10L 19/00 […] › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
G10L19/04 G10L 19/00 […] › utilizando técnicas de predicción.
G10L19/08 G10L 19/00 […] › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.
G10L19/09 G10L 19/00 […] › Predicción a largo plazo, p. ej. Eliminando redundancias periódicas, p. ej. utilizando un libro de códigos adaptable o predictor del tono.

PDF original: ES-2509817_T3.pdf

Ilustración 1 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Ilustración 2 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Ilustración 3 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Ilustración 4 de Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas.

Ver la galería de la patente con 9 ilustraciones.

Fragmento de la descripción:

Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas CAMPO DE LA INVENCIÓN

La presente Invención se refiere a tecnologías de codificación de la voz y en particular, a un método de asignación de tramas y el aparato asociado.

ANTECEDENTES DE LA INVENCIÓN

Cuando es objeto de procesamiento, la señal de voz se suele establecer en tramas para reducir la complejidad de cálculo de la codificación-decodificación, códec y el retardo del procesamiento. La señal vocal permanece estable en un segmento temporal después del establecimiento de la señal en tramas y los parámetros cambian con lentitud. Por lo tanto, los requisitos, tales como precisión de la cuantificación, pueden cumplirse solamente si la señal se procesa en función de la longitud de trama en la predicción a corto plazo para la señal. Además, cuando alguien realiza una fluctuación de un sonido, la glotis vibra a una determinada frecuencia y dicha frecuencia es la frecuencia fundamental. Cuando la frecuencia fundamental es baja, si la longitud de trama seleccionada es demasiado larga, pueden existir múltiples frecuencias fundamentales diferentes en una trama de señal vocal de una trama. En consecuencia, la frecuencia fundamental calculada es Inexacta. Por lo tanto, una trama necesita dividirse en subtramas por término medio.

En algunos campos de comprensión sin pérdidas o con pérdidas, para reducir el impacto causado por las pérdidas de paquetes en la red sobre la calidad del sonido, la trama actual necesita ser independiente de la trama anterior. A modo de ejemplo, la norma G.711 Codificación Sin Pérdidas (LLC) especifica que no están permitidos los datos en la memoria intermedia de registro histórico para predecir la señal de la trama actual. Por lo tanto, la primera parte de la señal en la trama actual se utiliza para predecir la parte Izquierda de la señal en la trama actual. SI la técnica anterior que divide la trama de señal completa en varias sub-tramas, por término medio, se sigue aplicando, pocos datos en las diversas sub-tramas en la cabecera de la señal se someten a la síntesis de Predicción a Largo Plazo (LTP). Según se ¡lustra en la Figura 1, para la frecuencia de muestreo de 8 kHz y la longitud de trama de 20 ms, una trama se divide en cuatro sub-tramas por término medio y cada sub-trama tiene 40 muestras. Suponiendo que la frecuencia fundamental de la primera sub-trama es T[0] = 34, el número de muestras para síntesis mediante el algoritmo de LTP, en la primera sub-trama es solamente 40 - 34 = 6. Las primeras 34 muestras se tratan como una memoria intermedia de registro histórico de las sub-tramas posteriores. De este modo, la ganancia de la primera sub-trama cambia, de forma brusca, con respecto a las sub-tramas posteriores y la ganancia calculada de la primera sub-trama es bruscamente distinta de la que tienen las sub-tramas posteriores, con lo que se llega a la inconveniencia en el procesamiento posterior. Si T[0] es mayor que la longitud de sub-trama (tal como T[0] = 60) incluso resulta impactada la segunda sub-trama.

El documento US 2008/215317 A1 da a conocer un codificador-decodificador de audio sin pérdidas que codifica/decodifica un flujo de bits de tasa binaria variable (VBR) sin pérdidas con capacidad de puntos de acceso aleatorio (RAP) para iniciar la decodificación, sin pérdidas en un segmento especificado dentro de una trama y/o capacidad de establecimiento de parámetros de predicción múltiples (MPPS) para mitigar los efectos transitorios. Esta operación se realiza por una técnica de segmentación adaptativa que fija los puntos de segmentos sobre la base de las restricciones impuestas por la existencia de un RAP deseado y/o transitorios detectados en la trama y selecciona una duración de segmento óptima en cada trama para reducir la carga útil de tramas codificadas sometida a una restricción de carga útil de segmentos codificados. En general, las restricciones límite especifican que un RAP deseado o transitorio detectado debe estar dentro de un determinado número de bloques de análisis de un punto de inicio de segmento. En una forma de realización, a modo de ejemplo, en donde los segmentos dentro de una trama son de la misma duración y una potencia de dos de la duración del bloque de análisis, las restricciones de RAP y/o transitorios establecen una duración de segmento máxima para garantizar las condiciones deseadas.

SUMARIO DE LA INVENCIÓN

La presente invención da a conocer un método de establecimiento de tramas y su aparato asociado para resolver el problema causado por la formación de tramas de promedio simple en la técnica anterior en el que las ganancias entre sub-tramas son incoherentes.

Según el primer aspecto de la idea inventiva, el soporte de almacenamiento legible por ordenador, que comprende códigos de programa informático que cuando se ejecutan por un procesador informático hacen que el procesador informático realice las etapas como sigue:

la obtención (21) de un orden de predicción de Codificación de Predicción Lineal (LPC) y una frecuencia fundamental de una señal;

la eliminación del número de muestras de orden de predicción de LPC en la cabecera de la señal y el número de

muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción de LPC en la cabecera de la señal y

la división (23) de las muestras restantes de la señal en varias sub-tramas.

Lo descrito anteriormente es un método de formación de tramas y su aparato asociado bajo la presente invención. Aunque la invención ha sido descrita a través de varias formas de realización, a modo de ejemplo, la invención no está limitada a dichas formas de realización.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Para hacer más evidentes las características de la solución técnica bajo la presente invención, se describe a continuación los dibujos adjuntos para ilustrar las formas de realización de la presente invención. Evidentemente, los dibujos adjuntos son para fines ilustrativos, a modo de ejemplo, solamente.

La Figura 1 ilustra un método de formación de tramas en promedio según una forma de realización de la presente invención;

La Figura 2 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención;

La Figura 3 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención;

La Figura 4 ilustra una instancia del método de formación de tramas ilustrado en la Figura 3;

La Figura 5 es un diagrama de flujo de otro método de formación de tramas según una forma de

presente invención;

La Figura 6 ilustra una instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 7 ilustra otra instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 8 es un diagrama de flujo de otro método de formación de tramas según una forma de presente invención;

La Figura 9 ilustra una instancia operativa del método de formación de tramas ilustrado en la Figura

La Figura 10 ilustra una estructura de un aparato de formación de tramas según una forma de presente invención;

La Figura 11 ilustra una estructura de otro aparato de formación de tramas según una forma de presente invención;

La Figura 12 ilustra una estructura de otro aparato de formación de tramas según una forma de presente invención y

La Figura 13 es un diagrama de flujo de un método de formación de tramas según una forma de presente invención.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

La solución técnica bajo la presente invención se describe, a continuación, haciendo referencia a los dibujos adjuntos. Evidentemente, las formas de realización aquí dadas a conocer son a modo de ejemplo solamente y no son todas las formas de realización posibles de la presente invención.

Según se ilustra en la Figura 2, un método de formación de tramas dado a conocer, en una forma de realización de la presente invención, incluye las etapas siguientes.

Etapa 21: Obtener un orden de predicción de Codificación de Predicción Lineal (LPC) y una frecuencia fundamental de una señal.

Etapa 22: Eliminar muestras inaplicables a la síntesis de LTP en conformidad con el orden de predicción de LPC y con la frecuencia fundamental.

Etapa 23: Dividir las muestras restantes de la señal en varias sub-tramas.

realización de la realización de la

realización de la

realización de la 8;

realización de la realización de la realización de la realización de la

En la codificación LPC, la predicción de... [Seguir leyendo]

Reivindicaciones:

1. Un soporte de almacenamiento legible por ordenador que comprende códigos de programa informático que, cuando se ejecutan por un procesador informático, hacen que el procesador informático realice las etapas que consisten en:

obtener (21) una orden de predicción de Codificación de Predicción Lineal, LPC, y una frecuencia fundamental de una señal;

eliminar el número de muestras de orden de predicción LPC en la cabecera de la señal y el número de muestras de frecuencia fundamental siguiente que sigue al número de muestras de orden de predicción LPC en la cabecera de la señal y

dividir (23) muestras restantes de la señal en varias sub-tramas para una síntesis de LTP.

2. El soporte de almacenamiento legible por ordenador según la reivindicación 1, en donde la división de las muestras restantes de la señal en varias sub-tramas comprende:

determinar (53) el número S de sub-tramas a dividir en función de la longitud de la señal;

dividir (54) el número muestras restantes de la señal por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas y

sustraer (55) la longitud total de las primeras S-1 sub-tramas de las muestras restantes de la señal para obtener una diferencia como la longitud de la S-ésima sub-trama.

3. El soporte de almacenamiento legible por ordenador según la reivindicación 1, que comprende la realización de la preformación de tramas antes de obtener la frecuencia fundamental de la señal;

en donde la obtención de la frecuencia fundamental de la señal es obtener una frecuencia fundamental de la primera sub-trama después de la preformación de tramas.

4. El soporte de almacenamiento legible por ordenador según la reivindicación 3, en donde la preformación de tramas comprende:

la utilización de una frecuencia fundamental de la señal completa como la frecuencia fundamental de la primera sub- trama para dividir la trama, de forma adaptativa, para obtener la longitud de la primera sub-trama y

la determinación de la frecuencia fundamental de la primera sub-trama mediante la búsqueda dentro del margen de fluctuación de la frecuencia fundamental de la señal.

5. El soporte de almacenamiento legible por ordenador según la reivindicación 1, después de dividir las muestras restantes de la señal en varias sub-tramas, comprende, además:

la búsqueda de la frecuencia fundamental de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y la determinación de la frecuencia fundamental de la primera sub-trama; y

la determinación del punto de inicio y del punto final de cada sub-trama de nuevo en función del orden de predicción de LPC, de la frecuencia fundamental de la primera sub-trama y de la longitud de cada sub-trama.

6. El soporte de almacenamiento legible por ordenador según cualquiera de las reivindicaciones 1 a 5, después de dividir las muestras restantes de la señal en varias sub-tramas, que comprende, además:

la eliminación de las muestras inaplicables a la síntesis de LTP de nuevo en función del orden de predicción de LPC y de la frecuencia fundamental de la primera sub-trama y

la división de las muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas.

7. El soporte de almacenamiento legible por ordenador según la reivindicación 1, después de dividir (143) las muestras restantes de la señal en varias sub-tramas que comprende, además:

la búsqueda (144) de la frecuencia fundamental de la primera sub-trama en función de la longitud de la primera sub- trama entre las diversas sub-tramas y la determinación de la frecuencia fundamental de la primera sub-trama;

la determinación (145) del punto de inicio y del punto final de cada sub-trama de nuevo en función del orden de predicción de LPC, de la frecuencia fundamental de la primera sub-trama y de la longitud de cada sub-trama;

la eliminación de las muestras de la señal que son inaplicables a la síntesis de predicción a largo plazo, LTP, en conformidad con el orden de predicción de LPC y la frecuencia fundamental de la primera sub-trama y

la división de las muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas.

8. El soporte de almacenamiento legible por ordenador según la reivindicación 7, en donde la eliminación (142) de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo (LTP) de nuevo comprende:

la eliminación del primer número de muestras del orden de predicción de LPC en la cabecera de la señal y la eliminación de la frecuencia fundamental siguiente del primer número de muestras de sub-trama que sigue al primer número de muestras de orden de predicción de LPC en la cabecera de la señal.

9. El soporte de almacenamiento legible por ordenador según la reivindicación 7 u 8, en donde la división de muestras restantes, recientemente obtenidas, de la señal en varias sub-tramas comprende:

la determinación del número S de sub-tramas a dividir en función de la longitud de la señal;

la división del número de muestras restantes, recientemente obtenidas, de la señal por el número S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y

la sustracción de la longitud total de las S-1 primeras sub-tramas de las muestras restantes, recientemente obtenidas de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]