Método y aparato para la distribución de una sub-trama.

Un método de puesta en tramas, que comprende:

la obtención (21) de un orden de predicción de Codificación de Predicción Lineal LPC y de una altura tonal de una señal;

la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP enfunción del orden de predicción de LPC y de la altura tonal y

la división (23) de las muestras restantes de la señal en varias sub-tramas;

en donde la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo PlazoLTP comprende:

la supresión de una parte del primer número de orden de predicción de LPC de muestras en la cabecera de la señal y delnúmero de muestras de altura tonal siguiente, en donde la parte es un número entero de muestras que varía desde 0 alorden de predicción LPC menos 1.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/CN2009/076309.

Solicitante: HUAWEI TECHNOLOGIES CO., LTD..

Nacionalidad solicitante: China.

Dirección: Huawei Administration Building Bantian Longgang District, Shenzhen Guangdong 518129 CHINA.

Inventor/es: XU,JIANFENG, MIAO,LEI, ZHANG,QING, QI,FENGYAN, ZHANG,DEJUN, LI,LIXIONG, MA,FUWEI.

Fecha de Publicación: 3 de Octubre de 2012.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
G10L19/04 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando técnicas de predicción.
G10L19/08 G10L 19/00 […] › Determinación o codificación de la función de excitación; Determinación de los parámetros de predicción a largo plazo.

PDF original: ES-2395365_T3.pdf

Fragmento de la descripción:

Método y aparato para la distribución de una sub-trama CAMPO DE LA INVENCIÓN

La presente invención se refiere a tecnologías de codificación de voz y en particular, a un método y aparato de puesta en tramas.

ANTECEDENTES DE LA INVENCIÓN

Cuando se procesa, la señal de voz se suele poner en tramas parar reducir la complejidad de cálculo del codec (codificador-decodificador) y el retardo del procesamiento. La señal de voz permanece estable en un segmento temporal después de que se ponga en tramas la señal y los parámetros cambien con lentitud. Por lo tanto, los requisitos tales como la precisión de cuantización se pueden cumplir solamente si la señal se procesa en función de la longitud de trama en la predicción a corto plazo para la señal. Además, cuando una persona articula un sonido, la glotis vibra a una determinada frecuencia y la frecuencia es la altura tonal. Cuando la altura tonal es baja, si la longitud de la trama seleccionada es demasiado grande, pueden existir múltiples alturas tonales diferentes en una sola trama de señal de voz de una trama. En consecuencia, la altura tonal calculada es inexacta. Por lo tanto, una trama necesita dividirse en sub-tramas en promedio.

En algunos campos de compresión sin pérdidas o con pérdidas, para reducir el impacto causado por la pérdida de paquetes en la red sobre la calidad del sonido, la trama actual necesita ser independiente de la trama anterior. Por ejemplo, la norma G.711 Codificación Sin Pérdidas (LLC) especifica que no está permitido utilizar los datos en la memoria intermedia histórica para predecir la señal de la trama actual. Por lo tanto, la primera parte de la señal, en la trama actual, se utiliza para predecir la parte izquierda de la señal en la trama actual. Si la técnica anterior, que divide la trama de señal completa en varias sub-tramas en promedio, se sigue aplicando, pocos datos en las varias sub-tramas en la cabecera son sometidos al análisis de Predicción a Largo Plazo (LTP) . Según se representa en la Figura 1, para la frecuencia de muestreo de 8 kHz y la longitud de trama de 20 ms, una trama se divide en cuatro sub-tramas como promedio y cada sub-trama tiene 40 muestras. Suponiendo que la altura tonal de la primera sub-trama es T[0] = 34, el número de muestras para síntesis mediante el algoritmo de LTP en la primera sub-trama es solamente 40 -34 = 6. Las primeras 34 muestras se tratan como una memorización intermedia histórica de las sub-tramas subsiguientes. De este modo, la ganancia de la primera sub-trama cambia bruscamente con respecto a las sub-tramas subsiguientes y la ganancia calculada de la primera sub-trama es muy diferente de la correspondiente a las sub-tramas siguientes, con lo que surgen inconvenientes operativos para el procesamiento posterior. Si T[0] es mayor que la longitud de sub-trama (tal como T[0] = 60) , incluso se impacta la segunda sub-trama.

El documento US 2008/215317 A1 da a conocer un codec (codificador-decodificador) de audio sin pérdidas que codifica/decodifica un flujo de bits de tasa binaria variable (VBR) sin pérdidas, con capacidad de punto de acceso aleatorio (RAP) para iniciar la decodificación sin pérdidas en un segmento especificado dentro de una trama y/o la capacidad de conjunto de parámetros de predicción múltiples (MPPS) en particiones para mitigar los efectos transitorios. Esta operación se realiza por una técnica de segmentación adaptativa que fija los puntos de partida de segmentos basados en las restricciones impuestas por la existencia de un punto RAP deseado y/o transitorios detectados en la trama y selecciona una duración de segmento óptima en cada trama para reducir la carga útil de tramas codificadas sujetas a una restricción de carga útil del segmento codificado. En general, las restricciones de contorno especifican que un RAP deseado o transitorios detectados deben permanecer dentro de un cierto número de bloques de análisis de un punto de partida de segmentos. En una forma de realización, a modo de ejemplo, en donde los segmentos dentro de una trama sean de la misma duración y de una potencia de dos de la duración de los bloques de análisis, el RAP y/o restricciones de transitorios establecen una duración de segmento máxima para garantizar las condiciones deseadas.

SUMARIO DE LA INVENCIÓN

La presente invención da a conocer un método de puesta en tramas según la reivindicación 1 y un aparato de puesta en tramas según la reivindicación 12 para resolver el problema causado por la puesta en tramas promediada simple en la técnica anterior en donde las ganancias entre sub-tramas son incoherentes.

Según el primer aspecto de la idea inventiva, un método de puesta en tramas comprende:

la obtención de un orden de predicción de codificación de predicción lineal (LPC) y una altura tonal de una señal;

la supresión de muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal y

la división de las muestras restantes de la señal en varias sub-tramas.

Según el segundo aspecto de la idea inventiva, un aparato de puesta en tramas comprende: una unidad de obtención, configurada para obtener un orden de predicción de Codificación de Predicción Lineal (LPC) y

una altura tonal de una señal; una unidad de supresión de muestras, configurada para suprimir las muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal obtenida por la unidad de obtención y

una unidad de puesta en tramas, configurada para dividir las muestras restantes de la señal después de que la unidad de supresión de muestras suprima las muestras inaplicables en varias sub-tramas.

BREVE DESCRIPCIÓN DE LOS DIBUJOS Para hacer más evidente la solución técnica dada a conocer por la presente invención, los dibujos adjuntos para ilustrar las formas de realización de la presente invención se describen a continuación. Evidentemente, los dibujos adjuntos son solamente a modo de ejemplo.

La Figura 1 representa un método de puesta en tramas de promedio en la técnica anterior;

La Figura 2 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente invención; La Figura 3 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente invención;

La Figura 4 representa una instancia operativa del método de puesta en tramas representado en la Figura 3;

La Figura 5 es un diagrama de flujo de otro método de puesta en tramas según una forma de realización de la presente

invención;

La Figura 6 representa una instancia operativa del método de puesta en tramas representado en la Figura 5;

La Figura 7 representa otra instancia operativa del método de puesta en tramas representado en la Figura 5;

La Figura 8 es un diagrama de flujo de otro método de puesta en tramas según una forma de realización de la presente

invención;

La Figura 9 representa una instancia operativa del método de puesta en tramas representado en la Figura 8;

La Figura 10 ilustra una estructura de un aparato de puesta en tramas según una forma de realización de la presente

invención;

La Figura 11 ilustra una estructura de otro aparato de puesta en tramas según una forma de realización de la presente invención;

La Figura 12 ilustra una estructura de otro aparato de puesta en tramas según una forma de realización de la presente

invención y

La Figura 13 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente invención. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La solución técnica dada a conocer por la presente invención se describe a continuación haciendo referencia a los

dibujos adjuntos. Evidentemente, las formas de realización aquí dadas a conocer son solamente a modo de ejemplos y

no son todas las formas de realización de la presente invención. Según se representa en la Figura 2, un método de puesta en tramas, dado a conocer en una forma de realización de la presente invención, incluye las etapas siguientes:

Etapa 21: Obtener un orden de predicción de Codificación de Predicción Lineal (LPC) y una altura tonal de una señal.

Etapa 22: Suprimir las muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal. Etapa 23: Dividir las muestras restantes de la señal en varias sub-tramas.

En la codificación LPC, la predicción de LPC puede ser un modo fijo o un modo adaptativo. El modo fijo significa que el orden de predicción es un número entero fijo (tal como 4, 8, 12 y 16) y se puede seleccionar en función... [Seguir leyendo]

Reivindicaciones:

1. Un método de puesta en tramas, que comprende:

la obtención (21) de un orden de predicción de Codificación de Predicción Lineal LPC y de una altura tonal de una señal;

la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP en función del orden de predicción de LPC y de la altura tonal y

la división (23) de las muestras restantes de la señal en varias sub-tramas;

en donde la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP comprende:

la supresión de una parte del primer número de orden de predicción de LPC de muestras en la cabecera de la señal y del número de muestras de altura tonal siguiente, en donde la parte es un número entero de muestras que varía desde 0 al orden de predicción LPC menos 1.

2. El método según la reivindicación 1, en donde la supresión (22) de las muestras de la señal que son inaplicables a la síntesis de la Predicción a Largo Plazo LTP comprende:

la supresión del número de muestras del orden de predicción LPC en la cabecera de la señal y el número de muestras de altura tonal siguiente que sigue al número de muestras del primer orden de predicción LPC en la cabecera de la señal.

3. El método según la reivindicación 1, en donde la supresión de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP comprende:

la supresión (52) de un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción LPC menos 1 en la cabecera de la señal y el número de muestras de altura tonal siguiente que sigue al número entero aleatorio de muestras.

4. El método según la reivindicación 1, en donde la división de las muestras restantes de la señal en varias sub-tramas comprende:

la determinación (53) del número S de sub-tramas a dividirse en función de la longitud de la señal;

la división (54) del número de muestras restantes de la señal por el valor S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y

la sustracción (55) de la longitud total de las S-1 primeras sub-tramas de las muestras restantes de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.

5. El método según la reivindicación 1, que comprende la realización de una puesta en tramas previa antes de obtener la altura tonal de la señal y la obtención de la altura tonal de la señal que consiste en la obtención de una altura tonal de la primera sub-trama después de la puesta en tramas previa.

6. El método según la reivindicación 5, en donde la puesta en tramas previa comprende:

la utilización de una altura tonal de la señal completa como altura tonal de la primera sub-trama para dividir la trama, de forma adaptativa, con el fin de obtener la longitud de la primera sub-trama y

la determinación de la altura tonal de la primera sub-trama mediante la búsqueda en el intervalo de fluctuación de la altura tonal de la señal.

7. El método según la reivindicación 1, que comprende, además, después de la división de las muestras restantes de la señal en varias sub-tramas:

la búsqueda de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama y

la determinación del punto de comienzo del punto final de cada sub-trama de nuevo en función del orden de predicción LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama.

8. El método según cualquiera de las reivindicaciones 1 a 3 que comprende, además, después de la división de las muestras restantes de la señal en varias sub-tramas:

la búsqueda de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama;

la supresión de las muestras inaplicables a la síntesis LTP de nuevo en función del orden de predicción LPC y de la altura tonal de la primera sub-trama y

la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas.

9. El método de puesta en tramas según la reivindicación 1, que después de la división (143) de las muestras restantes de la señal en varias sub-tramas comprende, además:

la búsqueda (144) de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama;

la determinación (145) del punto de comienzo y del punto final de cada sub-trama de nuevo en función del orden de predicción LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama;

la supresión de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP de nuevo en función del orden de predicción LPC y de la altura tonal de la primera sub-trama y

la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas.

10. El método según la reivindicación 9, en donde la supresión (142) de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP comprenden de nuevo:

la supresión del primer número de muestras del orden de predicción LPC en la cabecera de la señal y del número de muestras de altura tonal de primera sub-trama siguiente que sigue al número de muestras del primer orden de predicción LPC en la cabecera de la señal.

11. El método según la reivindicación 9 o 10, en donde la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas comprende:

la determinación del número S de sub-tramas a dividir en función de la longitud de la señal;

la división del número de muestras restantes recientemente obtenidas de la señal por valor S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y

la substracción de la longitud total de las S-1 primeras sub-tramas a partir de las muestras restantes recientemente obtenidas de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.

12. Un aparato de puesta en tramas, que comprende:

una unidad de obtención (101) , configurada para obtener un orden de predicción de Codificación de Predicción Lineal LPC y una altura tonal de una señal;

una unidad de supresión de muestras (102) , configurada para suprimir las muestras inaplicables a la síntesis de Predicción a Largo Plazo LTP en función del orden de predicción de LPC y de la altura tonal obtenida por la unidad de obtención y

una unidad de puesta en tramas (103) , configurada para dividir las muestras restantes de la señal en varias sub-tramas después de que la unidad de supresión de muestras suprima las muestras inaplicables;

en donde la unidad de supresión de muestras (102) es uno u otro de los siguientes módulos:

un primer módulo de supresión de muestras, configurado parar suprimir el número de muestras del primer orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la señal o un segundo módulo de supresión de muestras, configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción de LPC menos 1 en la cabecera y el número de muestras de la altura tonal de la señal.

13. El aparato según la reivindicación 12, en donde la unidad de puesta en tramas (103) comprende:

un módulo de determinación del número de sub-tramas (131) , configurado para determinar el número S de sub-tramas a dividirse en función de la longitud de la señal;

un módulo de asignación de longitud de sub-trama (132) , configurado para redondear al número entero inferior un cociente de la división de un número por el valor S con el fin de obtener la longitud de cada una de las S-1 primeras subtramas, siendo este número el número de las muestras restantes de la trama de señal después de que la unidad de supresión de muestras realice la supresión y siendo S determinado por el módulo de determinación de número de subtramas y

un último módulo de determinación de longitud de sub-trama (133) , configurado para sustraer una longitud total de las S1 primeras sub-tramas de las muestras restantes de la señal, con el fin de obtener una diferencia como longitud de la Sésima sub-trama.

14. El aparato según una cualquiera de las reivindicaciones 12 o 13 que comprende, además:

una primera unidad de determinación de altura tonal de sub-trama (120) , configurada para buscar el intervalo de fluctuación de la altura tonal de la señal con el fin de determinar la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama obtenida por el módulo de asignación de longitud de sub-trama.

15. El aparato según la reivindicación 14, en donde:

la unidad de supresión de muestras es un tercer módulo de supresión de muestras (123) configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la primera sub-trama siguiente de la señal y

la unidad de puesta en tramas (103) está configurada para determinar el punto de comienzo y el punto final de cada subtrama de nuevo en función de la longitud de cada sub-trama.

16. El aparato según la reivindicación 14, en donde:

la unidad de supresión de muestras es un tercer módulo de supresión de muestras (123) , configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía de 0 al orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la primera sub-trama siguiente de la señal y

la unidad de puesta en tramas (103) está configurada para dividir las muestras restantes de la señal en varias sub-tramas después de que el tercer módulo de supresión de muestras haya efectuado la supresión.

Obtener la orden de predicción LPC lpc_order y la altura tonal T0 de una

trama de señal

Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order-1 en la cabecera de la trama de señal y suprimir las T0 muestras siguientes Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de señal

Dividir las muestras restantes de las señales por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas

Substraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal y la diferencia obtenida es la longitud de la sub-trama S

Obtener la orden de LPC “lpc_order” de una trama de señal y la altura

tonal “T[0]” de la primera sub-trama

Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order en la cabecera de la trama de señal y suprimir las T[0] muestras siguientes Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de trama de señal

Dividir las muestras restantes de las señales por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas Substraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal y la diferencia obtenida es la longitud de la sub-trama S

Unidad de Unidad supresión obtención muestra Unidad puesta en tramas

Módulo determinación número sub-trama Módulo asignación longitud sub-trama

Último módulo determinación longitud sub-trama

Unidad de obtención

Tercer módulo supresión muestra Primera unidad determinación altura tonal subtrama Unidad puesta en tramas

Módulo determinación número sub-trama Módulo asignación longitud sub-trama

Último módulo determinación longitud sub-trama

Obtener la orden de LPC y una altura tonal T0 de señales

Suprimir muestras inaplicables a síntesis de LTP en función del orden de LPC y la altura tonal T0

Dividir las muestras restantes de la señal en varias sub-tramas Buscar la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y determinar la altura tonal T[0] de la primera sub-trama Determinar el punto de comienzo y el punto final de cada sub-trama de nuevo en función de la orden de LPC, la altura tonal de la primera sub-trama y la longitud de cada sub-trama

Buscar la altura tonal de las sub-tramas siguientes a la primera subtrama para obtener la altura tonal de las sub-tramas siguientes Realizar la puesta en tramas adaptativa de nuevo en función de la altura tonal T[0] de la primera sub-trama y obtener la longitud de cada sub-trama

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]