MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Método de conmutación de tasas de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión,

a partir de una señal de código, dos señales, denominadas primera señal (S1) y segunda señal (S2), se proporcionan a la entrada de un módulo de fundido encadenado, siendo al menos una de las señales post-tratada en el momento de una etapa de post-tratamiento, formando el post-tratamiento parte de un conjunto de post-tratamientos adaptados a conjuntos de tasas de transmisión diferentes y porque: - para la detección (401,406) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión comprendido en un primer conjunto de tasas de transmisión y una trama precedente a una tasa de transmisión comprendido en un segundo conjunto de tasas de transmisión, siendo las tasas de transmisión del primer conjunto superiores a los del segundo conjunto, se realiza un fundido encadenado (407) por ponderación, disminuyendo el peso de la segunda señal, posttratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión y aumentando el peso de la primera señal, post-tratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión, para obtener una señal de salida (S3) y - para la detección (401,402) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión comprendido en un segundo conjunto de tasas de transmisión y una trama precedente a una tasa de transmisión comprendido en un primer conjunto de tasas de transmisión, se realiza un fundido encadenado (404) por ponderación, disminuyendo el peso de la primera señal, posttratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión y aumentando el peso de la segunda señal, post-tratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión, para obtener una señal de salida (S3)

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2006/050697.

Solicitante: FRANCE TELECOM.

Nacionalidad solicitante: Francia.

Dirección: 6 PLACE D'ALLERAY 75015 PARIS FRANCIA.

Inventor/es: KOVESI, BALAZS, VIRETTE,DAVID, RAGOT,STEPHANE.

Fecha de Publicación: 8 de Abril de 2011.

Fecha Solicitud PCT: 10 de Julio de 2006.

Clasificación Internacional de Patentes:

G10L19/14A1R
G10L19/14P2

Clasificación PCT:

G01L19/14 FISICA. › G01 METROLOGIA; ENSAYOS. › G01L MEDIDA DE FUERZAS, TENSIONES, PARES, TRABAJO, POTENCIA MECANICA, RENDIMIENTO MECANICO O DE LA PRESION DE LOS FLUIDOS (pesado G01G). › G01L 19/00 Detalles o accesorios de aparatos para la medida de la presión permanente o cuasi-permanente de un medio fluyente en la medida en que estos detalles o accesorios no son especiales de los tipos particulares de manómetros. › Carcasas.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia.

PDF original: ES-2356492_T3.pdf

Ilustración 1 de MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Ilustración 2 de MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Ilustración 3 de MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Ilustración 4 de MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Ver la galería de la patente con 9 ilustraciones.

MÉTODO DE CONMUTACIÓN DE TASA DE TRANSMISIÓN EN DECODIFICACIÓN DE AUDIO ESCALABLE EN TASA DE TRANSMISIÓN Y ANCHO DE BANDA.

Fragmento de la descripción:

La presente invención se refiere a un método de conmutación de tasa de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión y más en particular, un sistema de codificación de audio escalable en tasa de transmisión y posiblemente en ancho de banda. Se refiere, además, a una aplicación de dicho método a un sistema de decodificación de audio escalable en tasa de transmisión y en ancho de banda y un decodificador de audio escalable en tasas de transmisión y en ancho de banda.

La invención encuentra una aplicación particularmente ventajosa en el campo de la transmisión de señales de voz y/o audio en redes de paquetes, de tipo voz sobre IP, con el fin de proporcionar una calidad modulable en función de la capacidad del canal de transmisión.

El método según la invención permite obtener transiciones sin artefactos de comunicación entre las diferentes tasas de transmisión de un codificador/decodificador (codec) de audio escalable en tasa de transmisión y en ancho de banda, más en particular en el caso de las transiciones entre la banda telefónica y la banda ancha dentro del contexto de una codificación de audio escalable en tasa de transmisión y en ancho de banda, con un núcleo en banda telefónica y su post-tratamiento, dependiente dla tasa de transmisión, y una o varias capas de mejora en banda ancha.

De manera habitual, se entiende por “banda telefónica” o “banda estrecha” la banda de frecuencia situada entre 300 y 3400 Hz, mientras que el término de “banda ancha” se reserva a la banda que se escalona de 50 a 7000 Hz.

Actualmente, existen numerosas técnicas para convertir una señal de audiofrecuencias (voz y/o audio) bajo la forma de una señal digital y para tratar las señales así digitalizadas.

Las técnicas más corrientes son los métodos de “codificación de forma de onda”, tales como la codificación MIC o MICDA (PCM o ADPCM, en la terminología inglesa), los métodos de “codificación paramétrica por análisis por síntesis” como la codificación CELP (“Code Excited Linear Prediction”), y los métodos de “codificación perceptual en sub-bandas o por transformada”. Se hace constar que en la codificación CELP en banda estrecha, se utiliza, en general, un post-tratamiento que sirve para mejorar la calidad. Este post-tratamiento comprende, en una realización típica, un post-filtrado adaptativo y un filtro de paso alto. Estas técnicas clásicas de codificación de las señales de audio-frecuencias se describen, por ejemplo, en la obra de WB. Kleijn and K.K. Paliwal editors, Speech Coding and Synthesis, Elsevier, 1995. En la presente invención sólo son de interés las técnicas utilizadas en la transmisión bi-direccional de las señales de audio-frecuencias.

En la codificación de voz convencional, el codificador genera un flujo binario de tasa de transmisión fija Esta limitación de tasa de transmisión fija simplifica la puesta en práctica y la utilización del codificador y del decodificador. Ejemplos de dichos sistemas se proporcionan por la codificación

G.711 a 64 kbits/s o la codificación G.729 a 8 kbits/s.

En algunas aplicaciones, tal como la telefonía móvil, la voz sobre IP, o las comunicaciones en redes ad hoc, es preferible generar un flujo binario de tasa de transmisión variable, tomándose los valores de la tasa de transmisión en un conjunto predefinido. Se distingue varias técnicas de codificación multitasas de transmisión:

- La codificación multi-modos controlada por la fuente y/o el canal, tal como se pone en práctica en los sistemas AMR-NB, AMR-WB, SMV o VMR-WB.

- La codificación jerárquica, llamada también codificación “escalable”, que genera un flujo binario denominado jerárquico porque comprende una tasa de transmisión núcleo y una o varias capas de mejora. El sistema G.722 a 48, 56 y 64 kbits/s es un ejemplo simple de codificación escalable en tasas de transmisión. El codec MPEG-4 CELP es, por sí mismo, escalable en tasa de transmisión y en ancho de banda (T. Nomura et al., A bitrate and bandwidth scalable CELP coder, ICASSP 1998).

- La codificación con descripciones múltiples (A. Gersho, J.D. Gibson, V. Cuperman, H. Dong, A multiple description speech coder based on AMR-WB for mobile ad hoc networks, ICASSP 2004).

En codificación multi-tasas de transmisión, es necesario cerciorarse de que la conmutación de una tasa de transmisión de codificación a otro no implica algunos fallos o artefactos de la comunicación.

La conmutación de tasas de transmisión es fácil de realizar si la codificación se basa, en todas las tasas de transmisión, sobre la representación por un mismo modelo de codificación de una señal de audio en un mismo ancho de banda. Por ejemplo, en el sistema AMR-NB, la señal se define en banda telefónica (300-3400 Hz) y la codificación se basa en el modelo ACELP (“Algebraic Code Excited Linear Prediction”), salvo para la generación de ruido de confort, la cual, no obstante, se realiza por un modelo de tipo LPC (“Linear Predictive Coding”) compatible con el modelo ACELP. Conviene señalar que la codificación AMR-NB utiliza, de forma clásica, un post-tratamiento bajo la forma de un post-filtrado adaptativo y de un filtro de paso alto, dependiendo los coeficientes del post-filtrado adaptativo de la tasa de transmisión de la decodificación. Sin embargo, ha de tomarse alguna precaución para no generar los posibles problemas relacionados con la utilización de parámetros de post-tratamiento, variables según la tasa de transmisión. En cambio, la codificación CELP en banda ancha, de tipo AMR-WB, no utiliza post-tratamiento, esencialmente por razones de complejidad.

La conmutación de tasas de transmisión es todavía más problemática en la codificación de audio escalable en tasa de transmisión y en ancho de banda. En efecto, en este caso, la codificación se basa en modelos y anchos de banda diferentes según la tasa de transmisión.

El concepto básico de la codificación de audio jerárquica se ilustra, por ejemplo, en el artículo de

Y. Hiwasaki, T. Mori, H. Ohmuro, J. lkedo, D. Tokumoto y A. Kataoka, Scalable Speech Coding Technology for High- Quality Ubiquitous Communications, NTT Technical Review, Marzo 2004. En este tipo de codificación, el flujo binario comprende una capa de base y una o varias capas de mejora. La capa de base se genera por un codec de baja tasa de transmisión fija, calificado como “codec núcleo”, que garantiza la calidad minima de la codificación. Esta capa se debe recibir por el decodificador para mantener un nivel de calidad aceptable. Las capas de mejora sirven para mejorar la calidad. Si todas ellas se emiten por el codificador, puede darse el caso, sin embargo, de que no sean todas recibidas por el decodificador. El interés principal de la codificación jerárquica es que permite una adaptación de la tasa de transmisión por simple truncado del flujo binario. El número de capas, es decir el número de truncados posibles del flujo binario, define la granularidad de la codificación. Se denomina codificación de granularidad fuerte si el flujo binario comprende pocas capas, del orden de 2 a 4, permitiendo una codificación de granularidad fina un paso del orden de 1 kbit/s.

En este caso, revisten más interés las técnicas de codificación jerárquica que sean escalables en tasa de transmisión y en ancho de banda, con un codificador núcleo de tipo CELP en banda telefónica y una o varias capa(s) de mejora en banda ancha. Ejemplos de tales sistemas se proporcionan en H. Taddéi et al., A Scalable Three Bitrate (8, 14.2 y 24 kbits/s) Audio Coder; 107th Convention AES, 1999 con una granularidad fuerte de 8, 14.2 y 24 kbits/s, y en B. Kovesi, D. Massaloux, A. Sollaud, A scalable speech and audio coding scheme with continuous bitrate flexibility, ICASSP 2004 con granularidad fina de 6,4 a 32 kbits/s o también la codificación MPEG-4 CELP.

Entre las referencias más pertinentes relacionadas con el problema de la conmutación de tasa de transmisión en el contexto de la codificación de audio escalable en tasa de transmisión y en ancho de banda, se puede citar las solicitudes internacionales WO 01/48931 y WO 02/060075.

Sin embargo, las técnicas descritas en estos dos documentos sólo tratan problemas de interoperabilidad entre redes de comunicación que utilizan codificaciones en banda telefónica y en banda ancha.

En... [Seguir leyendo]

Reivindicaciones:

1. Método de conmutación de tasas de transmisión a la decodificación de una señal de audio codificada por un sistema de codificación de audio multi-tasas de transmisión, a partir de una señal de código, dos señales, denominadas primera señal (S1) y segunda señal (S2), se proporcionan a la entrada de un módulo de fundido encadenado, siendo al menos una de las señales post-tratada en el momento de una etapa de post-tratamiento, formando el post-tratamiento parte de un conjunto de post-tratamientos adaptados a conjuntos de tasas de transmisión diferentes y porque:

- para la detección (401,406) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión comprendido en un primer conjunto de tasas de transmisión y una trama precedente a una tasa de transmisión comprendido en un segundo conjunto de tasas de transmisión, siendo las tasas de transmisión del primer conjunto superiores a los del segundo conjunto, se realiza un fundido encadenado (407) por ponderación, disminuyendo el peso de la segunda señal, post-tratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión y aumentando el peso de la primera señal, post-tratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión, para obtener una señal de salida (S3) y

- para la detección (401,402) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión comprendido en un segundo conjunto de tasas de transmisión y una trama precedente a una tasa de transmisión comprendido en un primer conjunto de tasas de transmisión, se realiza un fundido encadenado (404) por ponderación, disminuyendo el peso de la primera señal, post-tratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión y aumentando el peso de la segunda señal, post-tratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión, para obtener una señal de salida (S3).

2. Método según la reivindicación 1, caracterizado porque uno de los post-tratamientos es un filtro de paso alto(204).

3. Método según la reivindicación 1, caracterizado porque un de los post-tratamientos es un post-filtrado adaptativo (203).

4. Método según la reivindicación 1, caracterizado porque uno de los post-tratamientos es una combinación de un filtro de paso alto y de un post-filtro adaptativo.

5. Método según la reivindicación 1, caracterizado porque una sola señal a la entrada del módulo de fundido encadenado es post-tratada.

6. Método según la reivindicación 1, caracterizado porque las dos señales a la entrada del módulo de fundido encadenado son post-tratadas con post-tratamientos diferentes adaptados a conjuntos de tasas de transmisión diferentes.

7. Programa de ordenador que comprende instrucciones de código para la puesta en práctica del método según una cualquiera de las reivindicaciones 1 a 6 cuando dicho programa se ejecute por un ordenador.

8. Aplicación del método según una cualquiera de las reivindicaciones 1 a 6 a un sistema de decodificación de audio escalable en tasas de transmisión.

9. Aplicación del método según una cualquiera de las reivindicaciones 1 a 6 a un sistema de decodificación de audio escalable en tasas de transmisión y ancho de banda en donde una primera tasa de transmisión se obtiene por al menos una primera capa de decodificación en una primera banda de frecuencias, y una segunda tasa de transmisión se obtiene por una segunda capa de decodificación, denominada capa de extensión de la denominada primera banda de frecuencias en una segunda banda de frecuencias.

10. Decodificador de audio multi-tasas de transmisión, caracterizado porque comprende un módulo de fundido encadenado (205) que recibe, a la entrada, una primera señal (S1) y una segunda señal(S2) obtenidas a partir de una señal decodificada habiendo sufrido, al menos una de las dos señales, un post-tratamiento (203,204) entre un conjunto de post-tratamientos adaptados a conjuntos de tasas de transmisión diferentes, siendo el módulo de fundido encadenado adecuado:

- para la detección (401,406) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión, comprendida en un primer conjunto de tasas de transmisión y una trama precedente a una tasa de transmisión, comprendida en un segundo conjunto de tasas de transmisión, se realiza un fundido encadenado (407) por ponderación, disminuyendo el peso de la segunda señal, post-tratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión y aumentando el peso de la primera señal, post-tratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión, para obtener la señal de salida (S3) del módulo de fundido encadenado y

- para la detección (401,402) de una conmutación de tasa de transmisión entre una trama corriente a una tasa de transmisión, comprendida en un segundo conjunto de tasas de transmisión, y una 5 trama precedente a una tasa de transmisión comprendido en un primer conjunto de tasas de transmisión, se realiza un fundido encadenado (404) por ponderación, disminuyendo el peso de la primera señal, post-tratada o no, según el post-tratamiento adaptado al primer conjunto de tasas de transmisión y aumentando el peso de la segunda señal, post-tratada o no, según el post-tratamiento adaptado al segundo conjunto de tasas de transmisión, para obtener la señal de salida (S3) del módulo de fundido

10 encadenado.

11. Decodificador según la reivindicación 10, caracterizado porque al menos uno de los post-tratamientos es un filtro de paso alto.

12. Decodificador según la reivindicación 10, caracterizado porque al menos uno de los post-tratamientos es un post-filtrado adaptativo.

15 13. Decodificador según la reivindicación 10, caracterizado porque al menos uno de los post-tratamientos es una combinación de un filtro de paso alto y de un post-filtrado adaptativo.

14. Decodificador según la reivindicación 10, caracterizado porque una sola señal a la entrada del módulo de fundido encadenado es post-tratada.

15. Decodificador según la reivindicación 10, caracterizado porque las dos señales a la entrada 20 del módulo de fundido encadenado son post-tratadas con post-tratamientos diferentes adaptados a conjuntos de tasas de transmisión diferentes.

Patentes similares o relacionadas:

CODIFICACION DE AUDIO, del 19 de Enero de 2010, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con un medio para […]

CODEC AUDIO SIN PÉRDIDA ESCALABLE Y HERRAMIENTA DE AUTORÍA, del 19 de Agosto de 2011, de DTS, INC: Un método de codificar y crear datos audio, incluyendo: codificar sin pérdida los datos audio en una secuencia de ventanas de análisis en un flujo de bits escalable; […]

CÓDEC DE AUDIO MULTI-CANAL SIN PÉRDIDAS, del 1 de Agosto de 2011, de DTS, INC: Un método para codificar sin pérdidas datos de audio de PCM, que comprende: poner en bloques la señal de audio multicanal en tramas de igual tiempo de duración; procesar […]

DISPOSITIVO Y MÉTODO PARA EL PROCESAMIENTO POSTERIOR DE VALORES ESPECTRALES Y CODIFICADOR Y DECODIFICADOR PARA SEÑALES DE AUDIO, del 17 de Marzo de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Codificador para codificar una señal de audio, que comprende: un dispositivo para el procesamiento posterior de valores espectrales basándose en un primer […]

VOCODIFICADOR DE VELOCIDAD VARIABLE, del 2 de Diciembre de 2010, de QUALCOMM INCORPORATED: - Un procedimiento de procesamiento de una señal de voz que comprende una pluralidad de tramas, comprendiendo el procedimiento: calcular un nivel de energía […]

CODIFICACION DE AUDIO MULTICANAL AJUSTABLE A ESCALA, del 27 de Octubre de 2010, de KONINKLIJKE PHILIPS ELECTRONICS N.V.: Codificador de audio adaptado para codificar una señal de audio multicanal, comprendiendo el codificador: - un módulo de combinación de […]

METODOS Y DISPOSICIONES PARA UN EMISOR Y RECEPTOR DE CONVERSACION/AUDIO, del 11 de Agosto de 2010, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un emisor de audio/conversación que comprende un codificador de núcleo adaptado a una banda de frecuencia de una señal de audio/conversación […]

CUANTIFICACION DE VECTORES CON UN UNICO LIBRO DE CODIGOS PARA APLICACIONES DE MULTIPLES TASAS DE TRANSMISION, del 2 de Febrero de 2010, de NOKIA CORPORATION: Un procedimiento de cuantificación de vectores representativos de datos de voz/audio, comprendiendo dicho procedimiento: - proporcionar un […]