PROCEDIMIENTO DE TRANSMISIÓN DE UN FLUJO DE INFORMACIÓN POR INSERCIÓN EN EL INTERIOR DE UN FLUJO DE DATOS DE VOZ, Y CODEC PARAMÉTRICO PARA SU IMPLEMENTACIÓN.
Procedimiento de transmisión de un flujo de información secundaria (DS2) entre un emisor y un receptor,
que comprende la inserción de dicho flujo de información secundaria al nivel de un vocodificador paramétrico (100) del emisor que genera un flujo de información principal (DS1) que es un flujo de datos de voz que codifica una señal de voz (VS1) y que se transmite desde el emisor al receptor, según el cual unos bits del flujo de información secundaria se insertan: - en solamente algunas de las tramas (F[i]) del flujo de información principal, seleccionadas por una máscara de tramas conocida por el emisor y por el receptor; y - en el interior de una trama seleccionada del flujo de información principal, en posiciones predefinidas imponiendo una condición a solamente algunos de los bits de la trama, seleccionados por una máscara de bits conocida por el emisor y por el receptor; según el cual la máscara de tramas define una subserie (SF[m]) de grupos de tramas consecutivas en cada una de las cuales se insertan bits del flujo de información secundaria; y la longitud en número de tramas (M) de un grupo de tramas consecutivas es sensiblemente igual a la profundidad de memorización de las tramas en el vocodificador paramétrico
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2004/002259.
Solicitante: EADS SECURE NETWORKS.
Nacionalidad solicitante: Francia.
Dirección: 1, Boulevard Jean Moulin ZAC de la Clef Saint Pierre 78990 Elancourt.
Inventor/es: ROUSSEAU, FREDERIC.
Fecha de Publicación: .
Fecha Solicitud PCT: 6 de Septiembre de 2004.
Fecha Concesión Europea: 13 de Octubre de 2010.
Clasificación Internacional de Patentes:
- G10L19/14
Clasificación PCT:
- G10L19/14
- H04L9/12 ELECTRICIDAD. › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS. › H04L TRANSMISION DE INFORMACION DIGITAL, p. ej. COMUNICACION TELEGRAFICA (disposiciones comunes a las comunicaciones telegráficas y telefónicas H04M). › H04L 9/00 Disposiciones para las comunicaciones secretas o protegidas. › Dispositivos de cifrado de emisión y de recepción sincronizados o inicializados de manera especial.
Clasificación antigua:
- G10L19/14
- H04L9/12 H04L 9/00 […] › Dispositivos de cifrado de emisión y de recepción sincronizados o inicializados de manera especial.
Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre.
Fragmento de la descripción:
La presente invención se refiere de manera general al campo de la codificación de voz, y en particular a un procedimiento de inserción de un flujo de información en el interior de un flujo de datos de voz, pudiendo el flujo de información insertado ser un flujo de datos de voz a un rendimiento más débil o un flujo de datos transparentes. La invención encuentra aplicaciones, en particular, en los sistemas de radiocomunicación móvil públicos o 5 profesionales (sistemas PMR, del inglés “Professional Mobile Radiocommunication”). Se denomina señal de voz a una señal acústica emitida por un aparato vocal humano. Se denomina codec a una unidad material y/o software de codificación y de descodificación de un flujo digital. Su función de codificación permite transcodificar un flujo digital de muestras cuantificadas en el ámbito temporal de una señal de voz en un flujo digital comprimido. Su función de descodificación permite efectuar una 10 operación seudoinversa en el objetivo de restituir atributos representativos de la señal fuente, por ejemplo atributos perceptibles en un receptor tal como la oreja humana. Un flujo de datos de voz es un flujo de datos generados por un codec de voz, a partir de la codificación de una señal de voz. Un flujo de datos transparentes es una serie digital binaria cuyo tipo de contenido no se especifica, bien sea efectivamente un flujo de datos informáticos o un flujo de datos de voz. Los datos se 15 denominan transparentes en el sentido en que, desde un punto de vista externo, todos los bits tienen una importancia igual respecto de, por ejemplo, la corrección de los errores de transmisión de manera que una codificación correctora de errores debe ser por lo tanto uniforme sobre el conjunto de los bits. Por el contrario, si el flujo es un flujo de datos de voz, algunos bits son más importantes a proteger que otros. Un codec de voz, también denominado vocodoficador (en inglés “Vocoder” “Speech Codec” o “Voice 20 Codec”) es un codec especializado que está adaptado a la codificación de una señal de voz cuantificada y a la descodificación de un flujo de tramas de palabras. En particular, presenta parta su función de codificación una sensibilidad que depende de las características de la voz del locutor y una baja velocidad binaria asociada a una banda de frecuencias más limitada que la banda de frecuencias de audio general (20 Hz-kHz). Existen varias familias de técnicas de codificación de voz, especialmente técnicas de codificación de la 25 forma de onda de la señal de voz (por ejemplo la codificación ITU-T G.711 MIC ley A/mu), técnicas de codificación de modelo de fuente (siendo la más conocida la codificación CELP, del inglés “Code-Excited Linear Prediction”), codificaciones perceptuales , y técnicas híbridas fundadas sobre la combinación de técnicas pertenecientes a al menos dos de las familias anteriores. La invención apunta la aplicación a técnica de codificación “de modelo de fuente”. Estas técnicas también 30 denominadas técnicas de codificación paramétricas, ya que se basan en la representación de parámetros de excitación de la fuente de voz y/o parámetros que describen la envoltura espectral de la señal emitida por el locutor (por ejemplo según un modelo de codificación por predicción lineal que utilizan la correlación entre los valores consecutivos de los parámetros asociados a un filtro de síntesis, o también según un modelo espectral) y/o de parámetros acústicos dependientes de la fuente, por ejemplo la amplitud y la frecuencia central fundamental 35 percibida (“Pitch” en inglés), el periodo (“Pitch period” en inglés) y la amplitud de los picos de energía de los primeros harmónicos de una frecuencia de pitch de diferentes intervalos, su grado de sonorización (“voicing rate” en inglés), su melodía y sus encadenamientos. Se denomina vocodificador paramétrico un vocodificador que aplica una codificación digital de la voz utilizando un modelo paramétrico de la fuente de voz. En la práctica, tal vocodificador asocia varios parámetros a 40 cada trama del flujo de voz. En primer lugar, unos parámetros espectrales de predicción lineal también denominados, por ejemplo, coeficientes LP (del inglés “Linear Prediction” o coeficientes LPC (del inglés “Lineal Prediction Coding”) que definen el filtro de predicción lineal del vocodificador (filtro a corto lazo). En segundo lugar, unos parámetros de excitación adaptativa asociados a uno (o varios) vector(es) de excitación adaptativa, también denominados parámetros LTP (del inglés “Long Term Predictor”) o también coeficientes de predicción adaptativa, 45 que definen un filtro a largo plazo en forma de un primer vector de excitación y de una ganancia asociada a aplicar en la entrada del filtro de síntesis. Y en tercer lugar, unos parámetros de excitación fijada asociados a uno (o barios) vector(es) de excitación fija, también denominados parámetros algebraicos o parámetros estocásticos que definen un segundo vector de excitación y una ganancia asociada a aplicar en la entrada de un filtro de síntesis.
Por el documento EP-A-1 020 848, se conoce un procedimiento para transmitir información auxiliar en un 50 flujo de información principal que corresponde a una señal de voz, siendo dicha información auxiliar insertada al nivel del vocodificador CELP que codifica la señal de voz en sustitución del índice del vector de excitación fija. Más específicamente, los bits de información auxiliar se insertan en el vocodificador del emisor en lugar de los bits que codifican normalmente el índice correspondiente, y el valor de la ganancia se pone a cero con el fin de informar al
vocodificador del receptor. Según un inconveniente, la inserción de un flujo de información auxiliar en el flujo no es discreta, en el sentido en que basta constatar el valor nulo de la ganancia para saber que los bits normalmente asignados a la codificación del índice asociado contienen de hecho la información auxiliar. Esto se considera como un inconveniente para la aplicación del procedimiento en un sistema en el cual la confidencialidad de las transmisiones 5 es importante. El documento US 2001/038643 divulga un procedimiento de inserción de un flujo de información secundaria en un flujo de información principal, en el cual se determina subbandas de una señal de audio que corresponden al flujo principal que pueden contener datos del flujo secundario. Esta selección de subbandas se efectúa en función de característica de la señal de audio en cuestión, tal como la relación señal-ruido en las 10 subbandas consideradas. A continuación, para una subbanda seleccionada, se determina el número de bits de codificación disponibles para la inserción de datos del flujo secundario. De nuevo, esta determinación recurre a características de la señal de audio tales como la diferencia entre el factor de escala y el nivel suelo del ruido en la subbanda. Finalmente, unos valores asociados a subbandas están enmascarados con datos del flujo de información secundaria a transmitir. 15 La invención tiene por objeto principal permitir la inserción discreta de un flujo secundario en un flujo principal que corresponde a un flujo de voz. Otros objetos de la invención apuntar a maximizar la velocidad del flujo secundario que se puede insertar, a la vez que se preserva de la menor manera la eficiencia de la codificación del flujo principal respecto de atributos de la fuente (es decir, preservando la calidad percibida en la audición durante la síntesis del flujo de voz). Otro objeto de la invención es también preservar simultáneamente la eficiencia de la 20 codificación del flujo secundario respecto de atributos de la fuente del flujo secundario, especialmente cuando se trata también de un flujo de voz. Se alcanzan algunos o la totalidad de estos objetos, según un primer aspecto de la invención gracias a un procedimiento de transmisión de un flujo de información secundaria entre un emisor y un receptor según la reivindicación 1. 25 El emisor y el receptor, al igual que la transmisión, se deben interpretar en su aceptación más amplia. En un ejemplo de aplicación a un sistema de radiocomunicación, el emisor y el receptor son equipos terminales del sistema, y la transmisión es una radiotransmisión. La inserción se realiza al nivel de un vocodificador paramétrico del emisor que produce dicho flujo de información principal, sin modificación de la velocidad binaria de este último respecto de lo que sería sin inserción. 30 Dicho de otro modo, el flujo de información secundaria se interpreta como una serie de condiciones en la serie de valores de...
Reivindicaciones:
1. Procedimiento de transmisión de un flujo de información secundaria (DS2) entre un emisor y un receptor, que comprende la inserción de dicho flujo de información secundaria al nivel de un vocodificador paramétrico (100) del emisor que genera un flujo de información principal (DS1) que es un flujo de datos de voz que codifica una señal de voz (VS1) y que se transmite desde el emisor al receptor, 5 según el cual unos bits del flujo de información secundaria se insertan:
- en solamente algunas de las tramas (F[i]) del flujo de información principal, seleccionadas por una máscara de tramas conocida por el emisor y por el receptor; y
- en el interior de una trama seleccionada del flujo de información principal, en posiciones predefinidas imponiendo una condición a solamente algunos de los bits de la trama, seleccionados por una 10 máscara de bits conocida por el emisor y por el receptor;
según el cual la máscara de tramas define una subserie (SF[m]) de grupos de tramas consecutivas en cada una de las cuales se insertan bits del flujo de información secundaria; y la longitud en número de tramas (M) de un grupo de tramas consecutivas es sensiblemente igual a la profundidad de memorización de las tramas en el vocodificador paramétrico. 15 2. Procedimiento según la reivindicación 1, según el cual la máscara de tramas es variable y se genera según un algoritmo común paralelamente en el emisor y en el receptor. 3. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual el modelo de fuente del vocodificador paramétrico que prevé, para algunas al menos de las tramas del flujo de información principal diferentes clases de bits en función de su sensibilidad respecto de la calidad de la codificación 20 de la señal de voz, la máscara de bits es tal que unos bits del flujo de información secundaria son insertados en estas tramas imponiendo una condición prioritariamente a los bits pertenecientes a la clase de bits menos sensible. 4. Procedimiento según una cualquiera de las reivindicaciones 1 a 3, según el cual el flujo de información secundaria es un flujo de datos de voz que sale de otro vocodificador (20) que tiene una velocidad más baja que la velocidad del vocodificador paramétrico. 25 5. Procedimiento según una cualquiera de las reivindicaciones 1 a 3, según el cual el flujo de información secundaria es un flujo de datos transparentes 6. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual el flujo de información secundaria se somete a codificación correctora de errores antes de su inserción en el flujo de información principal. 30 7. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual unos bits del flujo de información secundaria son insertados imponiendo valores a unos bits que pertenecen a parámetros de excitación de un filtro del modelo fuente del vocodificador paramétrico. 8. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual unos bits del flujo de información secundaria son insertados en tramas de silencio del flujo de información principal. 35 9. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual unos bits del flujo de información secundaria son insertados imponiendo condiciones a bits no cifrados a modo de un cifrado de extremo a extremo del flujo de información principal. 10. Procedimiento según una cualquiera de las reivindicaciones anteriores, según el cual la condición es una condición de igualdad de los bits de la trama del flujo de información principal con los bits del flujo de información 40 secundaria insertados. 11. Vocodificador paramétrico (100) que comprende, para la inserción de un flujo de información secundaria (DS2) en un flujo de información principal (DS1) que es generado por el vocodificador paramétrico a partir de una señal de voz (VS1), medios de inserción adaptados para insertar bits del flujo de información secundaria.
- en solamente algunas de las tramas (F[i]) del flujo de información principal, seleccionadas por una 45 máscara de tramas conocida por el emisor y por el receptor; y
- en el interior de una trama seleccionada del flujo de información principal, en posiciones predefinidas imponiendo una condición a solamente algunos de los bits de la trama, seleccionados por una máscara de bits conocida por el emisor y por el receptor;
en el cual la máscara de tramas define una subserie de tramas consecutivas (SF[m]) en cada una de las cuales se insertan bits del flujo de información secundaria; y en el cual la longitud en número de tramas de la subserie de tramas consecutivas es sensiblemente igual a la profundidad de memorización de las tramas en el codec de voz paramétrico. 12. Vocodificador paramétrico según la reivindicación 11, en el cual la máscara de tramas es variable y se 5 genera según un algoritmo basándose en una clave secreta. 13. Vocodificador paramétrico según una cualquiera de las reivindicaciones 11 y 12 en el cual el modelo de fuente del vocodificador paramétrico que prevé, para algunas al menos de las tramas del flujo de información principal, diferentes clases de bits en función de su sensibilidad respecto de la calidad de la codificación de la señal de voz, la máscara de bits es tal que unos bits del flujo de información secundaria se insertan en estas tramas, 10 imponiendo una condición prioritariamente a los bits pertenecientes a la clase de bits menos sensible. 14. Vocodificador paramétrico según una cualquiera de las reivindicaciones 11 a 13, que comprende, además, medios para someter el flujo de información secundaria a una codificación correctora de errores antes de su inserción en el flujo de información principal 15. Vocodificador paramétrico según una cualquiera de las reivindicaciones 11 a 14, según el cual los medios 15 de inserción están adaptados para insertar bits del flujo de información secundaria imponiendo valores a bits pertenecientes parámetros de excitación de un filtro del modelo de fuente del vocodificador paramétrico. 16. Vocodificador paramétrico según una cualquiera de las reivindicaciones 11 a 15, en el cual los medios de inserción están adaptados para insertar bits del flujo de información secundaria en tramas de silencio del flujo de información principal. 20 17. Vocodificador paramétrico según una cualquiera de las reivindicaciones 11 a 16, en el cual los medios de inserción están adaptados para insertar bits del flujo de información secundaria imponiendo condiciones a bits no cifrados a modo de cifrado de extremo a extremo del flujo de información principal. 18. Equipo terminal de un sistema de radiocomunicaciónes que comprende un vocodificador paramétrico según una cualquiera de las reivindicaciones 11 a 17. 25
Patentes similares o relacionadas:
Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]
Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]
Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]
Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]
Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]
Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]
Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]
Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]