Procedimiento, programa informático y entidad de decodificación de una señal de audio digital.

Procedimiento de decodificación de una señal digital de audio, que incluye las etapas:

- recibir

(S110) un vector de transformada que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada;

- recibir (S101) un vector de predicción que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP que utiliza una predicción a largo plazo;

estando el procedimiento caracterizado por que la segunda secuencia comienza antes del final de la primera secuencia, recibiéndose así una sub-secuencia común a las primera y segunda secuencias codificadas a la vez mediante codificación de tipo CELP utilizando una predicción a largo plazo y mediante la codificación por transformada; y por que incluye además las etapas:

a) aplicar (S112) al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo;

b) decodificar (S114) al menos en el vector de predicción la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a);

c) decodificar (S115) en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada mediante codificación por transformada, basándose al menos en una muestra procedente de una de las etapas a) y b).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2009/051888.

Solicitante: Orange.

Nacionalidad solicitante: Francia.

Dirección: 78, rue Olivier de Serres 75015 Paris FRANCIA.

Inventor/es: PHILIPPE, PIERRICK, VIRETTE,DAVID.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/10 (siendo la función de excitación una excitación de impulsos múltiples)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/04 (utilizando técnicas de predicción)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/12 (Determinación o codificación de una excitación de código, p.ej. en codificadores vocales de predicción lineal excitados por código [CELP])
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/20 (utilizando codificación específica de clase de sonido, codificadores híbridos o codificación basada en objeto)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/107 (Excitación de pulsaciones débiles, p. ej. utilizando libros de códigos algebraico)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/022 (Bloqueo, p. ej. agrupación de muestras en el tiempo; Elección de las ventanas de análisis; Factorización de interferencias)

PDF original: ES-2542067_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Procedimiento, programa informático y entidad de decodificación de una señal de audio digital La presente invención se refiere al campo de la codificación de las señales digitales.

La invención se aplica ventajosamente a la codificación de sonidos que presentan alternancias de palabra y de música.

Para codificar eficazmente los sonidos de palabra, se preconizan las técnicas del tipo CELP ("Code Excited Linear Prediction") . Para codificar eficazmente los sonidos musicales, se preconizan sobre todo técnicas de codificación por transformada.

Los codificados del tipo CELP son unos codificadores predictivos. Tienen como objetivo modelizar la producción de la palabra a partir de diversos elementos: una predicción a largo plazo para modelizar la vibración de las cuerdas vocales en período vocal, una excitación estocástica (ruido blanco, excitación algebraica) , y una predicción a corto plazo para modelizar las modificaciones del conducto vocal.

Los codificadores por transformada utilizan unas transformadas de muestreo crítico con el fin de compactar la señal en el campo transformado. Se denomina "transformada de muestreo crítico", a una transformada para la que el número de coeficientes en el campo transformado es igual al número de coeficientes del sonido digitalizado.

Una solución para codificar eficazmente una señal que contenga estos dos tipos de contenido, consiste en seleccionar en el curso del tiempo la mejor técnica. Esta solución ha sido preconizada particularmente por el organismo de normalización 3GPP ("3rd Generation Partnership Project") , y se ha propuesto una técnica denominada AMR WB+ en el documento "3rd Generation Partnership Project; Technical Specification Group Service and System Aspects; Audio Codec processing functions; Extended AMR Wideband codec; Transcoding functions (Release 6) ", 3GPP standard; 3GPP TS 26.290, 3RD generation partnership project (3GPP) , 1 de mayo de 2004, páginas 1-71, XP050370247.

Esta técnica se basa en una técnica CELP de tipo AMR WB y una codificación por transformación basada en una transformada de Fourier de recubrimiento.

Esta solución padece de una calidad insuficiente en la música. Esta insuficiencia procede particularmente de la codificación por transformada. En efecto, la transformada de Fourier de recubrimiento no es una transformación de muestreo crítico, y debido a esto, está por debajo del óptimo.

Además, las ventanas utilizadas en este codificador no son óptimas con respecto a la concentración de energía: las formas en frecuencia de estas ventanas son relativamente rígidas.

Se conocen unas transformaciones de muestreo crítico. Por ejemplo, las transformadas utilizadas en los codificadores de música de tipo MP3 y AAC. Estas transformadas reposan sobre el formalismo denominado TDAC ("Time Domain Aliasing Cancellation") .

La utilización del TDAC permite obtener una excelente calidad de la música. Sin embargo, esto tiene el inconveniente de introducir unos repliegues temporales que hacen difícil la combinación con las tecnologías de tipo CELP.

En efecto, durante una transición de tipo TDAC hacia CELP el repliegue temporal de la parte TDAC no es anulado por la señal procedente del CELP que no integra ningún repliegue.

Un objeto de la presente invención es proponer una técnica que permita reconstruir una señal de audio, con buena calidad, alternando unas técnicas de codificación por transformada (por ejemplo de muestreo crítico) y unas técnicas de codificación predictiva (por ejemplo del tipo CELP) .

Con este fin, la presente invención se refiere a un procedimiento de decodificación aplicado después de una codificación de una señal digital de audio, incluyendo dicha codificación las etapas:

- codificar una primera secuencia de muestras de la señal digital de audio según una codificación por transformada;

- codificar una segunda secuencia de muestras de la señal digital de audio según una codificación predictiva;

y en la que la segunda secuencia comienza antes del final de la primera secuencia, siendo así codificada una subsecuencia común a la primera y segunda secuencias a la vez mediante codificación predictiva y mediante codificación por transformada.

De ese modo, durante la decodificación de la señal digital de audio, el repliegue creado por la codificación en la subsecuencia de la primera secuencia puede suprimirse por medio de muestras de esta sub-secuencia procedentes de la decodificación de la sub-secuencia en el seno de la segunda secuencia. Además, la segunda secuencia puede 5 ser decodificada porque las muestras del pasado, útiles para la decodificación predictiva, no incluyen este repliegue.

Ventajosamente la codificación por transformada es una codificación por transformada de muestreo crítico.

Por ejemplo, la codificación por transformada es una codificación por transformada de tipo TDAC. 10 Por ejemplo, la codificación predictiva es una codificación de tipo CELP.

En una realización ventajosa, la codificación por transformada de la primera secuencia comprende la aplicación de una ventana de análisis que permita deducir de una relación de reconstrucción perfecta de la señal digital una 15 ventana de síntesis que incluye al menos tres partes:

- una primera parte nominal, -una segunda parte terminal sustancialmente nula, 20 -una tercera parte intermedia sustancialmente continua entre la primera y segunda partes.

Se prevé entonces que al menos las partes de la ventana de análisis que permitan deducir respectivamente la segunda y tercera partes de la ventana de síntesis se apliquen a la sub-secuencia común a las dos secuencias.

Se entiende por "sustancialmente continua" el hecho de que la tercera parte permita no tener una discontinuidad entre la primera y segunda partes. En efecto, este tipo de discontinuidad reduce la calidad de la decodificación por adición de ruido de la decodificación.

La relación de reconstrucción perfecta impone una relación entre las formas de las ventanas de análisis y de síntesis. Además, durante el paso entre una codificación por transformada y una codificación predictiva, es posible describir la ventana de análisis o la ventana de síntesis de manera equivalente. En efecto, en este caso, la relación de reconstrucción hace surgir una relación directa entre las dos formas.

Con una ventana de análisis (y por tanto de síntesis) así elegida, es posible reducir la zona en la que el repliegue surge en la decodificación de la primera secuencia.

Con la ventana así definida, es posible reducir el número de muestras de la segunda secuencia (codificación predictiva) a transmitir para la decodificación. 40 Además, el número de muestras suplementario está ligado al tamaño de la parte intermedia.

Por ejemplo, la parte intermedia es un arco de seno. Por ejemplo también, la parte intermedia es una función derivada de "Kaisser-Bessel". Además, puede ser la resultante de un cálculo de optimización de la ventana y no 45 tener expresión explícita.

Por ejemplo, la ventana de síntesis es una ventana asimétrica.

Ese modo, es posible adaptar el perfil de la ventana de síntesis (por tanto la ventana de análisis) a la codificación de 50 la secuencia siguiente o precedente a la primera secuencia.

En una realización ventajosa, la ventana de síntesis incluye además una cuarta parte inicial continua entre un valor sustancialmente nulo y un valor no nulo de la primera parte.

De ese modo, es posible minimizar el impacto de la transición entre la codificación por transformada y la codificación predictiva sobre la codificación por transformada.

Por ejemplo,... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento de decodificación de una señal digital de audio, que incluye las etapas:

-recibir (S110) un vector de transformada que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada; -recibir (S101) un vector de predicción que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP que utiliza una predicción a largo plazo;

estando el procedimiento caracterizado por que la segunda secuencia comienza antes del final de la primera secuencia, recibiéndose así una sub-secuencia común a las primera y segunda secuencias codificadas a la vez mediante codificación de tipo CELP utilizando una predicción a largo plazo y mediante la codificación por transformada; y por que incluye además las etapas:

a) aplicar (S112) al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo; b) decodificar (S114) al menos en el vector de predicción la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; c) decodificar (S115) en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada mediante codificación por transformada, basándose al menos en una muestra procedente de una de las etapas a) y b) .

2. Procedimiento según la reivindicación 1, caracterizado por que la etapa b) incluye las sub-etapas:

b1) decodificar (S120) en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; b2) aplicar (S121) al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y b3) decodificar (S122) la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de la etapa b1) con una muestra correspondiente procedente de la etapa b2) .

3. Procedimiento según la reivindicación 1, caracterizado por que la etapa b) incluye las sub-etapas:

b4) decodificar (S130) en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; b5) crear (S131) a partir de al menos una muestra procedente de la etapa b4) una muestra que contenga un repliegue equivalente a una codificación por transformada seguida de una decodificación por transformada; b6) aplicar (S132) al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y b7) decodificar (S133) la sub-secuencia común a las primera y segunda secuencias mediante combinación de al 45 menos una muestra procedente de la etapa b5) con una muestra correspondiente procedente de la etapa b6) .

4. Procedimiento según la reivindicación 1, caracterizado por que la etapa a) incluye la aplicación de una ventana de síntesis que incluye al menos tres partes:

- una primera parte nominal, -una segunda parte terminal sustancialmente nula, -una tercera parte intermedia continua entre las primera y segunda zonas, y por que al menos las segunda y tercera partes de la ventana de síntesis se aplican a unas muestras que codifican 55 la sub-secuencia común a las dos secuencias.

5. Programa informático que incluye unas instrucciones para la implementación del procedimiento según la reivindicación 1 cuando el programa se ejecuta por un procesador.

6. Entidad de decodificación (DECOD) de una señal digital de audio, que incluye unos medios de recepción (150, 151) :

- de un vector de transformada (V_T) que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada; .

65. de un vector de predicción (V_P) que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP utilizando una predicción a largo plazo;

estando la entidad de decodificación caracterizada por que la segunda secuencia comienza antes del final de la primera secuencia, siendo así codificada una sub-secuencia común a las primera y segunda secuencias a la vez mediante codificación de tipo CELP utilizando la predicción a largo plazo y mediante la codificación por transformada; y por que incluye además:

- un primer decodificador (152, 153) para aplicar al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo; -un segundo decodificador (154) para decodificar al menos en el vector predictivo la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente del primer decodificador por transformada; y -un tercer decodificador (155) predictivo para decodificar en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada por codificación por transformada, basándose al menos en una muestra procedente de uno de los primero y segundo decodificadores.

7. Entidad de decodificación según la reivindicación 6, caracterizada por que el segundo decodificador incluye:

- unos primeros medios para decodificar en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante un decodificador de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra restituida por el primer decodificador mediante transformada; -unos segundos medios para aplicar al vector de transformada una transformada inversa de la codificación mediante transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y -unos terceros medios para decodificar la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de los primeros medios con una muestra correspondiente procedente de los segundos medios.

8. Entidad de decodificación según la reivindicación 6, caracterizada por que el segundo decodificador incluye:

- unos primeros medios para decodificar en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante un decodificador de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra restituida por el primer decodificador mediante transformada; -unos cuartos medios para crear un repliegue a partir de al menos una muestra procedente de los primeros medios equivalente a una codificación por transformada seguida de una decodificación por transformada; -unos quintos medios para aplicar al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y -unos sextos medios para decodificar la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de los cuartos medios con una muestra correspondiente procedente de los quintos medios.