Procedimiento, programa informático y entidad de decodificación de una señal de audio digital.

Procedimiento de decodificación de una señal digital de audio,

que incluye las etapas:

- recibir (S110) un vector de transformada que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada;

- recibir (S101) un vector de predicción que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP que utiliza una predicción a largo plazo;

estando el procedimiento caracterizado por que la segunda secuencia comienza antes del final de la primera secuencia, recibiéndose así una sub-secuencia común a las primera y segunda secuencias codificadas a la vez mediante codificación de tipo CELP utilizando una predicción a largo plazo y mediante la codificación por transformada; y por que incluye además las etapas:

a) aplicar (S112) al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo;

b) decodificar (S114) al menos en el vector de predicción la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a);

c) decodificar (S115) en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada mediante codificación por transformada, basándose al menos en una muestra procedente de una de las etapas a) y b).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/FR2009/051888.

Solicitante: Orange.

Nacionalidad solicitante: Francia.

Dirección: 78, rue Olivier de Serres 75015 Paris FRANCIA.

Inventor/es: PHILIPPE, PIERRICK, VIRETTE,DAVID.

Fecha de Publicación: 22 de Abril de 2015.

Clasificación Internacional de Patentes:

G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
G10L19/022 G10L 19/00 […] › Bloqueo, p. ej. agrupación de muestras en el tiempo; Elección de las ventanas de análisis; Factorización de interferencias.
G10L19/04 G10L 19/00 […] › utilizando técnicas de predicción.
G10L19/10 G10L 19/00 […] › siendo la función de excitación una excitación de impulsos múltiples.
G10L19/107 G10L 19/00 […] › Excitación de pulsaciones débiles, p. ej. utilizando libros de códigos algebraico.
G10L19/12 G10L 19/00 […] › Determinación o codificación de una excitación de código, p. ej. en codificadores vocales de predicción lineal excitados por código [CELP].
G10L19/20 G10L 19/00 […] › utilizando codificación específica de clase de sonido, codificadores híbridos o codificación basada en objeto.

PDF original: ES-2542067_T3.pdf

Fragmento de la descripción:

Procedimiento, programa informático y entidad de decodificación de una señal de audio digital La presente invención se refiere al campo de la codificación de las señales digitales.

La invención se aplica ventajosamente a la codificación de sonidos que presentan alternancias de palabra y de música.

Para codificar eficazmente los sonidos de palabra, se preconizan las técnicas del tipo CELP ("Code Excited Linear Prediction") . Para codificar eficazmente los sonidos musicales, se preconizan sobre todo técnicas de codificación por transformada.

Los codificados del tipo CELP son unos codificadores predictivos. Tienen como objetivo modelizar la producción de la palabra a partir de diversos elementos: una predicción a largo plazo para modelizar la vibración de las cuerdas vocales en período vocal, una excitación estocástica (ruido blanco, excitación algebraica) , y una predicción a corto plazo para modelizar las modificaciones del conducto vocal.

Los codificadores por transformada utilizan unas transformadas de muestreo crítico con el fin de compactar la señal en el campo transformado. Se denomina "transformada de muestreo crítico", a una transformada para la que el número de coeficientes en el campo transformado es igual al número de coeficientes del sonido digitalizado.

Una solución para codificar eficazmente una señal que contenga estos dos tipos de contenido, consiste en seleccionar en el curso del tiempo la mejor técnica. Esta solución ha sido preconizada particularmente por el organismo de normalización 3GPP ("3rd Generation Partnership Project") , y se ha propuesto una técnica denominada AMR WB+ en el documento "3rd Generation Partnership Project; Technical Specification Group Service and System Aspects; Audio Codec processing functions; Extended AMR Wideband codec; Transcoding functions (Release 6) ", 3GPP standard; 3GPP TS 26.290, 3RD generation partnership project (3GPP) , 1 de mayo de 2004, páginas 1-71, XP050370247.

Esta técnica se basa en una técnica CELP de tipo AMR WB y una codificación por transformación basada en una transformada de Fourier de recubrimiento.

Esta solución padece de una calidad insuficiente en la música. Esta insuficiencia procede particularmente de la codificación por transformada. En efecto, la transformada de Fourier de recubrimiento no es una transformación de muestreo crítico, y debido a esto, está por debajo del óptimo.

Además, las ventanas utilizadas en este codificador no son óptimas con respecto a la concentración de energía: las formas en frecuencia de estas ventanas son relativamente rígidas.

Se conocen unas transformaciones de muestreo crítico. Por ejemplo, las transformadas utilizadas en los codificadores de música de tipo MP3 y AAC. Estas transformadas reposan sobre el formalismo denominado TDAC ("Time Domain Aliasing Cancellation") .

La utilización del TDAC permite obtener una excelente calidad de la música. Sin embargo, esto tiene el inconveniente de introducir unos repliegues temporales que hacen difícil la combinación con las tecnologías de tipo CELP.

En efecto, durante una transición de tipo TDAC hacia CELP el repliegue temporal de la parte TDAC no es anulado por la señal procedente del CELP que no integra ningún repliegue.

Un objeto de la presente invención es proponer una técnica que permita reconstruir una señal de audio, con buena calidad, alternando unas técnicas de codificación por transformada (por ejemplo de muestreo crítico) y unas técnicas de codificación predictiva (por ejemplo del tipo CELP) .

Con este fin, la presente invención se refiere a un procedimiento de decodificación aplicado después de una codificación de una señal digital de audio, incluyendo dicha codificación las etapas:

- codificar una primera secuencia de muestras de la señal digital de audio según una codificación por transformada;

- codificar una segunda secuencia de muestras de la señal digital de audio según una codificación predictiva;

y en la que la segunda secuencia comienza antes del final de la primera secuencia, siendo así codificada una subsecuencia común a la primera y segunda secuencias a la vez mediante codificación predictiva y mediante codificación por transformada.

De ese modo, durante la decodificación de la señal digital de audio, el repliegue creado por la codificación en la subsecuencia de la primera secuencia puede suprimirse por medio de muestras de esta sub-secuencia procedentes de la decodificación de la sub-secuencia en el seno de la segunda secuencia. Además, la segunda secuencia puede 5 ser decodificada porque las muestras del pasado, útiles para la decodificación predictiva, no incluyen este repliegue.

Ventajosamente la codificación por transformada es una codificación por transformada de muestreo crítico.

Por ejemplo, la codificación por transformada es una codificación por transformada de tipo TDAC. 10 Por ejemplo, la codificación predictiva es una codificación de tipo CELP.

En una realización ventajosa, la codificación por transformada de la primera secuencia comprende la aplicación de una ventana de análisis que permita deducir de una relación de reconstrucción perfecta de la señal digital una 15 ventana de síntesis que incluye al menos tres partes:

- una primera parte nominal, -una segunda parte terminal sustancialmente nula, 20 -una tercera parte intermedia sustancialmente continua entre la primera y segunda partes.

Se prevé entonces que al menos las partes de la ventana de análisis que permitan deducir respectivamente la segunda y tercera partes de la ventana de síntesis se apliquen a la sub-secuencia común a las dos secuencias.

Se entiende por "sustancialmente continua" el hecho de que la tercera parte permita no tener una discontinuidad entre la primera y segunda partes. En efecto, este tipo de discontinuidad reduce la calidad de la decodificación por adición de ruido de la decodificación.

La relación de reconstrucción perfecta impone una relación entre las formas de las ventanas de análisis y de síntesis. Además, durante el paso entre una codificación por transformada y una codificación predictiva, es posible describir la ventana de análisis o la ventana de síntesis de manera equivalente. En efecto, en este caso, la relación de reconstrucción hace surgir una relación directa entre las dos formas.

Con una ventana de análisis (y por tanto de síntesis) así elegida, es posible reducir la zona en la que el repliegue surge en la decodificación de la primera secuencia.

Con la ventana así definida, es posible reducir el número de muestras de la segunda secuencia (codificación predictiva) a transmitir para la decodificación. 40 Además, el número de muestras suplementario está ligado al tamaño de la parte intermedia.

Por ejemplo, la parte intermedia es un arco de seno. Por ejemplo también, la parte intermedia es una función derivada de "Kaisser-Bessel". Además, puede ser la resultante de un cálculo de optimización de la ventana y no 45 tener expresión explícita.

Por ejemplo, la ventana de síntesis es una ventana asimétrica.

Ese modo, es posible adaptar el perfil de la ventana de síntesis (por tanto la ventana de análisis) a la codificación de 50 la secuencia siguiente o precedente a la primera secuencia.

En una realización ventajosa, la ventana de síntesis incluye además una cuarta parte inicial continua entre un valor sustancialmente nulo y un valor no nulo de la primera parte.

De ese modo, es posible minimizar el impacto de la transición entre la codificación por transformada y la codificación predictiva sobre la codificación por transformada.

Por ejemplo, la cuarta parte de la ventana de síntesis es una transición suave entre un valor inicial y un valor de la parte nominal, y la tercera parte es una transición abrupta entre un valor de la parte nominal y un valor de la parte 60 sustancialmente nula.

De ese modo, se obtiene una mejor concentración de la energía de la señal en el campo de la frecuencia para una mejor eficacia de la codificación de la parte transformada.

Se puede prever que la primera y segunda secuencias pertenezcan a una misma trama de la señal digital.

De ese modo, se puede utilizar la codificación de la primera secuencia como una codificación de transición después de la codificación de una trama mediante codificación por transformada. Esto permite mejorar la eficacia de la codificación sin perturbar esta trama. La presente invención prevé un procedimiento de decodificación de una señal digital de audio, que incluye las etapas:

- recibir un vector de transformada... [Seguir leyendo]

Reivindicaciones:

1. Procedimiento de decodificación de una señal digital de audio, que incluye las etapas:

-recibir (S110) un vector de transformada que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada; -recibir (S101) un vector de predicción que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP que utiliza una predicción a largo plazo;

estando el procedimiento caracterizado por que la segunda secuencia comienza antes del final de la primera secuencia, recibiéndose así una sub-secuencia común a las primera y segunda secuencias codificadas a la vez mediante codificación de tipo CELP utilizando una predicción a largo plazo y mediante la codificación por transformada; y por que incluye además las etapas:

a) aplicar (S112) al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo; b) decodificar (S114) al menos en el vector de predicción la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; c) decodificar (S115) en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada mediante codificación por transformada, basándose al menos en una muestra procedente de una de las etapas a) y b) .

2. Procedimiento según la reivindicación 1, caracterizado por que la etapa b) incluye las sub-etapas:

b1) decodificar (S120) en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; b2) aplicar (S121) al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y b3) decodificar (S122) la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de la etapa b1) con una muestra correspondiente procedente de la etapa b2) .

3. Procedimiento según la reivindicación 1, caracterizado por que la etapa b) incluye las sub-etapas:

b4) decodificar (S130) en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente de la etapa a) ; b5) crear (S131) a partir de al menos una muestra procedente de la etapa b4) una muestra que contenga un repliegue equivalente a una codificación por transformada seguida de una decodificación por transformada; b6) aplicar (S132) al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y b7) decodificar (S133) la sub-secuencia común a las primera y segunda secuencias mediante combinación de al 45 menos una muestra procedente de la etapa b5) con una muestra correspondiente procedente de la etapa b6) .

4. Procedimiento según la reivindicación 1, caracterizado por que la etapa a) incluye la aplicación de una ventana de síntesis que incluye al menos tres partes:

- una primera parte nominal, -una segunda parte terminal sustancialmente nula, -una tercera parte intermedia continua entre las primera y segunda zonas, y por que al menos las segunda y tercera partes de la ventana de síntesis se aplican a unas muestras que codifican 55 la sub-secuencia común a las dos secuencias.

5. Programa informático que incluye unas instrucciones para la implementación del procedimiento según la reivindicación 1 cuando el programa se ejecuta por un procesador.

6. Entidad de decodificación (DECOD) de una señal digital de audio, que incluye unos medios de recepción (150, 151) :

- de un vector de transformada (V_T) que codifica una primera secuencia de muestras de la señal digital de audio según una codificación por transformada; .

65. de un vector de predicción (V_P) que codifica una segunda secuencia de muestras de la señal digital de audio según una codificación de tipo CELP utilizando una predicción a largo plazo;

estando la entidad de decodificación caracterizada por que la segunda secuencia comienza antes del final de la primera secuencia, siendo así codificada una sub-secuencia común a las primera y segunda secuencias a la vez mediante codificación de tipo CELP utilizando la predicción a largo plazo y mediante la codificación por transformada; y por que incluye además:

- un primer decodificador (152, 153) para aplicar al vector de transformada una transformada inversa de la codificación por transformada para decodificar una sub-secuencia de la primera secuencia no codificada mediante codificación de tipo CELP utilizando una predicción a largo plazo; -un segundo decodificador (154) para decodificar al menos en el vector predictivo la sub-secuencia común a las primera y segunda secuencias al menos mediante una decodificación de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra procedente del primer decodificador por transformada; y -un tercer decodificador (155) predictivo para decodificar en el vector predictivo mediante una decodificación de tipo CELP utilizando una predicción a largo plazo una sub-secuencia de la segunda secuencia no codificada por codificación por transformada, basándose al menos en una muestra procedente de uno de los primero y segundo decodificadores.

7. Entidad de decodificación según la reivindicación 6, caracterizada por que el segundo decodificador incluye:

- unos primeros medios para decodificar en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante un decodificador de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra restituida por el primer decodificador mediante transformada; -unos segundos medios para aplicar al vector de transformada una transformada inversa de la codificación mediante transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y -unos terceros medios para decodificar la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de los primeros medios con una muestra correspondiente procedente de los segundos medios.

8. Entidad de decodificación según la reivindicación 6, caracterizada por que el segundo decodificador incluye:

- unos primeros medios para decodificar en el vector predictivo la sub-secuencia común a las primera y segunda secuencias mediante un decodificador de tipo CELP utilizando una predicción a largo plazo basándose al menos en una muestra restituida por el primer decodificador mediante transformada; -unos cuartos medios para crear un repliegue a partir de al menos una muestra procedente de los primeros medios equivalente a una codificación por transformada seguida de una decodificación por transformada; -unos quintos medios para aplicar al vector de transformada una transformada inversa de la codificación por transformada para decodificar la sub-secuencia común a las primera y segunda secuencias; y -unos sextos medios para decodificar la sub-secuencia común a las primera y segunda secuencias mediante combinación de al menos una muestra procedente de los cuartos medios con una muestra correspondiente procedente de los quintos medios.

Patentes similares o relacionadas:

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]