Procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja.

EN UN PROCEDIMIENTO PARA CODIFICAR UNA SEÑAL DE AUDIO DIGITALIZADA CON UNA VELOCIDAD DE EXPLORACION PEQUEÑA

, VARIAS LINEAS DE FRECUENCIA ADYACENTES DE LA SEÑAL DE AUDIO DIGITALIZADA, QUE ESTAN ASIGNADAS A UNA MISMA BANDA DE FACTORES DE ESCALA, SE CODIFICAN EN EL MISMO FACTOR DE ESCALA, EN QUE LAS BANDAS DE FACTORES DE ESCALA FORMAN UNA REGION DENTRO DE LA CUAL TODOS LOS FACTORES DE ESCALA SE CODIFICAN CON EL MISMO NUMERO DE BITS, QUE SE DETERMINA POR EL FACTOR DE ESCALA MAS ALTO DE LA REGION. LAS LINEAS DE FRECUENCIA DE AL MENOS LA REGION SUPERIOR DE LAS BANDAS DE FACTORES DE ESCALA SE CODIFICAN CON EL FACTOR DE ESCALA 0. PARA LA REGION SUPERIOR COMO MINIMO NO SE CODIFICA NINGUN FACTOR DE ESCALA.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP1997/000792.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FÖDERUNG DER ANGEWANDTEN FORSCHUNG E.V.

Nacionalidad solicitante: Alemania.

Dirección: LEONRODSTRASSE 54 80636 MÜNCHEN ALEMANIA.

Inventor/es: KUNZ, OLIVER, DIPL.-ING., DIETZ, MARTIN, DIPL.-ING., BUCHTA, RAINER, DIPL.-ING., ZELLER, JURGEN, DIPL.-ING., BRANDENBURG, KARLHEINZ, DR.-ING., SIELER, MARTIN, DIPL.-ING., GERHAUSER, HEINZ, DR.-ING.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/30 (Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia)
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION > Detalles de los sistemas de transmision, no cubiertos... > H04B1/66 (para reducir el ancho de banda de las señales; para mejorar la eficacia de la transmisión (H04B 1/68 tiene prioridad))
  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION > Detalles de los sistemas de transmision, no cubiertos... > H04B1/06 (Receptores)
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión analógica/digital; Conversión digital/analógica... > H03M1/12 (Convertidores analógico/digitales (H03M 1/02 - H03M 1/10 tienen prioridad))

PDF original: ES-2125739_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

La presente invención trata de un procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja. En particular, la invención trata de un procedimiento de codificación sólo poco modificado en comparación con el estándar ISO-MPEG2 Layer 3, que permite transmitir señales audio, que están digitalizadas con una velocidad de exploración más baja que la velocidad de exploración según el estándar ISO MPEG2 Layer 3, con una velocidad de bits baja.

El estándar ISO 13818-3 (MPEG2-Audio) exis- tente define con el Layer 3 un procedimiento de codificación para señales con frecuencias de exploración entre 24 kHz y 16 kHz y permite velocidades de bits hasta el valor mínimo de 8 kbit/s. En particular, a esta velocidad de bits muy reducida, que es muy atractiva para una transmisión, por ejemplo en redes de ordenadores, sería deseable aprovechar frecuencias de exploración aún más bajas. Sin embargo, el estándar indicado no los proporciona.

Partiendo de este estado de la técnica, la presente invención tiene el objeto de mejorar el procedimiento indicado para la codificación de señales audio de tal forma que se pueda realizar una exploración con velocidades de exploración no conformes con el estándar, desviándose lo menos posible del estándar, debiendo ser posible una decodificación con decodificadores existentes sin un esfuerzo importante de adaptación.

Este objeto se consigue mediante un procedimiento de acuerdo con la reivindicación 1.

En general, la invención prevé la codificación de señales audio que están digitalizadas con una velocidad de exploración que es más baja que la velocidad de exploración según el estándar ISO-MPEG2 Layer 3.

Por regla general, en el objeto de la invención, al igual que en el estándar conocido, las líneas de frecuencia adyacentes de la señal audio digitalizada, las cuales están asignadas a una banda de factores de escala, se codifican con el mismo factor de escala, que se transmite junto con la banda de factores de escala codificada.

También de la misma forma que en el procedimiento conocido según el estándar indicado, las bandas de factores de escala forman una región, dentro de la cual todos los factores de escala están codificados con un mismo número de bits, respectivamente, que depende del factor de escala más alto de esta región.

En el estándar ISO-MPEG2 Layer 3, a todas las bandas de factores de escala de todas las regiones les están asignados factores de escala. Solamente la última banda, en la que están dispuestas las líneas de frecuencia restantes, que quedan después de realizar la división deseada de líneas de frecuencia, no tienen factor de escala al realizar la codificación según el estándar indicado.

La invención prevé, en contraposición al estándar, que al menos las líneas de frecuencia de la región superior de las bandas de factores de escala estén codificadas con el factor de escala 0, de modo que al menos para la región superior no se codifique ni transmita ningún factor de escala. Los bits ahorrados por la supresión del factor de escala o la supresión de los factores de escala, se utilizan para una cuantificación de las líneas de frecuencia en el espectro restante más fina en comparación con el estándar.

Según otro aspecto importante de la invención, la división de las líneas de frecuencia en bandas de factores de escala está modificada en comparación con el estándar indicado de tal forma que los anchos de las bandas de factores de escala dentro de la región superior estén reducidos en comparación con los anchos de las bandas de factores de escala de la región superior según el estándar ISO-MPEG2 Layer 3.

A continuación, se explicará más detalladamente un ejemplo de realización preferible del procedimiento de acuerdo con la invención.

En el ejemplo de realización del procedimiento de acuerdo con la invención, se utiliza un "encabezador de delimitación" modificado en comparación con el "encabezador de delimitación" MPEG estándar, para señalizar a un decodificador la velocidad de exploración no conforme al estándar y la codificación no conforme al estándar. Con este fin se introduce dentro del "encabezador" en lugar de la palabra sinc hexadecimal "FFF" (hexadecimal para doce unos) la palabra sinc "FFE" (once unos y un cero). Cuando un decodificador detecta una palabra sinc modificada de esta forma, esto es un indicio de que la corriente de bits contiene una señal que ha sido digitalizada preferiblemente con media velocidad de exploración en comparación con el estándar MPEG2 (12 kHz, 11,025 kHz u 8 kHz). Por lo demás, la estructura de la corriente de bits permanece inalterada en comparación con el estándar.

En el ejemplo de realización que se discute aquí, con una velocidad de exploración de 8 kHz, se modifica, además, la división de las líneas de frecuencia en bandas de factores de escala. Aquí se aprovecha una construcción en formato de corriente de bits del Layer 3, con ayuda de la cual se puede aumentar el número de los bits disponibles para la codificación del espectro.

En el estándar MPEG2 Layer 3 se dividen, por ejemplo, veintiuna bandas de factores de escala en el caso de los llamados "bloques largos" o tres veces doce bandas de factores de escala en el caso de los llamados "bloques cortos" en cuatro regiones, respectivamente, es decir, 6-5-5-5 bandas de factores de escala por región para los "bloques largos" y 9-9-9-9 bandas de factores de escala para los "bloques cortos". En cada una de estas regiones, los factores de escala se codifican con el número de bits necesario para el factor de escala más alto de la región correspondiente. A través del valor "scalefac-comprimir" de la información lateral de la corriente de bits, se señaliza el número de bits con el que ha sido codificada cada región.

En el procedimiento según la invención se modifica para la velocidad de exploración de 8 kHz la tabla de los anchos de las bandas de factores de escala de tal forma que la región superior en el espectro ya sólo contenga muy pocas líneas, que por regla general no se utilizan de ningún modo o sólo se utilizan poco debido a las restricciones de los anchos de banda.

Según la invención, los factores de escala de las bandas de factores de escala de la región superior se ponen sin excepción a cero, de modo que no sea necesaria ninguna codificación de los factores de escala.

Debido a los bits así liberados, están disponibles bits adicionales para la cuantificación del espectro.

Efectivamente, el espectro se divide en el procedimiento según la invención de acuerdo con este ejemplo de realización en 17 bandas de factores de escala, sin que haya que abandonar por ello la sintaxis de la corriente de bits del estándar MPEG2.

Las tablas para los anchos de las bandas de factores de escala figuran a continuación. La tabla indicada en primer lugar para los anchos de las bandas de factores de escala para una velocidad de exploración de 16 kHz corresponde al estándar ISO-MPEG2-Layer 3. La tabla indicada en segundo lugar está modificada según la teoría de la invención para la velocidad de exploración de 8 kHz.

Anchos de las bandas de factores de escala para una velocidad de exploración de 16 kHz

(para fines comparativos según el estándar)

"Bloques largos"

6,6,6,6,6,6,8,10,12,14,16,20,24,28,32,38,46, 52,60,68,58,54

"Bloques cortos"

4,4,4,6,8,10,12,14,18,24,30,40,18

Anchos de las bandas de factores de escala para una velocidad de exploración de 8 kHz

"Bloques largos"

12,12,12,12,12,12,16,20,24,28,32,40,48,56, 64,76,90,2,2,2,2,2

"Bloques cortos"

8,8,8,12,16,20,24,28,36,2,2,2,26

Se observa que los últimos anchos de la... [Seguir leyendo]

 


Reivindicaciones:

1. Procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja,

en el que varias líneas de frecuencia adyacentes, respectivamente, de la señal audio digitalizada, las cuales están asignadas a una banda de factores de escala, se codifican con el mismo factor de escala;

en el que las bandas de factores de escala adyacentes forman una región, dentro de la cual están codificados todos los factores de escala con el mismo número de bits, respectivamente, que depende del factor de escala más alto de la región; y

en el que las líneas de frecuencia, al menos de la región superior de bandas de factores de escala, se codifican con el factor de escala 0 y en el que no se codifica ningún factor de escala, al menos para la región superior.

2. Procedimiento según la reivindicación 1, en el que los bits ahorrados en comparación con el estándar ISO-MPEG2 Layer 3 por la supresión de los factores de escala, al menos para la región superior, se utilizan para una cuantificación de las líneas de frecuencia más fina en comparación con el estándar.

3. Procedimiento según la reivindicación 1 ó 2, en el que la división de las líneas de frecuencia en bandas de factores de escala está modificada de tal forma en comparación con el estándar ISO-MPEG2 Layer 3 que los anchos de las bandas de factores de escala dentro de la región superior están reducidos en comparación con los anchos de las bandas de factores de escala de la región superior según este estándar.

4. Procedimiento según una de las reivindicaciones 1 a 3, en el que se transmite un "encabezador de delimitación" modificado en comparación con el "encabezador de delimitación" MPEG para señalizar la velocidad de exploración no conforme con el estándar.

5. Procedimiento según la reivindicación 4, en el que el "encabezador de delimitación" presenta la palabra sinc con el código hexadecimal "FFE".