Procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja.

EN UN PROCEDIMIENTO PARA CODIFICAR UNA SEÑAL DE AUDIO DIGITALIZADA CON UNA VELOCIDAD DE EXPLORACION PEQUEÑA,

VARIAS LINEAS DE FRECUENCIA ADYACENTES DE LA SEÑAL DE AUDIO DIGITALIZADA, QUE ESTAN ASIGNADAS A UNA MISMA BANDA DE FACTORES DE ESCALA, SE CODIFICAN EN EL MISMO FACTOR DE ESCALA, EN QUE LAS BANDAS DE FACTORES DE ESCALA FORMAN UNA REGION DENTRO DE LA CUAL TODOS LOS FACTORES DE ESCALA SE CODIFICAN CON EL MISMO NUMERO DE BITS, QUE SE DETERMINA POR EL FACTOR DE ESCALA MAS ALTO DE LA REGION. LAS LINEAS DE FRECUENCIA DE AL MENOS LA REGION SUPERIOR DE LAS BANDAS DE FACTORES DE ESCALA SE CODIFICAN CON EL FACTOR DE ESCALA 0. PARA LA REGION SUPERIOR COMO MINIMO NO SE CODIFICA NINGUN FACTOR DE ESCALA.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP1997/000792.

Solicitante: FRAUNHOFER-GESELLSCHAFT ZUR FÖDERUNG DER ANGEWANDTEN FORSCHUNG E.V.

Nacionalidad solicitante: Alemania.

Dirección: LEONRODSTRASSE 54 80636 MÜNCHEN ALEMANIA.

Inventor/es: KUNZ, OLIVER, DIPL.-ING., DIETZ, MARTIN, DIPL.-ING., BUCHTA, RAINER, DIPL.-ING., ZELLER, JURGEN, DIPL.-ING., BRANDENBURG, KARLHEINZ, DR.-ING., SIELER, MARTIN, DIPL.-ING., GERHAUSER, HEINZ, DR.-ING.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • G10L19/02 G10L […] › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
  • H03M1/12 ELECTRICIDAD.H03 CIRCUITOS ELECTRONICOS BASICOS.H03M CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO, EN GENERAL (por medio de fluidos F15C 4/00; convertidores ópticos analógico/digitales G02F 7/00; codificación, decodificación o conversión de código especialmente adaptada a aplicaciones particulares, ver las subclases apropiadas, p. ej. G01D, G01R, G06F, G06T, G09G, G10L, G11B, G11C, H04B, H04L, H04M, H04N; cifrado o descifrado para la criptografía o para otros fines que implican la necesidad de secreto G09C). › H03M 1/00 Conversión analógica/digital; Conversión digital/analógica (conversión de valores analógicos en, o a partir de una modulación diferencial H03M 3/00). › Convertidores analógico/digitales (H03M 1/02 - H03M 1/10 tienen prioridad).
  • H03M7/30 H03M […] › H03M 7/00 Conversión de un código, en el cual la información está representada por una secuencia dada o por un número de dígitos, en un código en el cual la misma información está representada por una secuencia o por un número de dígitos diferentes. › Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia.
  • H04B1/06 H […] › H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04B TRANSMISION.H04B 1/00 Detalles de los sistemas de transmision, no cubiertos por uno de los grupos H04B 3/00 - H04B 13/00; Detalles de los sistemas de transmisión no caracterizados por el medio utilizado para la transmisión. › Receptores.
  • H04B1/66 H04B 1/00 […] › para reducir el ancho de banda de las señales; para mejorar la eficacia de la transmisión (H04B 1/68 tiene prioridad).

PDF original: ES-2125739_T3.pdf

 


Descripción:

La presente invención trata de un procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja. En particular, la invención trata de un procedimiento de codificación sólo poco modificado en comparación con el estándar ISO-MPEG2 Layer 3, que permite transmitir señales audio, que están digitalizadas con una velocidad de exploración más baja que la velocidad de exploración según el estándar ISO MPEG2 Layer 3, con una velocidad de bits baja.

El estándar ISO 13818-3 (MPEG2-Audio) exis- tente define con el Layer 3 un procedimiento de codificación para señales con frecuencias de exploración entre 24 kHz y 16 kHz y permite velocidades de bits hasta el valor mínimo de 8 kbit/s. En particular, a esta velocidad de bits muy reducida, que es muy atractiva para una transmisión, por ejemplo en redes de ordenadores, sería deseable aprovechar frecuencias de exploración aún más bajas. Sin embargo, el estándar indicado no los proporciona.

Partiendo de este estado de la técnica, la presente invención tiene el objeto de mejorar el procedimiento indicado para la codificación de señales audio de tal forma que se pueda realizar una exploración con velocidades de exploración no conformes con el estándar, desviándose lo menos posible del estándar, debiendo ser posible una decodificación con decodificadores existentes sin un esfuerzo importante de adaptación.

Este objeto se consigue mediante un procedimiento de acuerdo con la reivindicación 1.

En general, la invención prevé la codificación de señales audio que están digitalizadas con una velocidad de exploración que es más baja que la velocidad de exploración según el estándar ISO-MPEG2 Layer 3.

Por regla general, en el objeto de la invención, al igual que en el estándar conocido, las líneas de frecuencia adyacentes de la señal audio digitalizada, las cuales están asignadas a una banda de factores de escala, se codifican con el mismo factor de escala, que se transmite junto con la banda de factores de escala codificada.

También de la misma forma que en el procedimiento conocido según el estándar indicado, las bandas de factores de escala forman una región, dentro de la cual todos los factores de escala están codificados con un mismo número de bits, respectivamente, que depende del factor de escala más alto de esta región.

En el estándar ISO-MPEG2 Layer 3, a todas las bandas de factores de escala de todas las regiones les están asignados factores de escala. Solamente la última banda, en la que están dispuestas las líneas de frecuencia restantes, que quedan después de realizar la división deseada de líneas de frecuencia, no tienen factor de escala al realizar la codificación según el estándar indicado.

La invención prevé, en contraposición al estándar, que al menos las líneas de frecuencia de la región superior de las bandas de factores de escala estén codificadas con el factor de escala 0, de modo que al menos para la región superior no se codifique ni transmita ningún factor de escala. Los bits ahorrados por la supresión del factor de escala o la supresión de los factores de escala, se utilizan para una cuantificación de las líneas de frecuencia en el espectro restante más fina en comparación con el estándar.

Según otro aspecto importante de la invención, la división de las líneas de frecuencia en bandas de factores de escala está modificada en comparación con el estándar indicado de tal forma que los anchos de las bandas de factores de escala dentro de la región superior estén reducidos en comparación con los anchos de las bandas de factores de escala de la región superior según el estándar ISO-MPEG2 Layer 3.

A continuación, se explicará más detalladamente un ejemplo de realización preferible del procedimiento de acuerdo con la invención.

En el ejemplo de realización del procedimiento de acuerdo con la invención, se utiliza un "encabezador de delimitación" modificado en comparación con el "encabezador de delimitación" MPEG estándar, para señalizar a un decodificador la velocidad de exploración no conforme al estándar y la codificación no conforme al estándar. Con este fin se introduce dentro del "encabezador" en lugar de la palabra sinc hexadecimal "FFF" (hexadecimal para doce unos) la palabra sinc "FFE" (once unos y un cero). Cuando un decodificador detecta una palabra sinc modificada de esta forma, esto es un indicio de que la corriente de bits contiene una señal que ha sido digitalizada preferiblemente con media velocidad de exploración en comparación con el estándar MPEG2 (12 kHz, 11,025 kHz u 8 kHz). Por lo demás, la estructura de la corriente de bits permanece inalterada en comparación con el estándar.

En el ejemplo de realización que se discute aquí, con una velocidad de exploración de 8 kHz, se modifica, además, la división de las líneas de frecuencia en bandas de factores de escala. Aquí se aprovecha una construcción en formato de corriente de bits del Layer 3, con ayuda de la cual se puede aumentar el número de los bits disponibles para la codificación del espectro.

En el estándar MPEG2 Layer 3 se dividen, por ejemplo, veintiuna bandas de factores de escala en el caso de los llamados "bloques largos" o tres veces doce bandas de factores de escala en el caso de los llamados "bloques cortos" en cuatro regiones, respectivamente, es decir, 6-5-5-5 bandas de factores de escala por región para los "bloques largos" y 9-9-9-9 bandas de factores de escala para los "bloques cortos". En cada una de estas regiones, los factores de escala se codifican con el número de bits necesario para el factor de escala más alto de la región correspondiente. A través del valor "scalefac-comprimir" de la información lateral de la corriente de bits, se señaliza el número de bits con el que ha sido codificada cada región.

En el procedimiento según la invención se modifica para la velocidad de exploración de 8 kHz la tabla de los anchos de las bandas de factores de escala de tal forma que la región superior en el espectro ya sólo contenga muy pocas líneas, que por regla general no se utilizan de ningún modo o sólo se utilizan poco debido a las restricciones de los anchos de banda.

Según la invención, los factores de escala de las bandas de factores de escala de la región superior se ponen sin excepción a cero, de modo que no sea necesaria ninguna codificación de los factores de escala.

Debido a los bits así liberados, están disponibles bits adicionales para la cuantificación del espectro.

Efectivamente, el espectro se divide en el procedimiento según la invención de acuerdo con este ejemplo de realización en 17 bandas de factores de escala, sin que haya que abandonar por ello la sintaxis de la corriente de bits del estándar MPEG2.

Las tablas para los anchos de las bandas de factores de escala figuran a continuación. La tabla indicada en primer lugar para los anchos de las bandas de factores de escala para una velocidad de exploración de 16 kHz corresponde al estándar ISO-MPEG2-Layer 3. La tabla indicada en segundo lugar está modificada según la teoría de la invención para la velocidad de exploración de 8 kHz.

Anchos de las bandas de factores de escala para una velocidad de exploración de 16 kHz

(para fines comparativos según el estándar)

"Bloques largos"

6,6,6,6,6,6,8,10,12,14,16,20,24,28,32,38,46, 52,60,68,58,54

"Bloques cortos"

4,4,4,6,8,10,12,14,18,24,30,40,18

Anchos de las bandas de factores de escala para una velocidad de exploración de 8 kHz

"Bloques largos"

12,12,12,12,12,12,16,20,24,28,32,40,48,56, 64,76,90,2,2,2,2,2

"Bloques cortos"

8,8,8,12,16,20,24,28,36,2,2,2,26

Se observa que los últimos anchos de la banda de factores de escala son claramente menores en el procedimiento según la invención en comparación con el procedimiento conocido según el estándar. En caso de codificar con "bloques largos", las últimas 100 líneas de frecuencia están codificadas sin factor de escala. Esto corresponde a una restricción del posible ancho de banda de 4000 Hz a 3300 Hz. Por consiguiente, se puede conseguir el efecto deseado, si el ancho de banda utilizado es menor de 3300 Hz, lo cual es seguramente razonable en el caso de una velocidad de bits de 8 kbit/s, para la que está prevista la velocidad de exploración de 8 kHz.


 


Reivindicaciones:

1. Procedimiento para codificar una señal audio digitalizada con una velocidad de exploración baja,

en el que varias líneas de frecuencia adyacentes, respectivamente, de la señal audio digitalizada, las cuales están asignadas a una banda de factores de escala, se codifican con el mismo factor de escala;

en el que las bandas de factores de escala adyacentes forman una región, dentro de la cual están codificados todos los factores de escala con el mismo número de bits, respectivamente, que depende del factor de escala más alto de la región; y

en el que las líneas de frecuencia, al menos de la región superior de bandas de factores de escala, se codifican con el factor de escala 0 y en el que no se codifica ningún factor de escala, al menos para la región superior.

2. Procedimiento según la reivindicación 1, en el que los bits ahorrados en comparación con el estándar ISO-MPEG2 Layer 3 por la supresión de los factores de escala, al menos para la región superior, se utilizan para una cuantificación de las líneas de frecuencia más fina en comparación con el estándar.

3. Procedimiento según la reivindicación 1 ó 2, en el que la división de las líneas de frecuencia en bandas de factores de escala está modificada de tal forma en comparación con el estándar ISO-MPEG2 Layer 3 que los anchos de las bandas de factores de escala dentro de la región superior están reducidos en comparación con los anchos de las bandas de factores de escala de la región superior según este estándar.

4. Procedimiento según una de las reivindicaciones 1 a 3, en el que se transmite un "encabezador de delimitación" modificado en comparación con el "encabezador de delimitación" MPEG para señalizar la velocidad de exploración no conforme con el estándar.

5. Procedimiento según la reivindicación 4, en el que el "encabezador de delimitación" presenta la palabra sinc con el código hexadecimal "FFE".

 

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .