Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable.

Un procedimiento para la asignación de velocidades de transmisión de bits a una pluralidad de canales enun proceso de codificación de audio escalable,

el procedimiento comprendiendo: la asignación de diferentesvelocidades de transmisión de bits a diferentes canales en el proceso de codificación de audio escalable, en el quelas diferentes velocidades de transmisión de bits son asignadas a diferentes canales en un proceso de codificacióndel plano de bits, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canalessobre la base de los valores del plano de bits para los diferentes canales.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SG2008/000036.

Solicitante: AGENCY FOR SCIENCE, TECHNOLOGY AND RESEARCH.

Nacionalidad solicitante: Singapur.

Dirección: 1 Fusionopolis Way 20-10 Connexis Singapore 138632 SINGAPUR.

Inventor/es: RAHARDJA,SUSANTO, LI,TE, HUANG,HAIBIN.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
  • G10L19/14

PDF original: ES-2401817_T3.pdf

 

Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable.

Fragmento de la descripción:

Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable Campo de la invención Antecedentes cambiar dinámicamente durante la transmisión.

Formas de realización de la invención se refieren globalmente a la codificación de audio escalable. Específicamente, formas de realización de la invención se refieren a la distribución de la velocidad de transmisión de bits o el truncado de la velocidad de transmisión de bits para la codificación de audio escalable. Debido a los diversos escenarios de las aplicaciones, unsistema de codificaciónde audio escalable es altamente favorable el cual es capaz de producirun flujo de bits jerárquico cuya velocidad de transmisión de bits se puede Por ejemplo, la codificación sin pérdidas escalable (SLS) MPEG-4, revelada en el documento de R.Yu yotros "MPEG-4 Scalable to Lossless Audio Coding", Documentodel congreso 6183, presentado en el 117 Congreso de la Sociedad de Ingeniería Audio, 28-31 octubre 2004, proporciona un refinamiento gradual, a partir de niveles de reconstrucción ponderados perceptualmente provistos por elflujo de bits del núcleode la codificación de audio perceptual (por ejemplo, codificaciónde audio avanzada, AAC) hasta la resolución de la señal original. La señal original es transformada por una transformada de coseno discreto modificada de enteros (IntMDCT) y los datos espectrales IntMDCT resultantes se codifican con dos capas complementarias, incluyendo una capa de MPEG-4 AAC del núcleo la cual genera un flujo de bits compatible AAC a una velocidad de transmisión de bits previamente definida la cual constituye lamínima relación velocidad/calidad del flujo de bits sin pérdidas y una capa mejorada sin pérdidas que utiliza el procedimiento de codificación del plano de bits para producir escalabilidad de grano fino a una º

parte sin pérdidas de un flujo de bits sin pérdidas.

En el codificador sin pérdidas escalable MPEG-4 SLS, la velocidad de transmisión de bits para diferentes canales de la señal de audio está uniformemente distribuida para la codificación con pérdidas. Por ejemplo, la velocidad de transmisión de bits asignada a cada repartidor, Br/f, se calcula como:

B

r s/f

N S

B

r/f

en donde Br es la velocidad de transmisión de bits total (kbps) , Ns/f es el número de muestra/repartidor y S es la velocidad de muestreo. Si existen dos canales, Br/f, se distribuye uniformemente en los dos canales como:

B

r/f

B

B

Por ejemplo, si se utiliza la codificación estéreo conjunta central/lateral (codificación M/S Mid channel o canal central, y Side channel o canal lateral) , las velocidades de transmisión de bits asignada al canal central y al canal lateral son idénticas según la ecuación anterior. El canal central representa el promedio de los datos del canal izquierdo y derecho y el canal lateral representa la diferencia entre los datos del canal izquierdo y el derecho. En otro ejemplo, los canales primero y segundo son el canal izquierdo y el canal derecho y la velocidad de transmisión de bits se asigna entonces al canal izquierdo y derecho según la ecuación anterior.

El flujo de bits sin pérdidas que resulta a partir del codificador sin pérdidas escalable SLS se puede descodificar directamente o se puede truncar mediante un truncador. El flujo de bits sin pérdidas se trunca, por ejemplo, para aplicaciones de bajas velocidades de transmisión de bits, en donde el flujo de bits sin pérdidas se puede truncar para cada repartidor sobre la base de la velocidad de transmisión de bits objetivo. Para un repartidor, las longitudes originales del flujo de bits sin pérdidas para los canales primero y segundo están representadas como BS1 y BS2, respectivamente. La longitud del flujo de bits objetivo está indicada como BST. En un truncador sin pérdidas escalable SLS normal, las velocidades de transmisión de bits truncadas están repartidas como:

BST

,

La codificación estéreo M/S puede ser utilizada en la codificación de audio con pérdidas así como en la codificación 2

T T

BS

BS

2

min min BS1, BS2

de audio sin pérdidas, por ejemplo, en codificación de audio sin pérdidas escalable (SLS) MPEG-4. En la mayoría de los casos, existe comparativamente poca diferencia entre los datos de audio para los canales izquierdo y derecho, mientras en algunos otros casos, existe mucha diferencia entre los datos de audio para los canales izquierdo y derecho. Por consiguiente, la codificación de datos en los canales central y lateral generalmente resulta en una situación en la que el canal central es muy diferente del canal lateral. En este caso, distribuyendo uniformemente las velocidades de transmisión de bits entre el canal central y el canal lateral en la codificación de audio, o distribuyendo uniformemente las velocidades de transmisión de bits truncadas entre el canal central y el canal lateral se hace ineficaz.

También es conocido, según la solicitud de patente EP 1422694A2, un procedimiento para repartir diferentes velocidades de transmisión de bits a los canales de un codificador de audio integrado.

Es adicionalmente conocido, según la patente número US 6, 104, 321, un procedimiento para repartir diferentes velocidades de transmisión de bits a los canales de un codificador de audio según la magnitud del índice del factor de escala.

Resumen de la invención Una solución a los temas de la técnica anterior se proporciona mediante un procedimiento según la reivindicación 1, un medio legible por ordenador según la reivindicación 6, un codificador según la reivindicación 7 y un elemento de programa de ordenador según la reivindicación 9.

Breve descripción de los dibujos En los dibujos, caracteres de referencia iguales generalmente se refieren a las mismas piezas a través de las diferentes vistas. Los dibujos no necesariamente están a escala, proporcionándose en cambio globalmente énfasis en la ilustración de los principios de la invención. En la siguiente descripción, diversas formas de realización de la invención se describen con referencia a los siguientes dibujos, en los cuales:

La figura 1 muestra un cuadro de flujo de la asignación de velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable según una forma de realización de la invención.

La figura 2 muestra un cuadro de flujo de la asignación de velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable según otra forma de realización de la invención.

Las figura 3A y 3B muestran la estructura de un codificador de audio sin pérdidas escalable 300, 350 según las formas de realización de la invención.

La figura 4 muestra los máximos valores del nivel del plano de bits de cada banda del factor de escala (sbf) para un repartidor en un canal.

La figura 5 muestra un cuadro de flujo de la asignación de diferentes velocidades de transmisión de bits truncadas a diferentes canales según una forma de realización de la invención.

Las figuras 6A – 6C muestran diferentes velocidades de transmisión de bits truncadas para diferentes canales según las formas de realización de la invención.

La figura 7 muestra la estructura de un codificador sin pérdidas escalable SLS y un truncador según una forma de realización de la invención.

La figura 8 muestra un descodificador sin pérdidas escalable SLS y un truncador según una forma de realización de la invención.

La figura 9 muestra un cuadro de flujo de un proceso de descodificación de audio escalable según una forma de realización de la invención.

Las figuras 10A y 10B muestran la estructura de un descodificador de audio sin pérdidas escalable según las formas de realización de la invención.

Descripción Diversas formas de realización de la invención se basan en el descubrimiento de que la cantidad de datos del canal central es muy diferente de la cantidad de datos desde el canal lateral en la mayoría de los casos. Por lo tanto, el canal menor puede ser codificado con precisión utilizando menos velocidades de transmisión de bits, liberando de ese modo recursos los cuales pueden ser empleados más eficazmente en el canal mayor.

Una forma de realización de la invención proporciona un procedimiento para la asignación de velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable. El procedimiento puede incluir la asignación de diferentes velocidades de transmisión de bits a diferentes... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento para la asignación de velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable, el procedimiento comprendiendo: la asignación de diferentes velocidades de transmisión de bits a diferentes canales en el proceso de codificación de audio escalable, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales en un proceso de codificación del plano de bits, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales sobre la base de los valores del plano de bits para los diferentes canales.

2. El procedimiento de la reivindicación 1 en el que la pluralidad de canales comprende un canal central y un canal lateral de un proceso de codificación estéreo central/lateral; en el que una primera velocidad de transmisión de bits es asignada al canal central y una segunda velocidad de trasmisión de bits, la cual es diferente de la primera velocidad de transmisión de bits, es asignada al canal lateral, o en el que la pluralidad de canales comprende un canal izquierdo y un canal derecho; en donde una primera velocidad de transmisión de bits es asignada al canal izquierdo y una segunda velocidad de transmisión de bits, la cual es diferente de la primera velocidad de transmisión de bits, es asignada al canal derecho.

3. El procedimiento de la reivindicación 1 en el que las diferentes velocidades de transmisión de bits son asignadas a los diferentes canales preferiblemente sobre la base de la relación de los valores del plano de bits para los diferentes canales; en el que las diferentes velocidades de transmisión de bits son asignadas a los diferentes canales preferiblemente sobre la base de la relación de los valores máximos del plano de bits para los diferentes canales; en el que las diferentes velocidades de transmisión de bits son asignadas a los diferentes canales preferiblemente sobre la base de la relación de un primer valor máximo promedio del plano de bits el cual comprende un valor promedio de una pluralidad de valores máximos del plano de bits para un primer canal de la pluralidad de canales y un segundo valor máximo promedio del plano de bits el cual comprende un valor promedio de una pluralidad de valores máximos del plano de bits para un segundo canal de la pluralidad de canales.

4. El procedimiento de la reivindicación 1 adicionalmente comprendiendo: la asignación de diferentes velocidades de transmisión de bits truncadas a diferentes canales en un proceso de truncado de audio escalable, en el que el procedimiento opcionalmente comprende adicionalmente: la determinación de si una velocidad de transmisión de bits total objetivo es menor que o igual a la suma de una primera velocidad de transmisión de bits del núcleo perceptual para un primer canal de la pluralidad de canales y una segunda velocidad de transmisión de bits del núcleo perceptual para un segundo canal de la pluralidad de canales; en el caso de que la velocidad de transmisión de bits total objetivo sea menor que o igual a la suma de la velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, la asignación de diferentes velocidades de transmisión de bits truncadas a los diferentes canales en el proceso de truncado de audio escalable sobre la base de la velocidad de transmisión de bits total, la primera velocidad de transmisión de bits del núcleo perceptual y la segunda velocidad de transmisión de bits del núcleo perceptual, en el que en el caso de que la velocidad de transmisión de bits total objetivo sea menor que o igual a la suma de la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, las diferentes velocidades de transmisión de bits truncadas son asignadas preferiblemente a canales diferentes en el proceso de truncado de audio escalable sobre la base de la velocidad de transmisión de bits total y una relación entre la primera velocidad de transmisión de bits del núcleo perceptual y la segunda velocidad de transmisión de bits del núcleo perceptual, en el que en el caso en que la velocidad de transmisión de bits total objetivo sea menor que o igual a la suma de la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, una primera velocidad de transmisión de bits truncada preferiblemente se asigna a un primer canal de la pluralidad de canales según la siguiente ecuación:

BSP

TT 1

BS BS . ;

PP

BS1 + BS2

una segunda velocidad de transmisión de bits truncada preferiblemente se asigna a un segundo canal de la pluralidad de canales según la siguiente ecuación:

BSP

TT 2

BS BS .

PP

BS1 + BS2

en donde T

BS indica la primera velocidad de transmisión de bits truncada asignada al primer canal de la pluralidad de canales;

BST indica la velocidad de transmisión de bits total objetivo;

P

BS indica la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de 1canales;

P

BS indica la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la 2 pluralidad de canales;

T

BS indica la segunda velocidad de transmisión de bits truncada asignada al segundo canal de la pluralidad de 2 canales.

5. El procedimiento de la reivindicación 1 adicionalmente comprendiendo: la asignación de diferentes velocidades de transmisión de bits truncadas a diferentes canales en un proceso de truncado de audio escalable; en el que el procedimiento opcionalmente comprende adicionalmente la determinación de si una velocidad de transmisión de bits total objetivo es menor que o igual a la suma de una primera velocidad de transmisión de bits del núcleo perceptual para un primer canal de la pluralidad de canales y una segunda velocidad de transmisión de bits del núcleo perceptual para un segundo canal de la pluralidad de canales; en el caso en que la velocidad de transmisión de bits total objetivo sea mayor que la suma de la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, la asignación de diferentes velocidades de transmisión de bits truncadas a los diferentes canales en el proceso de truncado de audio escalable sobre la base de la velocidad de transmisión de bits total, la primera velocidad de transmisión de bits del núcleo perceptual, la segunda velocidad de trasmisión de bits del núcleo perceptual, una primera velocidad de bits de intensificación para una capa de intensificación del primer canal y una segunda velocidad de transmisión de bits de intensificación para una capa de intensificación del segundo canal, en el que en el caso en que la velocidad de transmisión de bits total objetivo sea mayor que la suma de la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de trasmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, las diferentes velocidades de transmisión de bits truncadas son preferiblemente asignadas a los diferentes canales en el proceso de truncado de audio escalable sobre la base de la velocidad de trasmisión de bits total, la primera velocidad de trasmisión de bits del núcleo perceptual, la segunda velocidad de transmisión de bits del núcleo perceptual y una relación entre la primera velocidad de transmisión de bits de intensificación para una capa de intensificación del primer canal y la segunda velocidad de transmisión de bits de intensificación para una capa de intensificación del segundo canal, en el que en el caso en que la velocidad de transmisión de bits total objetivo sea mayor que la suma de la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de canales y la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la pluralidad de canales, una primera velocidad de transmisión de bits truncada preferiblemente es asignada a un primer canal de la pluralidad de canales según la siguiente ecuación:

BS BSP

T P TPP

BS BS + BS BS BS . P11 P;

12

BS BS + BS BS

22

una segunda velocidad de transmisión de bits truncada preferiblemente es asignada a un segundo canal de la pluralidad de canales según la siguiente ecuación:

BS BSP

T P TPP

BS BS + BS BSBS . 22

12PP

BS BS + BS BS

22

en donde T

BS indica la primera velocidad de transmisión de bits truncada asignada al primer canal de la pluralidad de 1canales;

BST indica la velocidad de transmisión de bits total objetivo;

P

BS indica la primera velocidad de transmisión de bits del núcleo perceptual para el primer canal de la pluralidad de 1canales;

P

BS indica la segunda velocidad de transmisión de bits del núcleo perceptual para el segundo canal de la 2 pluralidad de canales;

BS indica una primera velocidad de transmisión de bits parcial provista para el primer canal de la pluralidad de 1canales;

BS indica una segunda velocidad de transmisión de bits parcial provista para el segundo canal de la pluralidad de 2 canales;

T

BS indica la segunda velocidad de transmisión de bits truncada asignada al segundo canal de la pluralidad de 2 canales.

6. Un medio legible por ordenador, provisto de un programa grabado en el mismo en el que el programa está configurado para hacer que un ordenador ejecute un procedimiento para la asignación de velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable que comprende: la asignación de diferentes velocidades de transmisión de bits a diferentes canales en el proceso de codificación de audio escalable, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales en un proceso de codificación del plano de bits, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales sobre la base de los valores del plano de bits para los diferentes canales.

7. Un codificador para la codificación de audio escalable que comprende: un circuito de asignación configurado para asignar diferentes velocidades de transmisión de bits a diferentes canales de una pluralidad de canales en el proceso de codificación de audio escalable, en el que el circuito de asignación está configurado para asignar las diferentes velocidades de transmisión de bits a los diferentes canales en un proceso de codificación del plano de bits, en el que el circuito de asignación está configurado para asignar las diferentes velocidades de transmisión de bits a los diferentes canales sobre la base de los valores del plano de bits para los diferentes canales.

8. El codificador de la reivindicación 7 en el que el codificador es un codificador de audio sin pérdidas escalable que comprende: un circuito de transformación de dominio configurado para transformar una señal de audio para formar una señal transformada; un circuito de codificación configurado para codificar la señal transformada para formar un flujo de bits de la capa del núcleo; un circuito de codificación central/lateral configurado para codificar la señal transformada para formar una señal codificada central/lateral; un circuito de asignación de errores configurado para realizar una asignación de errores sobre la base de la señal codificada central-lateral y el flujo de bits de la capa del núcleo para extraer información que ha sido codificada en el flujo de bits de la capa del núcleo, resultando en una señal de error; un circuito de codificación del plano de bits configurado para codificar el plano de bits de la señal de error sobre la base de las diferentes velocidades de transmisión de bits para formar un flujo de bits de la capa de intensificación, en el que el circuito de codificación del plano de bits comprende el circuito de asignación configurado para asignar las diferentes velocidades de transmisión de bits a los diferentes canales de la pluralidad de canales en el proceso de codificación del plano de bits; y un circuito de multiplexado configurado para multiplexar el flujo de bits de la capa del núcleo y el flujo de bits de la capa de intensificación, generando de ese modo un flujo de bits codificado escalable.

9. Un elemento de programa de ordenador el cual está configurado para hacer que un ordenador ejecute un procedimiento para la asignación de las velocidades de transmisión de bits a una pluralidad de canales en un proceso de codificación de audio escalable que comprende: la asignación de diferentes velocidades de transmisión de bits a diferentes canales en el proceso de codificación de audio escalable, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales en un proceso de codificación del plano de bits, en el que las diferentes velocidades de transmisión de bits son asignadas a diferentes canales sobre la base de los valores del plano de bits para los diferentes canales.


 

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Imagen de 'Codificador y decodificador de audio para codificar tramas de…'Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .