Códec de audio sin pérdidas escalable y herramienta de autoría.

Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin pérdidas compatible hacia atrás que comprende:

codificar las muestras de audio de PCM de M-bits en un flujo principal de M-bits con pérdidas

(408);

empaquetar el flujo principal de M-bits con pérdidas en un flujo de bits;

decodificar el flujo principal de M-bits en una señal principal reconstruida (414);

separar (417) las muestras de audio de PCM de M-bits en porciones de MSB de M-N bits y de LSB de N-bits (418);

empaquetar la porción de LSB de N-bits en el flujo de bits;

desplazar (415) a la derecha la señal principal reconstruida en N bits para alinearla con la porción de MSB;

restar (420) la señal principal reconstruida de la porción de MSB para formar una señal de diferencia de M-N bits (422);

codificar sin pérdidas la señal de diferencia;

empaquetar la señal de diferencia codificada en el flujo de bits; y

empaquetar las achuras de bits de las porciones de LSB en el flujo de bits sin pérdidas.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10167970.

Solicitante: DTS, INC.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5220 Las Virgenes Road Calabasas, CA 91302 ESTADOS UNIDOS DE AMERICA.

Inventor/es: FEJZO,Zoran.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/14
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))

PDF original: ES-2537820_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Códec de audio sin pérdidas escalable y herramienta de autoría Antecedentes de la invención Campo de la invención Esta invención se refiere a códecs de audio sin pérdidas y más específicamente a un códec de audio sin pérdidas escalable.

Descripción de la técnica relacionada Actualmente se usan numerosos sistemas de codificación de audio con pérdidas de baja tasa de bits en una amplia gama de productos y servicios de reproducción de audio de consumo y profesional. Por ejemplo, el sistema de codificación de audio Dolby AC3 (Dolby digital) es una norma mundial para codificar pistas de sonido de audio estéreo y de 5.1 canales para Laser Disc, DVD vídeo codificado NTSC y ATV, usando tasas de bits de hasta 640 kbit/s. Las normas de codificación de audio de MPEG I y MPEG II se usan ampliamente para codificación de pistas de sonido estéreo y multi-canal para DVD vídeo codificado PAL, difusión de radio digital terrestre en Europa y difusión por Satélite en los Estados Unidos, a tasas de bits de hasta 768 kbit/s. El sistema de codificación de audio de Coherent Acoustics DTS (Sistemas de Cine Digital) se usa frecuentemente para pistas de sonido de audio de 5.1 canales de calidad de estudio para Discos Compactos, DVD vídeo, Difusión por Satélite en Europa y Laser Disc y tasas de bits de hasta 1536 kbit/s.

Un códec mejorado que ofrece ancho de banda de 96 kHz y resolución de 24 bits se desvela en la patente de Estados Unidos Nº 6.226.616 (asignada también a Digital Theater Systems, Inc.) . Esa patente emplea una metodología principal y de extensión en la que el algoritmo de codificación de audio tradicional constituye el codificador de audio `principal, y permanece sin alterar. Los datos de audio necesarios para representar frecuencias de audio superiores (en el caso de tasas de muestreo superiores) o resolución de muestreo superior (en el caso de longitudes de palabra más largas) , o ambas, se transmite como un flujo de `extensión. Esto permite a los proveedores de contenido de audio incluir un único flujo de bits de audio que es compatible con diferentes tipos de decodificadores residentes en la base del equipo de consumo. El flujo principal se decodificará por los decodificadores más antiguos que ignorarán los datos de extensión, mientras que los decodificadores más nuevos harán uso de tanto los flujos de datos principales y de extensión que proporcionan reproducción de sonido de calidad superior. Sin embargo, este enfoque anterior no proporciona codificación o decodificación verdaderamente sin pérdidas. Aunque el sistema de la patente de Estados Unidos Nº 6.226.216 proporciona reproducción de audio de calidad superior, no proporciona rendimiento "sin pérdidas".

Recientemente, muchos consumidores han mostrado interés en estos denominados códecs "sin pérdidas". Los códecs "sin pérdidas" se basan en algoritmos que comprimen datos sin descartar ninguna información. Como tal, no emplean efectos piscoacústicos tales como "enmascaramiento". Un códec sin pérdidas produce una señal decodificada que es idéntica a la señal fuente (digitalizada) . Este rendimiento tiene un coste: tales códecs normalmente requieren más ancho de banda que los códecs con pérdidas, y comprimen los datos a un menor grado.

La ausencia de compresión puede producir un problema cuando se realiza autoría de contenido para un disco, CD, DVD, etc., particularmente en casos de material fuente altamente no-correlacionado o requisitos de ancho de banda de la fuente muy grandes. Las propiedades ópticas de los medios establecen una tasa de bits pico para todo el contenido que no puede superarse. Como se muestra en la Figura 1, un umbral 10 definitivo, por ejemplo, 9, 6 Mbps para DVD audio, se establece normalmente para audio de modo que la tasa de bits total no supere el límite del medio.

El audio y otros datos se disponen en el disco para satisfacer las diversas restricciones del medio y para asegurar que todos los datos que se requieren para decodificar una trama dada estarán presentes en la memoria intermedia del decodificador de audio. La memoria intermedia tiene el efecto de suavizar la cabida útil 12 codificada trama a trama (tasa de bits) , que puede fluctuar incontroladamente de trama a trama, para crear una cabida útil 14 almacenada en memoria intermedia, es decir el promedio almacenado en memoria intermedia de la cabida útil codificada trama a trama. Si la cabida útil 14 almacenada en memoria intermedia del flujo de bits sin pérdidas para un canal dado supera el umbral en cualquier punto los ficheros de entrada de audio se alteran para reducir su contenido de información. Los ficheros de audio pueden alterarse reduciendo la profundidad de bits de uno o más canales tal como de 24 bits a 22 bits, filtrando un ancho de banda de frecuencia del canal para paso bajo únicamente, o reduciendo el ancho de banda del audio tal como filtrando información por encima de 40 kHz cuando se muestrea a 96 kHz. Los ficheros de entrada de audio alterado se re-codifican de modo que la cabida útil 16 nunca supera el umbral 10. Un ejemplo de este proceso se describe en SurCode MLP -Manual de Usuario págs. 20-23.

Esto es un proceso muy computacional e ineficaz en tiempo. Adicionalmente, aunque el codificador de audio es aún sin pérdidas, la cantidad del contenido de audio que se suministra al usuario se ha reducido a través de todo el flujo

de bits. Además, el proceso de alteración es inexacto, si se elimina demasiada poca información el problema puede existir aún, si se elimina demasiada información los datos de audio se descartan innecesariamente. Además, el proceso de autoría tendrá que adaptarse a las propiedades ópticas específicas del medio y al tamaño de memoria intermedia del decodificador.

El documento US2003/0179938A1 describe una técnica para generar una señal comprimida dividiendo una unidad de dos o más bits en una parte de MSB y una de LSB donde únicamente se comprime la parte de MSB de una manera sin pérdidas, y se combina con los LSB comprimidos para formar la señal comprimida.

Sumario de la invención En un primer aspecto la presente invención proporciona un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin pérdidas compatible hacia atrás, que comprende: codificar las muestras de audio de PCM de M-bits en un flujo principal de Mbits con pérdidas; empaquetar el flujo principal de M-bits con pérdidas en un flujo de bits; decodificar el flujo principal de M-bits en una señal principal reconstruida; separar las muestras de audio de PCM de M-bits en porciones de MSB de M-N bits y de LSB de N-bits; empaquetar la porción de LSB de N-bits en el flujo de bits; desplazar a la derecha la señal principal reconstruida en N bits para alienarla con la porción de MSB; restar la señal principal reconstruida de la porción de MSB para formar una señal de diferencia de M-N bits; codificar sin pérdidas la señal de diferencia; empaquetar la señal de diferencia codificada en el flujo de bits; y empaquetar las anchuras de bits de las porciones de LSB en el flujo de bits sin pérdidas.

En un segundo aspecto la presente invención proporciona un método para decodificar un flujo de bits para muestras de audio de PCM de M-bits, comprendiendo el flujo de bits un flujo principal, un flujo de extensión de bits menos significativos de N-bits (LSB) y un flujo de extensión de bits más significativos de M-N bits (MSB) , comprendiendo el método: desempaquetar el flujo de bits, incluyendo el desempaquetamiento separar el flujo principal del flujo de extensión de MSB y del flujo de extensión de LSB; decodificar el flujo principal en un flujo principal decodificado de PCM de M-bits con pérdidas usando un decodificador... [Seguir leyendo]

 


Reivindicaciones:

1. Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin pérdidas compatible hacia atrás que comprende:

codificar las muestras de audio de PCM de M-bits en un flujo principal de M-bits con pérdidas (408) ; empaquetar el flujo principal de M-bits con pérdidas en un flujo de bits; decodificar el flujo principal de M-bits en una señal principal reconstruida (414) ; separar (417) las muestras de audio de PCM de M-bits en porciones de MSB de M-N bits y de LSB de N-bits (418) ; empaquetar la porción de LSB de N-bits en el flujo de bits; desplazar (415) a la derecha la señal principal reconstruida en N bits para alinearla con la porción de MSB; restar (420) la señal principal reconstruida de la porción de MSB para formar una señal de diferencia de M-N bits (422) ; codificar sin pérdidas la señal de diferencia; empaquetar la señal de diferencia codificada en el flujo de bits; y empaquetar las achuras de bits de las porciones de LSB en el flujo de bits sin pérdidas.

2. El método de la reivindicación 1, que además comprende añadir vibración a la señal principal reconstruida antes de desplazar a la derecha y empaquetar un parámetro de vibración en el flujo de bits.

3. Un método para decodificar un flujo de bits para muestras de audio de PCM de M-bits, comprendiendo el flujo de bits un flujo principal (408) , un flujo de extensión de bits menos significativos (418) (LSB) de N-bits y un flujo de extensión de bits más significativos (426) (MSB) de M-N bits, comprendiendo el método:

desempaquetar el flujo de bits, incluyendo el desempaquetamiento separar el flujo principal desde el flujo de extensión de MSB y del flujo de extensión de LSB; decodificar el flujo principal en un flujo principal decodificado de PCM de M-bits con pérdidas usando un decodificador principal (432) ; decodificar el flujo de extensión de MSB en un flujo de extensión de MSB decodificado sin pérdidas usando un decodificador de (MSB) sin pérdidas (434) ; desplazar (436) a la derecha el flujo principal decodificado en N bits para producir un flujo principal desplazado a la derecha; combinar (438) el flujo principal decodificado desplazado a la derecha con el flujo de extensión de MSB decodificado para producir una salida sumada; desplazar (440) a la izquierda la salida sumada en N bits para producir una salida sumada desplazada a la izquierda; y combinar (446) la salida sumada desplazada a la izquierda con el flujo de extensión de LSB para formar una reconstrucción sin pérdidas de la señal de audio de PCM de M-bits original.

4. El método de la reivindicación 3, en el que el flujo principal (408) incluye 64 bandas, y en el que la etapa de decodificar el flujo principal incluye:

poner a cero las muestras de sub-bandas para unas 32 bandas superiores del flujo principal de 64 bandas.

5. Un codificador (400) configurado para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin pérdidas compatible hacia atrás, que comprende:

un codificador principal (404) configurado para codificar las muestras de audio de PCM de M-bits en un flujo principal de M-bits con pérdidas (408) ; un empaquetador (410) configurado para empaquetar el flujo principal de M-bits con pérdidas en un flujo de bits; un decodificador principal (412) configurado para decodificar el flujo principal de M-bits en una señal principal reconstruida (414) ; medios para separar las muestras de audio de PCM de M-bits en porciones de MSB de M-N bits y de LSB de Nbits (418) ; medios para desplazar a la derecha la señal principal reconstruida en N bits para alinearla con la porción de MSB; un nodo de resta (420) configurado para restar la señal principal reconstruida de la porción de MSB para formar una señal de diferencia de M-N bits (422) ; y un codificador sin pérdidas (422) configurado para codificar sin pérdidas la señal de diferencia; en donde el empaquetador está además configurado para:

empaquetar la porción de LSB de N-bits en el flujo de bits; empaquetar la señal de diferencia codificada en el flujo de bits; y empaquetar las anchuras de bits de las porciones de LSB en el flujo de bits.

6. El codificador de la reivindicación 5, en donde el codificador además comprende medios para añadir vibración a la señal principal reconstruida antes de que la señal principal reconstruida se desplace a la derecha, y en donde el empaquetador está además configurado para empaquetar un parámetro de vibración en el flujo de bits.

7. Un decodificador configurado para decodificar un flujo de bits para muestras de audio de PCM de M-bits, comprendiendo el flujo de bits un flujo principal (408) , un flujo de extensión de bits menos significativos (418) (LSB) de N-bits y un flujo de extensión de bits más significativos (426) (MSB) de M-N bits, comprendiendo el decodificador:

un desempaquetador (430) configurado para desempaquetar el flujo de bits y separar el flujo principal desde el flujo de extensión de MSB y del flujo de extensión de LSB; un decodificador principal (432) configurado para decodificar el flujo principal en un flujo principal decodificado de PCM de M-bits con pérdidas; un decodificador de MSB sin pérdidas (434) configurado para decodificar el flujo de extensión de MSB en un flujo de extensión de MSB decodificado sin pérdidas (442) ;

medios para desplazar a la derecha el flujo principal decodificado en N bits para producir un flujo principal decodificado desplazado a la derecha; un sumador (438) configurado para combinar el flujo principal decodificado desplazado a la derecha con el flujo de extensión de MSB decodificado para producir una salida sumada; medios para desplazar a la izquierda la salida sumada en N bits para producir una salida sumada desplazada a la izquierda; medios para combinar la salida sumada desplazada a la izquierda con el flujo de extensión de LSB para formar una reconstrucción sin pérdidas de la señal de audio de PCM de M-bits original.

8. El decodificador (432) de la reivindicación 7, en el que el flujo principal (408) incluye 64 bandas, y en donde el decodificador principal (432) está además configurado para poner a cero las muestras de sub-bandas para 32 bandas superiores del flujo principal de 64 bandas.