Transcodificación de audio de baja complejidad.

Un método para transcodificar información codificada de audio en una segunda señal codificada,

comprendiendoel método:

recibir una primera señal codificada transporta primeras mantisas cuantificadas, primeros exponentes, uno o másprimeros parámetros de control, y uno o más segundos parámetros de control, donde las primeras mantisascuantificadas y los primeros exponentes representan componentes espectrales de una señal de audio en unarepresentación de coma flotante, donde cada primer exponente se asocia con las una o más primeras mantisascuantificadas, cada primera mantisa cuantificada se estima de acuerdo con su primer exponente asociado que serepresenta mediante un número fijo de bits o, alternativamente, se restringe a tener un valor dentro de una gamaprescrita, y cada primera mantisa cuantificada y cada primer exponente asociado representan un respectivocomponente espectral;

obtener mantisas descuantificadas a partir de las primeras mantisas cuantificadas, descuantificándolas de acuerdocon resoluciones de cuantificación adaptadas en respuesta a los uno o más primeros parámetros de control;derivar segundos exponentes, donde dicha derivación comprende reducir primeros exponentes en uno y desplazarhacia la derecha las una o más primeras mantisas descuantificadas asociadas;

obtener segundas mantisas cuantificadas cuantificando las mantisas descuantificadas usando resoluciones decuantificación adaptadas en respuesta a los uno o más segundos parámetros de control, donde cada segundoexponente se asocia a una o más segundas mantisas cuantificadas, cada segunda mantisa cuantificada se estimade acuerdo con su segundo exponente asociado, y cada segunda mantisa cuantificada y cada segundo exponenteasociado representan un respectivo componente de control; y

ensamblar las segundas mantisas cuantificadas, los segundos exponentes y uno o más segundos parámetros decontrol en la segunda señal codificada.

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E09012227.

Solicitante: DOLBY LABORATORIES LICENSING CORP.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 PORTRERO AVENUE SAN FRANCISCO, CA 94103 ESTADOS UNIDOS DE AMERICA.

Inventor/es: TRUMAN, MICHAEL, MEAD, LENNON,BRIAN,TIMOTHY, ANDERSEN,ROBERT,LORING.

Fecha de Publicación: 5 de Septiembre de 2013.

Clasificación Internacional de Patentes:

G10L19/14
G10L19/16 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › Estructura de codificadores de voz.

PDF original: ES-2421713_T3.pdf

Fragmento de la descripción:

Transcodificación de audio de baja complejidad

Campo técnico La presente invención concierne, en general, a métodos y dispositivos de codificación de audio y, más específicamente, concierne a métodos y dispositivos mejorados para codificar y transcodificar información de audio.

Técnica anterior

A. CODIFICACIÓN

Muchos sistemas de comunicaciones se enfrentan al problema de que la demanda de transmisión de información y

de la capacidad de grabación excede a menudo de la capacidad disponible. Como resultado, existe un interés considerable entre los que se encuentran en los campos de retransmisión y grabación para reducir la cantidad de información requerida para transmitir o grabar una señal de audio destinada a la percepción humana sin degradar la calidad percibida.

Existe también un interés en mejorar la calidad percibida de la señal de salida para una anchura de banda o capacidad de almacenamiento dadas.

Los métodos tradicionales para reducir los requisitos de capacidad de información implican la transmisión o la grabación solamente de partes seleccionadas de la señal de entrada. Las partes restantes se descartan. Las técnicas conocidas como la codificación perceptiva convierten típicamente una señal de audio original en componentes espectrales o señales de sub-banda de frecuencias, de manera que aquellas partes de la señal que son redundantes o irrelevantes pueden ser identificadas y descartadas con mayor facilidad. Se estima que una parte de una señal es redundante si puede volverse a crear a partir de otras partes de la señal. Se estima que una parte de una señal es irrelevante si es perceptivamente insignificante o inaudible. Un descodificador perceptivo puede volver a crear las partes redundantes omitidas de una señal codificada, pero no puede crear ninguna información irrelevante omitida que no sea también redundante.

Sin embargo, la pérdida de información irrelevante es aceptable en muchas aplicaciones, porque su ausencia no tiene un efecto perceptible sobre la señal descodificada.

Una técnica de codificación de señales es perceptivamente transparente si descarta solamente aquellas partes de una señal que son redundantes o bien perceptivamente irrelevantes. Una manera en la cual las partes irrelevantes de una señal pueden ser descartadas, es representar componentes espectrales con menores niveles de precisión, lo que se denomina a menudo cuantificación. La diferencia entre un componente espectral original y su representación cuantificada en conocida como ruido de cuantificación. Las representaciones con una precisión menor tienen un nivel más alto de ruido de cuantificación. Las técnicas de codificación perceptiva intentan controlar el nivel del ruido de cuantificación, de manera que sea inaudible.

Si una técnica perceptivamente transparente no puede conseguir una reducción suficiente de los requisitos de 45 capacidad de información, se necesita entonces una técnica perceptivamente no transparente para descartar las partes adicionales de la señal que no son redundantes y son perceptivamente relevantes. El resultado inevitable es que la fidelidad percibida de la señal transmitida o registrada se degrada. Preferiblemente, una técnica perceptivamente no transparente descarta solamente aquellas partes de la señal que se estima que tienen el menor significado perceptivo.

Se puede utilizar una técnica de codificación denominada “acoplamiento”, que se considera a menudo como perceptivamente no transparente, para reducir los requisitos de capacidad de información. De acuerdo con esta técnica, los componentes espectrales en dos o más señales de audio de entrada son combinados para formar una señal de canal acoplado con una representación compuesta de estos componentes espectrales. Se genera también 55 una información lateral, que representa una envolvente espectral de los componentes espectrales en cada una de las señales de audio de entrada, que son combinadas para formar la representación compuesta. Una señal codificada que incluye la señal de canal acoplado y la información lateral, es transmitida o registrada para su descodificación subsiguiente por un receptor. El receptor genera señales desacopladas, que son réplicas inexactas de las señales de entrada originales, generando copias de la señal de canal acoplado y utilizando la información lateral para efectuar una estimación de los componentes espectrales en las señales copiadas, de manera que las envolventes espectrales de las señales de entrada originales son sustancialmente restauradas. Una técnica típica de acoplamiento para un sistema estéreo de dos canales, combina componentes de alta frecuencia de las señales de los canales izquierdo y derecho, para formar una sola señal de componentes compuestos de alta frecuencia, y genera información lateral que representa las envolventes espectrales de los componentes de alta frecuencia en las 65 señales originales de los canales izquierdo y derecho. Un ejemplo de una técnica de acoplamiento está descrito en el documento “Compresión Digital de Audio (AC-3) ”, que es el documento estándar A/52 (1994) del Comité de Sistemas Avanzados de Televisión (ATSC) , que en esta memoria se denomina documento A/52.

Una técnica de codificación conocida como regeneración espectral, es una técnica perceptivamente no transparente que puede ser utilizada para reducir los requisitos de capacidad de información. En muchas implementaciones, esta 5 técnica se denomina “regeneración de alta frecuencia” (HFR) , porque solamente se regeneran los componentes espectrales de alta frecuencia. De acuerdo con esta técnica, se transmite o almacena una señal de banda base que contenga solamente componentes de baja frecuencia de una señal de audio de entrada. Se proporciona también información lateral, que representa una envolvente espectral de los componentes originales de alta frecuencia. Se transmite o se registra una señal codificada que incluya la señal de banda base y la información lateral, para su posterior descodificación por un receptor. El receptor regenera los componentes de alta frecuencia omitidos con niveles espectrales basados en la información lateral, y combina la señal de banda base con los componentes de alta frecuencia regenerados, para producir una señal de salida. Se puede encontrar una descripción de métodos conocidos para la HFR en el artículo de Makhoul y Berouti “High-Frequency Regeneration in Speech Coding Systems” (“Regeneración de Alta Frecuencia en Sistemas de Codificación del Habla”) , Proc. of the International

Conf. on Acoust., Speech and Signal Proc., abril de 1979. Se divulgan técnicas mejoradas de regeneración espectral que son adecuadas para la codificación de música de alta calidad en los documentos US-A1-2003/0187663, US-A12003/0233234, US-A1-2003/0233236 y US-A1- 2004/0225505.

B. TRANSCODIFICACIÓN

Las técnicas de codificación conocidas han reducido los requisitos de capacidad de información de las señales de audio para un nivel dado de calidad percibida o, a la inversa, han mejorado la calidad percibida de las señales de audio que tienen una capacidad de información especificada. A pesar de este éxito, existe una demanda para un mayor avance y continúa la investigación sobre la codificación para descubrir nuevas técnicas de codificación y para descubrir nuevas formas de utilizar las técnicas conocidas.

Una consecuencia de los avances adicionales es una potencial incompatibilidad entre señales que son codificadas por técnicas de codificación más modernas y por equipos existentes que implementan técnicas de codificación más antiguas. Aunque se ha hecho un gran esfuerzo por organizaciones de estándares y por fabricantes de equipos para impedir la obsolescencia prematura, los receptores más antiguos no pueden descodificar siempre correctamente las señales que están descodificadas por técnicas de codificación más modernas. A la inversa, los receptores más modernos no siempre pueden descodificar correctamente las señales que están codificadas por técnicas de codificación más antiguas. Como resultado, tanto los profesionales como los consumidores adquieren y mantienen muchos equipos si desean asegurar la compatibilidad con las señales codificadas por técnicas de codificación antiguas y modernas.

Una manera con la que puede aliviarse o evitarse esta carga es adquirir un transcodificador que pueda convertir señales codificadas de un formato a otro. Un transcodificador puede servir como puente entre diferentes técnicas de codificación. Por ejemplo, un transcodificador puede convertir una señal que está codificada con una técnica de codificación moderna... [Seguir leyendo]

Reivindicaciones:

1. Un método para transcodificar información codificada de audio en una segunda señal codificada, comprendiendo el método:

recibir una primera señal codificada transporta primeras mantisas cuantificadas, primeros exponentes, uno o más primeros parámetros de control, y uno o más segundos parámetros de control, donde las primeras mantisas cuantificadas y los primeros exponentes representan componentes espectrales de una señal de audio en una representación de coma flotante, donde cada primer exponente se asocia con las una o más primeras mantisas cuantificadas, cada primera mantisa cuantificada se estima de acuerdo con su primer exponente asociado que se representa mediante un número fijo de bits o, alternativamente, se restringe a tener un valor dentro de una gama prescrita, y cada primera mantisa cuantificada y cada primer exponente asociado representan un respectivo componente espectral;

obtener mantisas descuantificadas a partir de las primeras mantisas cuantificadas, descuantificándolas de acuerdo con resoluciones de cuantificación adaptadas en respuesta a los uno o más primeros parámetros de control;

derivar segundos exponentes, donde dicha derivación comprende reducir primeros exponentes en uno y desplazar hacia la derecha las una o más primeras mantisas descuantificadas asociadas;

obtener segundas mantisas cuantificadas cuantificando las mantisas descuantificadas usando resoluciones de cuantificación adaptadas en respuesta a los uno o más segundos parámetros de control, donde cada segundo exponente se asocia a una o más segundas mantisas cuantificadas, cada segunda mantisa cuantificada se estima de acuerdo con su segundo exponente asociado, y cada segunda mantisa cuantificada y cada segundo exponente asociado representan un respectivo componente de control; y

ensamblar las segundas mantisas cuantificadas, los segundos exponentes y uno o más segundos parámetros de control en la segunda señal codificada.

2. Un transcodificador para transcodificar información codificada de audio, en el que el transcodificador comprende medios adaptados para realizar todos los pasos del método de acuerdo con la reivindicación 1.

3. Un medio que transporta un programa de instrucciones ejecutable por un dispositivo, en el que la ejecución del

programa de instrucciones hace que el dispositivo realice todos los pasos del método de acuerdo con la 35 reivindicación 1.

Patentes similares o relacionadas:

Decodificación de audio estéreo paramétrico, del 9 de Enero de 2019, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor para desmultiplexar un flujo de bits para obtener una señal mono y parámetros de amplitud estéreo; […]

Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico, del 20 de Septiembre de 2017, de DOLBY INTERNATIONAL AB: Receptor, que comprende: un demultiplexor configurado para extraer una señal monofónica codificada y parámetros de amplitud estereofónica […]

Método de codificación, método de descodificación, codificador, descodificador, programa y medio de grabación, del 29 de Marzo de 2017, de NIPPON TELEGRAPH AND TELEPHONE CORPORATION: Un método de codificación de voz o de señales acústicas que comprende adquirir códigos correspondientes a residuos de predicción obtenidos según […]

Dispositivo de codificación de sonido y procedimiento de codificación de sonido, del 25 de Enero de 2017, de III Holdings 12, LLC: Un aparato de codificación de voz que comprende: una sección de análisis de parámetro de predicción que calcula una diferencia de retardo y una relación […]

Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas, del 2 de Febrero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio adaptado para codificar tramas de una señal de audio muestreada para obtener tramas codificadas, en el que una […]

Codificador y descodificador de audio para codificar y descodificar muestras de audio, del 6 de Enero de 2016, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de audio para codificar muestras de audio, que comprende: un primer codificador de introducción de distorsión por repliegue del espectro […]

Códec de audio sin pérdidas escalable y herramienta de autoría, del 6 de Mayo de 2015, de DTS, INC: Un método para codificar un flujo de bits sin pérdidas escalable para muestras de audio de PCM de M-bits para decodificar mediante un decodificador sin […]

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora, del 25 de Marzo de 2015, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador de extensión de ancho de banda para codificar una señal de audio , la señal de audio que comprende una señal […]