Método y aparato para procesar una señal de audio.

Método de procesamiento de una señal de audio, que comprende las etapas de:

identificar si un tipo de codificación de la señal de audio es un tipo de codificación de señales musicales utilizando información de un primer tipo;

si el tipo de codificación de la señal de audio no es el tipo de codificación de señales musicales

, identificar si el tipo de codificación de la señal de audio es un tipo de codificación de señales de habla o un tipo de codificación de señales mixtas utilizando información de un segundo tipo;

si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, extraer los datos espectrales y un coeficiente de predicción lineal de la señal de audio;

generar una señal residual para predicción lineal llevando a cabo una conversión de frecuencia inversa sobre los datos espectrales;

reconstruir la señal de audio llevando a cabo una codificación de predicción lineal sobre el coeficiente de predicción lineal y la señal residual; y

reconstruir una señal de región de alta frecuencia utilizando una señal de base de extensión correspondiente a una región parcial de la señal de audio reconstruida e información de extensión de banda.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/KR2009/001081.

Solicitante: LG ELECTRONICS INC..

Nacionalidad solicitante: República de Corea.

Dirección: 20, Yeouido-dong, Yeongdeungpo-gu Seoul 150-721 REPUBLICA DE COREA.

Inventor/es: YOON,Sung Yong, LEE,Hyun Kook, KIM,Dong Soo, LIM,Jae Hyun.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION H — ELECTRICIDAD > TECNICA DE LAS COMUNICACIONES ELECTRICAS > TRANSMISION DE IMAGENES, p. ej. TELEVISION > Sistemas de televisión (detalles H04N 3/00, H04N... > H04N7/24 (Sistemas para la transmisión de señales de televisión que utilizan la modulación por impulsos codificados (H04N 21/00  tiene prioridad))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/30 (Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia)
  • SECCION G — FISICA > REGISTRO DE LA INFORMACION > REGISTRO DE LA INFORMACION BASADO EN UN MOVIMIENTO... > Tratamiento de la señal, no específica del procedimiento... > G11B20/10 (Registro o reproducción digitales)

PDF original: ES-2464722_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método y aparato para procesar una señal de audio.

Antecedentes de la invención Campo de la invención La presente invención se refiere a un aparato de procesamiento de señales de audio para codificar y decodificar varios tipos de señales de audio de manera eficaz, y a un método para ello.

Exposición de la técnica relacionada En general, las tecnologías de codificación se clasifican convencionalmente en dos tipos, tales como los codificadores de audio perceptuales y los codificadores basados en la predicción lineal. Por ejemplo, el codificador de audio perceptual, optimizado para música, adopta un esquema en el que se reduce el tamaño de la información en un proceso de codificación usando el principio del enmascaramiento, el cual constituye una teoría de sicoacústica auditiva humana, sobre un eje de frecuencia. Por el contrario, el codificador basado en la predicción lineal, optimizado para el habla, adopta un esquema en el que se reduce el tamaño de la información modelando la vocalización del habla sobre un eje de tiempo.

No obstante, cada una de las tecnologías descritas anteriormente presenta un buen rendimiento sobre cada señal de audio optimizada (por ejemplo, una señal de habla, una señal de música) , pero no consigue proporcionar un rendimiento uniforme sobre una señal de audio generada a partir de una mezcla complicada de diferentes tipos de señales de audio o señales de habla y música juntas.

En la técnica anterior, el documento EP 1 278 184 A2 da a conocer un códec híbrido que proporciona codificación por transformada para señales musicales y utiliza un filtro de síntesis de LP con Predicción Lineal, común, para señales tanto de habla como musicales.

Sumario de la invención Por lo tanto, la presente invención se refiere a un método de procesamiento de una señal de audio según se reivindica en las reivindicaciones 1 y 13, y a un aparato para el mismo según se reivindica en las reivindicaciones 7 y 14, que sustancialmente eliminan uno o más de los problemas debidos a limitaciones y desventajas de las anterioridades.

Un objetivo de la presente invención es proporcionar un aparato para procesar una señal de audio y un método para ello, mediante los cuales se pueden comprimir y/o reconstruir tipos diferentes de señales de audio con una mayor eficiencia.

Otro objetivo de la presente invención es proporcionar un esquema de codificación de audio adecuado para características de una señal de audio.

En la descripción que se proporciona a continuación, se expondrán características y ventajas adicionales de la invención, y las mismas, en parte, resultarán evidentes a partir de la descripción, o se pueden asimilar poniendo en práctica la invención. Los objetivos y otras ventajas de la invención se materializarán y obtendrán por medio de la estructura indicada particularmente en la descripción redactada y en las reivindicaciones de la misma, así como en los dibujos adjuntos.

Para lograr estas y otras ventajas y, de acuerdo con el objetivo de la presente invención, según se materializa y describe ampliamente, un método de procesamiento de una señal de audio según la presente invención incluye las etapas de identificar si un tipo de codificación de la señal de audio es un tipo de codificación de señales musicales usando información de un primer tipo, si el tipo de codificación de la señal de audio no es el tipo de codificación de señales musicales, identificar si el tipo de codificación de la señal de audio es un tipo de codificación de señales de habla o un tipo de codificación de señales mixtas usando información de un segundo tipo, si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, extraer datos espectrales y un coeficiente de predicción lineal a partir de la señal de audio, generar una señal residual para predicción lineal llevando a cabo una conversión de frecuencia inversa sobre los datos espectrales, reconstruir la señal de audio llevando a cabo una codificación de predicción lineal sobre el coeficiente de predicción lineal y la señal residual, y reconstruir una señal de región de alta frecuencia usando una señal de base de extensión correspondiente a una región parcial de la señal de audio reconstruida e información de extensión de banda.

Para lograr adicionalmente estas y otras ventajas y de acuerdo con el objetivo de la presente invención, un aparato para procesar una señal de audio incluye un demultiplexor que extrae información de un primer tipo e información de un segundo tipo a partir de un flujo continuo de bits, una unidad de determinación de decodificador que identifica si un tipo de codificación de la señal de audio es un tipo de codificación de señales musicales usando información del primer tipo, de manera que, si el tipo de codificación de la señal de audio no es el tipo de codificación de señales musicales, el decodificador identifica si el tipo de codificación de la señal de audio es un tipo de codificación de señales de habla o un tipo de codificación de señales mixtas usando información del segundo tipo, determinando a continuación el decodificador un esquema de decodificación, una unidad de extracción de información, si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, que extrae datos espectrales y un coeficiente de predicción lineal a partir de la señal de audio, una unidad de transformación de frecuencias que genera una señal residual para predicción lineal llevando a cabo una conversión de frecuencia inversa sobre los datos espectrales, una unidad de predicción lineal que reconstruye la señal de audio llevando a cabo una codificación de predicción lineal sobre el coeficiente de predicción lineal y la señal residual, y una unidad de decodificación de extensión de ancho de banda que reconstruye una señal de región de alta frecuencia usando una señal de base de extensión correspondiente a una región parcial de la señal de audio reconstruida e información de extensión de banda.

Preferentemente, la señal de audio incluye una pluralidad de subtramas y en donde la información del segundo tipo existe por una unidad de la subtrama.

Preferentemente, un ancho de banda de la señal de región de alta frecuencia no es igual al de la señal de base de extensión. Preferentemente, la información de extensión de banda incluye por lo menos uno de un rango de filtro aplicado a la señal de audio reconstruida, una frecuencia de inicio de la señal de base de extensión y una frecuencia final de la señal de base de extensión.

Preferentemente, si el tipo de codificación de la señal de audio es el tipo de codificación de señales musicales, la señal de audio comprende una señal en el dominio de la frecuencia, en donde si el tipo de codificación de la señal de audio es el tipo de codificación de señales de habla, la señal de audio comprende una señal en el dominio del tiempo, y en donde si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, la señal de audio comprende una señal en el dominio de MDCT.

Preferentemente, la extracción del coeficiente de predicción lineal incluye extraer un modo de coeficiente de predicción lineal y extraer el coeficiente de predicción lineal que tiene un tamaño de bits variable correspondiente al modo extraído del coeficiente de predicción lineal.

Debe apreciarse que tanto la anterior descripción general como la siguiente descripción detallada son ejemplificativas y explicativas, y están destinadas a proporcionar una explicación adicional de la invención según se reivindica.

Breve descripción de los dibujos Los dibujos adjuntos, que se incluyen para proporcionar... [Seguir leyendo]

 


Reivindicaciones:

1. Método de procesamiento de una señal de audio, que comprende las etapas de:

identificar si un tipo de codificación de la señal de audio es un tipo de codificación de señales musicales utilizando información de un primer tipo;

si el tipo de codificación de la señal de audio no es el tipo de codificación de señales musicales, identificar si el tipo de codificación de la señal de audio es un tipo de codificación de señales de habla o un tipo de codificación de señales mixtas utilizando información de un segundo tipo;

si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, extraer los datos espectrales y un coeficiente de predicción lineal de la señal de audio;

generar una señal residual para predicción lineal llevando a cabo una conversión de frecuencia inversa sobre los datos espectrales;

reconstruir la señal de audio llevando a cabo una codificación de predicción lineal sobre el coeficiente de predicción lineal y la señal residual; y

reconstruir una señal de región de alta frecuencia utilizando una señal de base de extensión correspondiente a una región parcial de la señal de audio reconstruida e información de extensión de banda.

2. Método según la reivindicación 1, en el que la señal de audio incluye una pluralidad de subtramas y en el que la 25 información del segundo tipo existe por una unidad de la subtrama.

3. Método según la reivindicación 1, en el que un ancho de banda de la señal de región de alta frecuencia no es igual al de la señal de base de extensión.

4. Método según la reivindicación 1, en el que la información de extensión de banda incluye por lo menos uno de un rango de filtro aplicado a la señal de audio reconstruida, una frecuencia de inicio de la señal de base de extensión y una frecuencia final de la señal de base de extensión.

5. Método según la reivindicación 1, en el que si el tipo de codificación de la señal de audio es el tipo de

codificación de señales musicales, la señal de audio comprende una señal en el dominio de la frecuencia, en el que si el tipo de codificación de la señal de audio es el tipo de codificación de señales de habla, la señal de audio comprende una señal en el dominio del tiempo, y en el que si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, la señal de audio comprende una señal en el dominio de MDCT.

6. Método según la reivindicación 1, comprendiendo la etapa de extracción del coeficiente de predicción lineal las etapas de:

extraer un modo de coeficiente de predicción lineal; y

extraer el coeficiente de predicción lineal que presenta un tamaño de bits variable correspondiente al modo de coeficiente de predicción lineal extraído.

7. Aparato para procesar una señal de audio, que comprende:

un demultiplexor (210) configurado para extraer información de un primer tipo e información de un segundo tipo a partir de un flujo continuo de bits;

una unidad de determinación de decodificador (220) configurada para identificar si un tipo de codificación de la señal de audio es un tipo de codificación de señales musicales utilizando información del primer tipo, estando 55 configurada además la unidad de determinación de decodificador (220) , si el tipo de codificación de la señal de audio no es el tipo de codificación de señales musicales, para identificar si el tipo de codificación de la señal de audio es un tipo de codificación de señales de habla o un tipo de codificación de señales mixtas utilizando información del segundo tipo, estando configurada además la unidad de determinación de decodificador (220) para determinar a continuación un esquema de decodificación;

una unidad de extracción de información (233) configurada, si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, para extraer los datos espectrales y un coeficiente de predicción lineal de la señal de audio;

una unidad de transformación de frecuencias (235) configurada para generar una señal residual para predicción lineal llevando a cabo una conversión de frecuencia inversa sobre los datos espectrales;

una unidad de predicción lineal (236) configurada para reconstruir la señal de audio llevando a cabo una codificación de predicción lineal sobre el coeficiente de predicción lineal y la señal residual; y

una unidad de decodificación de extensión de ancho de banda (250) configurada para reconstruir una señal de región de alta frecuencia utilizando una señal de base de extensión correspondiente a una región parcial de la señal de audio reconstruida e información de extensión de banda.

8. Aparato según la reivindicación 7, en el que la señal de audio incluye una pluralidad de subtramas y en el que la información del segundo tipo existe por una unidad de una subtrama.

9. Aparato según la reivindicación 7, en el que un ancho de banda de la señal de región de alta frecuencia no es igual al de la señal de base de extensión.

10. Aparato según la reivindicación 7, en el que la información de extensión de banda incluye por lo menos uno de un rango de filtro aplicado a la señal de audio reconstruida, una frecuencia de inicio de la señal de base de extensión y una frecuencia final de la señal de base de extensión.

11. Aparato según la reivindicación 7, en el que si el tipo de codificación de la señal de audio es el tipo de codificación de señales musicales, la señal de audio comprende una señal en el dominio de la frecuencia, en el que si el tipo de codificación de la señal de audio es el tipo de codificación de señales de habla, la señal de audio comprende una señal en el dominio del tiempo, y en el que si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, la señal de audio comprende una señal en el dominio de MDCT.

12. Aparato según la reivindicación 7, en el que la unidad de extracción de información (233) está configurada para extraer un modo de coeficiente de predicción lineal; y

extraer el coeficiente de predicción lineal que presenta un tamaño de bits variable correspondiente al modo del coeficiente de predicción lineal extraído.

13. Método de procesamiento de una señal de audio, que comprende las etapas de:

eliminar de una señal de frecuencia de una señal de submezcla de la señal de audio una señal de alta frecuencia de la señal de audio correspondiente a una región de alta frecuencia y generar información de extensión de banda para reconstruir la señal de banda de alta frecuencia y dar salida a una señal de submezcla de baja frecuencia de la señal de audio;

determinar un tipo de codificación de la señal de audio;

si la señal de audio es una señal musical, generar información de un primer tipo que indica que la señal de audio se codifica en un tipo de codificación de señales musicales;

si la señal de audio no es la señal musical, generar información de un segundo tipo que indica que la señal de 45 audio se codifica o bien en un tipo de codificación de señales de habla o bien en un tipo de codificación de señales mixtas;

si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, generar un coeficiente de predicción lineal llevando a cabo una codificación de predicción lineal sobre la señal de submezcla de baja frecuencia de la señal de audio;

generar una señal residual para la codificación de predicción lineal utilizando la señal de submezcla de baja frecuencia;

generar un coeficiente espectral mediante una transformación de frecuencia de la señal residual; y

generar un flujo continuo de bits de audio que incluye la información del primer tipo, la información del segundo tipo, el coeficiente de predicción lineal y la señal residual.

14. Aparato para procesar una señal de audio, que comprende:

una unidad de preprocesamiento de ancho de banda (150) configurada para eliminar de una señal de frecuencia de una señal de submezcla de la señal de audio una señal de alta frecuencia de la señal de audio correspondiente a una región de alta frecuencia y dar salida a una señal de baja frecuencia de la señal de audio,

estando configurada además la unidad de preprocesamiento de ancho de banda (150) para generar información de extensión de banda con el fin de reconstruir la señal de alta frecuencia;

una unidad de clasificación de señales (100) configurada para determinar un tipo de codificación de la señal de audio, estando configurada además la unidad de clasificación de señales (100) , si la señal de audio es una señal musical, para generar información de un primer tipo que indica que la señal de audio está codificada en un tipo de codificación de señales musicales, estando configurada además la unidad de clasificación de señales (100) , si la señal de audio no es la señal musical, para generar información de un segundo tipo que indica que la señal de audio está codificada o bien en un tipo de codificación de señales de habla o bien un tipo de codificación de señales mixtas;

una unidad de modelado de predicción lineal (110) configurada, si el tipo de codificación de la señal de audio es el tipo de codificación de señales mixtas, para generar un coeficiente de predicción lineal llevando a cabo una codificación de predicción lineal sobre la señal de submezcla de baja frecuencia de la señal de audio;

una unidad de extracción de señales residuales (132) configurada para generar una señal residual para la 15 codificación de predicción lineal usando la señal de submezcla de baja frecuencia; y

una unidad de transformación de frecuencias (133) configurada para generar un coeficiente espectral mediante la transformación de frecuencias de la señal residual.

15. Aparato según la reivindicación 14, en el que la señal de audio incluye una pluralidad de subtramas, y en el que la información del segundo tipo se genera por una unidad de una subtrama.