Dispositivo de codificación, dispositivo de descodificación y método de los mismos.

Un aparato de codificación de audio que comprende:

una sección de codificación de primera capa

(102) accionable para realizar un procesamiento de codificación con respecto a unos coeficientes de transformación de entrada para generar unos datos codificados de primera capa; una sección de descodificación de primera capa (103) accionable para realizar un procesamiento de descodificación usando los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa; y

una sección de codificación de segunda capa (105) accionable para realizar un procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes de transformación de entrada y los coeficientes de transformación descodificados de primera capa, se halla un máximo error, para generar unos datos codificados de segunda capa,

donde la sección de codificación de segunda capa comprende:

una primera sección de especificación de posición (201) accionable para buscar una primera banda que comprende el máximo error a través de la totalidad de una banda entera, sobre la base de un ancho de banda más amplio que la banda de frecuencia objetivo y un primer tamaño de escalón previamente determinado para generar una primera información de posición que muestra la primera banda especificada; una segunda sección de especificación de posición (202) accionable para buscar la banda de frecuencia objetivo a través de la totalidad de la primera banda, sobre la base de un segundo tamaño de escalón más estrecho que el primer tamaño de escalón para generar una segunda información de posición que muestra la banda de frecuencia objetivo especificada; y

una sección de codificación (203) accionable para codificar los coeficientes de transformación de error de primera capa incluidos en la banda de frecuencia objetivo que se especifica sobre la base de la primera información de posición y la segunda información de posición para generar una información codificada.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2008/000396.

Solicitante: Panasonic Intellectual Property Corporation of America.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 20000 Mariner Avenue, Suite 200 Torrance CA 90503 ESTADOS UNIDOS DE AMERICA.

Inventor/es: MORII,TOSHIYUKI, OSHIKIRI,MASAHIRO, YAMANASHI,TOMOFUMI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/14
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > G10L19/00 (Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p.ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/005 (Corrección de errores producidos por el canal de transmisión, si se refieren al algoritmo de codificación)

PDF original: ES-2473277_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Dispositivo de codificación, dispositivo de descodificación y método de los mismos

Campo de la técnica La presente invención se refiere a un aparato de codificación, a un aparato de descodificación y a métodos de los mismos usados en un sistema de comunicación de un esquema de codificación escalonable.

Antecedentes de la técnica En un sistema de comunicación móvil, se demanda que las señales de voz se compriman hasta unas tasas de bits bajas para su transmisión para utilizar de manera eficiente los recursos de ondas de radio y así sucesivamente. Por otro lado, también se demanda que se realice una mejora de calidad en la voz en las llamadas telefónicas y el

servicio de llamada de alta fidelidad y, para cumplir estas demandas, es preferible no solo proporcionar unas señales de voz de calidad sino también codificar unas señales de calidad que no sean las señales de voz, tal como señales de audio de calidad de unas bandas más amplias.

La técnica de integrar una pluralidad de técnicas de codificación en capas es prometedora para estas dos demandas contradictorias. Esta técnica combina en capas la primera capa para codificar señales de entrada en una forma adecuada para las señales de voz a unas tasas de bits bajas y una segunda capa para codificar señales diferenciales entre señales de entrada y señales descodificadas de la primera capa en una forma adecuada para unas señales que no sean voz. La técnica de realizar una codificación por capas de esta forma tiene unas características de provisión de escalonabilidad en flujos de bits que se adquieren de un aparato de codificación, es decir, adquiriendo señales descodificadas de parte de la información de flujos de bits y, por lo tanto, en general se hace referencia a la misma como “codificación escalonable (codificación por capas) ”.

El esquema de codificación escalonable puede soportar de manera flexible una comunicación entre redes de tasas de bits variables gracias a sus características y, en consecuencia, es adecuado para un entorno de red futuro en el

que se integrarán diversas redes mediante el protocolo IP.

Por ejemplo, el documento no de patente 1 divulga una técnica de obtener una codificación escalonable usando la técnica que está normalizada por la norma de MPEG–4 (Moving Picture Experts Group, fase 4) . Esta técnica usa una codificación de CELP (Code Excited Linear Prediction, Predicción Lineal Excitada por Código) adecuada para las señales de voz, en la primera capa, y usa una codificación por transformación tal como AAC (Advanced Audio Coder, Codificador de Audio Avanzado) y TwinVQ (Transform Domain Weighted Interleave Vector Quantization, Cuantificación Vectorial Entrelazada Ponderada en el Dominio de Transformación) con respecto a señales residuales sustrayendo las señales descodificadas de primera capa de las señales originales, en la segunda capa.

En contraste con esto, el documento no de patente 2 divulga un método de codificar coeficientes de MDCT de una banda de frecuencia deseada en capas usando TwinVQ que se aplica a un módulo como un componente básico. Mediante la compartición de este módulo para su uso una pluralidad de veces, es posible implementar una codificación escalonable simple de un alto grado de flexibilidad. A pesar de que este método se basa en la configuración en la que se determinan por adelantado unas sub–bandas que son los objetivos que van a codificarse 45 por cada capa, también se divulga una configuración en la que la posición de una sub–banda, que es el objetivo que va a codificarse por cada capa, se cambia en el interior de unas bandas previamente determinadas de acuerdo con la propiedad de las señales de entrada.

Documento no de patente 1: “All about MPEG–4”, escrito y editado por Sukeichi MIKI, primera edición, Kogyo 50 Chosakai Publishing, Inc., 30 de septiembre de 1998, páginas 126 a 127 Documento no de patente 2: “Scalable Audio Coding Based on Hierarchical Transform Coding Modules”, Akio JIN y col., Academic Journal of The Institute de Electronics, Information and Communication Engineers, Volumen J83–A, Nº 3, páginas 241 a 252, marzo de 2000 Documento no de patente 3: “AMR Wideband Speech Codec; Transcoding functions”, 3GPP TS 26.190, marzo 55 de 2001. Documento no de patente 4: “Source–Controlled–Variable–Rate Multimode Wideband Speech Codec (VMR– WB) , Service options 62 and 63 for Spread Spectrum Systems”, 3GPP2 C.S0052–A, abril de 2005. Documento no de patente 5: “7/10/15 kHz band scalable speech coding schemes using the band enhancement technique by means de pitch filtering”, Journal of Acoustic Society of Japan 3–11–4, páginas 327 a 328, marzo de 60 2004

Divulgación de la invención

Problemas a resolver por la invención No obstante, para mejorar la calidad de voz de las señales de salida, es importante cómo se establecen las sub– bandas (es decir, las bandas de frecuencia objetivo) de la sección de codificación de segunda capa. El método que se divulga en el documento no de patente 2 determina por adelantado unas sub–bandas que son el objetivo que va a codificarse por la segunda capa (figura 1A) . En este caso, la calidad de las sub–bandas previamente determinadas se mejora en todo momento y, por lo tanto, existe el problema de que, cuando los componentes de error están concentrados en unas bandas que no sean estas sub–bandas, no es posible adquirir en gran medida un efecto de mejora de la calidad de voz.

Además, a pesar de que el documento no de patente 2 divulga que la posición de una sub–banda, que es el objetivo que va a codificarse por cada capa, se cambia en el interior de unas bandas previamente determinadas (figura 1B) 15 de acuerdo con la propiedad de las señales de entrada, la posición que se emplea por la sub–banda está limitada en el interior de las bandas previamente determinadas y, por lo tanto, no puede solucionarse el problema que se ha descrito en lo que antecede. Si una banda que se emplea como una sub–banda cubre una banda entera de una señal de entrada (figura 1C) , existe el problema de que aumenta la complejidad de cálculo para especificar la posición de una sub–banda. Además, cuando aumenta el número de capas, se necesario que la posición de una sub–banda se especifique en función de la capa y, por lo tanto, este problema se vuelve sustancial.

Por lo tanto, un objeto de la presente invención es la provisión de un aparato de codificación, un aparato de descodificación y métodos de los mismos para, en un esquema de codificación escalonable, especificar con precisión una banda de un gran error a partir de la banda entera con una pequeña complejidad de cálculo.

Medios para resolver el problema El aparato de codificación de acuerdo con la presente invención emplea una configuración que incluye: una sección de codificación de primera capa que realiza el procesamiento de codificación con respecto a unos coeficientes de 30 transformación de entrada para generar unos datos codificados de primera capa; una sección de descodificación de primera capa que realiza el procesamiento de descodificación usando los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa; y una sección de codificación de segunda capa que realiza el procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes 35 de transformación de entrada y los coeficientes de transformación descodificados de primera capa, se halla un... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato de codificación de audio que comprende:

una sección de codificación de primera capa (102) accionable para realizar un procesamiento de codificación con respecto a unos coeficientes de transformación de entrada para generar unos datos codificados de primera capa; una sección de descodificación de primera capa (103) accionable para realizar un procesamiento de descodificación usando los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa; y

una sección de codificación de segunda capa (105) accionable para realizar un procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes de transformación de entrada y los coeficientes de transformación descodificados de primera capa, se halla un máximo error, para generar unos datos codificados de segunda capa,

donde la sección de codificación de segunda capa comprende:

una primera sección de especificación de posición (201) accionable para buscar una primera banda que comprende el máximo error a través de la totalidad de una banda entera, sobre la base de un ancho de banda más amplio que la banda de frecuencia objetivo y un primer tamaño de escalón previamente determinado para generar una primera información de posición que muestra la primera banda especificada; una segunda sección de especificación de posición (202) accionable para buscar la banda de frecuencia objetivo a través de la totalidad de la primera banda, sobre la base de un segundo tamaño de escalón más estrecho que el primer tamaño de escalón para generar una segunda información de posición que muestra la banda de frecuencia objetivo especificada; y

una sección de codificación (203) accionable para codificar los coeficientes de transformación de error de primera capa incluidos en la banda de frecuencia objetivo que se especifica sobre la base de la primera información de posición y la segunda información de posición para generar una información codificada.

2. El aparato de codificación de acuerdo con la reivindicación 1, donde la segunda sección de especificación de 30 posición especifica la banda de frecuencia objetivo sobre la base de una única frecuencia objetivo.

3. El aparato de codificación de acuerdo con la reivindicación 1, donde la segunda sección de especificación de posición especifica la banda de frecuencia objetivo sobre la base de una pluralidad de frecuencias objetivo.

4. El aparato de codificación de acuerdo con la reivindicación 1, donde la segunda sección de especificación de posición especifica la banda de frecuencia objetivo de tal modo que se minimiza la distorsión de cuantificación que se produce cuando se codifican los coeficientes de transformación de error de primera capa.

5. El aparato de codificación de acuerdo con la reivindicación 1, donde la primera sección de especificación de posición especifica la primera banda sobre la base de una magnitud de energía de los coeficientes de transformación de error de primera capa.

6. El aparato de codificación de acuerdo con la reivindicación 1, donde la primera sección de especificación de posición especifica la primera banda a partir de una banda de baja frecuencia más baja que una frecuencia de 45 referencia que está establecida.

7. El aparato de codificación de acuerdo con la reivindicación 1, donde la primera sección de especificación de posición especifica la primera banda sobre la base de un múltiplo entero de una frecuencia de altura tonal.

8. El aparato de codificación de acuerdo con la reivindicación 1, donde:

el número de capas en el procesamiento de codificación es de por lo menos dos; una frecuencia de referencia se establece más alta en una capa más alta; y la primera sección de especificación de posición especifica la primera banda a partir de una banda de baja 55 frecuencia más baja que la frecuencia de referencia, en función de la capa.

9. El aparato de codificación de acuerdo con la reivindicación 1, donde la primera sección de especificación de posición divide la banda entera en una pluralidad de bandas parciales, selecciona una banda en cada una de la pluralidad de bandas parciales y concatena una pluralidad de bandas seleccionadas para hacer una banda 60 concatenada como la primera banda.

10. El aparato de codificación de acuerdo con la reivindicación 9, donde la primera sección de especificación de posición selecciona una banda fija previamente determinada, en por lo menos una de la pluralidad de bandas parciales.

11. Un aparato de descodificación de audio que comprende:

una sección de recepción accionable para recibir:

unos datos codificados de primera capa que se adquieren mediante la realización de un procesamiento de codificación con respecto a unos coeficientes de transformación de entrada; unos datos codificados de segunda capa que se adquieren mediante la realización de un procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes de transformación de entrada y los coeficientes de transformación descodificados de primera capa que se adquieren mediante la descodificación de los datos codificados de primera capa, se halla un máximo error; una primera información de posición que muestra una primera banda que maximiza el error, en un ancho de banda más amplio que la banda de frecuencia objetivo; y una segunda información de posición que muestra la banda de frecuencia objetivo en la primera banda;

una sección de descodificación de primera capa (602) accionable para descodificar los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa; una sección de descodificación de segunda capa (603) accionable para especificar la banda de frecuencia objetivo sobre la base de la primera información de posición y la segunda información de posición y para descodificar los datos codificados de segunda capa para generar unos coeficientes de transformación de error descodificados de primera capa; y una sección de suma (604) accionable para sumar los coeficientes de transformación descodificados de primera capa y los coeficientes de transformación de error descodificados de primera capa para generar unos coeficientes de transformación descodificados de segunda capa.

12. El aparato de descodificación de acuerdo con la reivindicación 11, donde la sección de descodificación de segunda capa realiza una descodificación usando una información de forma y una información de ganancia incluidas en los datos codificados de segunda capa.

13. Un método de codificación de audio que comprende:

una etapa de codificación de primera capa de realizar un procesamiento de codificación con respecto a unos coeficientes de transformación de entrada para generar unos datos codificados de primera capa; una etapa de descodificación de primera capa de realizar un procesamiento de descodificación usando los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa; y una etapa de codificación de segunda capa de realizar un procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes de transformación de entrada y los coeficientes de transformación descodificados de primera capa, se halla un máximo error, para generar unos datos codificados de segunda capa, donde la etapa de codificación de segunda capa comprende:

una primera etapa de especificación de posición de buscar una primera banda que comprende el máximo error a través de la totalidad de una banda entera, sobre la base de un ancho de banda más amplio que la banda de frecuencia objetivo y un primer tamaño de escalón previamente determinado para generar una 45 primera información de posición que muestra la primera banda especificada; una segunda etapa de especificación de posición de buscar la banda de frecuencia objetivo a través de la totalidad de la primera banda, sobre la base de un segundo tamaño de escalón más estrecho que el primer tamaño de escalón para generar una segunda información de posición que muestra la banda de frecuencia objetivo especificada; y una etapa de codificación de codificar los coeficientes de transformación de error de primera capa incluidos en la banda de frecuencia objetivo que se especifica sobre la base de la primera información de posición y la segunda información de posición para generar una información codificada.

14. Un método de descodificación de audio que comprende:

una etapa de recepción de recibir:

unos datos codificados de primera capa que se adquieren mediante la realización de un procesamiento de codificación con respecto a unos coeficientes de transformación de entrada; unos datos codificados de segunda capa que se adquieren mediante la realización de un procesamiento de codificación con respecto a una banda de frecuencia objetivo en la que, en unos coeficientes de transformación de error de primera capa que representan un error entre los coeficientes de transformación de entrada y los coeficientes de transformación descodificados de primera capa que se adquieren mediante la descodificación de los datos codificados de primera capa, se halla un máximo error;

una primera información de posición que muestra una primera banda que maximiza el error, en un ancho de banda más amplio que la banda de frecuencia objetivo; y

una segunda información de posición que muestra la banda de frecuencia objetivo en la primera banda;

una etapa de descodificación de primera capa de descodificar los datos codificados de primera capa para generar unos coeficientes de transformación descodificados de primera capa;

una etapa de descodificación de segunda capa de especificar la banda de frecuencia objetivo sobre la base de la primera información de posición y la segunda información de posición y de descodificar los datos codificados de segunda capa para generar unos coeficientes de transformación de error descodificados de primera capa; y una etapa de suma de sumar los coeficientes de transformación descodificados de primera capa y los coeficientes de transformación de error descodificados de primera capa para generar unos coeficientes de transformación descodificados de segunda capa.

ººººººººººººººº