Codificador, descodificador, método de codificación y método de descodificación.

Un aparato codificador que genera información de codificación de banda de frecuencia baja e información de codificación de banda de frecuencia alta a partir de una señal original conteniendo una señal de voz o audio

, incluyendo el aparato codificador:

una sección de cálculo de primer espectro que calcula un primer espectro de una banda de frecuencia baja a partir de una señal descodificada de la información de codificación de banda de frecuencia baja;

una sección de cálculo de segundo espectro que calcula un segundo espectro a partir de la señal original; una sección de cálculo de primer parámetro que calcula un primer parámetro que indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta del segundo espectro;

una sección de cálculo de segundo parámetro que calcula un segundo parámetro que indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y

una sección de codificación que codifica el primer parámetro y el segundo parámetro calculados como la información de codificación de banda de frecuencia alta.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2005/020200.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: EHARA,HIROYUKI, YOSHIDA,KOJI, OSHIKIRI,MASAHIRO.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Tratamiento de la señal de la voz para producir... > G10L21/02 (Mejora de la inteligibilidad de la voz, p.ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08))
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Conversión de un código, en el cual la información... > H03M7/30 (Compresión (análisis-síntesis de la voz para reducción de redundancia G10L 19/00; para transmisión de imágenes H04N ); Expansión; Supresión de datos innecesarios, p. ej. reducción de redundancia)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/06 (Determinación o codificación de las características del espectro, p.ej. de los coeficientes de predicción a corto plazo)

PDF original: ES-2476992_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Codificador, descodificador, método de codificación y método de descodificación Campo técnico La presente invención se refiere a un aparato codificador, un aparato descodificador, un método de codificación y un método de descodificación para codificar/descodificar señales de voz, señales audio, y análogos.

Antecedentes de la invención Para utilizar efectivamente recursos de ondas radio en sistemas de comunicaciones móviles, hay que comprimir las señales de voz a una tasa de bits baja. Por otra parte, se espera del usuario que mejore la calidad de voz de comunicación y que implemente servicios de comunicación con alta fidelidad. Con el fin de implementarlo, es preferible no solamente mejorar la calidad de las señales de voz, sino también poder codificar señales distintas de voz, tal como señales audio que tienen una banda más ancha con alta calidad.

Para dicha demanda contradictoria, parece prometedor un acercamiento de incorporar jerárquicamente una pluralidad de técnicas de codificación. Específicamente, se adopta una configuración que combina en forma en capas una sección de codificación de primera capa que codifica una señal de entrada usando una tasa de bits baja usando un modelo adecuado para una señal de voz y una sección de codificación de segunda capa que codifica una señal residual entre la señal de entrada y la señal descodificada de primera capa usando un modelo adecuado para señales comunes incluyendo la señal de voz. Los esquemas de codificación que tienen dicha estructura en capas tienen escalabilidad (son capaces de obtener señales descodificadas incluso a partir de información parcial de las flujos de bits) en flujos de bits obtenidas por una sección de codificación, y por lo tanto tales esquemas se denominan codificación escalable. La codificación escalable tiene una característica de ser capaz también de soportar flexiblemente la comunicación entre redes que tienen diferentes tasas de bits. Esta característica es adecuada para un entorno de red futuro donde una variedad de redes estarán integradas con protocolo IP.

Como codificación escalable convencional, por ejemplo, está la codificación escalable descrita en el documento no patente 1. Este documento describe un método donde la codificación escalable se configura usando la técnica definida en MPEG-4 (grupo de expertos en imágenes en movimiento Fase-4) . Específicamente, en una primera capa (capa base) , una señal de voz --señal original--es codificada usando CELP (predicción lineal por excitación de código) , y en una segunda capa (capa de extensión) , una señal residual es codificada usando codificación de transformada tal como, por ejemplo, ACC (codificador audio avanzado) y TwinVQ (cuantificación vectorial entrelazada ponderada de dominio de transformada) . Aquí, la señal residual es una señal obtenida restando una señal (señal descodificada de primera capa) que se obtiene descodificando el código codificado obtenido en la primera capa, de la señal original.

Otro ejemplo de una codificación escalable convencional se describe en OSHIKIRI M y colaboradores: “A scalable coder designed for 10-KHZ bandwidth speech”, SPEECH CODING, 2002, IEEE WORKSHOP PROCEEDINGS. OCT. 6-9, 2002, PISCATAWAY, USA, IEEE, 6 octubre 2002, páginas 111-113.

Documento no patente 1: “Ever y thing for MPEG-4”, escrito por Miki Sukeichi, publicado por Kogyo Chosakai Publishing, Inc., 30 de Septiembre, 1998, páginas 126 a 127

Descripción de la invención Problemas a resolver con la invención Sin embargo, con la técnica de la técnica relacionada descrita anteriormente, la codificación de transformada en la segunda capa se lleva a cabo en la señal residual obtenida restando la señal descodificada de primera capa de la señal original. Como resultado, parte de la información principal contenida en la señal original es quitada mediante la primera capa. En este caso, la característica de la señal residual está cerca de una secuencia de ruido. Por lo tanto, cuando se usa para la segunda capa codificación de transformada diseñada con el fin de codificar eficientemente señales de música tales como AAC y TwinVQ, para codificar una señal residual que tenga la característica antes descrita y lograr alta calidad de la señal descodificada, hay que asignar gran número de bits. Esto significa que la tasa de bits es grande.

Por lo tanto, un objeto de la presente invención es tomar en consideración estos problemas para proporcionar un aparato codificador, aparato descodificador, método de codificación y método de descodificación capaces de obtener señales descodificadas de alta calidad incluso cuando la codificación se lleva a cabo a una tasa de bits baja en la segunda capa o capas superiores a la segunda capa.

Medios para resolver el problema Un aparato codificador de la presente invención según la reivindicación 1 genera información de codificación de banda de frecuencia baja e información de codificación de banda de frecuencia alta a partir de una señal original y adopta una configuración incluyendo: una sección de cálculo de primer espectro que calcula un primer espectro de una banda de frecuencia baja a partir de una señal descodificada de la información de codificación de banda de frecuencia baja; una sección de cálculo de segundo espectro que calcula un segundo espectro a partir de la señal original; una sección de cálculo de primer parámetro que calcula un primer parámetro que indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta del segundo espectro; una sección de cálculo de segundo parámetro que calcula un segundo parámetro que indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y una sección de codificación que codifica el primer parámetro y el segundo parámetro calculados como la información de codificación de banda de frecuencia alta.

Un aparato descodificador de la presente invención según la reivindicación 7 adopta una configuración incluyendo: una sección de adquisición de espectro que adquiere un primer espectro correspondiente a una banda de frecuencia baja; una sección de adquisición de parámetro que adquiere respectivamente un primer parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta de un segundo espectro correspondiente a una señal original, y un segundo parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y una sección descodificadora que descodifica el segundo espectro usando el primer parámetro y el segundo parámetro adquiridos.

Un método de codificación de la presente invención según la reivindicación 8 para generar información de codificación de banda de frecuencia baja e información de codificación de banda de frecuencia alta en base a una señal original, adopta una configuración incluyendo: un paso de cálculo de primer espectro que consiste en calcular un primer espectro de una banda de frecuencia baja a partir de una señal descodificada de la información de codificación de banda de frecuencia baja; un paso de cálculo de segundo espectro que consiste en calcular un segundo espectro a partir de la señal original; un paso de cálculo de primer parámetro que consiste en calcular un primer parámetro que indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta del segundo espectro; un paso de cálculo de segundo parámetro que consiste en calcular un segundo parámetro que indica un componente de fluctuación entre el primer... [Seguir leyendo]

 


Reivindicaciones:

1. Un aparato codificador que genera información de codificación de banda de frecuencia baja e información de codificación de banda de frecuencia alta a partir de una señal original conteniendo una señal de voz o audio, incluyendo el aparato codificador:

una sección de cálculo de primer espectro que calcula un primer espectro de una banda de frecuencia baja a partir de una señal descodificada de la información de codificación de banda de frecuencia baja;

una sección de cálculo de segundo espectro que calcula un segundo espectro a partir de la señal original;

una sección de cálculo de primer parámetro que calcula un primer parámetro que indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta del segundo espectro;

una sección de cálculo de segundo parámetro que calcula un segundo parámetro que indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y

una sección de codificación que codifica el primer parámetro y el segundo parámetro calculados como la información de codificación de banda de frecuencia alta.

2. El aparato codificador según la reivindicación 1, donde la sección de cálculo de primer parámetro envía un parámetro que indica una característica de un filtro como el primer parámetro usando el filtro que tiene el primer espectro como un estado interno.

3. El aparato codificador según la reivindicación 1, donde la sección de cálculo de segundo parámetro tiene un libro de códigos de formas residuales de espectros registrado con una pluralidad de candidatos residuales de espectros y envía un código del espectro residual como el segundo parámetro.

4. El aparato codificador según la reivindicación 1, incluyendo además una sección de codificación de componente residual que codifica un componente residual entre el primer espectro y una banda de frecuencia baja del segundo espectro,

donde la sección de cálculo de primer parámetro y la sección de cálculo de segundo parámetro calculan el primer parámetro y el segundo parámetro después de mejorar la calidad del primer espectro usando el componente residual codificado por la sección de codificación de componente residual.

5. El aparato codificador según la reivindicación 4, donde la sección de codificación de componente residual mejora tanto la calidad de la banda de frecuencia baja del primer espectro como la calidad de una banda de frecuencia alta del espectro descodificado obtenido del primer parámetro y el segundo parámetro codificados por la sección de codificación.

6. El aparato codificador según la reivindicación 1, donde:

el primer parámetro contiene un retardo;

el segundo parámetro contiene un espectro residual; y

el aparato codificador incluye además una sección de configuración que configura un flujo de bits dispuesto en el orden del retardo y el espectro residual.

7. Un aparato descodificador incluyendo:

una sección de adquisición de espectro que adquiere un primer espectro correspondiente a una banda de frecuencia baja de un espectro correspondiente a una señal original conteniendo una señal de voz o audio;

una sección de adquisición de parámetro que adquiere respectivamente un primer parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta de un segundo espectro correspondiente a la señal original, y un segundo parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y

una sección descodificadora que descodifica el segundo espectro usando el primer parámetro y el segundo parámetro adquiridos.

8. Un método de codificación para generar información de codificación de banda de frecuencia baja e información de codificación de banda de frecuencia alta a partir de una señal original conteniendo una señal de voz o audio,

incluyendo el método de codificación:

un paso de cálculo de primer espectro que consiste en calcular un primer espectro de una banda de frecuencia baja a partir de una señal descodificada de la información de codificación de banda de frecuencia baja; 5 un paso de cálculo de segundo espectro que consiste en calcular un segundo espectro a partir de la señal original;

un paso de cálculo de primer parámetro que consiste en calcular un primer parámetro que indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta del segundo espectro;

un paso de cálculo de segundo parámetro que consiste en calcular un segundo parámetro que indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y

un paso de codificación que consiste en codificar el primer parámetro y el segundo parámetro calculados como la 15 información de codificación de banda de frecuencia alta.

9. Un método de descodificación incluyendo:

un paso de adquisición de espectro que consiste en adquirir un primer espectro correspondiente a una banda de 20 frecuencia baja de un espectro correspondiente a una señal original conteniendo una señal de voz o audio;

un paso de adquisición de parámetro que consiste en adquirir respectivamente un primer parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un grado de semejanza entre el primer espectro y una banda de frecuencia alta de un segundo espectro correspondiente a la señal original, y un segundo parámetro que es codificado como información de codificación de banda de frecuencia alta e indica un componente de fluctuación entre el primer espectro y la banda de frecuencia alta del segundo espectro; y

un paso de descodificación que consiste en descodificar el segundo espectro usando el primer parámetro y el segundo parámetro adquiridos. 30