Método codificador, método decodificador, dispositivo codificador, dispositivo decodificador, programa y medio de grabación.

Un método de codificación que comprende:

una etapa de cuantificación vectorial para la cuantificación vectorial colectiva de varias muestras para obtener un índice de cuantificación vectorial y el valor cuantificado de cada una de las varias muestras

, siendo las muestras señales del dominio frecuencial basadas en señales acústicas;

una etapa de asignación de bits para la asignación de bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana a uno o más conjuntos de posiciones de muestras entre varios conjuntos de posiciones de muestras, siendo los conjuntos sub-bandas, comprendiendo cada conjunto varias posiciones de muestras y dándosele un orden de prioridad basado en las características de percepción auditiva humana, no siendo mayor el número de bits que el número de bits obtenido de restar el número de bits usados para un código correspondiente al índice de cuantificación vectorial del número de bits asignados para el código correspondiente al índice de cuantificación vectorial; y

una etapa de selección de grupos de coeficientes de producción de información de índices que indica un grupo de coeficientes que minimiza la suma del error entre el valor de cada muestra incluida en cada uno de los conjuntos de posiciones de muestras a los que se asignan los bits en la etapa de asignación de bits y el valor obtenido multiplicando el valor cuantificado de cada muestra incluida en el conjunto de posiciones de muestras por un coeficiente correspondiente a la posición de la muestra, de todas las posiciones de muestras incluidas en el conjunto de posiciones de muestras, entre varios grupos de coeficientes predeterminados correspondientes a las posiciones de las muestras.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2011/065276.

Solicitante: NIPPON TELEGRAPH AND TELEPHONE CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 3-1 Otemachi 2-chome Chiyoda-ku Tokyo 100-8116 JAPON.

Inventor/es: SASAKI,SHIGEAKI, HIWASAKI,YUSUKE, TSUTSUMI,KIMITAKA, FUKUI,MASAHIRO, KOYAMA,SHOICHI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/02 (utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda)
  • SECCION G — FISICA > INSTRUMENTOS DE MUSICA; ACUSTICA > ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE... > Técnicas de análisis-síntesis de la voz o de señales... > G10L19/032 (Cuantificación o descuantificación de componentes espectrales)

PDF original: ES-2536902_T3.pdf

 

google+ twitter facebook

Fragmento de la descripción:

Método codificador, método decodificador, dispositivo codificador, dispositivo decodificador, programa y medio de

grabación

CAMPO TÉCNICO

La presente invención versa sobre una tecnología para codificar o decodificar secuencias de señales de señales acústicas, señales de vídeo y otras señales, tales como voz y música, mediante cuantificación vectorial.

TÉCNICA ANTECEDENTE

En un dispositivo de codificación dado a conocer en la Bibliografía de patente 1, una señal de entrada es dividida en primer lugar por un valor de normalización para llevar a cabo la normalización. Se cuantifica el valor de normalización y se genera un índice de cuantificación. La señal de entrada normalizada es cuantificada vectorialmente, y se genera un índice de un vector de cuantificación representativo. El índice de cuantificación generado y el vector de cuantificación representativo generado son enviados a un dispositivo de decodificación. El dispositivo de decodificación decodifica el índice de cuantificación y genera un valor de normalización. También se decodifica el índice del vector de cuantificación representativo y se genera una secuencia de muestras. Una secuencia de los valores obtenidos multiplicando cada muestra de la secuencia de muestras generada por el valor de normalización sirve de secuencia decodificada de muestras de señales.

Por otra parte, se usan de forma generalizada como métodos de cuantificación vectorial sumamente eficientes que generan poco ruido de cuantificación el método de cuantificación vectorial esférica (SVQ) (remitirse, por ejemplo a la Bibliografía no de patente 1) y otros métodos de cuantificación vectorial que cuantifican varias señales de entrada conjuntamente dentro de un número predeterminado de bits de cuantificación.

En el método SVQ, se normalizan muestras de señales de entrada tales como coeficientes de la transformada discreta de coseno modificada (MDCT) usando un valor de normalización cuantificado, y las muestras normalizadas son cualificadas conjuntamente en unidades de sub-bandas. Aquí, se asigna dinámicamente el número de bits (bits de cuantificación) a un código correspondiente a cada sub-banda según la importancia perceptiva de cada subbanda. Suponiendo que las señales de entrada estén dispersas, el método SVQ cuantifica preferentemente los elementos principales de las señales de entrada. Por lo tanto, las señales de entrada que tengan energía dispersa en el dominio frecuencial (señales dispersas), tales como señales armónicas y vocales, pueden ser cualificadas con gran precisión.

Sin embargo, el método SVQ aumenta la frecuencia para que un componente frecuencial incluido en las señales de entrada no esté incluido en las señales decodificadas de los valores cualificados (las señales decodificadas carecen del componente frecuencial) cuando se cuantifican las muestras para señales de entrada que tienen energía en muchas frecuencias. Cuando las señales decodificadas carecen de un componente frecuencial, la presencia o la ausencia del componente frecuencial en las señales decodlflcadas varía de forma discontinua en el tiempo a alta frecuencia. Los seres humanos son sensibles a esas variaciones temporalmente discontinuas en presencia o ausencia de un componente frecuencial. Si las señales de entrada son señales acústicas, estas variaciones pueden ser percibidas como ruido, al que se denomina ruido musical. SI las señales de entrada son señales de vídeo, puede producirse ruido de bloqueo, que es equivalente al ruido musical en las señales acústicas. El ruido musical y el ruido de bloqueo serán denominados más abajo "ruido musical y similares".

Un método de cuantificación vectorial algebraica (AVQ) (remitirse, por ejemplo a la Bibliografía no de patente 2) es un método de cuantificación vectorial en el que las señales decodificadas carecen de un componente frecuencial a una frecuencia menor que con el método SVQ. Como el método SVQ, el método AVQ da por sentado que las señales están dispersas, pero el método AVQ puede proporcionar valores cuantlflcados con los que pueden restaurarse más componentes frecuenclales que con el método SVQ.

La Bibliografía de patente 2 detalla un método de codificación que comprende: una etapa de normalización para la normalización de una señal de entrada en cada trama que contiene varias muestras, con un valor de normalización correspondiente a la señal de entrada y calculado de la señal de entrada de la trama para generar una secuencia de señales de entrada normalizadas; una etapa de cuantificación de señales de cuantificación de la secuencia de señales de entrada normalizadas para generar un índice de cuantificación de señales; una etapa de generación de un coeficiente de corrección para la generación de un coeficiente de corrección que minimiza la medida de distancia entre una secuencia de señales de entrada y una secuencia de señales obtenida por normalización Inversa de una secuencia de señales correspondiente al índice de cuantificación de señales con el valor de normalización corregido con el coeficiente de corrección; una etapa de cuantificación de la Información de normalización de generación de un índice de cuantificación de la Información de normalización cuantlflcando el coeficiente de corrección y el valor de normalización o el valor de normalización corregido con el coeficiente de corrección; y una etapa de producción de código para la producción de un código que incluye al menos el índice de cuantificación de señales y el índice de cuantificación de la información de normalización.

Aquí, la Bibliografía de patente 2 detalla la etapa de cuantificación de señales, que corresponde a la etapa de cuantificación vectorial de la presente invención; sin embargo, la Bibliografía de patente 2 carece de la etapa de asignación de bits y de la etapa de selección de grupos de coeficientes de la presente invención.

Es decir, aunque la Bibliografía de patente 2 da a conocer que una sola trama se divide en M partes, que corresponden a sub-bandas (véanse, por ejemplo, las realizaciones décima y undécima), no divulga la etapa de asignación de bits para la asignación de bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana a uno o más conjuntos de posiciones de muestras entre varias sub-bandas.

Con respecto a la etapa de selección de grupos de coeficientes, la Bibliografía de patente 2 (véase, por ejemplo, la undécima realización) da a conocer la realización de la cuantificación escalar del coeficiente de corrección (es decir, la ganancia) y del valor de normalización correspondiente a la secuencia de señales de entrada, siendo idéntico el valor de normalización para la secuencia de señales de entrada, que corresponde a un conjunto de posiciones de muestras. Sin embargo, la Bibliografía de patente 2 no divulga la etapa de selección de grupos de coeficientes que lleva a cabo la cuantificación vectorial de coeficientes (es decir, ganancias) correspondientes a las respectivas posiciones de las muestras.

Bibliografía de patente 1: Solicitud de patente japonesa abierta a inspección pública n° H7- 261800. Bibliografía de patente 2: Solicitud de patente internacional publicada WO 2009/093714 Al.

Bibliografía no de patente 1: Propuesta ITU-T G.729.1, SERIES G: TRANSMISION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS, Digital terminal equipments - Coding of analogue signáis by methods other than PCM, G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

Bibliografía no de patente 2: Propuesta ITU-T G.718, SERIES G: TRANSMISION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS,... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de codificación que comprende:

una etapa de cuantificación vectorial para la cuantlflcación vectorial colectiva de varias muestras para obtener un índice de cuantlflcación vectorial y el valor cuantlflcado de cada una de las varias muestras, siendo las muestras señales del dominio frecuenclal basadas en señales acústicas;

una etapa de asignación de bits para la asignación de bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana a uno o más conjuntos de posiciones de muestras entre varios conjuntos de posiciones de muestras, siendo los conjuntos sub-bandas, comprendiendo cada conjunto varias posiciones de muestras y dándosele un orden de prioridad basado en las características de percepción auditiva humana, no siendo mayor el número de bits que el número de bits obtenido de restar el número de bits usados para un código correspondiente al índice de cuantlflcación vectorial del número de bits asignados para el código correspondiente al índice de cuantificación vectorial; y

una etapa de selección de grupos de coeficientes de producción de Información de índices que Indica un grupo de coeficientes que minimiza la suma del error entre el valor de cada muestra Incluida en cada uno de los conjuntos de posiciones de muestras a los que se asignan los bits en la etapa de asignación de bits y el valor obtenido multiplicando el valor cuantificado de cada muestra Incluida en el conjunto de posiciones de muestras por un coeficiente correspondiente a la posición de la muestra, de todas las posiciones de muestras Incluidas en el conjunto de posiciones de muestras, entre varios grupos de coeficientes predeterminados correspondientes a las posiciones de las muestras.

2. El método de codificación según la Reivindicación 1 en el que el número de bits asignados a un primer conjunto de posiciones de muestras entre los conjuntos de posiciones de muestras no es inferior al número de bits asignados a un segundo conjunto de posiciones de muestras entre los conjuntos de posiciones de muestras que tienen prioridad menor que la del primer conjunto de posiciones de muestras.

3. El método de codificación según la Reivindicación 1 en el que la etapa de asignación de bits comprende las etapas de:

cuando el número de bits restantes que quedan sin asignar a ninguno de los conjuntos de posiciones de muestras, entre los bits que no se usan para el código correspondiente al índice de cuantificación vectorial, no es mayor que el número de conjuntos de posiciones de muestras a los que no se asignan bits, entre los varios conjuntos de posiciones de muestras, asignar un primer número de bits al conjunto de posiciones de muestras que tenga la prioridad más alta entre los conjuntos de posiciones de muestras a los que no se asignan bits; y

cuando el número de bits restantes es mayor que el número de conjuntos de posiciones de muestras a los que no se asignan bits, entre los varios conjuntos de posiciones de muestras, asignar un segundo número de bits que es mayor que el primer número de bits al conjunto de posiciones de muestras que tenga la prioridad más alta entre los conjuntos de posiciones de muestras a los que no se asignan bits.

4. El método de codificación según una de las Reivindicaciones 1 a 3 en el que cada uno de los grupos de coeficientes está formado de coeficientes dispuestos en una línea recta en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de cada uno de los varios grupos de coeficientes están dispuestos en el plano en una línea recta que tiene un gradiente diferente del de las líneas rectas para los otros grupos.

5. El método de codificación según una de las Reivindicaciones 1 a 3 en el que cada uno de los grupos de coeficientes está formado de coeficientes distribuidos asimétricamente en una línea recta o una curva específica en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de los varios grupos de coeficientes están dispuestos asimétricamente en el plano en líneas rectas que no son paralelas al primer eje o en curvas específicas.

6. Un método de decodificación que comprende:

una etapa de decodiflcaclón vectorial de obtención de varios valores correspondientes a un índice de cuantificación vectorial de entrada como valores decodlflcados correspondientes, respectivamente, a varias posiciones de muestras; y

una etapa de multiplicación de coeficientes de producción, con un conjunto de posiciones de muestras a las que se asignan bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana que se considera como un objetivo de procesamiento entre varios conjuntos de posiciones de muestras que constituyen las varias posiciones de muestras, siendo los conjuntos sub-bandas, y

correspondiendo el uso de un grupo de coeficientes predeterminados a las varias posiciones de muestras y estando indicado por información de índices de entrada, estando incluidos los valores obtenidos multiplicando los valores decodificados y los coeficientes correspondientes a las posiciones de muestras en el conjunto de posiciones de muestras considerado el objetivo de procesamiento.

7. El método de decodificación según la Reivindicación 6 en el que el grupo de coeficientes está formado de coeficientes dispuestos en una línea recta en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de cada uno de los varios grupos de coeficientes están dispuestos en el plano en una línea recta que tiene un gradiente diferente del de las líneas rectas para los otros grupos.

8. El método de decodlflcaclón según la Reivindicación 6 en el que el grupo de coeficientes está formado de coeficientes distribuidos asimétricamente en una línea recta o una curva específica en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de los varios grupos de coeficientes están dispuestos asimétricamente en el plano en líneas rectas que no son paralelas al primer eje o en curvas específicas.

9. Un dispositivo (11) de codificación que comprende:

un cuantlflcador vectorial (115) adaptado para cuantlficar vectorialmente varias muestras colectivamente para obtener un índice de cuantlflcaclón vectorial y el valor cuantificado de cada una de las varias muestras, siendo las muestras señales del dominio frecuenclal basadas en señales acústicas;

una unidad (116) de asignación de bits adaptada para asignar bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana a uno o más conjuntos de posiciones de muestras entre varios conjuntos de posiciones de muestras, siendo los conjuntos sub-bandas, comprendiendo cada conjunto varias posiciones de muestras y dándosele un orden de prioridad basado en las características de percepción auditiva humana, no siendo mayor el número de bits que el número de bits obtenido de restar el número de bits usados para un código correspondiente al índice de cuantificación vectorial del número de bits asignados para el código correspondiente al índice de cuantificación vectorial; y una unidad (116) de selección de grupos de coeficientes adaptada para producir información de índices que indica un grupo de coeficientes que minimiza la suma del error entre el valor de cada muestra incluida en cada uno de los conjuntos de posiciones de muestras a los que la unidad de asignación de bits asigna los bits y el valor obtenido multiplicando el valor cuantificado de cada muestra incluida en el conjunto de posiciones de muestras por un coeficiente correspondiente a la posición de la muestra, de todas las posiciones de muestras incluidas en el conjunto de posiciones de muestras, entre varios grupos de coeficientes predeterminados correspondientes a las posiciones de las muestras.

10. El dispositivo de codificación según la Reivindicación 9 en el que el número de bits asignados a un primer conjunto de posiciones de muestras entre los conjuntos de posiciones de muestras no es inferior al número de bits asignados a un segundo conjunto de posiciones de muestras entre los conjuntos de posiciones de muestras que tienen prioridad menor que la del primer conjunto de posiciones de muestras.

11. El dispositivo de codificación según la Reivindicación 9 en el que, cuando el número de bits restantes que quedan sin asignar a ninguno de los conjuntos de posiciones de muestras, entre los bits que no se usan para el código correspondiente al índice de cuantificación vectorial, no es mayor que el número de conjuntos de posiciones de muestras a los que no se asignan bits, entre los varios conjuntos de posiciones de muestras, la unidad de asignación de bits asigna un primer número de bits al conjunto de posiciones de muestras que tenga la prioridad más alta entre los conjuntos de posiciones de muestras a los que no se asignan bits; y

cuando el número de bits restantes es mayor que el número de conjuntos de posiciones de muestras a los que no se asignan bits, entre los varios conjuntos de posiciones de muestras, la unidad de asignación de bits asigna un segundo número de bits que es mayor que el primer número de bits al conjunto de posiciones de muestras que tenga la prioridad más alta entre los conjuntos de posiciones de muestras a los que no se asignan bits.

12. El dispositivo de codificación según una de las Reivindicaciones 9 a 11 en el que cada uno de los grupos de coeficientes está formado de coeficientes dispuestos en una línea recta en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de cada uno de los varios grupos de coeficientes están dispuestos en el plano en una línea recta que tiene un gradiente diferente del de las líneas rectas para los otros grupos.

13. El dispositivo de codificación según una de las Reivindicaciones 9 a 11 en el que cada uno de los grupos de coeficientes está formado de coeficientes distribuidos asimétricamente en una línea recta o una curva específica en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que

están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de los varios grupos de coeficientes están dispuestos asimétricamente en el plano en líneas rectas que no son paralelas al primer eje o en curvas específicas.

14. Un dispositivo (12) de decodlflcación que comprende:

un decodlflcador vectorial (122) adaptado para obtener varios valores correspondientes a un índice de cuantlflcaclón vectorial de entrada como valores decodlflcados correspondientes, respectivamente, a varias posiciones de muestras; y

una unidad (124) de multiplicación de coeficientes adaptada para producir, con un conjunto de posiciones de muestras a las que se asignan bits en un orden de prioridad predeterminado basado en las características de percepción auditiva humana que se considera como un objetivo de procesamiento entre varios conjuntos de posiciones de muestras que constituyen las varias posiciones de muestras, siendo los conjuntos sub-bandas, y correspondiendo el uso de un grupo de coeficientes predeterminados a las varias posiciones de muestras y estando Indicado por Información de índices de entrada, estando Incluidos los valores obtenidos multiplicando los valores decodlflcados y los coeficientes correspondientes a las posiciones de muestras en el conjunto de posiciones de muestras considerado el objetivo de procesamiento.

15. El dispositivo de decodlflcación según la Reivindicación 14 en el que el grupo de coeficientes está formado de coeficientes dispuestos en una línea recta en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de cada uno de los varios grupos de coeficientes están dispuestos en el plano en una línea recta que tiene un gradiente diferente del de las líneas rectas para los otros grupos.

16. El dispositivo de decodificación según la Reivindicación 14 en el que el grupo de coeficientes está formado de coeficientes distribuidos asimétricamente en una línea recta o una curva específica en un plano que tiene valores de frecuencia o de tiempo correspondientes a las posiciones de muestras con las que están asociados los coeficientes en un primer eje del mismo y los valores de los coeficientes en un segundo eje del mismo; y

los coeficientes de los varios grupos de coeficientes están dispuestos asimétricamente en el plano en líneas rectas que no son paralelas al primer eje o en curvas específicas.

17. Un programa adaptado para hacer que un ordenador ejecute las etapas del método de codificación según la

Reivindicación 1.

18. Un programa adaptado para hacer que un ordenador ejecute las etapas del método de decodificación según la Reivindicación 6.

19. Un medio de grabación legible por ordenador que tiene almacenado en el mismo un programa adaptado para hacer que un ordenador ejecute las etapas del método de codificación según la Reivindicación 1.

20. Un medio de grabación legible por ordenador que tiene almacenado en el mismo un programa adaptado para hacer que un ordenador ejecute las etapas del método de decodificación según la Reivindicación 6.