Dispositivo de codificación y método de codificación.

Un aparato de codificación que comprende:

una sección de 5 cuantificación de forma que codifica una forma de un espectro de frecuencia de audio;

y

una sección de cuantificación de ganancia que codifica una ganancia del espectro de frecuencia de audio,caracterizado por que la sección de cuantificación de forma comprende:

una sección de búsqueda de intervalo que busca una primera forma de onda fija en cada una de unapluralidad de bandas de frecuencia que dividen un intervalo de búsqueda de frecuencia predeterminado; yuna sección de búsqueda minuciosa que busca segundas formas de onda fijas sobre una totalidad delintervalo de búsqueda de frecuencia predeterminado.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/JP2008/000397.

Solicitante: PANASONIC CORPORATION.

Nacionalidad solicitante: Japón.

Dirección: 1006, OAZA KADOMA KADOMA-SHI OSAKA 571-8501 JAPON.

Inventor/es: MORII,TOSHIYUKI, OSHIKIRI,MASAHIRO, YAMANASHI,TOMOFUMI.

Fecha de Publicación: 27 de Mayo de 2013.

Clasificación Internacional de Patentes:

G10L19/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 19/00 Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H). › utilizando análisis espectrales, p. ej. codificadores vocales de transformación o codificadores vocales subbanda.
G10L19/10 G10L 19/00 […] › siendo la función de excitación una excitación de impulsos múltiples.

PDF original: ES-2404408_T3.pdf

Fragmento de la descripción:

Dispositivo de codificación y método de codificación

Campo técnico La presente invención se refiere a un aparto de codificación y método de codificación para codificar señales del habla y señales de audio.

Antecedentes de la invención En comunicaciones móviles, es necesario comprimir y codificar información digital tal como el habla e imágenes para uso eficaz de capacidad del canal de radio y medios de almacenamiento para ondas de radio, y se han desarrollado muchos esquemas de codificación y decodificación hasta la fecha.

Entre estos, se ha mejorado significativamente el rendimiento de la tecnología de codificación del habla mediante el esquema fundamental de “CELP (Predicción Lineal con Excitación por Código) ”, que adopta hábilmente cuantificación vectorial modelando el sistema del tracto vocal del habla. Además, se ha mejorado significativamente el rendimiento de la tecnología de codificación de sonido tal como codificación de audio transformando técnicas de codificación (tales como los estándares MPEG ACC y MP3) .

Por otro lado, se diseña un códec escalable, la estandarización del cual está en progreso por la ITU-T (Unión Internacional de Telecomunicaciones - Sector de Estandarización de las Telecomunicaciones) y otros, para cubrir desde la banda del habla convencional (300 Hz a 3, 4 kHz) hasta la banda ancha (hasta 7 kHz) , con su velocidad de bits establecida tan alta como aproximadamente 32 kbps. Es decir, un código de banda ancha tiene incluso que aplicar un cierto grado de codificación a audio y por lo tanto no se puede soportar mediante únicamente métodos de codificación del habla de baja velocidad de bits convencionales, en base al modelo de voz humana, tal como CELP. Ahora, el estándar ITU-T G.729.1, declarado anteriormente como una recomendación, usa un esquema de codificación de códec de audio de codificación por transformación, para codificar el habla de banda ancha y superior.

El Documento de Patente 1 desvela un esquema de codificación que utiliza parámetros espectrales y parámetros de paso, en los cuales se realiza una transformación ortogonal y codificación de una señal obtenida mediante filtrado inverso a una señal del habla en base a parámetros espectrales, y adicionalmente desvela, como un ejemplo de codificación, un método de codificación en base a libros de código de estructuras algebraicas.

El Documento de Patente 2 desvela un esquema de codificación de división de una señal en los parámetros de predicción lineales y los componentes residuales, realizando la transformación cuadrática de los componentes residuales y normalizando la forma de onda residual por la potencia, y a continuación cuantificando la ganancia y el residuo normalizado. Adicionalmente, el Documento de Patente 2 desvela cuantificación vectorial como un método de cuantificación para el residuo normalizado.

El Documento distinto de Patente 1 desvela un método de codificación en base a un libro de código algebraico formado con espectros de excitación mejorados en TCX (es decir un esquema de codificación fundamental modelado con una excitación sometida a una codificación por transformación y filtrado de parámetros espectrales) , y se adopta este método de codificación en el estándar ITU-T G.729.1.

El Documento distinto de Patente 2 desvela la descripción del esquema del estándar MPEG “TC-WVQ”. Este esquema se usa también para transformar residuo de predicción lineal en un espectro y realizar cuantificación vectorial del espectro, usando la DCT (Transformación Discreta en Coseno) como el método de transformación ortogonal.

Por medio de las cuatro técnicas anteriores, es posible aplicar, a codificación, cuantificación de parámetros espectrales tales como parámetros de predicción lineal, que es parte de una técnica de codificación útil de señales del habla, posibilitando de esta manera la eficacia y la baja velocidad de codificación de audio a realizar.

Documento de Patente 1: Solicitud de Patente Japonesa Abierta a Inspección Pública Nº HE110-260698 Documento de Patente 2: Solicitud de Patente Japonesa Abierta a Inspección Pública Nº HE107-261800 Documento distinto de Patente 1: Xie, Adoul, “EMBEDDED ALGEBRAIC VECTOR QUANTIZERS (EAVQ) WITH APPLICATION TO WIDEBAND SPEECH CODING" ICASSP’96 Documento distinto de Patente 2: Moriya, Honda, “Transform Coding of Speech Using a Weighted Vector Quantizer” IEEE journal on selected areas in communications, Vol. 6, Nº 2, febrero 1988

Divulgación de la invención

Problemas a resolver mediante la invención Sin embargo, el número de bits a asignar mediante un códec escalable es pequeño especialmente en una capa relativamente inferior, y, en consecuencia, el rendimiento de la codificación por transformación de excitación no es suficiente. Por ejemplo, en el estándar ITU-T G.729.1, aunque una velocidad de bits es 12 kbps en la segunda capa o inferior que soporta la banda telefónica (300 Hz a 3, 4 kHz) , únicamente se asigna una velocidad de bits de 2 kbps a la siguiente, tercera capa que soporta una banda ancha (50 Hz a 7 kHz) . Por lo tanto, cuando hay unos pocos bits de información, no es posible conseguir suficiente rendimiento perceptivo usando un método de codificación de un espectro, que se obtiene mediante una transformación ortogonal, con cuantificación vectorial usando un libro de código.

Es por lo tanto un objeto de la presente invención proporcionar un aparato de codificación y método de codificación que puedan conseguir buena calidad perceptiva incluso si hay pocos bits de información.

Medios para resolver el problema Se define una solución a los problemas anteriores mediante un aparato de codificación de acuerdo con la reivindicación 1 y un método de codificación de acuerdo con la reivindicación 5.

Efectos ventajosos de la invención De acuerdo con la presente invención, es posible codificar frecuencias (posiciones) con precisión donde la energía está presente, de modo que es posible mejorar rendimiento cualitativo, que es único para codificación de espectro, y producir buena calidad de sonido incluso a bajas velocidades de bits.

Breve descripción de los dibujos La Figura 1 es un diagrama de bloques que muestra la configuración de un aparato de codificación del habla de acuerdo con una realización de la presente invención; La Figura 2 es un diagrama de bloques que muestra la configuración de un aparato de decodificación del habla de acuerdo con una realización de la presente invención; La Figura 3 es un diagrama de flujo que muestra el algoritmo de búsqueda en una sección de búsqueda de intervalo de acuerdo con una realización de la presente invención; La Figura 4 es un diagrama que muestra un ejemplo de un espectro representado mediante pulsos buscados en una sección de búsqueda de intervalo de acuerdo con una realización de la presente invención; La Figura 5 es un diagrama de flujo que muestra el algoritmo de búsqueda en una sección de búsqueda minuciosa de acuerdo con una realización de la presente invención; La Figura 6 es un diagrama de flujo que muestra el algoritmo de búsqueda en una sección de búsqueda minuciosa de acuerdo con una realización de la presente invención; La Figura 7 es un diagrama que muestra un ejemplo de un espectro representado mediante pulsos buscados en una sección de búsqueda de intervalo y sección de búsqueda minuciosa de acuerdo con una realización de la presente invención; La Figura 8 es un diagrama de flujo que muestra el algoritmo de decodificación en una sección de decodificación de espectro de acuerdo con una realización de la presente invención.

Mejor modo de llevar a cabo la invención En la codificación de señal del habla en base al esquema CELP y otros, a menudo se representa una señal del habla mediante una excitación y filtro de síntesis. Si se puede decodificar un vector que tiene una forma similar a una señal de excitación, que es una secuencia vectorial en el dominio del tiempo, es posible producir una forma de onda similar al habla de entrada a través de un filtro de síntesis, y conseguir buena calidad perceptiva. Esta es la característica cualitativa que ha conducido al éxito del libro de código algebraico usado en CELP.

Por otro lado, en el caso de codificación de espectro (vector) de frecuencia, un filtro de síntesis tiene como sus componentes ganancias espectrales, y por lo tanto la distorsión de las frecuencias (es decir posiciones) de los componentes de gran potencia es más significativa que la distorsión de esas ganancias. Es decir, buscando posiciones de alta energía y decodificando los pulsos en las posiciones de alta energía, en lugar... [Seguir leyendo]

Reivindicaciones:

1. Un aparato de codificación que comprende:

una sección de cuantificación de forma que codifica una forma de un espectro de frecuencia de audio; y una sección de cuantificación de ganancia que codifica una ganancia del espectro de frecuencia de audio, caracterizado por que la sección de cuantificación de forma comprende:

una sección de búsqueda de intervalo que busca una primera forma de onda fija en cada una de una pluralidad de bandas de frecuencia que dividen un intervalo de búsqueda de frecuencia predeterminado; y una sección de búsqueda minuciosa que busca segundas formas de onda fijas sobre una totalidad del intervalo de búsqueda de frecuencia predeterminado.

2. El aparato de codificación de acuerdo con la reivindicación 1, donde la sección de búsqueda minuciosa busca las segundas formas de onda fijas evaluando distorsión de codificación mediante una ganancia ideal por banda.

3. El aparato de codificación de acuerdo con la reivindicación 1, donde la sección de búsqueda minuciosa codifica información de posición de las segundas formas de onda fijas en base a un número de combinaciones de posiciones de las segundas formas de onda fijas.

4. El aparato de codificación de acuerdo con la reivindicación 1, donde la sección de cuantificación de ganancia calcula ganancias de la primera forma de onda fija y las segundas formas de onda fijas para cada banda.

5. Un método de codificación que comprende:

una etapa de cuantificación de forma de codificación de una forma de un espectro de frecuencia de audio; y una etapa de cuantificación de ganancia de codificación de una ganancia del espectro de frecuencia de audio, caracterizado por que la etapa de cuantificación de forma comprende:

una etapa de búsqueda de intervalo de búsqueda de una primera forma de onda fija en una pluralidad de bandas de frecuencia que dividen un intervalo de búsqueda de frecuencia predeterminado; y una etapa de búsqueda minuciosa de búsqueda de segundas formas de onda fijas sobre una totalidad del intervalo de búsqueda de frecuencia predeterminado.

Patentes similares o relacionadas:

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo, del 15 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia que genera un espectro que comprende realizar […]

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda […]

Aparato, método y programa informático para decodificar una señal de audio codificada, del 8 de Julio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para decodificar una señal de audio codificada que comprende una señal central codificada y datos paramétricos , que comprende: un decodificador […]

Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario, del 24 de Junio de 2020, de VOICEAGE CORPORATION: Un método de codificación de sonido estéreo para codificar canales izquierdo y derecho de una señal de sonido estéreo, que comprende: mezclar por […]

Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda, del 24 de Junio de 2020, de Crystal Clear Codec, LLC: Un método para predecir una señal de banda de frecuencia de extensión del ancho de banda, que comprende: demultiplexación de un flujo de bits recibido y […]

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada, del 24 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un codificador para codificar una señal de audio , donde el codificador está configurado para codificar la señal de audio […]

Codificación de audio, del 10 de Junio de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método de codificación de audio, que comprende: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del […]

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial, del 3 de Junio de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio , comprendiendo el procesador […]

Dispositivo de codificación y método de codificación.

Un aparato de codificación que comprende: una sección de 5 cuantificación de forma que codifica una forma de un espectro de frecuencia de audio;

Fragmento de la descripción:

Reivindicaciones:

Patentes similares o relacionadas:

Un aparato de codificación que comprende:

una sección de 5 cuantificación de forma que codifica una forma de un espectro de frecuencia de audio;