Esquema multimodo para codificación mejorada de audio.
Método para codificar una señal de entrada en un sistema codificador,
en el que el método comprende las etapasde:
- aplicar (102) un primer modo de codificación a la señal de entrada (X), cuantificando una primera parte de laseñal de entrada hasta un umbral de cuantificación que caracteriza el primer 5 modo de codificación para formaruna primera señal de salida (Y1)
- aplicar (104) un segundo modo de codificación a la señal de entrada (X), cuantificando una segunda parte de laseñal de entrada hasta un umbral de cuantificación que caracteriza el segundo modo de codificación para formaruna segunda señal de salida (Y2);
- formar (105) una primera salida procesada (Y1,proc) a partir de por lo menos una parte de la primera señal desalida (Y1), y una segunda salida procesada (Y2,proc) a partir de por lo menos una parte de la segunda señal desalida (Y2), en el que la formación de la segunda salida procesada comprende estimar una parte de la señal deentrada a partir de por lo menos una parte de la segunda señal de salida (Y2), reconstruyendo la parte de la señalde entrada por encima del umbral de cuantificación que caracteriza el segundo modo de codificación, utilizandoextensión del ancho de banda;
- determinar (106) un modo óptimo de codificación en base a la primera salida procesada (Y1,proc) y a la segundasalida procesada (Y2,proc), y sobre un criterio de selección calculado a partir de la señal de entrada y las salidasprocesadas, en el que el criterio de selección está definido como un problema de minimización dado como:donde m(*) es el modo óptimo m de codificación, D es la distorsión, m ≥ (1,...,M) es el índice sobre M modos o mes el índice sobre un subconjunto de M modos, X ≥ (x0,...,xN-1) es la señal de entrada, e Ym,proc ≥ (y0,...,yN-1)m,proc esla salida procesada para el modo m, donde N es el número de coeficientes en la señal de entrada, y
- seleccionar (108) la señal de salida (Y1, Y2) de acuerdo con el modo óptimo de codificación.
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/SE2008/050758.
Solicitante: TELEFONAKTIEBOLAGET L M ERICSSON (PUBL).
Nacionalidad solicitante: Suecia.
Dirección: 164 83 STOCKHOLM SUECIA.
Inventor/es: BRUHN, STEFAN, GRANCHAROV,VOLODYA, POBLOTH,HARALD.
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).
- G10L21/02 G10L […] › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).
PDF original: ES-2406422_T3.pdf
Fragmento de la descripción:
Esquema multimodo para codificación mejorada de audio
Campo técnico
La presente invención se refiere a un esquema mejorado para codificación de audio. En particular, la presente invención se refiere a un dispositivo codificador y a un método para la codificación de una señal de entrada en un sistema codificador.
Antecedentes Una solución convencional para la codificación, por ejemplo de audio, es cuantificar zonas de baja frecuencia de la señal de entrada en un codificador, y reconstruir zonas de alta frecuencia del espectro en el descodificador, en función de un libro de códigos de reconstrucción. De este modo, todos los bits son asignados a las componentes de frecuencia inferiores a un umbral de frecuencia predefinido o índice, y en el descodificador los componentes de frecuencia restantes (no cuantificados) se reconstruyen a partir de los componentes de frecuencia cuantificados.
Una solución más avanzada, que es adecuada para velocidades binarias variables, es detectar dinámicamente las zonas a cuantificar y las zonas a reconstruir en base, por ejemplo, a la energía de las bandas de frecuencia de la entrada.
Además, se ha propuesto ajustar el tamaño de las zonas a cuantificar en base al grado de dificultad para codificar dichas zonas en la señal de entrada en cuestión. La zona es menor cuando contiene un espectro que es difícil de cuantificar, y viceversa.
En la memoria US 2007/019086 A1 se da a conocer un ejemplo de un esquema conocido de codificación de audio que permite la utilización de parámetros de codificación.
A pesar de lo mencionado anteriormente, sigue existiendo la necesidad de un esquema mejorado para codificación de audio.
Compendio Por consiguiente, es un objetivo de la presente invención dar a conocer un dispositivo codificador y un método para disponer un esquema de codificación que permita una calidad de audio mejorada en un terminal receptor.
Se da a conocer un método para codificar una señal de entrada en un sistema codificador, según la reivindicación 1. El método comprende aplicar un primer modo a la señal de entrada para formar una primera salida y aplicar un segundo modo a la señal de entrada para formar una segunda salida. A continuación se forma una primera salida procesada a partir de por lo menos una parte de la primera salida, y se forma una segunda salida procesada a partir de por lo menos una parte de la segunda salida. Formar una segunda salida procesada comprende estimar una parte de la señal de entrada a partir de por lo menos una parte de la segunda salida.
A continuación, se determina un modo óptimo en base a la primera salida procesada y la segunda salida procesada, y se selecciona la salida de acuerdo con el modo óptimo. Además, se da a conocer un dispositivo codificador según la reivindicación 7. El dispositivo codificador comprende un controlador y una unidad codificadora conectada al controlador. La unidad codificadora está dispuesta para aplicar un primer modo a una señal de entrada a efectos de formar una primera salida, y está dispuesta para aplicar un segundo modo a la señal de entrada a efectos de formar una segunda salida. El controlador está dispuesto para formar una primera salida procesada a partir de por lo menos una parte de la primera salida, y una segunda salida procesada a partir de por lo menos una parte de la segunda salida. Formar una segunda salida procesada comprende estimar una parte de la señal de entrada a partir de por lo menos una parte de la segunda salida. Además, el controlador está dispuesto para determinar un modo óptimo en base a la primera salida procesada y a la segunda salida procesada, y está dispuesto para seleccionar la salida en función del modo óptimo.
Una ventaja importante de la presente invención es que se selecciona un modo óptimo para la codificación a partir de una serie de modos, de manera que se mejora la calidad de una transmisión de señal de audio.
Durante la cuantificación de una señal de entrada, se introducen errores de cuantificación debido al número limitado de bits disponibles. Puede obtenerse una precisión mayor para la cuantificación mediante el recurso de cuantificar solamente una parte seleccionada de la señal de entrada y reconstruir la parte restante. La reconstrucción de una señal, por ejemplo componentes de alta frecuencia desconocidos a partir de componentes de baja frecuencia cuantificados conocidos, introduce artefactos de reconstrucción en la señal de salida resultante. Por lo tanto, existe un compromiso entre errores de cuantificación y artefactos de reconstrucción cuando se codifica una señal de entrada.
Según la presente invención, un modo óptimo correspondiente a una salida óptima es determinado y seleccionado a partir de una serie de modos que incluyen un primer modo y un segundo modo en base a un proceso, que por ejemplo incluye descodificación, de las salidas resultantes de la aplicación de dicha serie de modos a la señal de entrada.
Breve descripción de los dibujos Las anteriores y otras características y ventajas de la presente invención resultarán evidentes para los expertos en la materia mediante la siguiente descripción detallada de realizaciones a modo de ejemplo de la misma, haciendo referencia a los dibujos adjuntos, en los cuales:
la figura 1 muestra esquemáticamente una realización del dispositivo codificador según la presente invención, la figura 2 muestra esquemáticamente una realización del dispositivo codificador según la presente invención, la figura 3 muestra esquemáticamente una realización de una unidad codificadora de la figura 1, la figura 4 muestra esquemáticamente una realización de un controlador de la figura 1, la figura 5 muestra esquemáticamente una realización de una unidad codificadora de la figura 2, la figura 6 muestra esquemáticamente una realización de un controlador de la figura 2, la figura 7 muestra esquemáticamente una realización de un dispositivo codificador según la presente
invención;
la figura 8 muestra diferentes modos aplicados en el dispositivo codificador y el método según la presente invención, la figura 9 muestra esquemáticamente una realización del método según la presente invención, la figura 10 muestra esquemáticamente una realización del método según la presente invención, y la figura 11 muestra una envolvente del espectro y un residuo comprimido para una trama de voz de 20 ms.
Abreviaturas AR autorregresivo BWE extensión del ancho de banda DFT transformada de Fourier discreta GMM modelos mixtos gaussianos KLT transformada de Karhunen Loève MDCT transformada de coseno discreta modificada SBR replicación de la banda espectral SQ cuantificador escalar VQ cuantificador vectorial
Descripción detallada Las figuras son esquemáticas y están simplificadas por claridad, y muestran simplemente los detalles que son esenciales para la comprensión de la invención, habiéndose omitido otros. A través de toda la descripción, se utilizan los mismos numerales de referencia para partes idénticas o correspondientes.
El método según la invención comprende la aplicación de la serie de modos que incluyen un primer modo y un segundo modo, a la señal de entrada. La señal de entrada puede ser preprocesada, por ejemplo mediante la aplicación de una envolvente espectral antes de la aplicación de los modos.
Aplicar un modo a una señal de entrada puede comprender cuantificar una parte seleccionada de la señal de entrada, por ejemplo aplicar un primer modo a la señal de entrada puede comprender cuantificar una primera parte de la señal de entrada y/o aplicar un segundo modo la señal de entrada puede comprender cuantificar una segunda parte de la señal de entrada. La primera parte y la segunda parte pueden solapar.
Un ejemplo de modo consiste en que se cuantifican las frecuencias o los coeficientes de la señal de entrada menores o iguales a un umbral de cuantificación, quedando para ser reconstruidas las frecuencias o coeficientes superiores al umbral de cuantificación. Diferentes umbrales de cuantificación pueden caracterizar modos diferentes.
En el método, formar una segunda salida procesada puede comprender reconstruir una parte de la señal de entrada utilizando extensión del ancho de banda.
En el método según la invención, un número adecuado M de modos puede aplicarse a la señal de entrada para formar M salidas. En una realización, una selección de salidas o preferiblemente todas se procesan para formar 5 salidas procesadas. Dichas salidas seleccionadas o preferiblemente todas, procesadas, pueden formar parcial o totalmente bases para la determinación del modo óptimo.
En el método, la determinación... [Seguir leyendo]
Reivindicaciones:
1. Método para codificar una señal de entrada en un sistema codificador, en el que el método comprende las etapas de:
- aplicar (102) un primer modo de codificación a la señal de entrada (X) , cuantificando una primera parte de la
señal de entrada hasta un umbral de cuantificación que caracteriza el primer modo de codificación para formar una primera señal de salida (Y1)
- aplicar (104) un segundo modo de codificación a la señal de entrada (X) , cuantificando una segunda parte de la señal de entrada hasta un umbral de cuantificación que caracteriza el segundo modo de codificación para formar una segunda señal de salida (Y2) ;
- formar (105) una primera salida procesada (Y1, proc) a partir de por lo menos una parte de la primera señal de salida (Y1) , y una segunda salida procesada (Y2, proc) a partir de por lo menos una parte de la segunda señal de salida (Y2) , en el que la formación de la segunda salida procesada comprende estimar una parte de la señal de entrada a partir de por lo menos una parte de la segunda señal de salida (Y2) , reconstruyendo la parte de la señal de entrada por encima del umbral de cuantificación que caracteriza el segundo modo de codificación, utilizando extensión del ancho de banda;
- determinar (106) un modo óptimo de codificación en base a la primera salida procesada (Y1, proc) y a la segunda salida procesada (Y2, proc) , y sobre un criterio de selección calculado a partir de la señal de entrada y las salidas procesadas, en el que el criterio de selección está definido como un problema de minimización dado como:
donde m (*) es el modo óptimo m de codificación, D es la distorsión, m = (1, ..., M) es el índice sobre M modos o m es el índice sobre un subconjunto de M modos, X = (x0, ..., xN-1) es la señal de entrada, e Ym, proc = (y0, ..., yN-1) m, proc es la salida procesada para el modo m, donde N es el número de coeficientes en la señal de entrada, y
- seleccionar (108) la señal de salida (Y1, Y2) de acuerdo con el modo óptimo de codificación.
2. Método según la reivindicación 1, en el que se aplican M > 2 modos en la señal de entrada para formar M señales 25 de salida.
3. Método según cualquiera de las reivindicaciones precedentes, en el que la distorsión D para por lo menos un modo de codificación está dada por:
4. Método según cualquiera de las reivindicaciones precedentes, en el que la distorsión D para por lo menos un modo de codificación está dada por:
donde N es el número de coeficientes en la señal de entrada, I es un subconjunto de enteros desde 0 hasta N-1, NI es el número de elementos en I,
5. Método según cualquiera de las reivindicaciones precedentes, en el que la distorsión D se estima para por lo menos un modo de codificación.
6. Método según cualquiera de las reivindicaciones precedentes, que comprende además la etapa de transmitir información acerca del modo óptimo de codificación.
7. Dispositivo codificador (2, 2', 2') ' que comprende un controlador (4, 4') y una unidad codificadora (6, 6') conectada al controlador (4, 4') , estando dispuesta la unidad codificadora para aplicar un primer modo de codificación a una señal de entrada (X) , cuantificando una primera parte de la señal de entrada hasta un umbral de cuantificación que caracteriza el primer modo de codificación para formar la primera señal de salida (Y1) , y estando dispuesta para aplicar un segundo modo de codificación a la señal de entrada (X) , cuantificando una segunda parte de la señal de entrada hasta un umbral de cuantificación que caracteriza al segundo modo de codificación, para formar una segunda señal de salida (Y2) , en el que el controlador (4, 4') está dispuesto para formar una primera salida procesada (Y1, proc) a partir de por lo menos una parte de la primera señal de salida (Y1) , y una segunda salida procesada (Y2, proc) a partir de por lo menos una parte de la segunda señal de salida (Y2) , en el que la formación de la segunda salida procesada comprende estimar una parte de la señal de entrada a partir de por lo menos una parte de la segunda señal de salida (Y2) , reconstruyendo la parte de la señal de entrada que está por encima del umbral de cuantificación que caracteriza el segundo modo de codificación, utilizando extensión del ancho de banda, y determinar un modo óptimo de codificación en base a la primera salida procesada y la segunda salida procesada, y sobre un criterio de selección calculado a partir de la señal de entrada y las salidas procesadas, en el que el criterio de selección está definido como un problema de minimización dado por: m (*) = arg minm D (X, Ym, proc) , donde m (*) es el modo óptimo m de codificación, D es la distorsión, m= (1, ..., M) es el índice sobre M modos o m es el índice sobre un subconjunto de M modos, X = (x0, ..., xN-1) en la señal de entrada, e Ym, proc = (y0, ..., yN-1) m, proc es la salida procesada para el modo m donde N es el número de coeficientes en la señal de entrada, y seleccionar la señal de salida (Y1, Y2) de acuerdo con el modo óptimo.
8. Dispositivo codificador según la reivindicación 7, en el que la unidad codificadora (6) comprende un codificador
(22) que está adaptado para aplicar en serie el primer modo de codificación y el segundo modo de codificación y enviar en serie la primera señal de salida y la segunda señal de salida al controlador (4, 4') sobre una primera conexión (10) .
9. Dispositivo codificador según la reivindicación 7, en el que la unidad codificadora (6) comprende un primer codificador (28) y un segundo codificador (30) , en el que el primer codificador está dispuesto para aplicar el primer modo de codificación y para enviar la primera señal de salida al controlador sobre una primera conexión y el segundo codificador está dispuesto para aplicar el segundo modo de codificación y para enviar la segunda señal de salida al controlador sobre una segunda conexión.
10. Dispositivo codificador según cualquiera de las reivindicaciones 7 a 9, en el que el controlador (4, 4') comprende por lo menos un descodificador dispuesto para formar la primera salida procesada y la segunda salida procesada de acuerdo con el primer y el segundo modos de codificación respectivamente, y un procesador dispuesto para determinar el modo óptimo de codificación en base a un criterio de selección calculado a partir de la señal de entrada y la primera salida procesada y la segunda salida procesada.
11. Sistema codificador que comprende un dispositivo codificador según cualquiera de las reivindicaciones 7 a 10.
Patentes similares o relacionadas:
SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]
Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]
Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]
Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]
Método y dispositivo de enriquecimiento espectral, del 14 de Junio de 2019, de Orange: Procedimiento de enriquecimiento del contenido espectral de una señal que tiene un espectro incompleto incluyendo una primera banda espectral, comprendiendo […]
Transposición armónica basada en bloque de sub bandas mejorada, del 22 de Mayo de 2019, de DOLBY INTERNATIONAL AB: Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, […]
Procedimiento y aparato de procesamiento de señales de voz/audio, del 15 de Mayo de 2019, de HUAWEI TECHNOLOGIES CO., LTD.: Un procedimiento de procesamiento de señales de voz/audio, que comprende: cuando una señal de voz/audio conmuta desde una señal de frecuencia ancha a una […]
Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo, del 27 de Marzo de 2019, de ROBERT BOSCH GMBH: Sistema para emitir una senal de audio en un entorno , comprendiendo el sistema : una fuente de audio para proporcionar la senal de audio, […]