MEJORAMIENTO DE AUDIO EN DOMINIO CODIFICADO.

Un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un segundo parámetro,

comprendiendo el procedimiento las etapas de:

determinar un valor actual de primer parámetro a partir de un índice correspondiente a un primer parámetro;

ajustar el valor actual de primer parámetro con el fin de conseguir una primera característica mejorada, obteniendo de ese modo un valor mejorado de primer parámetro;

determinar un valor actual de segundo parámetro a partir del índice correspondiente además a un segundo parámetro; y

determinar un nuevo valor de índice a partir de una tabla que relaciona valores de índice con valores de primer parámetro y que relaciona los valores de índice con valores de segundo parámetro, de manera que un nuevo valor de primer parámetro correspondiente al nuevo valor de índice y un nuevo valor de segundo parámetro correspondiente al nuevo valor de índice se correspondan sustancialmente con el valor mejorado de primer parámetro y con el valor actual de segundo parámetro

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E04029839.

Solicitante: NOKIA CORPORATION.

Nacionalidad solicitante: Finlandia.

Dirección: KEILALAHDENTIE 4,02150 ESPOO.

Inventor/es: VALVE,PAIVI, PASANEN,ANTTI.

Fecha de Publicación: 21 de Abril de 2010.

Fecha Solicitud PCT: 16 de Diciembre de 2004.

Fecha Concesión Europea: 20 de Enero de 2010.

Clasificación Internacional de Patentes:

G10L19/14T
G10L21/02A4

Clasificación PCT:

G10L19/14
G10L21/02 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › G10L 21/00 Tratamiento de la señal de la voz para producir otra señal audible o no audible, p. ej. visual o táctil, con el fin de modificar su calidad o su inteligibilidad (G10L 19/00 tiene prioridad). › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Clasificación antigua:

G10L19/14
G10L21/02 G10L 21/00 […] › Mejora de la inteligibilidad de la voz, p. ej. reducción de ruido o eliminación de ecos (reducción de efectos de eco en los sistemas de transmisión en línea H04B 3/20; supresión de eco en teléfonos de manos libres H04M 9/08).

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Grecia, Italia, Liechtensein, Luxemburgo, Países Bajos, Suecia, Mónaco, Portugal, Irlanda, Eslovenia, Finlandia, Rumania, Chipre, Lituania, Letonia, Ex República Yugoslava de Macedonia, Albania.

Fragmento de la descripción:

Mejoramiento de audio en dominio codificado.

Campo de la invención

La presente invención se refiere al mejoramiento de voz y, en particular, a un procedimiento y a un aparato para mejorar una señal de audio codificada.

Antecedentes de la invención

La calidad de voz mejorada creada por los algoritmos DSP (procesamiento de señales digitales) de procesamiento de voz se ha utilizado para diferenciar proveedores de red. La transferencia a redes de paquetes o a redes con un funcionamiento libre en tándem (TFO) extendido o con un funcionamiento libre de transcodificador (TrFO) reducirá esta capacidad de diferenciar redes con algoritmos de procesamiento de voz tradicionales. Por lo tanto, los operadores que generalmente han sido responsables de mantener la calidad de voz para sus clientes están demandando algoritmos de procesamiento de voz que también se utilicen para la voz codificada.

TFO es una norma de voz que se utilizará en las redes GSM (sistema global de comunicaciones móviles) y en las redes 3G (tercera generación) evolucionadas de GSM. Está destinada a evitar la doble codificación/descodificación tradicional de voz en configuraciones de llamadas entre móviles. El principal inconveniente de una configuración en tándem es la degradación de la calidad de voz introducida por la doble transcodificación. Según las pruebas de escucha del ETSI, esta degradación es normalmente más apreciable cuando los códecs de voz funcionan a bajas velocidades. Además, un nivel de ruido de fondo más alto aumenta la degradación.

Cuando las conexiones de origen y destino utilizan el mismo códec de voz, es posible transmitir de manera transparente las tramas de voz recibidas desde la MS (estación móvil) origen hasta la MS destino sin activar las funciones de transcodificación en las redes origen y destino.

Las principales ventajas del funcionamiento libre en tándem son la mejora de la calidad de voz evitando la doble transcodificación en la red, posibles ahorros en los enlaces de transmisión entre PLMN (red móvil pública terrestre), que transportan voz comprimida compatible con un esquema de submultiplexión de 16 kbit/s o de 8 kbit/s, incluyendo transmisión por conmutación de paquetes, posibles ahorros en la potencia de procesamiento del equipo de red puesto que se omiten las funciones de transcodificación en las unidades de transcodificador, y una posible reducción en el retardo de transmisión de extremo a extremo.

En la configuración de llamada TFO, un dispositivo de transcodificador está presente físicamente en la trayectoria de la señal, pero las funciones de transcodificación se omiten. El dispositivo de transcodificación puede llevar a cabo funciones de control y de conversión de protocolos. Por otro lado, en el funcionamiento libre de transcodificador (TrFO), no hay ningún dispositivo de transcodificador físicamente presente y, por lo tanto, no se activa ninguna función de control o de conversión u otras funciones asociadas con el mismo.

El nivel de voz es un factor importante que afecta a la calidad de voz percibida. Normalmente, en el lado de red se utilizan algoritmos de control de nivel automático que ajustan el nivel de voz hasta un determinado nivel objetivo deseado incrementando el nivel de voz débil y reduciendo en cierto grado el nivel de voces muy altas.

Estos procedimientos no pueden utilizarse como tales en futuras redes de paquetes donde la voz se propaga en el formato codificado de extremo a extremo desde el dispositivo de transmisión hasta el dispositivo de recepción.

Actualmente, la voz codificada se descodifica en la red y el mejoramiento de voz se lleva a cabo con muestras PCM lineales utilizando procedimientos de mejoramiento de voz tradicionales. Después, la voz se codifica de nuevo y se transmite a la parte de recepción.

Sin embargo, por ejemplo, para el códec de voz AMR el control de nivel es más difícil en los modos inferiores debido a que la ganancia de libro de códigos fijo ya no puede cuantificarse de manera escalar sino que se cuantifica de manera vectorial junto con la ganancia de libro de códigos adaptativo.

Resumen de la invención

Un objeto de la invención es proporcionar un procedimiento y un aparato para mejorar una señal de audio codificada mediante los cuales se resuelvan los problemas descritos anteriormente y se obtenga un mejoramiento adicional de una señal de audio codificada.

Según un primer aspecto de la invención, este objeto se consigue mediante un aparato y un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un segundo parámetro, lo que comprende:

quaddeterminar un valor actual de primer parámetro a partir de un índice correspondiente a un primer parámetro; quadajustar el valor actual de primer parámetro con el fin de conseguir una primera característica mejorada, obteniendo de ese modo un valor mejorado de primer parámetro; quaddeterminar un valor actual de segundo parámetro a partir del índice correspondiente además a un segundo parámetro; y quaddeterminar un nuevo valor de índice a partir de una tabla que relaciona valores de índice con valores de primer parámetro y que relaciona los valores de índice con valores de segundo parámetro, de manera que un nuevo valor de primer parámetro correspondiente al nuevo valor de índice y un nuevo valor de segundo parámetro correspondiente al nuevo valor de índice se correspondan sustancialmente con el valor mejorado de primer parámetro y con el valor actual de segundo parámetro.

Según un segundo aspecto de la invención, este objeto se consigue mediante un aparato y un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un parámetro de ruido de fondo, lo que comprende:

quaddeterminar un valor actual de primer parámetro a partir de un índice correspondiente a al menos un primer parámetro; quadajustar el valor actual de primer parámetro con el fin de conseguir una primera característica mejorada, obteniendo de ese modo un valor mejorado de primer parámetro; quaddeterminar un nuevo valor de índice a partir de una tabla que relaciona valores de índice con al menos valores de primer parámetro, de manera que un nuevo valor de primer parámetro correspondiente al nuevo valor de índice se corresponda sustancialmente con el valor mejorado de primer parámetro; quaddetectar un valor actual de índice de parámetro de ruido de fondo; y quaddeterminar un nuevo valor de índice de parámetro de ruido de fondo correspondiente a la primera característica mejorada.

La invención también puede realizarse como un producto de programa informático que comprenda partes para llevar a cabo las etapas cuando el producto se ejecute en un ordenador.

Según una realización de la invención, una señal de audio codificada que comprende voz y/o ruido en un dominio codificado se mejora manipulando parámetros de ruido y/o de voz codificada de un códec de voz AMR (adaptativo a múltiples velocidades). Como resultado, puede obtenerse en la red un control de nivel adaptativo, un control de eco y una supresión de ruido incluso si la voz no se transforma en muestras PCM lineales, tal como es el caso de las redes TFO, TrFO y de futuras redes de paquetes.

Más específicamente, según una realización de la invención, se describe un procedimiento para controlar el nivel de la voz codificada AMR para todos los modos de 12,2 kbit/s, 10,2 kbit/s, 7,95 kbit/s, 7,40 kbit/s, 6,70 kbit/s, 5,90 kbit/s, 5,15 kbit/s y 4,75 kbit/s de los códec AMR. El nivel de la voz codificada se ajusta modificando uno de los parámetros de voz codificada, concretamente el índice de cuantificación del factor...

Reivindicaciones:

1. Un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un segundo parámetro, comprendiendo el procedimiento las etapas de:

2. Un procedimiento de mejoramiento de una señal de audio codificada que comprende índices que representan parámetros de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un parámetro de ruido de fondo, comprendiendo el procedimiento las etapas de:

3. El procedimiento según la reivindicación 1, que comprende además la etapa de:

quadsustituir un valor actual del índice correspondiente a al menos el primer parámetro por el nuevo valor de índice determinado.

4. El procedimiento según la reivindicación 1, que comprende además las etapas de:

quaddetectar un valor actual de índice de parámetro de ruido de fondo; y quaddeterminar un nuevo valor de índice de parámetro de ruido de fondo correspondiente a la primera característica mejorada.

5. El procedimiento según la reivindicación 1, que comprende además la etapa de determinar el nuevo valor de índice a partir de la tabla de manera que una correspondencia sustancial del valor actual de segundo parámetro tenga precedencia.

6. El procedimiento según la reivindicación 2, que comprende además las etapas de:

quadsustituir un valor actual del índice correspondiente al primer parámetro por el nuevo valor de índice determinado.

7. Un aparato para mejorar una señal de audio codificada que comprende índices que representan parámetros de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un segundo parámetro, comprendiendo el aparato:

quadmedios de determinación de valor de parámetro para determinar un valor actual de primer parámetro a partir de un índice correspondiente a un primer parámetro y para determinar un valor actual de segundo parámetro a partir del índice correspondiente además a un segundo parámetro; quadmedios de ajuste para ajustar el valor actual de primer parámetro con el fin de conseguir una primera característica mejorada, obteniendo de ese modo un valor mejorado de primer parámetro; y quadmedios de determinación de valor de índice para determinar un nuevo valor de índice a partir de una tabla que relaciona valores de índice con valores de primer parámetro y que relaciona los valores de índice con valores de segundo parámetro, donde un nuevo valor de primer parámetro correspondiente al nuevo valor de índice y un nuevo valor de segundo parámetro correspondiente al nuevo valor de índice se corresponden sustancialmente con el valor mejorado de primer parámetro y con el valor actual de segundo parámetro.

8. Un aparato para mejorar una señal de audio codificada que comprende índices que representan parámetros de señales de audio que comprenden al menos un primer parámetro que representa una primera característica de la señal de audio y un parámetro de ruido de fondo, comprendiendo el aparato:

quadmedios de determinación de valor de parámetro para determinar un valor actual de primer parámetro a partir de un índice correspondiente a al menos un primer parámetro; quadmedios de ajuste para ajustar el valor actual de primer parámetro con el fin de conseguir una primera característica mejorada, obteniendo de ese modo un valor mejorado de primer parámetro; quadmedios de determinación de valor de índice para determinar un nuevo valor de índice a partir de una tabla que relaciona valores de índice con al menos valores de primer parámetro, de manera que un nuevo valor de primer parámetro correspondiente al nuevo valor de índice se corresponda sustancialmente con el valor mejorado de primer parámetro; quadmedios de detección para detectar un valor actual de índice de parámetro de ruido de fondo; y quadmedios de determinación para determinar un nuevo valor de índice de parámetro de ruido de fondo correspondiente a la primera característica mejorada.

9. El aparato según la reivindicación 7, que comprende además:

quadmedios de sustitución para sustituir un valor actual del índice correspondiente a al menos el primer parámetro por el nuevo valor de índice determinado.

10. El aparato según la reivindicación 7, que comprende además:

quadmedios de detección para detectar un valor actual de índice de parámetro de ruido de fondo; y quadmedios de determinación para determinar un nuevo valor de índice de parámetro de ruido de fondo correspondiente a la primera característica mejorada.

11. El aparato según la reivindicación 7, en el que los medios de determinación de valor de índice están configurados para determinar el nuevo valor de índice a partir de la tabla de manera que una correspondencia sustancial del valor actual de segundo parámetro tenga precedencia.

12. El aparato según la reivindicación 8, que comprende además:

quadmedios de sustitución para sustituir un valor actual del índice correspondiente al primer parámetro por el nuevo valor de índice determinado.

13. Un producto de programa de ordenador que comprende partes adaptadas para llevar a cabo las etapas del procedimiento según una cualquiera de las reivindicaciones 1 a 6 cuando el producto se ejecuta en un ordenador.

14. El producto de programa de ordenador según la reivindicación 13, en el que dicho producto de programa de ordenador puede cargarse directamente en la memoria interna del ordenador.

15. Un medio legible por ordenador en el que está almacenado el producto de programa de ordenador según la reivindicación 13.

Patentes similares o relacionadas:

PROCEDIMIENTO PARA LA INTEROPERACIÓN ENTRE CODECS DE LA VOZ DE BANDA ANCHA TASA MÚLTIPLE ADAPTATIVO (AMR-WR) Y DE BANDA ANCHA, TASA DE BITS VARIABLE MODO MÚLTIPLE (VMR-WB), del 14 de Junio de 2011, de NOKIA CORPORATION: Un procedimiento para la codificación de una señal de voz usando un códec de banda ancha en modo múltiple tasa de bits variable controlado el origen para la interoperación […]

DISPOSITIVO DE MEJORA DE SONIDO DE VOZ, del 16 de Enero de 2012, de FUJITSU LIMITED: Un dispositivo de mejora de sonido de voz incluyendo: una unidad de calculo SNR configurada para calcular una SNR que es una relacion […]

DISPOSITIVO Y PROCEDIMIENTO PARA GENERAR UNA SEÑAL MULTICANAL CON UN PROCESAMIENTO DE SEÑAL DE VOZ, del 16 de Septiembre de 2011, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Dispositivo para generar una señal multicanal con un número de señales de canal de salida, que es mayor que un número de señales de canal de entrada de una señal […]

PROCEDIMIENTO, DISPOSITIVO Y MEDIO DE CÓDIGO DE PROGRAMA INFORMÁTICO PARA LA CONVERSIÓN DE VOZ, del 22 de Agosto de 2011, de ASOCIACIÓN CENTRO DE TECNOLOGÍAS DE INTERACCIÓN VISUAL Y COMUNICACIONES VICOMTECH DEL POZO ECHEZARRETA, MARÍA ARANTZAZU: Un procedimiento para convertir una señal de habla de un hablante fuente en un a señal de voz convertida, que comprende los pasos de: - una etapa de entrenamiento, […]

SISTEMA Y DISPOSITIVO INALÁMBRICO Y PONIBLE PARA REGISTRO, PROCESAMIENTO Y REPRODUCCIÓN DE SONIDOS EN PERSONAS CON DISTROFIA EN EL SISTEMA RESPIRATORIO, del 5 de Marzo de 2020, de ARAGÓN HAN, Daniel: La invención se refiere a un sistema y dispositivo para el registro, procesamiento y reproducción de sonidos en personas con distrofia en el […]

Métodos, aparatos y sistema para codificar y decodificar una señal, del 8 de Enero de 2020, de HUAWEI TECHNOLOGIES CO., LTD.: Un método para codificar una señal, que comprende: realizar un proceso de decisión de clasificación sobre una señal de banda de alta frecuencia de una señal […]

Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio, del 1 de Enero de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Un método para codificar una señal de audio, comprendiendo el método: (a) recibir una señal de audio ; (b) generar una señal de audio codificada; […]

Método y aparato para la mejora multisensorial del habla en un dispositivo móvil, del 13 de Noviembre de 2019, de Zhigu Holdings Limited: Un dispositivo móvil de mano, que comprende: un micrófono de conducción de aire que está configurado para convertir ondas acústicas en una señal […]