Procedimiento, aparato y producto de programa de ordenador para reconstruir una trama de voz borrada.

Un procedimiento para reconstruir una trama de voz borrada que tiene una posición de índice asociada con latrama,

que comprende:

recibir de una memoria intermedia una segunda trama de voz, en el que la posición de índice de la segundatrama de voz es mayor que la posición de índice de la trama de voz borrada;

determinar qué tipo de procedimiento de ocultación de pérdida de paquetes (PLC) en base a una o ambasde las tramas de voz segunda y tercera,

en el que la posición de índice de la tercera trama de voz es menor que la posición de índice de la trama devoz borrada;

reconstruir la trama de voz borrada a partir de una o ambas de las tramas de voz segunda y tercera;caracterizado por

recibir un indicador que indique la diferencia entre la posición de índice de la trama de voz borrada y laposición de índice de la segunda trama de voz; y

las etapas de determinación y reconstrucción se basan también en determinar si el indicador es mayor queun umbral.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2010/037302.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5775 Morehouse Drive San Diego, California 92121-1714 ESTADOS UNIDOS DE AMERICA.

Inventor/es: FANG,ZHENG, SINDER,DANIEL J, KANDHADAI,ANANTHAPADMANABHAN ARASANIPALAI.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G10L19/00 FISICA.G10 INSTRUMENTOS MUSICALES; ACUSTICA.G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ.Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2401171_T3.pdf

 

Procedimiento, aparato y producto de programa de ordenador para reconstruir una trama de voz borrada.

Fragmento de la descripción:

Procedimiento, aparato y producto de programa de ordenador para reconstruir una trama de voz borrada

Campo técnico

Los presentes sistemas y procedimientos versan acerca de tecnologías de comunicaciones y de tipo inalámbrico. En 5 particular, los presentes sistemas y procedimientos versan acerca de sistemas y procedimientos para reconstruir una trama de voz borrada.

Antecedentes Se han realizado comunicaciones digitales de voz en redes conmutadas por circuitos. Una red conmutada por circuitos es una red en la que se establece un trayecto físico entre dos terminales en el transcurso de la duración de una llamada. En aplicaciones conmutadas por circuitos, un terminal transmisor envía al terminal receptor una secuencia de paquetes que contienen información de voz en un trayecto físico. El terminal receptor usa la información de voz contenida en los paquetes para sintetizar la voz.

Han empezado a efectuarse comunicaciones digitales de voz en redes conmutadas por paquetes. Una red conmutada por paquetes es una red en la que se encaminan paquetes a través de la red en base a una dirección de destino. Con las comunicaciones conmutadas por circuitos, los dispositivos de encaminamiento determinan un trayecto para cada paquete individualmente, enviándolo por cualquier trayecto disponible para alcanzar su destino. En consecuencia, los paquetes no llegan al terminal receptor a la vez ni en el mismo orden. Puede usarse una memoria intermedia anti fluctuaciones, en el terminal receptor, para volver a poner los paquetes en orden y reproducirlos de forma secuencial continua.

En algunas ocasiones, se pierde un paquete en tránsito desde el terminal transmisor hasta el terminal receptor. Un paquete perdido puede degradar la calidad de la voz sintetizada. Por ello, pueden lograrse beneficios proporcionando sistemas y un procedimiento para reconstruir un paquete perdido.

El documento US 2006/0173687 A1 da a conocer un decodificador de voz configurado para recibir una secuencia de tramas. Un módulo de ocultación del borrado de tramas reconstruye parámetros de voz para una trama borrada en una secuencia de tramas a partir de los parámetros de voz en una o más tramas anteriores y de los parámetros de voz en una o más tramas subsiguientes. El documento EP 1 746 580 A1 da a conocer un procedimiento de comunicaciones por paquetes de señales acústicas. Una unidad transmisora transmite un paquete que contiene en el mismo paquete tanto una señal acústica de trama como datos correspondientes de una señal acústica para una trama diferente. Si se pierde una trama, la trama perdida se obtiene usando los datos correspondientes de la señal

acústica.

El objeto de la presente invención, que se define en las reivindicaciones adjuntas a las que debería hacerse referencia ahora, es mejorar la reconstrucción de tramas de voz borradas.

Breve descripción de los dibujos La Figura 1 es un diagrama de bloques que ilustra un ejemplo de un terminal transmisor y un terminal

receptor en un medio de transmisión; la Figura 2 es un diagrama de bloques que ilustra una configuración adicional del terminal receptor; la Figura 3 es un diagrama de bloques que ilustra una configuración del terminal receptor con un módulo de ocultación mejorada de pérdida de paquetes (PLC) ; la Figura 4 es un diagrama de flujo que ilustra un ejemplo de un procedimiento para reconstruir una trama de voz usando una trama futura; la Figura 5 ilustra bloques de medio más función correspondientes al procedimiento mostrado en la Figura 4; la Figura 6 es un diagrama de flujo que ilustra una configuración adicional de un procedimiento de ocultación de la pérdida de una trama de voz;

la Figura 7 es un diagrama de flujo que ilustra un ejemplo adicional de un procedimiento de ocultación de la pérdida de una trama de voz; y la Figura 8 ilustra diversos componentes que pueden utilizarse en un dispositivo inalámbrico.

Descripción detallada En una red conmutada por paquetes pueden implementarse aplicaciones de voz. Los paquetes con información de 50 voz pueden transmitirse por la red desde un primer dispositivo hasta un segundo dispositivo. Sin embargo, algunos de los paquetes pueden perderse durante la transmisión de los paquetes. En una configuración, la información de voz (es decir, de habla) puede ser organizada en tramas de voz. Un paquete puede incluir una o más tramas de voz. Cada trama de voz puede subdividirse, además, en subtramas. Pueden usarse estos límites arbitrarios de tramas cuando se lleve a cabo algún procesamiento en bloques. Sin embargo, las muestras de voz pueden no estar

divididas en tramas (y subtramas) si se implementa un procesamiento continuo en vez de un procesamiento en

bloques. La pérdida de múltiples tramas de voz (a veces denominada pérdida en ráfagas) puede ser una razón de la degradación de la calidad percibida de la voz en un dispositivo receptor. En los ejemplos descritos, cada paquete transmitido desde el primer dispositivo hasta el segundo dispositivo puede incluir una o más tramas, dependiendo de la aplicación específica y de las limitaciones totales de diseño.

En una red conmutada por circuitos pueden implementarse aplicaciones de datos y pueden transmitirse por la red paquetes con datos desde un primer dispositivo hasta un segundo dispositivo. Los paquetes de datos también pueden perderse durante la transmisión de los datos. La manera convencional de ocultar la pérdida de una trama en un paquetes de datos en un sistema conmutado por circuitos es reconstruir los parámetros de la trama perdida mediante extrapolación de la trama anterior con cierta atenuación. Los esquemas de ocultación de la pérdida de paquetes (o tramas) usados por los sistemas convencionales pueden ser denominados ocultación de pérdida de paquetes (PLC) convencional. La extrapolación puede incluir el uso de los parámetros de trama o la forma de onda de la altura tonal de la trama anterior para reconstruir la trama perdida. Aunque el uso de comunicaciones de voz en redes conmutadas por paquetes (es decir, voz sobre protocolo de Internet (VoIP) ) está aumentando, la PLC convencional usada en redes conmutadas por circuitos también se usa para implementar esquemas de ocultación de pérdida de paquetes en redes conmutadas por paquetes.

Aunque la PLC convencional funciona razonablemente bien cuando hay una pérdida de una sola trama en una zona de voz estable, puede no ser adecuada para ocultar la pérdida de una trama de transición. Además, la PLC convencional puede no funcionar tampoco bien para pérdidas de tramas a ráfagas. Sin embargo, en redes conmutadas por paquetes, por diversas razones como una elevada carga del enlace y fluctuaciones elevadas, las pérdidas de paquetes pueden ser a ráfagas. Por ejemplo, en redes conmutadas por paquetes pueden perderse tres o más paquetes consecutivos. En esta circunstancia, el enfoque de la PLC convencional puede no ser lo suficientemente robusta para proporcionar una calidad de percepción razonablemente buena para los usuarios.

Para proporcionar una calidad de percepción mejorada en las redes conmutadas por paquetes, puede usarse un esquema mejorado de ocultación de la pérdida de paquetes. Este esquema de ocultación puede denominarse PLC mejorada que utiliza un algoritmo de tramas futuras. El algoritmo de PLC mejorada puede utilizar una trama futura (almacenada en una memoria intermedia antifluctuaciones) para interpolar algunos o la totalidad de los parámetros del paquete perdido. En un ejemplo, el algoritmo de PLC mejorada puede mejorar la calidad percibida de voz sin afectar la capacidad del sistema. Los presentes sistemas y procedimientos descritos en lo que sigue pueden ser usados con numerosos tipos de códecs de voz.

Según la invención, se proporciona un procedimiento, según se expone en la reivindicación independiente 1, para reconstruir una trama de voz borrada.

Según la invención, también se proporciona un aparato, según se expone en la reivindicación independiente 15, para reconstruir una trama de voz borrada.

Además, según la invención, según se expone en la reivindicación independiente 18, se proporciona un producto de programa de ordenador.

En las reivindicaciones dependientes se exponen realizaciones preferentes de la invención.

La Figura 1 es un diagrama 100 de bloques que ilustra un ejemplo de un terminal transmisor 102 y un terminal receptor 104 en un medio de transmisión. Los terminales transmisor y receptor 102, 104 pueden ser cualquier dispositivo que sea capaz de soportar comunicaciones de voz, incluyendo teléfonos, ordenadores, equipo de radiodifusión y recepción de audio, equipo de videoconferencias o similares. En una configuración, los terminales... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento para reconstruir una trama de voz borrada que tiene una posición de índice asociada con la trama, que comprende:

recibir de una memoria intermedia una segunda trama de voz, en el que la posición de índice de la segunda trama de voz es mayor que la posición de índice de la trama de voz borrada; determinar qué tipo de procedimiento de ocultación de pérdida de paquetes (PLC) en base a una o ambas de las tramas de voz segunda y tercera, en el que la posición de índice de la tercera trama de voz es menor que la posición de índice de la trama de voz borrada;

reconstruir la trama de voz borrada a partir de una o ambas de las tramas de voz segunda y tercera;

caracterizado por

recibir un indicador que indique la diferencia entre la posición de índice de la trama de voz borrada y la posición de índice de la segunda trama de voz; y las etapas de determinación y reconstrucción se basan también en determinar si el indicador es mayor que un umbral.

2. El procedimiento de la reivindicación 1 que, además, comprende recibir una tasa de trama y un tipo de trama asociados con la segunda trama de voz o interpolar un parámetro de la trama de voz borrada usando un parámetro de la segunda trama de voz y un parámetro de la tercera trama de voz.

3. El procedimiento de la reivindicación 1 que, además, comprende detectar la trama de voz borrada o calcular un 20 factor de interpolación a partir del indicador.

4. El procedimiento de la reivindicación 3 en el que, si se calcula un factor de interpolación, el factor de interpolación se calcula como FI = , en la que FI es el factor de interpolación y m es el indicador.

m +1

5. El procedimiento de la reivindicación 4 en el que la trama de voz borrada es una trama de predicción lineal por

excitación de código (CELP) o en el que la trama de voz borrada es una trama de periodo de altura tonal 25 prototipo (PPP) .

6. El procedimiento de la reivindicación 1 en el que la memoria intermedia comprende más de una trama de voz, en el que las posiciones de índice de algunas de las tramas de voz son mayores que la posición de índice de la trama de voz borrada y las posiciones de índices de otras tramas de voz son menores que la posición de índice de la trama borrada.

7. El procedimiento de la reivindicación 6 que, además, comprende seleccionar una de las tramas de voz dentro de la memoria intermedia, en el que la trama de voz se selecciona en base a la tasa de codificación, en el tipo de codificación o en la cercanía temporal de la trama de voz a la trama borrada o en el que la trama de voz es seleccionada en base al tamaño de la trama en la memoria intermedia.

8. El procedimiento de la reivindicación 1 en el que la tercera trama de voz tiene un tipo de trama que es diferente 35 del tipo de trama de la segunda trama de voz.

9. El procedimiento de la reivindicación 1 que, además, comprende utilizar una trama de voz futura para interpolar algunos o la totalidad de los parámetros de la trama de voz borrada.

10. El procedimiento de la reivindicación 1 en el que la determinación de qué tipo de procedimiento de ocultación de pérdida de paquetes usar se basa en una tasa de trama y un tipo de trama de una o ambas de las tramas

de voz segunda y tercera o en el que la determinación de qué tipo de procedimiento de ocultación de pérdida de paquetes usar se basa en una similitud de la segunda trama de voz y la tercera trama de voz.

11. El procedimiento de la reivindicación 10 en el que si la determinación se basa en la similitud de la segunda trama de voz y la tercera trama de voz, la similitud es calculada en base a una estimación de envolvente espectral o una estimación de forma de onda de altura tonal de la segunda trama de voz y la tercera trama de 45 voz.

12. El procedimiento de la reivindicación 1 que, además, comprende seleccionar un factor de interpolación basado en características de la segunda trama de voz y la tercera trama de voz o que, además, comprende estimar parámetros de la trama de voz borrada usando retroextrapolación.

13. El procedimiento de la reivindicación 12 en el que si los parámetros de la trama de voz borrada son estimados

usando retroextrapolación, entonces determinar si usar retroextrapolación se basa en el tipo de trama y en las características de la segunda trama de voz y la tercera trama de voz.

14. El procedimiento de la reivindicación 1 que, además, comprende interpolar una porción de los parámetros de la segunda trama para reconstruir la trama de voz borrada, estando perdida o corrompida la trama de voz borrada.

15. Un aparato para reconstruir una trama de voz borrada que tiene una posición de índice asociada con la trama, 5 que comprende:

un medio para recibir de una memoria intermedia una segunda trama de voz, en el que la posición de índice de la segunda trama de voz es mayor que la posición de índice de la trama de voz borrada; un medio para determinar qué tipo de procedimiento de ocultación de pérdida de paquetes (PLC) en base a una o ambas de las tramas de voz segunda y tercera, en el que la posición de índice de la tercera trama de voz es menor que la posición de índice de la trama de voz borrada; y un medio para reconstruir la trama de voz borrada a partir de una o ambas de las tramas de voz segunda y tercera;

caracterizado por

un módulo de ocultación del borrado de tramas configurado para recibir un indicador,

en la que el indicador indica la diferencia entre la posición de índice de la trama de voz borrada y la posición índice de la segunda trama de voz, estando configurado el módulo de ocultación del borrado de tramas, además, para determinar si el indicador está por encima de un umbral, estando adaptado el medio de determinación y reconstrucción para determinar y reconstruir la trama de voz borrada en base a si el indicador está por encima del umbral.

16. El aparato para reconstruir una trama de voz borrada de la reivindicación 15 en el que el módulo de ocultación del borrado de tramas está configurado, además, para interpolar un parámetro de la trama de voz borrada usando un parámetro de la segunda trama de voz y un parámetro de la tercera trama de voz o que, además, comprende un decodificador de voz configurado para detectar la trama de voz borrada.

17. El aparato para reconstruir una trama de voz borrada de la reivindicación 15 en el que el módulo de ocultación 25 del borrado de tramas está configurado, además, para calcular un factor de interpolación a partir del indicador.

18. Un producto de programa de ordenador para reconstruir una trama de voz borrada, comprendiendo el producto de programa de ordenador un medio legible por ordenador que tiene instrucciones en el mismo, comprendiendo las instrucciones un código para realizar las etapas del procedimiento de la reivindicación 1 cuando es ejecutado en el ordenador.


 

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .