Procedimiento y aparato para modificar una sincronización de reproducción de ráfagas de voz en una frase sin afectar a la inteligibilidad.
Un procedimiento que comprende:
recibir una pluralidad de paquetes en un receptor,
almacenar los paquetes recibidos en una memoria intermedia adaptativa de supresión de fluctuación (106, 122) que tiene un retardo de memoria intermedia de supresión de fluctuación, determinar la longitud de al menos un periodo de silencio (422) asociado a la pluralidad recibida de paquetes, en el cual el al menos un periodo de silencio (422) se produce entre ráfagas de voz (420, 424) del habla; determinar si el al menos un periodo de silencio (422) se produce dentro de la frase del habla, en el que la frase comprende periodos de silencio y periodo de ráfagas de voz (420, 424); y si el al menos un periodo de silencio se produce dentro de la frase, entonces determinar un espacio de silencio basado en la longitud del al menos un periodo de silencio (422) y el retardo de memoria intermedia de supresión de fluctuación, y transmitir los paquetes almacenados en un tiempo basado en el espacio de silencio, en el que si la longitud del al menos un periodo de silencio (422) es inferior a una primera longitud, entonces el espacio de silencio se establece igual a la primera longitud, en el que si la longitud del al menos un periodo de silencio (422) es superior a una segunda longitud que es superior a la primera longitud, entonces el espacio de silencio se establece igual a la segunda longitud, y en el que si la longitud del al menos un periodo de silencio (422) se encuentra entre la primera longitud y la segunda longitud, entonces el espacio de silencio se establece igual a la longitud del al menos un periodo de silencio (422)
Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2008/061348.
Solicitante: QUALCOMM INCORPORATED.
Nacionalidad solicitante: Estados Unidos de América.
Dirección: Attn: International IP Administration 5775 Morehouse Drive San Diego, CA 92121 ESTADOS UNIDOS DE AMERICA.
Inventor/es: KAPOOR,ROHIT, SPINDOLA,Serafin Diaz .
Fecha de Publicación: .
Clasificación Internacional de Patentes:
- H04L12/56
PDF original: ES-2378491_T3.pdf
Fragmento de la descripción:
Procedimiento y aparato para modificar una sincronización de reproducción de ráfagas de voz en una frase sin afectar a la inteligibilidad Antecedentes
Campo
La presente invención se refiere a sistemas de comunicación inalámbricos, y específicamente a la reproducción de paquetes en una memoria intermedia adaptativa de supresión de fluctuación para voz sobre protocolo de internet (VoIP) para comunicaciones conmutadas por paquetes.
Antecedentes
En un sistema de comunicaciones, el retardo de extremo a extremo de un paquete se puede definir como el tiempo desde su generación en la fuente hasta el momento en que el paquete alcanza su destino. En un sistema de comunicaciones conmutadas por paquetes, el retardo para que los paquetes se desplacen desde la fuente hasta el destino puede variar dependiendo de varias condiciones operativas, incluyendo pero no limitándose a, condiciones de canal y carga de red. Las condiciones de canal se refieren a la calidad del enlace inalámbrico.
El retardo extremo a extremo de un paquete incluye retardos introducidos en la red y los diversos elementos a través de los cuales pasa el paquete. Muchos factores contribuyen al retardo extremo a extremo. La variación en el retardo extremo a extremo se denomina fluctuación. Los factores tales como la fluctuación conducen a la degradación de la calidad de la comunicación. Una memoria intermedia de supresión de fluctuación se puede aplicar para corregir la fluctuación y mejorar la calidad global en un sistema de comunicación.
Se llama la atención al documento US 2 282 196 B1 que divulga un sistema de voz por paquetes que incluye una capa de adaptación ATM de tipo 2 (AAL-2) y un sistema de subcapa de convergencia de servicio específico (SSCS) . La parte receptora del sistema SSCS recupera los paquetes AAL-2 et reproduce el audio comprimido en un elemento de descodificación de voz. Proporcionado la reproducción, el receptor aplica el retardo de construcción al inicio de cada ráfaga de voz. El elemento de descodificación de voz proporciona un flujo de audio no comprimido. En otra realización, la parte receptora del sistema SSCS aplica el retardo de construcción al inicio de cada ráfaga de voz como una función de la longitud del intervalo de silencio anterior.
Se ha de tomar en cuenta otro documento EP 1 770 688 A. En dicho documento, se proporciona un aparato que es capaz de, en un entorno ruidoso, realizar puntos terminales de expresión fáciles de oír incluso en el caso en que particularmente los puntos terminales de expresión son considerados erróneamente como siendo la sección de noexpresión, y obviando el retardo. Se considera que si se introduce un segmento objetivo de procesamiento, una señal de voz es un segmento de expresión o un segmento de no-expresión, se adquiere una longitud de continuación de no-expresión que representa una longitud de la señal de voz considerada continuamente como siendo el segmento de no-expresión. Además, se cambia la velocidad de reproducción del segmento objetivo de procesamiento en la señal de voz de manera que la velocidad de reproducción aumenta a medida que la longitud de continuación de no-expresión aumenta y de manera que un aumento en la velocidad de reproducción se limita a un mayor grado a medida que la longitud de continuación de no-expresión se reduce.
Según la presente invención, se proporcionan un procedimiento como se expone en la reivindicación 1, un aparato como se expone en la reivindicación 10, y un producto de programa legible por ordenador como se expone en la reivindicación 13. Realizaciones de la invención se reivindican en las reivindicaciones dependientes.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La figura 1 es un diagrama de un sistema de comunicaciones, en el cual un Terminal de Acceso incluye una memoria intermedia adaptativa de supresión de fluctuación La figura 2 ilustra un ejemplo de una memoria intermedia de supresión de fluctuación.
La figura 3 ilustra el retardo de la memoria intermedia de supresión de fluctuación en un ejemplo.
La figura 4 es un diagrama de temporización que ilustra ejemplos: i) compresión de una parte de selección de un segmento de habla; e ii) expansión de una parte de silencio de un segmento de habla.
La figura 5 ilustra un segmento de habla que tiene ráfagas de voz y periodos de silencio.
La figura 6 ilustra un ejemplo de compresión y expansión de un periodo de silencio en una frase corta.
La figura 7 ilustra paquetes consecutivos con marcas de tiempo RTP.
La figura 8A ilustra un ejemplo del procedimiento divulgado.
La figura 8B ilustra otro ejemplo del procedimiento divulgado.
La figura 8C ilustra otro ejemplo del procedimiento divulgado.
La figura 9 ilustra un diagrama de flujo de un ejemplo del procedimiento y el aparato divulgados.
La figura 10 es un diagrama de bloques de un sistema de comunicaciones, en el cual un terminal de acceso (AT) incluye una memoria intermedia adaptativa de supresión de fluctuación y una unidad caracterizadora de silencio.
La figura 11 es un diagrama de bloques de una parte de un receptor en un sistema de comunicaciones que incorpora un ejemplo del procedimiento y el aparato divulgados.
La figura 12 es un diagrama de bloques que ilustra un sistema de comunicaciones según un ejemplo, que incluye una memoria intermedia adaptativa de supresión de fluctuación y una unidad caracterizadora de silencio; y La figura 13 ilustra un diagrama de flujo de un ejemplo del procedimiento y el aparato divulgados.
DESCRIPCIÓN DETALLADA
Generalmente, el habla consiste en frases que tienen periodos de ráfagas de voz y periodos de silencio. Las frases individuales están separadas por periodos de silencio, y a su vez, una frase puede comprender múltiples ráfagas de voz separadas por periodos de silencio. Las frases pueden ser largas o cortas, y los periodos de silencio dentro de las frases (o "intrafrase") pueden típicamente ser más cortos que los periodos de silencio que separan frases. Tal como se usa en el presente documento, una ráfaga de voz está generalmente constituida por múltiples paquetes de datos. En muchos servicios y muchas aplicaciones, por ejemplo voz sobre IP (VoIP) , videotelefonía, juegos interactivos, servicio de mensajería, etc., los datos se forman en paquetes y se encaminan a través de una red.
Generalmente, en los sistemas de comunicaciones inalámbricas, las condiciones de canal, las capacidades de carga de red, de calidad del servicio (QoS) de un sistema, la competencia de los recursos por diferentes flujos, entre otros factores, tienen incidencia sobre el retardo extremo a extremo de los paquetes en una red. El retardo extremo a extremo de paquetes se puede definir como o el tiempo que tarda un paquete en desplazarse dentro de una red desde un "remitente" a un "receptor". Cada paquete puede incurrir en una única fuente para el retardo de destino, dando como resultado una condición generalmente denominada como "fluctuación". Si un receptor falla en la corrección de una fluctuación, un mensaje recibido experimentará distorsión cuando los paquetes de vuelvan a ensamblar. Cuando los paquetes que llegan a un receptor fallan en llegar a intervalos regulares, se puede usar una memoria intermedia de supresión de fluctuación para ajustar la irregularidad de los datos entrantes. La memoria intermedia de supresión de fluctuación alisa la fluctuación experimentada por los paquetes y oculta la variación en el tiempo de llegada de paquetes en el receptor. En algunos sistemas este efecto de alisado se consigue usando una memoria intermedia adaptativa de supresión de fluctuación para retardar la reproducción de un primer paquete de cada ráfaga de voz. El "retardo de supresión de fluctuación" se puede calcular usando un algoritmo, o puede ser igual al tiempo que tarda en recibir datos de voz iguales a la longitud del retardo de memoria intermedia de supresión de fluctuación.
Las condiciones de canal, y de este modo la fluctuación pueden variar y el retardo de una memoria intermedia de supresión de fluctuación puede cambiar de una ráfaga de voz a otra ráfaga de voz para adaptarse a estas condiciones cambiantes. Mientras se adapta el retardo de supresión de fluctuación, los paquetes (que representan tanto la voz como el silencio) se pueden expandir o comprimir, en un procedimiento denominado en el presente documento como "alineamiento temporal". La calidad de comunicación... [Seguir leyendo]
Reivindicaciones:
1. Un procedimiento que comprende:
recibir una pluralidad de paquetes en un receptor, almacenar los paquetes recibidos en una memoria intermedia adaptativa de supresión de fluctuación (106, 122) que tiene un retardo de memoria intermedia de supresión de fluctuación, determinar la longitud de al menos un periodo de silencio (422) asociado a la pluralidad recibida de paquetes, en el cual el al menos un periodo de silencio (422) se produce entre ráfagas de voz (420, 424) del habla; determinar si el al menos un periodo de silencio (422) se produce dentro de la frase del habla, en el que la frase comprende periodos de silencio y periodo de ráfagas de voz (420, 424) ; y si el al menos un periodo de silencio se produce dentro de la frase, entonces determinar un espacio de silencio basado en la longitud del al menos un periodo de silencio (422) y el retardo de memoria intermedia de supresión de fluctuación, y transmitir los paquetes almacenados en un tiempo basado en el espacio de silencio, en el que si la longitud del al menos un periodo de silencio (422) es inferior a una primera longitud, entonces el espacio de silencio se establece igual a la primera longitud, en el que si la longitud del al menos un periodo de silencio (422) es superior a una segunda longitud que es superior a la primera longitud, entonces el espacio de silencio se establece igual a la segunda longitud, y en el que si la longitud del al menos un periodo de silencio (422) se encuentra entre la primera longitud y la segunda longitud, entonces el espacio de silencio se establece igual a la longitud del al menos un periodo de silencio (422) .
2. Procedimiento según la reivindicación 1, en el que:
la determinación de si el al menos un periodo de silencio (422) se produce dentro de la frase comprende, además, determinar si un número consecutivo mayor de paquetes de silencio recibidos es inferior a un determinado número.
3. Procedimiento según la reivindicación 1, en el que:
la determinación de si el al menos un periodo de silencio (422) se produce dentro de la frase comprende, además, determinar si el mayor del al menos un periodo de silencio (422) asociado a los paquetes recibidos es menor que una determinada trama de tiempo.
4. Procedimiento según la reivindicación 1, que comprende, además:
si el al menos un periodo de silencio (422) se produce dentro de una frase, adaptar la memoria intermedia de supresión de fluctuación (106, 122) para mantener una longitud de periodo de silencio originariamente transmitido (422) ; y transmitir la parte de los paquetes en la longitud mantenida.
5. Procedimiento según la reivindicación 1, en el que el espacio de silencio es [X-a, X+b], donde "X" es la longitud del al menos un periodo de silencio (422) , "a" es una primera longitud predeterminada, y "b" es una segunda longitud predeterminada de tiempo diferente de "a", y en el que [X-a, X+b] es proporcional a la longitud del al menos un periodo de silencio (422) .
6. Procedimiento según la reivindicación 1, que comprende:
determinar el retardo de memoria intermedia de supresión de fluctuación; transmitir una primera parte de los paquetes almacenados en un tiempo igual al retardo de memoria intermedia de supresión de fluctuación; y transmitir una segunda parte de los paquetes almacenados en un tiempo calculado basado en el valor [X-a, X+b], donde "X" es la longitud del al menos un periodo de silencio (422) , "a" es una primera longitud predeterminada de tiempo, y "b" es una segunda longitud predeterminada de tiempo diferente de "a", en el que si el retardo de memoria intermedia de supresión de fluctuación es inferior a un tiempo que corresponde a X-a, transmitir la segunda pare de los paquetes almacenados en un tiempo correspondiente a X-a, si el retardo de memoria intermedia de supresión de fluctuación es superior o igual a un tiempo correspondiente a X-a, y el retardo de memoria intermedia de supresión de fluctuación es inferior o igual a un tiempo correspondiente a X+b, transmitir la segunda parte de los paquetes almacenados en un tiempo correspondiente al retardo de memoria intermedia de supresión de fluctuación, y si el retardo de memoria intermedia de supresión de fluctuación es superior a un tiempo correspondiente a X+b, transmitir la segunda parte de los paquetes almacenados en un tiempo igual al mayor de un tiempo correspondiente a un tiempo de llegada o un tiempo correspondiente a X+b.
7. Procedimiento según la reivindicación 6, en el cual la memoria intermedia de supresión de fluctuación (106, 122) comprende, además:
determinar el retardo de memoria intermedia de supresión de fluctuación; transmitir una primera parte de los paquetes almacenados en un tiempo igual al retardo de memoria intermedia de supresión de fluctuación; y transmitir una segunda parte de los paquetes almacenados en un tiempo calculado basado en el valor [X-a, X+b], donde "X" es la longitud del al menos un periodo de silencio (422) , "a" es una primera longitud predeterminada de tiempo, y "b" es una segunda longitud predeterminada de tiempo diferente de "a", y que comprende, además:
si el retardo de memoria intermedia de supresión de fluctuación es inferior a un tiempo que corresponde a Xa, transmitir la segunda pare de los paquetes almacenados en un tiempo correspondiente a X-a.
8. Procedimiento según la reivindicación 6, en el cual la memoria intermedia de supresión de fluctuación (106, 122) comprende, además:
determinar el retardo de memoria intermedia de supresión de fluctuación; transmitir una primera parte de los paquetes almacenados en un tiempo igual al retardo de memoria intermedia de supresión de fluctuación; y transmitir una segunda parte de los paquetes almacenados en un tiempo calculado basado en el valor [X-a, X+b], donde "X" es la longitud del al menos un periodo de silencio (422) , "a" es una primera longitud predeterminada de tiempo, y "b" es una segunda longitud predeterminada de tiempo diferente de "a", y que comprende, además:
si el retardo de memoria intermedia de supresión de fluctuación es superior o igual a un tiempo correspondiente a X-a, y el retardo de memoria intermedia de supresión de fluctuación es inferior o igual a un tiempo correspondiente a X+b, transmitir la segunda parte de los paquetes almacenados en un tiempo correspondiente al retardo de memoria intermedia de supresión de fluctuación.
9. Procedimiento según la reivindicación 6, en el cual la memoria intermedia de supresión de fluctuación (106, 122) comprende, además:
determinar el retardo de memoria intermedia de supresión de fluctuación; transmitir una primera parte de los paquetes almacenados en un tiempo igual al retardo de memoria intermedia de supresión de fluctuación; y transmitir una segunda parte de los paquetes almacenados en un tiempo calculado basado en el valor [X-a, X+b], donde "X" es la longitud del al menos un periodo de silencio (422) , "a" es una primera longitud predeterminada de tiempo, y "b" es una segunda longitud predeterminada de tiempo diferente de "a", y que comprende, además:
si el retardo de memoria intermedia de supresión de fluctuación es superior a un tiempo correspondiente a X+b, transmitir la segunda parte de los paquetes almacenados en un tiempo igual al mayor de un tiempo correspondiente a un tiempo de llegada o un tiempo correspondiente a X+b.
10. Aparato que comprende:
medios para recibir una pluralidad de paquetes, medios para almacenar los paquetes recibidos, teniendo los medios un retardo de memoria intermedia, medios para determinar la longitud de al menos un periodo de silencio (422) asociado a la pluralidad recibida de paquetes, en el cual el al menos un periodo de silencio (422) se produce entre ráfagas de voz (420, 424) del habla; medios para determinar si el al menos un periodo de silencio (422) se produce dentro de la frase del habla, en el que la frase comprende periodos de silencio y periodo de ráfagas de voz (420, 424) ; y medios para, si el al menos un periodo de silencio (422) se produce dentro de la frase, determinar un espacio de silencio basado en la longitud del al menos un periodo de silencio (422) y el retardo de memoria intermedia, y medios para transmitir los paquetes almacenados en un tiempo basado en el espacio de silencio, en el que si la longitud del al menos un periodo de silencio (422) es inferior a una primera longitud, entonces el espacio de silencio se establece igual a la primera longitud, en el que si la longitud del al menos un periodo de silencio (422) es superior a una segunda longitud que es superior a la primera longitud, entonces el espacio de silencio se establece igual a la segunda longitud, y en el que si la longitud del al menos un periodo de silencio (422) se encuentra entre la primera longitud y la segunda longitud, entonces el espacio de silencio se establece igual a la longitud del al menos un periodo de silencio (422) .
11. Aparato según la reivindicación 10, en el cual los medios para almacenar los paquetes recibidos comprenden una memoria intermedia adaptativa de supresión de fluctuación (106, 122) .
12. Aparato según la reivindicación 11, en el cual los medios de determinación comprenden un medio de memoria intermedia de supresión de fluctuación (106, 122) y en el cual los medios de memoria intermedia de supresión de fluctuación (106, 122) comprenden, además un medio caracterizador (1005) .
13. Producto de programa informático que comprende:
un medio legible por ordenador que comprende:
un código para hacer que el ordenador reciba una pluralidad de paquetes un código para hacer que el ordenador almacene los paquetes recibidos en una memoria intermedia adaptativa de supresión de fluctuación (106, 122) que tiene un retardo de memoria intermedia de supresión de fluctuación, un código para hacer que el ordenador determine la longitud de al menos un periodo de silencio (422) asociado a la pluralidad recibida de paquetes, en el que el al menos un periodo de silencio (422) se produce entre ráfagas de voz (420, 424) del habla, un código para hacer que el ordenador determine si el al menos un periodo de silencio (422) se produce dentro de una frase de habla, en el cual la frase comprende periodos de silencio y periodos de ráfagas de voz (420, 424) ; y un código para, si el al menos un periodo de silencio (422) se produce dentro de la frase, hacer que el ordenador determine un espacio de silencio basado en la longitud del al menos un período de silencio (422) y el retardo de la memoria intermedia de supresión de fluctuación, y hacer que el ordenador transita los paquetes almacenados en un tiempo basado en el espacio de silencio.
en el que la longitud del al menos un periodo de silencio (422) es inferior a una primera longitud, entonces el espacio de silencio se establece igual a la primera longitud, en el cual si la longitud del al menos un periodo de silencio (422) es superior a la segunda longitud que es superior a la primera longitud, entonces el espacio de silencio se establece igual a la segunda longitud y en el cual si la longitud del al menos un periodo de silencio (422) se encuentra entre la primera longitud y la segunda longitud, entonces el espacio de silencio se establece igual a la longitud del al menos un periodo de silencio (422) .
Patentes similares o relacionadas:
Dispositivo inalámbrico y procedimiento para visualizar un mensaje, del 25 de Marzo de 2020, de QUALCOMM INCORPORATED: Un dispositivo inalámbrico para visualizar un mensaje, comprendiendo el dispositivo inalámbrico: un visualizador gráfico ; una unidad de comunicaciones inalámbricas […]
Método de indicación de disponibilidad de servicio para terminales de radiofrecuencia de corto alcance, con visualización de icono de servicio, del 26 de Febrero de 2020, de Nokia Technologies OY: Un método que comprende: recibir, en un dispositivo , información de icono de un dispositivo de origen en conexión con descubrimiento de dispositivo […]
Procedimiento y aparato para la transmisión de entramado con integridad en un sistema de comunicación inalámbrica, del 6 de Noviembre de 2019, de QUALCOMM INCORPORATED: Un procedimiento para el entramado de paquetes en un sistema de transmisión inalámbrico que admite transmisiones de radiodifusión, el procedimiento que comprende: […]
Aparato y procedimiento para usar en la realización de peticiones de repetición automática en sistemas de comunicaciones de acceso múltiple inalámbricas, del 6 de Noviembre de 2019, de QUALCOMM INCORPORATED: Un procedimiento para usar en un sistema de comunicaciones inalámbricas que comprende al menos una estación base y al menos dos terminales inalámbricos […]
Procedimiento y aparato para sistemas inalámbricos de activación, del 31 de Octubre de 2019, de QUALCOMM INCORPORATED: Un procedimiento para controlar de forma inalámbrica una tarjeta de interfaz de red NIC (108 A-N) usando una red inalámbrica , con la NIC (108 A-N) […]
Método y sistema para visualizar un nivel de confianza de las operaciones de comunicación de red y la conexión de servidores, del 16 de Octubre de 2019, de Nokia Technologies OY: Un método que comprende: recibir, en un servidor , una primera solicitud para un análisis de una primera operación de comunicación desde […]
Un protocolo de red agile para comunicaciones seguras con disponibilidad asegurada de sistema, del 11 de Septiembre de 2019, de VirnetX Inc: Un método para un primer nodo para establecer una sesión con un segundo nodo , el método se realiza en el primer nodo , en el que […]
Dispositivo de nodo para una red de sensores inalámbricos, del 10 de Julio de 2019, de Wirepas Oy: Un dispositivo de nodo para una red de sensores inalámbricos, comprendiendo el dispositivo de nodo: - un transceptor […]