Procedimiento y aparato de reducción de latencia de voz en un sistema de comunicación inalámbrica de voz sobre datos.

Un procedimiento para reducir la latencia de voz en un sistema de comunicación inalámbrica de voz sobre datos,

que comprende las etapas de:

generar (800) una pluralidad de tramas de datos;

descartar (806, 806) una o más de dicha pluralidad de tramas de datos para producir una pluralidad de tramas de datos restantes, en el cual la etapa de descartar una o más de dicha pluralidad de tramas de datos comprende las etapas de:

determinar una latencia (802) del canal de comunicación; y

descartar (806, 808) cada una de dicha pluralidad de tramas de datos que tenga una tasa codificada igual a una primera tasa de codificación si dicha latencia del canal de comunicación supera un umbral predeterminado; y

almacenar (810) dicha pluralidad de tramas de datos restantes en una cola.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2000/026426.

Solicitante: QUALCOMM INCORPORATED.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 5775 MOREHOUSE DRIVE SAN DIEGO, CA 92121-1714 ESTADOS UNIDOS DE AMERICA.

Inventor/es: YAO, YU-DONG, BROWN,JAMES,M, TOMCIK,JAMES, VON DAMM,Matthew B.

Fecha de Publicación: 18 de Abril de 2012.

Clasificación Internacional de Patentes:

G10L19/00 FISICA. › G10 INSTRUMENTOS MUSICALES; ACUSTICA. › G10L ANALISIS O SINTESIS DE LA VOZ; RECONOCIMIENTO DE LA VOZ; PROCESAMIENTO DE LA VOZ O EL HABLA; CODIFICACIÓN O DESCODIFICACIÓN DEL AUDIO O LA VOZ. › Técnicas de análisis-síntesis de la voz o de señales de audio para la reducción de la redundancia, p. ej. en codificadores vocales; Codificación o decodificación de la voz o de señales de audio, utilizando modelos filtro-fuente o el análisis psicoacústico (en instrumentos musicales G10H).

PDF original: ES-2382539_T3.pdf

Fragmento de la descripción:

Procedimiento y aparato de reducción de latencia de voz en un sistema de comunicación inalámbrica de voz sobre datos.

Antecedentes de la invención

I. Campo de la invención

La presente invención se refiere, en general, al campo de las comunicaciones inalámbricas y, más específicamente, a la provisión de un procedimiento y un aparato eficaces para reducir la latencia de la voz asociada a un sistema de comunicación inalámbrica de voz sobre datos.

II. Antecedentes

El campo de las comunicaciones inalámbricas tiene muchas aplicaciones que incluyen teléfonos sin cables, la búsqueda de personas, los bucles locales inalámbricos y los sistemas de comunicación satelital. Una aplicación especialmente importante son los sistemas de telefonía celular para abonados móviles. (Según se usa en el presente documento, el término de sistemas "celulares" abarca las frecuencias tanto celulares como de PCS (Sistemas de Comunicación Personal) ) . Diversas interfaces aéreas han sido desarrolladas para tales sistemas de telefonía celular, incluso el acceso múltiple por división de frecuencia (FDMA) , el acceso múltiple por división del tiempo (TDMA) y el acceso múltiple por división de código (CDMA) . Con relación a las mismas, han sido establecidos diversos estándares domésticos e internacionales, que incluyen el Servicio Avanzado de Telefonía Móvil (AMPS) , el Sistema Global para Móviles (GSM) y el Estándar Interino 95 (IS-95) . En particular, el IS-95 y sus derivados, tales como IS-95A e IS-95B (a menudo denominados colectivamente IS-95) , ANSI J-STD-008, IS-99, IS-657, IS-707 y otros, son promulgados por la Asociación de la Industria de Telecomunicación (TIA) y otros entes de estandarización bien conocidos.

Los sistemas de telefonía celular configurados de acuerdo al uso del estándar IS-95 emplean técnicas de CDMA de procesamiento de señales para proporcionar un servicio de telefonía celular sumamente eficiente y robusto. Un sistema ejemplar de telefonía celular configurado esencialmente de acuerdo al uso del estándar IS-95 se describe en la Patente Estadounidense Nº 5.103.459 titulada "System and Method for Generating Signal Waveforms in a CDMA Cellular Telephone System" ["Sistema y procedimiento para generar ondas de señales en un sistema de telefonía celular de CDMA"], que está cedido al cesionario de la presente invención y que se incorpora al presente documento por referencia. La patente precitada ilustra el procesamiento de señales de transmisión, o de enlace directo, en una estación base de CDMA. El procesamiento ejemplar de señales de recepción, o de enlace inverso, en una estación base de CDMA se describe en la Solicitud Estadounidense con Nº de Serie 08 / 987.172, depositada el 9 de diciembre de 1997, titulada MULTICHANNEL DEMODULATOR [DEMODULADOR MULTICANAL], que está cedida al cesionario de la presente invención. En sistemas de CDMA, el control de potencia por el aire es una cuestión vital. Un procedimiento ejemplar de control de potencia en un sistema de CDMA se describe en la Patente Estadounidense Nº 5.056.109 titulada "Method and Apparatus for Controlling Transmission Power in a CDMA Cellular Mobile Telephone System" ["Procedimiento y aparato para controlar la potencia de transmisión en un sistema celular de telefonía móvil de CDMA"], que está cedida al cesionario de la presente invención y que se incorpora al presente documento por referencia.

Una ventaja primaria de usar una interfaz aérea de CDMA es que las comunicaciones se llevan a cabo simultáneamente por la misma banda de RF (Frecuencia de Radio) . Por ejemplo, cada unidad de abonado móvil (habitualmente un teléfono celular) en un sistema dado de telefonía celular puede comunicarse con la misma estación base transmitiendo una señal de enlace inverso por los mismos 1, 25 MHz del espectro de RF. De manera similar, cada estación base en un sistema tal puede comunicarse con unidades móviles transmitiendo una señal de enlace directo por otros 1, 25 MHz del espectro de RF.

La transmisión de señales por el mismo espectro de RF brinda varias ventajas, incluso un aumento en la reutilización de frecuencias de un sistema de telefonía celular y la capacidad de llevar a cabo un traspaso suave entre dos o más estaciones base. La reutilización aumentada de la frecuencia permite que se lleve a cabo un mayor número de llamadas para una cierta cantidad del espectro. El traspaso suave es un procedimiento robusto para efectuar la transición de una unidad móvil entre el área de cobertura de dos o más estaciones base, que implica mantener simultáneamente interfaces con dos o más estaciones base. (Por el contrario, el traspaso duro implica terminar la interfaz con una primera estación base antes de establecer la interfaz con una segunda estación base) . Un procedimiento ejemplar de realizar el traspaso suave se describe en la Patente Estadounidense Nº 5.267.261 titulada "Mobile Station Assisted Soft Handoff in a CDMA Cellular Communications System" ["Traspaso suave asistido por estación móvil en un sistema de comunicaciones celulares de CDMA"], que está cedida al cesionario de la presente invención.

Según los Estándares Interinos IS-99 e IS-657 (mencionados colectivamente en el presente documento como IS-707) , un sistema de comunicaciones conforme al estándar IS-95 puede proporcionar servicios tanto de voz como de comunicaciones de datos. Los servicios de comunicaciones de datos permiten que se intercambien datos digitales entre un transmisor y uno o más receptores por una interfaz inalámbrica. Los ejemplos del tipo de de datos digitales habitualmente transmitidos usando el estándar IS-707 incluyen los ficheros de ordenador y el correo electrónico.

De acuerdo a ambos estándares IS-95 e IS-707, los datos intercambiados entre un transmisor y un receptor se procesan en paquetes discretos, conocidos también como paquetes de datos o tramas de datos, o simplemente tramas. Para aumentar la probabilidad de que una trama sea transmitida con éxito durante una transmisión de datos, el estándar IS-707 emplea un protocolo de enlace por radio (RLP) para rastrear las tramas transmitidas con éxito y para realizar la retransmisión de tramas cuando una trama no es transmitida con éxito. La retransmisión se realiza hasta tres veces en el estándar IS-707, y es la responsabilidad de los protocolos de capas superiores tomar medidas adicionales para asegurarse de que las tramas sean recibidas con éxito.

Recientemente ha surgido una necesidad para transmitir información de audio, tal como la voz, usando los protocolos de datos del estándar IS-707. Por ejemplo, en un sistema de comunicaciones inalámbricas que emplea técnicas criptográficas, la información de audio puede ser manipulada y distribuida más fácilmente entre las redes de datos usando un protocolo de datos. En tales aplicaciones, es deseable mantener el uso de los protocolos de datos existentes, por lo que no son necesarios cambios en la infraestructura existente. Sin embargo, aparecen problemas al transmitir la voz usando un protocolo de datos, debido a la naturaleza de las características de la voz.

Uno de los problemas principales de la transmisión de información de audio usando un protocolo de datos son los retardos asociados a las retransmisiones de tramas, usando un protocolo de datos aéreo tal como el RLP. Los retardos de más de unos pocos cientos de milisegundos en el habla pueden dar como resultado una calidad de voz inaceptable. Al transmitir datos, tales como ficheros de ordenador, los retardos temporales se toleran fácilmente debido a la naturaleza no de tiempo real de los datos. Como consecuencia, los protocolos del estándar IS-707 pueden permitirse usar el esquema de retransmisión de tramas según lo descrito anteriormente, lo que puede dar como resultado retardos de transmisión, o un periodo de latencia, de más de unos pocos segundos. Un tal periodo de latencia es inaceptable para transmitir información de voz.

Lo que se necesita es un procedimiento y aparato para minimizar los problemas causados por los retardos temporales asociados a las solicitudes de retransmisión de tramas provenientes de un receptor. Además, el procedimiento y aparato deberían ser retro-compatibles con la infraestructura existente para evitar actualizaciones onerosas de esos sistemas.

Se reclama atención adicional al documento EP 0 915 634, que revela un sistema de voz por paquetes AAL2 / SSCS, que multiplexa diversas formas de tráfico de banda de voz, incluso paquetes de voz, paquetes de fax y paquetes de datos, en un circuito virtual (VC) . Este sistema de voz por paquetes... [Seguir leyendo]

Reivindicaciones:

1. Un procedimiento para reducir la latencia de voz en un sistema de comunicación inalámbrica de voz sobre datos, que comprende las etapas de:

generar (800) una pluralidad de tramas de datos; descartar (806, 806) una o más de dicha pluralidad de tramas de datos para producir una pluralidad de tramas de datos restantes, en el cual la etapa de descartar una o más de dicha pluralidad de tramas de datos comprende las etapas de:

determinar una latencia (802) del canal de comunicación; y descartar (806, 808) cada una de dicha pluralidad de tramas de datos que tenga una tasa codificada igual a una primera tasa de codificación si dicha latencia del canal de comunicación supera un umbral predeterminado; y almacenar (810) dicha pluralidad de tramas de datos restantes en una cola.

2. El procedimiento de la reivindicación 1, en el cual dicha pluralidad de tramas de datos comprende una pluralidad de tramas de vocodificador.

3. El procedimiento de la reivindicación 2, en el cual la etapa de generar dicha pluralidad de tramas de vocodificador comprende las etapas de: convertir información de audio a un formato digital:

proporcionar dicha información de audio digitalizada a un codificador de voz; y generar dicha pluralidad de tramas de datos, por parte de dicho codificador de voz, a una tasa predeterminada.

4. El procedimiento de la reivindicación 1, en el cual la etapa de generar dicha pluralidad de tramas de datos comprende las etapas de:

recibir una señal de comunicación; y demodular dicha señal de comunicación para producir una primera pluralidad de tramas de datos.

5. El procedimiento de la reivindicación 4, en el cual la etapa de descartar una o más de dicha pluralidad de tramas de datos comprende las etapas de:

determinar una integridad de trama de voz; comparar (1004) dicha integridad de trama de voz con un valor predeterminado, representando dicho valor predeterminado una mínima calidad de voz deseada;

aumentar (1006) un umbral variable de cola si dicha integridad de trama de voz es menor que dicho valor predeterminado; disminuir (1008) dicho umbral variable de cola si dicha integridad de trama de voz es mayor que dicho valor predeterminado;

descartar (1014) tramas a una primera tasa si una longitud de dicha cola es menor que dicho umbral variable de cola; y descartar (1016) tramas a una segunda tasa si dicha longitud es mayor que dicho umbral variable de cola.

6. El procedimiento de la reivindicación 1, en el cual la etapa de descartar una o más de dicha pluralidad de tramas de datos comprende la etapa de descartar dicha pluralidad de tramas de datos a una tasa fija predeterminada.

7. El procedimiento de la reivindicación 1, en el cual la etapa de descartar una o más de dicha pluralidad de tramas de datos comprende las etapas de:

determinar una latencia del canal de comunicación; y descartar dicha pluralidad de tramas de datos a una tasa variable, de acuerdo a dicha latencia del canal de comunicación.

8. El procedimiento de la reivindicación 7, en el cual la etapa de descartar dicha pluralidad de tramas de datos a una tasa variable comprende las etapas de:

disminuir dicha tasa si dicha latencia del canal de comunicación cae por debajo de al menos un umbral predeterminado; y aumentar dicha tasa si dicha latencia del canal de comunicación supera al menos otro umbral predeterminado.

9. El procedimiento de la reivindicación 1, en el cual la etapa de descartar dicha pluralidad de tramas de datos comprende las etapas de:

determinar una latencia del canal de comunicación;

descartar dicha pluralidad de tramas de datos a una primera tasa fija predeterminada si dicha latencia del canal de comunicación cae por debajo de un umbral predeterminado; y descartar dicha pluralidad de tramas de datos a una segunda tasa fija predeterminada si dicha latencia del canal de comunicación supera dicho umbral predeterminado.

10. El procedimiento de la reivindicación 1, que comprende adicionalmente la etapa de descartar cada una de dicha pluralidad de tramas de datos que tenga una tasa codificada igual a dicha primera tasa de codificación, y una segunda tasa de codificación si dicha latencia del canal de comunicación supera un segundo umbral predeterminado.

11. Un aparato para reducir la latencia de voz en un sistema de comunicación inalámbrica de voz sobre datos, comprendiendo el aparato:

un medio (406) para generar tramas de datos;

un procesador (410) conectado con dicho medio de generación de tramas de datos para descartar una o más de dichas tramas de datos, para producir tramas de datos restantes, en el cual dicho procesador (410) está adicionalmente configurado para determinar (802) una latencia del canal de comunicación, y para descartar (806, 808) cada una de dichas tramas de datos que tenga una tasa codificada igual a una primera tasa de codificación si dicha latencia del canal de comunicación supera un umbral predeterminado; y una cola (408) para almacenar dichas tramas de datos restantes.

12. El aparato de la reivindicación 11, en el cual dichas tramas de datos son descartadas a una tasa fija predeterminada.

13. El aparato de la reivindicación 11, en el cual dichas tramas de datos son descartadas a una tasa variable.

14. El aparato de la reivindicación 13, en el cual: dicho procesador (410) es además para determinar (802) una latencia del canal de comunicación; dichas tramas de datos son descartadas a una tasa reducida si dicha latencia del canal de comunicación supera al

menos un umbral predeterminado; y dichas tramas de datos son descartadas a una tasa aumentada si dicha latencia del canal de comunicación cae por debajo de al menos otro umbral predeterminado.

15. El aparato de la reivindicación 11, en el cual dicho procesador (410) es adicionalmente para determinar (802) una latencia del canal de comunicación, para descartar (806, 808) dichas tramas de datos a una primera tasa fija si dicha latencia del canal de comunicación cae por debajo de un umbral predeterminado, y para descartar (806, 806) dichas tramas de datos a una segunda tasa fija si dicha latencia del canal de comunicación supera dicho umbral predeterminado.

16. El aparato de la reivindicación 11, en el cual dicho procesador (410) es además para descartar cada una de dichas tramas de datos que tenga una tasa codificada igual a dicha primera tasa de codificación, y una segunda tasa de codificación si dicha latencia del canal de comunicación supera un segundo umbral predeterminado.

17. El aparato de la reivindicación 11, en el cual dicho medio para generar (406) tramas de datos comprende: un receptor (602) para recibir una señal de comunicación inalámbrica; y un demodulador (604) para demodular dicha señal de comunicación inalámbrica y para producir dichas tramas de

datos.

18. El aparato de la reivindicación 17, que comprende adicionalmente:

un medio para determinar una integridad de trama de voz;

dicho procesador (620) , para comparar adicionalmente dicha integridad de trama de voz con un valor predeterminado, representando dicho valor predeterminado una mínima calidad de voz deseada, para aumentar un umbral variable de cola si dicha integridad de trama de voz es menor que dicho valor predeterminado, para disminuir dicho umbral variable de cola si dicha integridad de trama de voz es mayor que dicho valor predeterminado, para descartar tramas a una primera tasa si una longitud de dicha cola es menor que dicho umbral variable de cola, y para descartar tramas a una segunda tasa si dicha longitud es mayor que dicho umbral variable de cola.

Patentes similares o relacionadas:

Almacenamiento eficiente de registros de códigos cifrados estructurados múltiples, del 22 de Julio de 2020, de Nokia Technologies OY: Un aparato que comprende: medios para formar un vector de código base combinando componentes 5 de vector de un sub-vector señalado por […]

Sistema decodificador, método de decodificación y programa informático respectivo, del 15 de Julio de 2020, de DOLBY INTERNATIONAL AB: Un sistema decodificador para proporcionar una señal estéreo mediante codificación estéreo de predicción compleja, comprendiendo el sistema decodificador: […]

Codificación de las posiciones de los picos espectrales, del 27 de Mayo de 2020, de TELEFONAKTIEBOLAGET LM ERICSSON (PUBL): Un método de codificación de las posiciones de los picos espectrales de un segmento de una señal de audio, comprendiendo el método: - determinar cuál […]

Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC, del 20 de Mayo de 2020, de VOICEAGE CORPORATION: Un método de conformación de ruido en el dominio de la frecuencia para interpolar una forma espectral y una envolvente en el dominio del tiempo del ruido […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos, del 8 de Abril de 2020, de DOLBY INTERNATIONAL AB: Aparato para generar una señal de decorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda complejo para filtrar […]

Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de conjunto de parámetros de predicción múltiple (MPPS), del 11 de Marzo de 2020, de DTS, INC: Un método de codificación de audio multicanal, en un flujo de datos de audio de tasa de bits variable sin pérdida, VBR, que comprende: bloquear […]