Método y sistema informático distribuido para sincronizar los conjuntos de datos memorizados en dispositivos de comunicación diferentes.

Un método para sincronizar conjuntos de datos memorizados en diferentes dispositivos de comunicación

(10, 20) que están conectados por intermedio de enlaces de comunicación, que comprende las etapas de:

1a) Memorización de un primer conjunto de datos en un primer dispositivo de comunicación (10), comprendiendo dicho primer conjunto de datos un número de m de elementos;

1b) Memorización de un segundo conjunto de datos en un segundo dispositivo de comunicación (20), comprendiendo dicho segundo conjunto de datos un número de n de elementos;

1c) Codificación, en el primer dispositivo de comunicación (10), del primer conjunto de datos utilizando un código lineal aleatorio para obtener un número de k de elementos codificados, en donde k es un parámetro ajustable;

1d) Determinación, en el segundo dispositivo de comunicación (20), del número total de elementos, que son diferentes entre dicho primer conjunto de datos y dicho segundo conjunto de datos, sobre la base de un mensaje recibido desde el primer dispositivo de comunicación (10);

1e) Determinación, en el segundo dispositivo de comunicación (20), de si el número total de diferentes elementos es menor que o igual al parámetro k;

1f) Si la respuesta es afirmativa, entonces transmitir los k elementos codificados desde el primer dispositivo de comunicación (10) al segundo dispositivo de comunicación (20);

1g) Decodificación, en el segundo dispositivo de comunicación (20), de al menos algunos de los elementos codificados recibidos utilizando un decodificador lineal aleatorio con el fin de obtener todos los elementos del primer conjunto de datos, que no estén contenidos en el segundo conjunto de datos;

2a) Realización, de una partición de conjunto en el primer conjunto de datos con el fin de obtener una arborescencia multinivel jerárquica que comprende una pluralidad de primeros subconjuntos de datos; 2b) Realización de una partición de conjunto en el segundo conjunto de datos con el fin de obtener una arborescencia multinivel jerárquica que comprende una pluralidad de segundos subconjuntos de datos, en donde cada uno de los primeros subconjuntos de datos corresponden a uno separado de los segundos subconjuntos de datos;

2c) Codificación, en el primer dispositivo de comunicación (10), de cada primer subconjunto de datos utilizando un código lineal aleatorio con el fin de obtener un número de k elementos codificados;

2d) Si el número de diferentes elementos determinados en la etapa 1d) es mayor que k, entonces seleccionar, en el segundo dispositivo de comunicación (20) un segundo subconjunto de datos del segundo conjunto de datos y seleccionar, en el primer dispositivo de comunicación (10), el primer subconjunto de datos correspondiente en respuesta a un mensaje recibido desde el segundo dispositivo de comunicación;

2e) Determinación, en el segundo dispositivo de comunicación (20), del número de elementos, que son diferentes entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos correspondiente sobre la base de un mensaje recibido desde el primer dispositivo de comunicación (10);

2f) Determinación, en el segundo dispositivo de comunicación (20), de si el número de diferentes elementos seleccionados entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos seleccionado es menor que o igual al parámetro k;

2g) Si la respuesta es afirmativa, entonces transmitir los k elementos codificados del primer subconjunto de datos seleccionado entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos seleccionado desde el primer dispositivo de comunicación (10) al segundo dispositivo de comunicación (20) y 2h) Decodificación, en el segundo dispositivo de comunicación (20), de al menos algunos de los elementos codificados recibidos utilizando un decodificador lineal aleatorio con el fin de obtener los elementos del primer subconjunto de datos seleccionado, que no están contenidos en el segundo subconjunto de datos seleccionado del segundo conjunto de datos;

2i) Repetición de las etapas 2d) a 2h) hasta que todos los elementos del primer conjunto de datos, que no estaban inicialmente contenidos en el segundo conjunto de datos, hayan sido decodificados en el segundo dispositivo de comunicación (20).

Tipo: Patente Europea. Resumen de patente/invención. Número de Solicitud: E10010280.

Solicitante: DEUTSCHE TELEKOM AG.

Nacionalidad solicitante: Alemania.

Dirección: FRIEDRICH-EBERT-ALLEE 140 53113 BONN ALEMANIA.

Inventor/es: SACHIN KUMAR AGARWAL.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)
  • SECCION H — ELECTRICIDAD > CIRCUITOS ELECTRONICOS BASICOS > CODIFICACION, DECODIFICACION O CONVERSION DE CODIGO,... > Codificación, decodificación o conversión de código... > H03M13/37 (Métodos o técnicas de decodificación que no son específicas de un tipo particular de codificación previsto en los grupo H03M 13/03 - H03M 13/35)

PDF original: ES-2469818_T3.pdf

 

google+ twitter facebookPin it
Método y sistema informático distribuido para sincronizar los conjuntos de datos memorizados en dispositivos de comunicación diferentes.

Fragmento de la descripción:

Mïtodo y sistema informïtico distribuido para sincronizar los conjuntos de datos memorizados en dispositivos de comunicaciïn diferentes CAMPO DE LA INVENCIïN

La presente invenciïn se refiere a un mïtodo y un sistema informïtico distribuido para sincronizar conjuntos de datos memorizados en diferentes dispositivos de comunicaciïn.

ANTECEDENTES DE LA INVENCIïN

Un sistema informïtico distribuido comprende una pluralidad de ordenadores geogrïficamente distribuidos tales como PDAs, ordenadores portïtiles o telïfonos mïviles, que estïn conectados, de forma intermitente, por intermedio de una tecnologïa de transmisiïn digital. Dichos sistemas informïticos distribuidos comparten datos comunes entre los ordenadores geogrïficamente distribuidos y los datos pueden modificarse con independencia de los ordenadores durante la utilizaciïn del conjunto de datos por aplicaciones, pero puede producirse un gran solapamiento entre los elementos de conjuntos de datos de los conjuntos de datos. Por lo tanto, es necesario sincronizar estos datos a travïs de los diferentes ordenadores, de vez en cuando, con el fin de hacer volver el sistema informïtico distribuido a un estado sincronizado. La sincronizaciïn frecuente es un proceso que necesita una gran cantidad de recursos en tïrminos de comunicaciïn y de cïlculo y por lo tanto, estï limitado a solicitudes periïdicas. El periodo de tiempo entre las sincronizaciones de datos es un parïmetro dependiente de la aplicaciïn y puede variar desde el tiempo real (fracciïn de un segundo) a una rïplica “perezosa” (cada pocos meses) . En algunas instancias operativas, el periodo de tiempo entre sincronizaciones de datos se deja en extremo abierto (sin periodicidad fijada) y la sincronizaciïn de datos se solicita manualmente cuando asï se desea por los usuarios del sistema distribuido. Es importante disponer de sistemas de sincronizaciïn de datos eficientes con el fin de reducir al mïnimo los costes de la sincronizaciïn de datos repetida en sistemas distribuidos. La sincronizaciïn de datos eficiente puede estimular tambiïn un mayor grado de sincronizaciïn entre ordenadores distribuidos y de este modo, aumentar la eficiencia de un sistema informïtico distribuido.

La sincronizaciïn de datos es un proceso de sincronizaciïn, a modo de ejemplo, de dos conjuntos de datos similares memorizados en dos ordenadores diferentes conectados por intermedio de un enlace de comunicaciïn. Un conjunto de datos es un conjunto no ordenado de elementos de informaciïn digital que pueden memorizarse en un dispositivo de comunicaciïn digital, tambiïn aquï denominado un concentrador o host. Dicho dispositivo de comunicaciïn comprende medios de cïlculo, de memorizaciïn de datos y de comunicaciïn digital. El resultado final del procedimiento de sincronizaciïn de datos debe ser copias idïnticas de los conjuntos de datos en ambos ordenadores.

El documento de S. Agarwal et al:”Difusiïn de actualizaciïn casi ïptima de conjuntos de datos”, PROCEEDINGS, IEEE 8TH INTERNATIONAL CONFERENCE ON MOBILE DATA MANAGEMENT, 27 de enero de 2007 – 1 de febrero de 2007, pïginas 356 – 360, XP002646583, es una contribuciïn de conferencia que se refiere a la difusiïn de actualizaciones incrementales desde una fuente de datos a mïltiples terminales que contienen copias fuera de uso (y posiblemente distintas) de los datos. En esta descripciïn, se ha utilizado un algoritmo de reconciliaciïn de conjuntos para una codificaciïn sin tasas. Un protocolo de dos canales se utiliza en el que los nuevos elementos de fuente se determinan a travïs de un canal y se utilizan para la decodificaciïn sin tasa en un canal secundario.

El documento de D. Starobinski et al: “Sincronizaciïn de PDA eficiente”, IEEE TRANSACTIONS ON MOBILE COMPUTING, vol. 2, nï 1, 1 enero 2003, pïginas 40-51, XP001171684, es una publicaciïn cientïfica que describe un sistema de sincronizaciïn para redes heterogïneas de numerosas mïquinas tales como ordenadores PCs y PDAs. En este caso, los datos se convierten a un determinado tipo de polinomio conocido como el polinomio caracterïstico. Cuando se sincroniza, el PDA envïa valores muestreados de su polinomio caracterïstico al ordenador PC.

El documento de S. Agarwal: “Reconciliaciïn eficiente de datos no estructurados y estructurados a travïs de redes”, Boston University, febrero 2006, XP002646584, es un trabajo de disertaciïn que se refiere a un sistema de sincronizaciïn de datos cuya propiedad mïs destacada es que su complejidad de comunicaciïn depende del nïmero de diferencias entre el PDA y el PC. Este mïtodo implica la transformaciïn de una cadena en un multiconjunto de subcadenas que se reconcilian eficientemente utilizando los algoritmos de reconciliaciïn establecidos y luego, dispuestos juntos en un host remoto utilizando las recientes tïcnicas de grïficos teïricos.

Es un objetivo de la presente invenciïn hacer disponible un nuevo mïtodo y un sistema informïtico distribuido para sincronizar conjuntos de datos memorizados en diferentes dispositivos de comunicaciïn que dan lugar a un intercambio de datos reducido entre dos dispositivos de comunicaciïn durante el procedimiento de sincronizaciïn de datos.

Es un aspecto, ademïs, de la presente invenciïn dar a conocer garantïas de protecciïn de datos cuando se sincronizan conjuntos de datos que se transmiten a travïs de canales propensos a errores/pïrdidas, esto es, enlaces de comunicaciones.

Por lo tanto, la carga informïtica del procedimiento puede reducirse de modo que el procedimiento de sincronizaciïn pueda completarse en una pequeïa cantidad de tiempo finita. La mïs baja complejidad informïtica durante el proceso de sincronizaciïn conserva tambiïn energïa que es un recurso limitado en los dispositivos de comunicaciïn accionados por baterïas, tales como telïfonos mïviles. Ademïs, el proceso de sincronizaciïn de datos se realizarï aïn cuando el canal de comunicaciïn entre los dos dispositivos de comunicaciïn pierda algunos de los paquetes de datos de comunicaciones. Esta mediciïn de la invenciïn hace al proceso de sincronizaciïn de datos mïs sïlido y tolerante a fallos en comparaciïn con simplemente copiar los conjuntos de datos desde un dispositivo de comunicaciïn al otro.

Es un aspecto adicional de la presente invenciïn dar a conocer una valoraciïn para reducir la complejidad informïtica desfavorable en la etapa de decodificaciïn de un dispositivo de comunicaciïn.

SUMARIO DE LA INVENCIïN

Es un aspecto esencial de la presente invenciïn utilizar un cïdigo de correcciïn de errores hacia delante para la sincronizaciïn de datos asï como una transmisiïn de datos resistente a errores durante el proceso de sincronizaciïn de datos. En particular, se utiliza una tecnologïa de cïdigos lineales aleatorios que se emplea tradicionalmente para la detecciïn y correcciïn de errores.

Con el fin de sincronizar grandes conjuntos de datos utilizando cïdigos lineales aleatorios, se realiza una particiïn de conjuntos en los grandes conjuntos de datos. Por lo tanto, un sistema informïtico distribuido se hace escalable dividiendo la realizaciïn de sincronizaciïn de datos en numerosas tareas de sincronizaciïn mïs pequeïas. Esta disposiciïn da lugar a una complejidad informïtica notablemente menor en la decodificaciïn del dispositivo de comunicaciïn, permitiendo que la sincronizaciïn de datos se realice con mucha mayor rapidez (menor tiempo de cïlculo del sistema) y tambiïn ahorra recursos de comunicaciïn entre los dos dispositivos de comunicaciïn en sincronizaciïn.

El problema tïcnico anteriormente descrito se resuelve por las etapas del mïtodo segïn la reivindicaciïn 1.

Por lo tanto,... [Seguir leyendo]

 


Reivindicaciones:

1. Un mïtodo para sincronizar conjuntos de datos memorizados en diferentes dispositivos de comunicaciïn (10, 20) que estïn conectados por intermedio de enlaces de comunicaciïn, que comprende las etapas de: 5

1a) Memorizaciïn de un primer conjunto de datos en un primer dispositivo de comunicaciïn (10) , comprendiendo dicho primer conjunto de datos un nïmero de m de elementos;

1b) Memorizaciïn de un segundo conjunto de datos en un segundo dispositivo de comunicaciïn (20) , comprendiendo dicho segundo conjunto de datos un nïmero de n de elementos;

1c) Codificaciïn, en el primer dispositivo de comunicaciïn (10) , del primer conjunto de datos utilizando un cïdigo lineal aleatorio para obtener un nïmero de k de elementos codificados, en donde k es un parïmetro ajustable;

1d) Determinaciïn, en el segundo dispositivo de comunicaciïn (20) , del nïmero total de elementos, que son diferentes entre dicho primer conjunto de datos y dicho segundo conjunto de datos, sobre la base de un mensaje recibido desde el primer dispositivo de comunicaciïn (10) ;

1e) Determinaciïn, en el segundo dispositivo de comunicaciïn (20) , de si el nïmero total de diferentes elementos es menor que o igual al parïmetro k;

1f) Si la respuesta es afirmativa, entonces transmitir los k elementos codificados desde el primer dispositivo de comunicaciïn (10) al segundo dispositivo de comunicaciïn (20) ;

1g) Decodificaciïn, en el segundo dispositivo de comunicaciïn (20) , de al menos algunos de los elementos codificados recibidos utilizando un decodificador lineal aleatorio con el fin de obtener todos los elementos del primer conjunto de datos, que no estïn contenidos en el segundo conjunto de datos;

2a) Realizaciïn, de una particiïn de conjunto en el primer conjunto de datos con el fin de obtener una arborescencia multinivel jerïrquica que comprende una pluralidad de primeros subconjuntos de datos;

2b) Realizaciïn de una particiïn de conjunto en el segundo conjunto de datos con el fin de obtener una arborescencia multinivel jerïrquica que comprende una pluralidad de segundos subconjuntos de datos, en donde cada uno de los primeros subconjuntos de datos corresponden a uno separado de los segundos subconjuntos de datos;

2c) Codificaciïn, en el primer dispositivo de comunicaciïn (10) , de cada primer subconjunto de datos utilizando un cïdigo lineal aleatorio con el fin de obtener un nïmero de k elementos codificados;

2d) Si el nïmero de diferentes elementos determinados en la etapa 1d) es mayor que k, entonces seleccionar, en el segundo dispositivo de comunicaciïn (20) un segundo subconjunto de datos del segundo conjunto de datos y seleccionar, en el primer dispositivo de comunicaciïn (10) , el primer subconjunto de datos correspondiente en respuesta a un mensaje recibido desde el segundo dispositivo de comunicaciïn;

2e) Determinaciïn, en el segundo dispositivo de comunicaciïn (20) , del nïmero de elementos, que son diferentes entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos correspondiente sobre la base de un mensaje recibido desde el primer dispositivo de comunicaciïn (10) ;

2f) Determinaciïn, en el segundo dispositivo de comunicaciïn (20) , de si el nïmero de diferentes elementos seleccionados entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos seleccionado es menor que o igual al parïmetro k;

2g) Si la respuesta es afirmativa, entonces transmitir los k elementos codificados del primer subconjunto de datos seleccionado entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos 55 seleccionado desde el primer dispositivo de comunicaciïn (10) al segundo dispositivo de comunicaciïn (20) y

2h) Decodificaciïn, en el segundo dispositivo de comunicaciïn (20) , de al menos algunos de los elementos codificados recibidos utilizando un decodificador lineal aleatorio con el fin de obtener los elementos del primer subconjunto de datos seleccionado, que no estïn contenidos en el segundo subconjunto de datos seleccionado del segundo conjunto de datos;

2i) Repeticiïn de las etapas 2d) a 2h) hasta que todos los elementos del primer conjunto de datos, que no estaban inicialmente contenidos en el segundo conjunto de datos, hayan sido decodificados en el segundo dispositivo de comunicaciïn (20) .

2. El mïtodo segïn la reivindicaciïn 1, en donde la etapa 1c) comprende la etapa adicional de creaciïn de una matriz de nïmeros aleatorios k x m-Beta (Beta) , en donde dichos m elementos del primer conjunto de datos estïn representados por un vector de columna de m elementos (VA) y dichos k elementos codificados se representan por un vector de columna de k elementos (VY) que se calcula realizando la multiplicaciïn matricial de la matriz de nïmero aleatorio Βeta y el vector de columna de m elementos; en donde antes de realizar la etapa 1f) cada uno de los k elementos codificados es encapsulado junto con las entradas de la respectiva fila de la matriz de nïmeros aleatorios Beta en un paquete separado a transmitirse y en donde la etapa 1g) comprende la etapa de calcular la inversa de dicha matriz de nïmeros aleatorios Beta recibida, en donde el vector de columna de m elementos se calcula realizando la multiplicaciïn matricial de la inversa de dicha matriz de nïmeros aleatorios Beta y el vector de columna de k elementos.

3. El mïtodo segïn la reivindicaciïn 1, en donde la etapa 2c) comprende la etapa adicional de crear, con respecto a cada primer subconjunto de datos, de una matriz de nïmeros aleatorios Beta de k x li, en donde li corresponde al nïmero de elementos del primer subconjunto de datos y li es menor que m, en donde dichos li elementos del i-ïsimo primer subconjunto de datos estïn representados por un vector de columna de li elementos y dichos k elementos codificados estïn representados por un vector de columna de k elementos, que se obtiene realizando la multiplicaciïn matricial de la matriz de nïmeros aleatorios Beta y el vector de columna de li elementos; en donde antes de realizar la etapa 2g) , cada uno de k elementos codificados se encapsula junto con las entradas de la fila respectiva de la matriz de nïmeros aleatorios Beta en un paquete separado para transmitirse y en donde la etapa 2h) comprende la etapa de calcular la inversa de la matriz de nïmeros aleatorios Beta de k x li recibida, en donde el vector de columna de li elementos se obtiene realizando la multiplicaciïn matricial de la inversa de dicha matriz de nïmeros aleatorios Beta y el vector de columna de k elementos.

4. El mïtodo segïn cualquiera de las reivindicaciones precedentes, en donde antes de realizar la etapa de decodificaciïn 1g) , los elementos comunes entre el primer conjunto de datos y el segundo conjunto de datos se determina y en donde solamente los elementos codificados recibidos, que no estïn incluidos en el segundo conjunto de datos, son objeto de decodificaciïn y/o en donde antes de realizar la etapa de decodificaciïn 2h) , los elementos comunes entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos correspondiente se determinan y en donde solamente los elementos codificados recibidos, que no estïn incluidos en el subconjunto de datos seleccionado del segundo subconjunto de datos, son objeto de decodificaciïn.

5. El mïtodo segïn cualquiera de las reivindicaciones precedentes, en donde la etapa 2d) comprende las etapas siguientes:

- transmitir una demanda desde el segundo dispositivo de comunicaciïn al primer dispositivo de comunicaciïn para enviar un mensaje relativo a todos los elementos incluidos en el primer conjunto de datos;

-transmitir el mensaje en un paquete ïnico al segundo dispositivo de comunicaciïn y

en donde la etapa 2e) comprende las etapas siguientes:

-transmitir una demanda desde el segundo dispositivo de comunicaciïn al primer dispositivo de comunicaciïn para enviar un mensaje con respecto a todos los elementos incluidos en el primer subconjunto de datos seleccionado;

-transmitir la informaciïn respectiva en un paquete ïnico al segundo dispositivo de comunicaciïn.

6. El mïtodo segïn la reivindicaciïn 5,

en donde la informaciïn comprende las cadenas aleatorias, denominadas hashes, de cada elemento incluido en el primer conjunto de datos y/o las hashes de cada elemento del primer subconjunto de datos seleccionado, en donde la etapa 1d) comprende las etapas adicionales de:

generaciïn, en el segundo dispositivo de comunicaciïn, de la clave aleatoria hash de cada elemento incluido en el segundo conjunto de datos; la comparaciïn de las hashes de cada elemento incluido en el primer conjunto de datos recibido desde el primer dispositivo de comunicaciïn con las hashes de los elementos del segundo conjunto de datos con el fin de determinar el nïmero total de elementos del primer conjunto de datos que no estïn incluidos en el segundo conjunto de datos y en donde la etapa 2e) comprende las etapas adicionales de:

generaciïn, en el segundo dispositivo de comunicaciïn, de la hash de cada elemento incluido en el segundo subconjunto de datos seleccionado;

comparar las hashes de cada elemento del primer subconjunto de datos seleccionado recibido desde el primer dispositivo de comunicaciïn con las hashes de los elementos del segundo subconjunto de datos seleccionado con el fin de determinar el nïmero de elementos del primer subconjunto de datos seleccionado que no estïn incluidos en el segundo subconjunto de datos seleccionado.

7. El mïtodo segïn cualquiera de las reivindicaciones precedentes, en donde la etapa 2g) comprende la etapa de demandar al primer dispositivo de comunicaciïn para el envïo de los k elementos codificados.

8. El mïtodo segïn cualquiera de las reivindicaciones precedentes, que comprende las siguientes etapas de:

determinar, en el segundo dispositivo de comunicaciïn de si el nïmero de elementos del segundo conjunto de datos o el nïmero de elementos de un segundo subconjunto de datos seleccionado es menor que o igual al parïmetro k;

si la respuesta es afirmativa, demandar al primer dispositivo de comunicaciïn para transmitir todos los elementos del primer conjunto de datos o para transmitir todos los elementos del primer subconjunto de datos seleccionado, que corresponde al segundo subconjunto de datos seleccionado, al segundo dispositivo de comunicaciïn.

9. Un sistema informïtico distribuido (1) para sincronizar conjuntos de datos memorizados en diferentes dispositivos de comunicaciïn que estïn conectados a travïs de enlaces de comunicaciïn, que comprende:

a) un primer dispositivo de comunicaciïn (10) que comprende las caracterïsticas siguientes:

-un primer medio de memorizaciïn (18) para memorizar un primer conjunto de datos, incluyendo dicho primer conjunto de datos un nïmero de m elementos,

- un codificador (11) para codificar el primer conjunto de datos utilizando un cïdigo lineal aleatorio para obtener un nïmero de k elementos codificados, en donde k es un parïmetro ajustable,

-un transmisor (13) para transmitir los k elementos codificados al segundo dispositivo de comunicaciïn en respuesta a una demanda del segundo dispositivo de comunicaciïn;

-un medio para realizar una particiïn de conjuntos en el primer conjunto de datos con el fin de obtener una arborescencia multinivel jerïrquica, que comprende una pluralidad de primeros subconjuntos de datos;

-un medio para seleccionar un primer subconjunto de datos en respuesta a un mensaje recibido desde el 35 segundo dispositivo de comunicaciïn,

-en donde el codificador (11) estï adaptado para codificar cada primer subconjunto de datos utilizando un cïdigo lineal aleatorio con el fin de obtener un nïmero de k elementos codificados y

b) un segundo dispositivo de comunicaciïn (20) conectado a travïs de un enlace de comunicaciïn (30) con el primer dispositivo de comunicaciïn (10) , comprendiendo dicho segundo dispositivo de comunicaciïn (20) las caracterïsticas siguientes:

-un primer medio de memorizaciïn (28) para memorizar un segundo conjunto de datos, incluyendo dicho 45 segundo conjunto de datos un nïmero de n elementos;

-un medio (26) para determinar el nïmero total de elementos, que sean diferentes entre dicho primero y segundo conjunto de datos, sobre la base de un mensaje recibido desde el primer dispositivo de comunicaciïn

(10) y para determinar si el nïmero total de diferentes elementos es menor que o igual al parïmetro k;

-un decodificador (24) para decodificar, si el nïmero de elementos diferentes es menor que o igual a k, los k elementos codificados recibidos utilizando un decodificador lineal aleatorio con el fin de obtener todos los elementos del primer conjunto de datos que no estïn contenidos en el segundo conjunto de datos,

-un medio para realizar una particiïn de conjuntos en el segundo conjunto de datos con el fin de obtener una arborescencia multinivel jerïrquica, que comprende una pluralidad de segundos subconjuntos de datos, en donde cada primer subconjunto de datos corresponde a un segundo subconjunto de datos separado del segundo conjunto de datos,

-un medio para seleccionar, si el nïmero de diferentes elementos es mayor que k, al menos un segundo subconjunto de datos en conformidad con una regla predeterminada,

-un medio para determinar el nïmero de elementos, que son diferentes entre el segundo subconjunto de datos seleccionado y el primer subconjunto de datos seleccionado sobre la base de un mensaje recibido desde el 65 primer dispositivo de comunicaciïn (10) en donde el primer subconjunto de datos seleccionado y el segundo subconjunto de datos seleccionado se corresponden entre sï y para determinar si el nïmero de diferentes

elementos es menor que o igual al parïmetro k,

-en donde el decodificador (24) estï adaptado para decodificar, si el nïmero de elementos diferentes entre dicho segundo subconjunto de datos seleccionado y dicho primer subconjunto de datos seleccionado es menor que o

igual a k, al menos algunos de los k elementos codificados recibidos del primer subconjunto de datos seleccionado utilizando un decodificador lineal aleatorio con el fin de obtener los elementos del primer subconjunto de datos, que no estïn contenidos en el segundo subconjunto de datos seleccionado del segundo conjunto de datos.

10. El sistema informïtico distribuido segïn la reivindicaciïn 9, en donde el primer dispositivo de comunicaciïn (10) comprende un segundo medio de memorizaciïn (12) para memorizar los elementos codificados.

11. El sistema informïtico distribuido segïn cualquiera de las reivindicaciones 8 a 9, en donde el codificador (11) estï adaptado para utilizar una matriz de nïmeros aleatorios k x m-Beta para codificar el primer conjunto de datos, en donde el primer dispositivo de comunicaciïn comprende medios para la encapsulaciïn de cada uno de los k elementos codificados junto con las entradas de la respectiva fila de la matriz de nïmeros aleatorios Beta en un paquete separado y en donde el decodificador (24) estï adaptado para calcular la inversa de la matriz de nïmeros aleatorios Beta recibida.

12. El sistema informïtico distribuido segïn cualquiera de las reivindicaciones 9 a 11,

-en donde el codificador (11) estï adaptado para utilizar, para cada primer subconjunto de datos a codificarse, una matriz de nïmeros aleatorios k x li -Beta, en donde li corresponde al nïmero de elementos del i-ïsimo 25 primer subconjunto de datos y li es menor que m,

-en donde el primer dispositivo de comunicaciïn comprende medios para la encapsulaciïn de cada uno de los k elementos codificados de un respectivo primer subconjunto de datos junto con las entradas de la respectiva fila de la matriz de nïmeros aleatorios k x li -Beta en un paquete separado y

- en donde el decodificador (24) estï adaptado para calcular la inversa de la matriz de nïmeros aleatorios de k x li -Beta recibida.

Host A Depïsito CodificadorpaquetesConjunto datos SA

Estructura arborescentedatos Transmisor / receptor

Depïsito paquetes

Decodificador Host B Codificador

Conjunto datos SB Depïsito paquetes

Estructuraarborescente datos

Transmisor / receptor

Depïsito Codificador

paquetes Paquete 1

Paquete 2

Paquete 3

Paquete k