Almacenamiento de datos distribuido.

Método para mantener datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos,

utilizándose el método en un nodo de almacenamiento en el sistema de almacenamiento de datos y comprendiendo:

- monitorizar el estado (59) de otros nodos de almacenamiento en el sistema así como operaciones (65, 67, 69) de escritura llevadas a cabo en el sistema de almacenamiento de datos, de manera que el nodo de almacenamiento tiene acceso, para una entidad de datos, a una lista de anfitriones, que incluye nodos de almacenamiento que almacenan la entidad de datos;

- detectar (51), basándose en la monitorización, condiciones en el sistema de almacenamiento de datos, que indican que un nodo de almacenamiento del sistema de almacenamiento de datos está funcionando de manera deficiente;

- determinar entidades de datos almacenadas que fueron almacenadas también por el nodo de almacenamiento que funciona de manera deficiente, sobre la base de la información existente en una pluralidad de listas de anfitriones, en donde la lista de anfitriones para cada entidad de datos comprende una lista asociada que identifica un subconjunto de nodos de almacenamiento dentro del sistema de almacenamiento de datos, que almacenan la entidad de datos; e

- iniciar un proceso (53) de duplicación para entidades de datos que fueron almacenadas por el nodo de almacenamiento que funciona deficientemente en caso de que se detecten las condiciones, en donde el proceso de duplicación incluye enviar un mensaje de multidifusión, a una pluralidad de nodos de almacenamiento, de modo que el mensaje consulta cuáles de dichos nodos de almacenamiento almacenan datos específicos.

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/EP2009/063796.

Solicitante: Compuverde AB.

Inventor/es: MELANDER,CHRISTIAN, BERNBO,STEFAN, PETERSSON,GUSTAV, PERSSON,ROGER.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • G06F17/30 SECCION G — FISICA.G06 COMPUTO; CALCULO; CONTEO.G06F TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores en los que una parte del cálculo se efectúa hidráulica o neumáticamente G06D, ópticamente G06E; sistemas de computadores basados en modelos de cálculo específicos G06N). › G06F 17/00 Equipo o métodos de tratamiento de datos o de cálculo digital, especialmente adaptados para funciones específicas. › Recuperación de la información; Estructura de bases de datos a este efecto.

PDF original: ES-2538129_T3.pdf

 


Fragmento de la descripción:

Almacenamiento de datos distribuido Campo técnico La presente exposición se refiere a métodos para escribir y mantener datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos, utilizándose los métodos en un servidor y en un nodo de almacenamiento del sistema de almacenamiento de datos. La exposición se refiere además a nodos de almacenamiento o servidores con capacidad de llevar a cabo dichos métodos.

Antecedentes Se da a conocer un método de este tipo, por ejemplo, en el documento US. 2005/0246393. A1. Este método se da a conocer para un sistema que usa una pluralidad de centros de almacenamiento en ubicaciones geográficamente dispares. Se incluyen administradores de almacenamiento distribuido de objetos con el fin de mantener información referente a datos almacenados.

Uno de los problemas asociados a un sistema de este tipo es cómo lograr una escritura así como un mantenimiento de datos, que sean sencillos aunque robustos y fiables.

El documento US-7266556-B1 describe un sistema de almacenamiento en red con un sistema de archivos virtual. El sistema incluye una serie de administradores de almacenamiento distribuido y una serie de nodos de almacenamiento inteligentes. Se almacenan duplicados de archivos en dos nodos de almacenamiento, y en caso de fallo de un nodo de almacenamiento, se dirige una solicitud del archivo al otro nodo de almacenamiento en el que se guarda el archivo.

HONG TANG ET AL: "An Efficient Data Localization Protocol for Self-organizing Storage Clusters", 2003 ACM/IEEE CONFERENCE PHOENIX, AZ, USA 15 a 21 de NOV. de 2003, describe un agrupamiento para almacenamiento a gran escala. Se usa una combinación de diferentes esquemas para el posicionamiento de datos, que incluye posicionar bloques pequeños de datos sobre la base de un hashing y bloques más grandes con filtros Bloom.

Sumario de la Invención El objetivo de la invención se alcanza con las características de las reivindicaciones independientes. Otras realizaciones constituyen la materia objeto de las reivindicaciones dependientes.

Por lo tanto, un objetivo de la presente exposición es materializar una escritura o mantenimiento robustos de datos en un sistema de almacenamiento distribuido, sin utilizar servidores de mantenimiento centralizados, los cuales pueden constituir en sí mismos uno de los puntos débiles de un sistema. Este objetivo se alcanza por medio de un método del tipo mencionado en el inicio, que se materializa en un nodo de almacenamiento y comprende: monitorizar el estado de otros nodos de almacenamiento en el sistema así como operaciones de escritura llevadas a cabo en el sistema de almacenamiento de datos, detectar, basándose en la monitorización, condiciones en el sistema de almacenamiento de datos, que implican la necesidad de duplicación de datos entre los nodos en el sistema de almacenamiento de datos, e iniciar un proceso de duplicación en caso de que se detecte dicha condición. El proceso de duplicación incluye enviar un mensaje de multidifusión a una pluralidad de nodos de almacenamiento, de manera que el mensaje consulta sobre cuáles de esos nodos de almacenamiento almacenan datos específicos.

Con un método del tipo mencionado, cada nodo de almacenamiento puede participar de manera activa en el mantenimiento de datos del sistema completo. En caso de que un nodo de almacenamiento falle, sus datos pueden ser recuperados por otros nodos del sistema, pudiéndose considerar por lo tanto que dicho sistema es autoreparable.

La monitorización puede incluir la escucha de señales de latidos (heart-beat) provenientes de otros nodos de almacenamiento del sistema. Una condición que implica una necesidad de duplicación es entonces un nodo de almacenamiento que está funcionando deficientemente.

Los datos incluyen archivos y una condición que implica la necesidad de duplicaciones puede ser entonces una de entre una eliminación de archivos o una inconsistencia de archivos.

Se puede mantener una lista de duplicación, que incluye archivos que requieren duplicación, y la misma puede incluir prioridades.

El proceso de duplicación puede incluir: enviar una solicitud en forma de mensaje de multidifusión a una pluralidad de nodos de almacenamiento consultando sobre cuáles de dichos nodos de almacenamiento almacenan datos específicos, recibir respuestas de aquellos nodos de almacenamiento que contienen dichos datos específicos, determinar si dichos datos específicos están almacenados en un número suficiente de nodos de almacenamiento, y, 65 en caso negativo, seleccionar por lo menos un nodo de almacenamiento adicional y transmitir dichos datos

específicos a ese nodo de almacenamiento. Además, los datos específicos de nodos de almacenamiento que contienen versiones obsoletas de los mismos se pueden actualizar.

Adicionalmente, el proceso de duplicación puede comenzar con el nodo de almacenamiento intentado obtener 5 dominio del archivo, que se va a duplicar, entre todos los nodos de almacenamiento del sistema.

La monitorización puede incluir además monitorizar operaciones de lectura llevadas a cabo en el sistema de almacenamiento de datos.

La presente exposición se refiere además a un nodo de almacenamiento de datos, para llevar a cabo mantenimiento de datos, correspondiente al método. En este caso, el nodo de almacenamiento comprende en general medios para llevar a cabo las acciones del método.

El objetivo también se alcanza por medio de un método para escribir datos en un sistema de almacenamiento de datos del tipo mencionado en el inicio, lo cual se materializa en un servidor que ejecuta una aplicación que accede a datos en el sistema de almacenamiento de datos. El método comprende: enviar una consulta de almacenamiento de multidifusión a una pluralidad de nodos de almacenamiento, recibir una pluralidad de respuestas de un subconjunto de dichos nodos de almacenamiento, incluyendo las respuestas datos geográficos referentes a la posición geográfica de cada servidor, seleccionar por lo menos dos nodos de almacenamiento del subconjunto, basándose en dichas respuestas, y enviar datos y un identificador de datos, correspondiente a los datos, a los nodos de almacenamiento seleccionados.

Este método logra una escritura robusta de datos en el sentido que se materializa una diversidad geográfica de una manera eficiente.

La posición geográfica puede incluir latitud y longitud del nodo de almacenamiento en cuestión, y las respuestas pueden incluir además carga del sistema y/o antigüedad del sistema para el nodo de almacenamiento en cuestión.

La consulta de almacenamiento de multidifusión puede incluir un identificador de datos, que identifica los datos a 30 almacenar.

Típicamente, se pueden seleccionar por lo menos tres nodos para el almacenamiento, y se puede enviar una lista de nodos de almacenamiento, que almacenan satisfactoriamente los datos, a los nodos de almacenamiento seleccionados.

La presente exposición se refiere además a un servidor, para llevar a cabo escritura de datos, correspondiente al método. En este caso, el servidor comprende en general medios para llevar a cabo las acciones del método.

Breve descripción de los dibujos La figura 1 ilustra un sistema de almacenamiento distribuido de datos. Las figuras 2A a 2C y la figura 3 ilustran un proceso de lectura de datos. Las figuras 4A a 4C y la figura 5 ilustran un proceso de escritura de datos. La figura 6 ilustra esquemáticamente una situación en la que una serie de archivos se almacena entre una serie de nodos de almacenamiento de datos.

La figura 7 ilustra la transmisión de señales de latidos. La figura 8 es una vista general de un proceso de mantenimiento de datos.

Descripción detallada La presente exposición se refiere a un sistema de almacenamiento distribuido de datos que comprende una 50 pluralidad de nodos de almacenamiento. La estructura del sistema y el contexto en que se utiliza se esbozan de manera general en la figura 1.

Un ordenador 1 de usuario accede, por medio de Internet 3, a una aplicación 5 que se ejecuta en un servidor 7. El contexto de usuario, según se ilustra en la presente, es por lo tanto una configuración habitual de cliente-servidor, la 55 cual es bien conocida de por sí. Sin embargo, debe indicarse que el sistema de almacenamiento de datos que se va a dar a conocer también puede ser útil en otras configuraciones.

En el caso ilustrado, en el servidor 7 se ejecutan dos aplicaciones 5, 9. Sin embargo, evidentemente este número de aplicaciones puede ser diferente. Cada aplicación tiene una API (Interfaz de Programación de Aplicaciones) 11 que 60 proporciona una interfaz con relación... [Seguir leyendo]

 


Reivindicaciones:

1. Método para mantener datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos, utilizándose el método en un nodo de almacenamiento en el sistema de almacenamiento de datos y comprendiendo:

- monitorizar el estado (59) de otros nodos de almacenamiento en el sistema así como operaciones (65, 67, 69) de escritura llevadas a cabo en el sistema de almacenamiento de datos, de manera que el nodo de almacenamiento tiene acceso, para una entidad de datos, a una lista de anfitriones, que incluye nodos de almacenamiento que almacenan la entidad de datos; -detectar (51) , basándose en la monitorización, condiciones en el sistema de almacenamiento de datos, que indican que un nodo de almacenamiento del sistema de almacenamiento de datos está funcionando de manera deficiente; -determinar entidades de datos almacenadas que fueron almacenadas también por el nodo de almacenamiento que funciona de manera deficiente, sobre la base de la información existente en una pluralidad de listas de anfitriones, en donde la lista de anfitriones para cada entidad de datos comprende una lista asociada que identifica un subconjunto de nodos de almacenamiento dentro del sistema de almacenamiento de datos, que almacenan la entidad de datos; e -iniciar un proceso (53) de duplicación para entidades de datos que fueron almacenadas por el nodo de almacenamiento que funciona deficientemente en caso de que se detecten las condiciones, en donde el proceso de duplicación incluye enviar un mensaje de multidifusión, a una pluralidad de nodos de almacenamiento, de modo que el mensaje consulta cuáles de dichos nodos de almacenamiento almacenan datos específicos.

2. Método según la reivindicación 1, en el que la monitorización incluye escuchar (59) señales de latido provenientes de otros nodos de almacenamiento en el sistema, y en donde una condición que implica necesidad de duplicación es un nodo de almacenamiento que funciona de manera deficiente.

3. Método según la reivindicación 1 ó 2, en el que los datos incluyen archivos y una condición es una de entre una eliminación de archivo o una inconsistencia de archivo.

4. Método según cualquiera de las reivindicaciones anteriores, en el que se mantiene una lista de duplicación, que incluye archivos que requieren duplicación.

5. Método según la reivindicación 4, en el que la lista de duplicación incluye prioridades.

6. Método según cualquiera de las reivindicaciones anteriores, en el que el proceso de duplicación incluye además:

- recibir respuestas de aquellos nodos de almacenamiento que contienen dichos datos específicos; -determinar si dichos datos específicos están almacenados en un número suficiente de nodos de almacenamiento; y -si no, seleccionar por lo menos un nodo de almacenamiento adicional y transmitir dichos datos específicos a ese nodo de almacenamiento.

7. Método según la reivindicación 6, que comprende además actualizar dichos datos específicos en nodos de almacenamiento que contienen versiones obsoletas de los mismos.

8. Método según la reivindicación 6 ó 7, en el que el proceso de duplicación comienza con el intento, por parte del nodo de almacenamiento, de obtener dominio del archivo a duplicar entre todos los nodos de almacenamiento del sistema.

9. Método según cualquiera de las reivindicaciones anteriores, en el que la monitorización incluye además monitorizar operaciones (63) de lectura llevadas a cabo en el sistema de almacenamiento de datos.

10. Nodo de almacenamiento de datos para mantener datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos, comprendiendo el nodo de almacenamiento de datos:

- medios para monitorizar el estado de otros nodos de almacenamiento en el sistema así como operaciones de escritura llevadas a cabo en el sistema de almacenamiento de datos, en donde la monitorización para una entidad de datos está basada en una lista de anfitriones, que incluye nodos de almacenamiento que almacenan la entidad de datos;

- medios para detectar, basándose en la monitorización, condiciones en el sistema de almacenamiento de datos que indican que un nodo de almacenamiento del sistema de almacenamiento de datos está funcionando de manera deficiente; -medios para determinar entidades de datos almacenadas que fueron almacenadas también por el nodo de almacenamiento que funciona de manera deficiente, sobre la base de la información existente en una pluralidad de listas de anfitriones, en donde la lista de anfitriones para cada entidad de datos comprende una lista asociada que identifica un subconjunto de nodos de almacenamiento dentro del sistema de almacenamiento de datos, que almacenan la entidad de datos; y -medios para iniciar un proceso de duplicación para entidades de datos que fueron almacenadas por el nodo de almacenamiento que funciona deficientemente en caso de que se detecten las condiciones, en donde el proceso de duplicación incluye enviar un mensaje de multidifusión, a una pluralidad de nodos de almacenamiento, de modo que el mensaje consulta cuáles de dichos nodos de almacenamiento almacenan datos específicos.

11. Método para escribir datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos, utilizándose el método en un servidor que ejecuta una aplicación que accede a datos en el sistema de almacenamiento de datos, y comprendiendo:

- enviar (41) una consulta de almacenamiento de multidifusión a una pluralidad de dichos nodos de almacenamiento; -recibir (43) una pluralidad de respuestas de un subconjunto de dichos nodos de almacenamiento, incluyendo las respuestas datos geográficos referentes a la posición geográfica de cada nodo de almacenamiento; -seleccionar (45) por lo menos dos nodos de almacenamiento del subconjunto, sobre la base de dichas respuestas; y -enviar (47) a los nodos de almacenamiento seleccionados datos, un identificador de datos, correspondiente a los datos, y una lista de anfitriones, que es una lista de nodos de almacenamiento que almacenan satisfactoriamente los datos.

12. Método según la reivindicación 11, en el que la posición geográfica incluye latitud y longitud del nodo de almacenamiento en cuestión.

13. Método según la reivindicación 12, en el que las respuestas incluyen además antigüedad del sistema para el nodo de almacenamiento en cuestión.

14. Método según la reivindicación 12 ó 13, en el que las respuestas incluyen además carga del sistema para el nodo de almacenamiento en cuestión.

15. Método según cualquiera de las reivindicaciones 12 a 14, en el que la consulta de almacenamiento de multidifusión incluye un identificador de datos, que identifica los datos a almacenar.

16. Método según cualquiera de las reivindicaciones 12 a 15, en el que se seleccionan por lo menos tres nodos.

17. Servidor adaptado para escribir datos en un sistema de almacenamiento de datos que comprende una pluralidad de nodos de almacenamiento de datos, comprendiendo el servidor:

- medios para enviar una consulta de almacenamiento de multidifusión a una pluralidad de dichos nodos de almacenamiento; -medios para recibir una pluralidad de respuestas de un subconjunto de dichos nodos de almacenamiento, incluyendo las respuestas datos geográficos referentes a la posición geográfica de cada nodo de almacenamiento; -medios para seleccionar por lo menos dos nodos de almacenamiento del subconjunto, sobre la base de dichas respuestas; y -medios para enviar a los nodos de almacenamiento seleccionados datos y un identificador de datos, correspondiente a los datos, y una lista de anfitriones, que es una lista de nodos de almacenamiento que almacenan satisfactoriamente los datos.


 

Patentes similares o relacionadas:

Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, del 21 de Mayo de 2019, de IG Knowhow Limited: Un sistema de control para controlar el funcionamiento de una unidad de procesamiento de datos, la unidad de procesamiento de datos recibiendo una primera […]

Dispositivo de procesamiento de información, método de procesamiento de información, programa de procesamiento de información y soporte de registro, del 1 de Mayo de 2019, de RAKUTEN, INC: Dispositivo de procesamiento de información que comprende: un medio (12b) de memoria de palabra de área local que almacena una palabra de área […]

Método para proporcionar una estructura de índice en una base de datos, del 1 de Mayo de 2019, de Capish International AB: Metodo para proporcionar una estructura de indice en una base de datos que comprende una pluralidad de tipos de objetos, donde cada tipo de objetos […]

SISTEMA PARA LA DETECCIÓN REMOTA DEL USO DEL CINTURÓN DE SEGURIDAD EN UN VEHÍCULO, del 18 de Abril de 2019, de CASANOVA RENT VOLKS, S.A. DE C.V: La presente invención se refiere a la industria automotriz, particularmente está relacionada con los cinturones de seguridad con que están equipados los vehículos, […]

Proporcionar vistas de datos únicas basadas en cambios o reglas, del 3 de Abril de 2019, de Palantir Technologies, Inc: Un método, que comprende: crear y almacenar, en un a base de datos de revisión, versiones de uno o más objetos de datos; en el que […]

Buscar automáticamente elementos relacionados contextualmente de una tarea, del 3 de Abril de 2019, de Microsoft Technology Licensing, LLC: Un sistema contextual implementado por ordenador para producir resultados basándose en un elemento de referencia, siendo el elemento de referencia […]

Un indicador de región de vídeo que indica que hay disponible contenido de vídeo, del 1 de Abril de 2019, de Nokia Technologies OY: Un método que comprende: determinar una localización de navegación interactiva; provocar la visualización de una imagen en perspectiva […]

Coautoría para un sistema de gestión de documentos, del 6 de Marzo de 2019, de M-Files Oy: Un método en un sistema de gestión de documentos, en donde dicho sistema de gestión de documentos almacena objetos electrónicos en un servidor […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .