Sistema de archivos.

Un método de acceso a un archivo que tiene un nombre de archivo y almacenado como un objeto de archivo de un sistema de archivos en un almacén de objetos en uno o más dispositivos de almacenamiento en ordenador,

teniendo el almacén de objetos un índice de ubicaciones

(204) de nombres de objeto y ubicaciones físicas de objeto para los objetos (P, Q, R) almacenados en el almacén de objetos, teniendo cada objeto como su nombre de objeto una huella digital de objeto globalmente única (H(p), H(q), H(r)) que se deriva del contenido del objeto,

teniendo el objeto de archivo (401) su propia huella digital de objeto de archivo, que comprende una tabla de puesta en correspondencia (402) de huellas digitales de objeto para objetos de datos del archivo almacenado en el almacén de objetos, estando la tabla de puesta en correspondencia indexada por un desplazamiento en el contenido del archivo para determinar qué objetos del archivo van a ser referenciados,

comprendiendo el método acceder a objetos en el almacén de objetos usando el índice de ubicaciones (204) y huellas digitales de objeto incluyendo:

acceder a un objeto de directorio (501), que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto, comprendiendo el objeto de directorio una puesta en correspondencia de números de nodo - i con nombres de archivo;

examinar el objeto de directorio usando un nombre de archivo para obtener un número de nodo - i; acceder a un objeto de correspondencia de nodos - i (502, 650), que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto de correspondencia de nodos - i, comprendiendo el objeto de correspondencia de nodos - i una puesta en correspondencia de números de nodo - i de sistema de archivos y huellas digitales de objeto; usar el objeto de correspondencia de nodos - i (502, 650) para traducir el número de nodo - i a partir del objeto de directorio a una huella digital de objeto de archivo; 25 acceder al objeto de archivo (401), que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto de archivo, por lo que los objetos de datos (410, 411, 412) del archivo almacenado en el almacén de objetos se encuentran disponibles para un acceso por medio de la tabla de puesta en correspondencia (402).

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/US2010/040058.

Solicitante: Simplivity Corporation.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 8 Technology Drive Westborough, MA 01581-1756 ESTADOS UNIDOS DE AMERICA.

Inventor/es: BOWDEN,PAUL, BEAVERSON,ARTHUR J.

Fecha de Publicación: .

Clasificación Internacional de Patentes:

  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Equipo o métodos de tratamiento de datos o de cálculo... > G06F17/30 (Recuperación de la información; Estructura de bases de datos a este efecto)
  • SECCION G — FISICA > COMPUTO; CALCULO; CONTEO > TRATAMIENTO DE DATOS DIGITALES ELECTRICOS (computadores... > Detección de errores; Corrección de errores; Monitorización... > G06F11/14 (Detección o corrección de errores en los datos por redundancia en las operaciones, p. ej. mediante la utilización de diversas secuencias de operaciones que conduzcan al mismo resultado (G06F 11/16 tiene prioridad))

PDF original: ES-2546562_T3.pdf

 

google+ twitter facebookPin it
Ilustración 1 de Sistema de archivos.
Ilustración 2 de Sistema de archivos.
Ilustración 3 de Sistema de archivos.
Ilustración 4 de Sistema de archivos.
Ver la galería de la patente con 12 ilustraciones.
Sistema de archivos.

Fragmento de la descripción:

Sistema de archivos

Campo de la invención

La presente invención se refiere a estructuras de datos de sistema de archivos informáticos y a métodos y aparatos para la denominación y el almacenamiento de archivos.

Antecedentes

Una solución de almacenamiento con todas las funciones incluidas puede incluir discos en bruto, un sistema de archivos, instantáneas, control de versiones de archivos, compresión, cifrado, optimización de capacidades incorporadas (por ejemplo, desduplicación de datos) , otras características de seguridad tales como auditoría y resistencia a manipulación indebida, una replicación eficiente en una ubicación fuera del sitio con fines de recuperación en casos de desastre, y así sucesivamente. Muchas de estas características se entregan en aparatos separados que entonces han de ser conectados por unos técnicos sumamente experimentados.

La construcción de una solución de almacenamiento de este tipo con la tecnología de hoy en día, para muchos terabytes (TB) de datos, a menudo da como resultado una solución multicaja que puede superar con facilidad unos costes de 100.000 dólares, lo que hace que una solución de almacenamiento con todas las funciones incluidas de este tipo no se encuentre disponible para muchas empresas y clientes.

Esta solución ad hoc multicaja no es un aspecto fundamental del almacenamiento, sino más bien que las implementaciones y arquitecturas de sistema de archivos no se han mantenido a la par con otros desarrollos tecnológicos. Por ejemplo, la mayor parte de las arquitecturas de sistema de archivos no han evolucionado para aprovechar completamente las unidades de procesamiento informático (CPU, computer processing unit) , más rápidas, la memoria flash, y el diferente equilibrio entre el ancho de banda de red, la densidad de disco y las tasas de acceso a disco.

Si se define la accesibilidad de los datos como la relación del ancho de banda de acceso con respecto al almacenamiento direccionable, la accesibilidad de los datos está disminuyendo. Las densidades de almacenamiento están aumentando más rápido que el acceso a los discos, por lo tanto para un tamaño de conjunto de datos dado, el tiempo que se necesita para acceder a los datos está aumentando (y por lo tanto, dando lugar a una accesibilidad reducida) . El efecto sobre las arquitecturas de almacenamiento es tal como sigue: una vez que se almacenan los datos, no deberían moverse a menos que sea absolutamente necesario. Esta simple observación se infringe muchas veces en las arquitecturas de almacenamiento actuales donde los datos constantemente se están colocando en memoria y escribiéndose de nuevo. El resultado es un gasto adicional significativo (por ejemplo, 10 canales, CPU, potencia, tiempo, gestión) .

Se hace referencia al documento US 2009/0037456 que describe un almacén de datos donde se almacenan fragmentos. Cada recopilación de fragmentos forma unos archivos respectivos. Se proporciona un índice que pone en correspondencia compendios de fragmentos con páginas que contienen información para recrear los fragmentos, en donde el índice se almacena en un almacenamiento persistente.

Sumario de la invención

La invención se expone en la reivindicación independiente 1.

De acuerdo con un ejemplo de la invención, se proporciona un sistema de archivos que comprende:

un sistema de archivos digitalmente firmado donde datos, metadatos y archivos son objetos, teniendo cada objeto una huella digital globalmente única y derivada de contenido y donde las referencias de objeto se ponen en correspondencia mediante las huellas digitales;

teniendo el sistema de archivos un objeto raíz que comprende una puesta en correspondencia de todas las huellas digitales de objeto en el sistema de archivos; en el que un cambio en el sistema de archivos da como resultado un cambio en el objeto raíz, y realizar un seguimiento de los cambios en el objeto raíz proporciona una historia de la actividad de sistema de archivos.

En un ejemplo:

el sistema de archivos incluye un objeto de correspondencia de nodos -i que comprende una puesta en correspondencia de números de nodo -i con huellas digitales de objeto de archivo y donde la huella digital del objeto de correspondencia de nodos -i comprende una instantánea del sistema de archivos.

De acuerdo con otro ejemplo de la invención, se proporciona un medio legible por ordenador que contiene unas instrucciones de programa ejecutables para un método indexación de objetos almacenados, comprendiendo el método:

proporcionar datos, metadatos y archivos como objetos; proporcionar una huella digital para cada objeto que es globalmente única y que se deriva del contenido del objeto; y en el que se proporciona un objeto raíz de sistema de archivos que comprende una puesta en correspondencia de todas las huellas digitales de objeto en el sistema de archivos, de tal modo que un cambio en el sistema de archivos da como resultado un cambio en el objeto raíz, y realizar un seguimiento de los cambios en el objeto raíz proporciona una historia de la actividad de sistema de archivos.

En un ejemplo, el método incluye:

proporcionar un objeto de correspondencia de nodos -i de sistema de archivos que comprende una puesta en correspondencia de números de nodo -i con huellas digitales de objeto de archivo, en el que la huella digital del objeto de correspondencia de nodos -i comprende una instantánea del sistema de archivos.

En un ejemplo, el método incluye:

publicar la huella digital de correspondencia de nodos -i en otro sistema informático en un almacén de objetos distinto.

En un ejemplo, el método incluye:

usar la huella digital de correspondencia de nodos -i como una instantánea del sistema de archivos para una recuperación en casos de desastre.

En un ejemplo:

el objeto de correspondencia de nodos -i contiene una huella digital de una correspondencia de nodos -i previa.

En un ejemplo:

las huellas digitales de correspondencia de nodos -i previa comprenden una historia de instantáneas del sistema de archivos.

En un ejemplo:

los objetos tienen unos recuentos de referencia; y tras un cambio en el sistema de archivos, ajustar los recuentos de referencia de objeto de cada objeto por debajo del objeto de correspondencia de nodos -i.

En un ejemplo:

el ajuste se realiza en cada transacción de E / S para proporcionar una protección de datos continua.

En un ejemplo:

el ajuste se realiza de forma periódica, a demanda, o al ocurrir sucesos particulares para generar unas instantáneas.

En un ejemplo:

los objetos tienen unos recuentos de referencia; y los ajustes a los recuentos de referencia se utilizan para la desduplicación de datos de tal modo que solo se almacena un nuevo contenido de datos.

De acuerdo con otro ejemplo de la invención, se proporciona un sistema de archivos de ordenador para la denominación y el almacenamiento de archivos en uno o más dispositivos de almacenamiento en ordenador, comprendiendo el sistema:

un sistema de archivos de espacio de nombres donde archivos, datos y metadatos son objetos, teniendo cada 65 objeto una huella digital globalmente única que se deriva del contenido del objeto, comprendiendo cada objeto de archivo una puesta en correspondencia de huellas digitales de objeto para los objetos de datos y / u objetos de

metadatos del archivo y teniendo el objeto de archivo su propia huella digital de objeto derivada de las huellas digitales de los objetos en el archivo, y donde el sistema incluye una puesta en correspondencia de números de nodo -i con las huellas digitales de objeto de archivo.

En un ejemplo:... [Seguir leyendo]

 


Reivindicaciones:

1. Un método de acceso a un archivo que tiene un nombre de archivo y almacenado como un objeto de archivo de un sistema de archivos en un almacén de objetos en uno o más dispositivos de almacenamiento en ordenador, teniendo el almacén de objetos un índice de ubicaciones (204) de nombres de objeto y ubicaciones físicas de objeto para los objetos (P, Q, R) almacenados en el almacén de objetos, teniendo cada objeto como su nombre de objeto una huella digital de objeto globalmente única (H (p) , H (q) , H (r) ) que se deriva del contenido del objeto, teniendo el objeto de archivo (401) su propia huella digital de objeto de archivo, que comprende una tabla de puesta en correspondencia (402) de huellas digitales de objeto para objetos de datos del archivo almacenado en el almacén de objetos, estando la tabla de puesta en correspondencia indexada por un desplazamiento en el contenido del archivo para determinar qué objetos del archivo van a ser referenciados, comprendiendo el método acceder a objetos en el almacén de objetos usando el índice de ubicaciones (204) y huellas digitales de objeto incluyendo:

acceder a un objeto de directorio (501) , que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto, comprendiendo el objeto de directorio una puesta en correspondencia de números de nodo -i con nombres de archivo; examinar el objeto de directorio usando un nombre de archivo para obtener un número de nodo -i; acceder a un objeto de correspondencia de nodos -i (502, 650) , que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto de correspondencia de nodos -i, comprendiendo el objeto de correspondencia de nodos -i una puesta en correspondencia de números de nodo -i de sistema de archivos y huellas digitales de objeto; usar el objeto de correspondencia de nodos -i (502, 650) para traducir el número de nodo -i a partir del objeto de directorio a una huella digital de objeto de archivo;

acceder al objeto de archivo (401) , que tiene su propia huella digital de objeto, en el almacén de objetos usando la huella digital de objeto de archivo, por lo que los objetos de datos (410, 411, 412) del archivo almacenado en el almacén de objetos se encuentran disponibles para un acceso por medio de la tabla de puesta en correspondencia (402) .

2. El método de la reivindicación 1:

en el que, la huella digital del objeto de correspondencia de nodos -i comprende una instantánea del sistema de archivos.

3. El método de la reivindicación 1, que incluye:

publicar la huella digital de objeto de correspondencia de nodos -i en otro sistema informático.

4. El método de la reivindicación 1, que incluye: 40

realizar una recuperación en casos de desastre usando la huella digital de objeto de correspondencia de nodos i como una instantánea del sistema de archivos.

5. El método de la reivindicación 1, donde el objeto de correspondencia de nodos -i (502, 650, 659) incluye una 45 huella digital de objeto de un objeto de correspondencia de nodos -i previa.

6. El método de la reivindicación 5, donde:

las huellas digitales de objeto de correspondencia de nodos -i previa comprenden una historia de instantáneas 50 del sistema de archivos.

7. El método de la reivindicación 1, donde:

la tabla de puesta en correspondencia de objetos de archivo (402) comprende una lista lineal, una estructura en 55 árbol o una tabla de direccionamiento indirecto.

8. El método de la reivindicación 1, que incluye:

generar un registro de transacciones de actividad de objetos, incluyendo lecturas, escrituras, eliminaciones y 60 actualizaciones de recuentos de referencia.

9. El método de la reivindicación 1, que incluye:

añadir, modificar o eliminar un objeto de datos del archivo y generar una nueva huella digital de objeto de 65 archivo.

10. El método de la reivindicación 1, que incluye:

utilizar una aceleración de soporte físico (113) para realizar uno o más de denominación de objetos, compresión y cifrado. 5

11. El método de la reivindicación 1, que incluye:

mantener un recuento de referencia para cada objeto, y actualizar el recuento de referencia del objeto cuando se añaden o se eliminan referencias al objeto. 10

12. El método de la reivindicación 1, que incluye:

cuando se cambia el contenido de un objeto de archivo o un objeto de datos, propagar el cambio hacia arriba hasta un objeto raíz. 15