32 votes

Système de stockage distribué de fichiers - Lequel/Existe-t-il un produit prêt à l'emploi?

Avec Hadoop et CouchDB partout dans les Blogs et les actualités associées, quelle est une solution de stockage distribué tolérante aux pannes qui fonctionne réellement.

  • CouchDB n'a en fait aucune fonctionnalité de distribution intégrée, à ma connaissance, le moyen de distribuer automatiquement des entrées ou même des bases de données entières est tout simplement absent.
  • Hadoop semble être très largement utilisé - du moins il bénéficie d'une bonne presse, mais a toujours un point de défaillance unique : le NameNode. De plus, il n'est montable que via FUSE, je comprends que le HDFS n'est en fait pas l'objectif principal de Hadoop.
  • GlusterFS a un concept de partage de ressources mais récemment j'ai lu plusieurs articles qui m'ont amené à penser qu'il n'est pas tout à fait aussi stable.
  • Lustre a également un point de défaillance unique car il utilise un serveur de métadonnées dédié.
  • Ceph semble être le choix préféré mais la page d'accueil indique qu'il est toujours à ses débuts alpha.

Alors la question est : quel système de fichiers distribué a l'ensemble de fonctionnalités suivant (sans ordre particulier) :

  • Compatible POSIX
  • Ajout/suppression facile des nœuds
  • Concept de partage de ressources
  • Fonctionne sur du matériel bon marché (processeurs de classe AMD Geode ou VIA Eden)
  • Authentification/autorisation intégrée
  • Un système de fichiers réseau (j'aimerais pouvoir le monter simultanément sur différents hôtes)

Appréciable d'avoir :

  • Fichiers localement accessibles : je peux mettre un nœud hors service et monter la partition avec un système de fichiers local standard (ext3/xfs/whatever...) et toujours accéder aux fichiers

Je ne cherche pas des applications hébergées, mais plutôt quelque chose qui me permettra de prendre par exemple 10 Go de chacune de nos boîtes matérielles et d'avoir ce stockage disponible dans notre réseau, facilement montable sur une multitude d'hôtes.

0 votes

Alors, qu'avez-vous finalement obtenu? Il serait intéressant d'en savoir plus sur votre configuration actuelle.

0 votes

Lustre semble avoir ajouté des MDS actifs/passifs depuis que vous avez écrit ceci, il pourrait donc être nécessaire de jeter un autre coup d'œil.

0 votes

Dans mon expérience, GlusterFS a été stable mais les performances sont assez médiocres. Pour de meilleures performances, vous aurez besoin d'un matériel sérieusement haut de gamme - essentiellement RDMA. La chose importante est la latence entre tous les serveurs et la machine cliente GlusterFS.

3voto

MattBianco Points 587

Que diriez-vous de Xtreemfs ? La version 1.4 (novembre 2012) est considérée comme étant de qualité de production.

Il est compatible POSIX et possède une tolérance de panne automatique exceptionnelle.

2voto

mreggen Points 2940

Lustre permet d'avoir plusieurs magasins de métadonnées en configuration active/passive pour la redondance, donc aucun point de défaillance unique.

OCFS2 pourrait également être intéressant à regarder.

Notez que le fait d'éliminer le besoin d'un accès réseau simultané multiple rend possible le passage à quelque chose comme iSCSI ou même cifs ou nfs. L'inconvénient est que vous devez "découper" des morceaux de votre uberArray en morceaux pour chaque serveur ayant besoin d'espace.

2voto

Soldarnal Points 2646

Sauf à des fins académiques ou de développement, ce type de chose doit être abordé en commençant par les exigences générales du projet. La plupart des systèmes de fichiers distribués ne sont pas suffisamment matures pour un déploiement sérieux - par exemple, que faites-vous si tout s'effondre. Si c'est à des fins académiques ou de développement, alors c'est en fait une bonne chose car vous pourriez apprendre beaucoup et corriger de nombreux bugs.

Le commentaire questionnant si vous avez vraiment besoin de la sémantique POSIX est un bon début. Les sémantiques de "système de fichiers" non-POSIX peuvent être beaucoup plus flexibles, conduisant à des systèmes beaucoup plus fiables.

S'il s'agit d'une application héritée, je me demande vraiment pourquoi un système de fichiers distribué moderne pourrait être considéré comme la meilleure solution.

Ne me comprenez pas mal - ce sont des jouets incroyablement amusants. Je ne voudrais simplement pas être responsable d'une solution complexe interdépendante qui n'est pas couramment utilisée et qui serait très difficile à réparer en cas de collapse.

1voto

David Pashley Points 22851

Avez-vous vraiment, absolument besoin de la sémantique POSIX? La vie est beaucoup plus facile si vous pouvez utiliser un magasin de données personnalisé. Nous disposons d'un magasin de données écrit en interne qui est en fait un très grand magasin de clés-valeurs distribué. Vous stockez un fichier dedans et vous obtenez un jeton en retour. Si vous voulez récupérer le fichier, redonnez-lui le jeton qui vous a été donné précédemment. Il est distribué, ne partage rien, les données sont répliquées trois fois, les nœuds peuvent être ajoutés et supprimés à volonté, tant les serveurs de stockage que les serveurs de contrôle.

0 votes

Malheureusement, j'ai vraiment besoin de la sémantique POSIX. Nous avons beaucoup d '"applications héritées" qui stockent des choses sur le système de fichiers local. Réécrire tout cela est définitivement en dehors de tout budget.

0 votes

Je suspecte que vous allez devoir abandonner certaines de vos autres exigences. Je regarderais du côté de GlusterFS, Lustre, OCFS2, GFS, mais je doute que vous en trouverez un qui a shared-nothing.

0 votes

en.wikipedia.org/wiki/… répertorie les systèmes de fichiers distribués, mais très peu d'entre eux sont POSIX.

1voto

s014gr0 Points 27

Lustre a également un point de défaillance unique car il utilise un serveur de métadonnées dédié

Lustre est conçu pour prendre en charge la redondance et un MDS/MDT/OSS peut avoir plusieurs adresses auxquelles il peut être contacté, un heartbeat peut être utilisé pour migrer le service.

Sachez que certaines versions récentes ont eu des problèmes où le démontage semble fonctionner mais les données sont toujours en cours d'écriture sur le disque. Cependant, la protection double montage aurait dû aider (à part les problèmes intéressants qu'elle a rencontrés) ...

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X