2 votes

Glusterd est mort mais le cluster fonctionne toujours

Nous utilisons actuellement un cluster de trois nœuds, sur Gluster 3.6.4.

Sur un de nos nœuds, nous avons remarqué que le démon glusterd est mort.

Mais les démons glusterfsd fonctionnent toujours, et nous pensons que les clients se connectent et récupèrent les données.

Nous avons remarqué que le démon est mort depuis une semaine, et nous ne l'avons pas vu. Les montages distribués NFS ont continué à fonctionner normalement.

Nous aimerions savoir pouvons-nous aller de l'avant et redémarrer le service glusterd ?

Si c'est le cas, cela déclencherait-il un auto-guérison sur tous les volumes ? Car cela poserait un problème de performance.

Les journaux de ce nœud sont les suivants : :

[2016-08-19 18:01:52.804453] E [rpc-clnt.c:362:saved_frames_unwind] (--> /usr/lib64/libglusterfs.so.0(_gf_log_callingfn+0x1e0)[0x7f4f3ffca550] (--> /usr/lib64/libgfrpc.so.0(saved_frames_unwind+0x1e7)[0x7f4f3fd9f787] (--> /usr/lib64/libgfrpc.so.0(saved_frames_destroy+0xe)[0x7f4f3fd9f89e] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_connection_cleanup+0x91)[0x7f4f3fd9f951] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_notify+0x15f)[0x7f4f3fd9ff1f] ))))) 0-DAOS-client-4: forced unwinding frame type(GF-DUMP) op(DUMP(1)) called at 2016-08-19 18:01:51.886737 (xid=0x144a1d)
[2016-08-19 18:01:52.804480] W [client-handshake.c:1588:client_dump_version_cbk] 0-DAOS-client-4: received RPC status error
[2016-08-19 18:01:52.804504] W [socket.c:620:__socket_rwv] 0-glusterfs: readv on 127.0.0.1:24007 failed (No data available)
[2016-08-19 18:02:02.900863] E [socket.c:2276:socket_connect_finish] 0-glusterfs: connection to 127.0.0.1:24007 failed (Connection refused)

Si nous ne sommes pas sûrs de pouvoir le faire, que devons-nous faire pour résoudre ce problème ?

( information utile : cet article de blog traite de la différence entre glusterfsd et glusterd http://blog.nixpanic.net/2013/12/gluster-and-not-restarting-brick.html )

1voto

dsegleau Points 1460

Oui, vos volumes ne peuvent pas s'auto-guérir sans qu'un nombre requis de nœuds votent sur la question. Et oui, il devrait redémarrer le processus d'auto-guérison lorsque vous démarrez glusterd.service. Cependant, il ne réparera que les fichiers qui ont été marqués comme devant être réparés.

Puisque vous n'avez pas remarqué l'absence du démon glusterd, je suppose que vous ne modifiez pas beaucoup les briques / volumes sur ce cluster. Cependant, les démons glusterfsd sont tous en cours d'exécution, ce qui signifie que l'auto-réparation ne devrait pas être nécessaire pour la plupart.

Le plus important est que l'autoréparation ressemble moins à une lecture de patrouille qu'à un nettoyage sélectif, dans la mesure où elle ne fonctionne que sur les fichiers qui ont été marqués comme sales. En gardant cela à l'esprit, le démarrage du démon glusterd n'est pas un problème.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X