Nous utilisons actuellement un cluster de trois nœuds, sur Gluster 3.6.4.
Sur un de nos nœuds, nous avons remarqué que le démon glusterd est mort.
Mais les démons glusterfsd fonctionnent toujours, et nous pensons que les clients se connectent et récupèrent les données.
Nous avons remarqué que le démon est mort depuis une semaine, et nous ne l'avons pas vu. Les montages distribués NFS ont continué à fonctionner normalement.
Nous aimerions savoir pouvons-nous aller de l'avant et redémarrer le service glusterd ?
Si c'est le cas, cela déclencherait-il un auto-guérison sur tous les volumes ? Car cela poserait un problème de performance.
Les journaux de ce nœud sont les suivants : :
[2016-08-19 18:01:52.804453] E [rpc-clnt.c:362:saved_frames_unwind] (--> /usr/lib64/libglusterfs.so.0(_gf_log_callingfn+0x1e0)[0x7f4f3ffca550] (--> /usr/lib64/libgfrpc.so.0(saved_frames_unwind+0x1e7)[0x7f4f3fd9f787] (--> /usr/lib64/libgfrpc.so.0(saved_frames_destroy+0xe)[0x7f4f3fd9f89e] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_connection_cleanup+0x91)[0x7f4f3fd9f951] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_notify+0x15f)[0x7f4f3fd9ff1f] ))))) 0-DAOS-client-4: forced unwinding frame type(GF-DUMP) op(DUMP(1)) called at 2016-08-19 18:01:51.886737 (xid=0x144a1d)
[2016-08-19 18:01:52.804480] W [client-handshake.c:1588:client_dump_version_cbk] 0-DAOS-client-4: received RPC status error
[2016-08-19 18:01:52.804504] W [socket.c:620:__socket_rwv] 0-glusterfs: readv on 127.0.0.1:24007 failed (No data available)
[2016-08-19 18:02:02.900863] E [socket.c:2276:socket_connect_finish] 0-glusterfs: connection to 127.0.0.1:24007 failed (Connection refused)
Si nous ne sommes pas sûrs de pouvoir le faire, que devons-nous faire pour résoudre ce problème ?
( information utile : cet article de blog traite de la différence entre glusterfsd et glusterd http://blog.nixpanic.net/2013/12/gluster-and-not-restarting-brick.html )