5 votes

Rapport ZFS (sur FreeBSD et Linux via ZoL)

En tant qu'utilisateur de mdadm de longue date, je venais juste de faire face à une erreur de disque et je me suis souvenu que j'avais configuré un rapport automatique par e-mail pour mdadm sur les erreurs de disque.

Par conséquent, j'ai juste eu à insérer mon adresse e-mail dans /etc/mdadm/mdadm.conf

MAILADDR someone@exaplme.org

Mais j'ai vraiment manqué ça sur FreeBSD. Et comme mon RAID6 ZFS tourne depuis plus de six mois maintenant, je me demandais ce qui se passerait si un disque subissait une panne?

Je n'ai jamais configuré d'adresse e-mail externe. Existe-t-il un moyen facile de réaliser et de tester cela?

Comme pour mdadm:

sudo mdadm –monitor –scan –test

Et comment le ferais-je sur Linux avec ZoL (ZFS sur Linux)?

MODIFICATION: Désolé, je voulais dire Rapport automatique, pas planifié.

Je sais que j'aurais pu construire un script et analyser zpool status -X toutes les minutes. mais je pense que ce n'est pas une approche très élégante pour résoudre le problème de reporting. Il serait préférable d'être averti immédiatement en cas de panne de disque (comme mdadm)

MODIFICATION[2]: Merci pour vos conseils, mais maintenant je suis coincé avec quelques problèmes de script, quelqu'un pourrait-il m'aider avec mon problème de boucle for dans /bin/sh ici -> PASTEBIN

MODIFICATION[3]: J'ai résolu mon problème de boucle for. :) (mise à jour dans PASTEBIN)

D'autres conseils pour mon script?

3voto

ewwhite Points 193555

Exécutez un script régulier (cron) qui vérifie la sortie de zpool status -x. À long terme, le projet ZFS sur Linux travaille vers cela sous la forme d'un démon d'événement. Les systèmes dérivés de Solaris avaient accès à l'Architecture de Gestion des Erreurs.

En ce qui concerne les rapports automatisés, même des solutions commerciales comme NexentaStor utilisent des vérifications programmées. Il n'y a rien de mal à cela.

entrer la description de l'image ici


Quelque chose comme ceci :

[root@mdmarra ~]# zpool status -x
tous les pools sont sains

Par opposition à quelque chose de terrible comme :

[root@mdmarra ~]# zpool status -x
  pool: vol1
 state: UNAVAIL
status: Un ou plusieurs appareils sont défectueux en réponse à des échecs d'E/S.
action: Assurez-vous que les appareils concernés sont connectés, puis exécutez 'zpool clear'.
   voir: http://www.sun.com/msg/ZFS-8000-JQ
 scan: le scrub a réparé 0 en 1h15m avec 0 erreurs le Dimanche 28 Juillet à 21:15:10 2013
config:

        NAME          STATE     READ WRITE CKSUM
        vol1          UNAVAIL      0     0     0  réplicas insuffisantes
          mirror-0    DEGRADÉ      0     0     0
            c1t0d0    UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t0d0    EN LIGNE     0     0     0
          mirror-1    DEGRADÉ      0     0     0
            c1t1d0    UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t1d0    EN LIGNE     0     0     0
          mirror-2    DEGRADÉ      0     0     0
            spare-0   UNAVAIL      0     0     0  réplicas insuffisantes
              c1t2d0  UNAVAIL      0     0     0  ne peut pas ouvrir
              c2t8d0  UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t2d0    EN LIGNE     0     0     0
          mirror-3    DEGRADÉ      0     0     0
            c1t3d0    UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t3d0    EN LIGNE     0     0     0
          mirror-4    DEGRADÉ      0     0     0
            c1t4d0    UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t4d0    EN LIGNE     0     0     0
          mirror-5    UNAVAIL      0     0     0  réplicas insuffisantes
            c1t5d0    UNAVAIL      0     0     0  ne peut pas ouvrir
            c2t5d0    DÉFAILLI    0     0     0  trop d'erreurs
        cache
          c3t5d0      EN LIGNE     0     0     0
        pièces de rechange
          c2t8d0      UNAVAIL   ne peut pas ouvrir

erreurs: Aucune erreur de données connue

3voto

ptman Points 26336

Essayez zfswatcher, ça fonctionne vraiment bien pour moi.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X