Là où je travaille - nous avons été confrontés au même problème lorsque j'ai commencé à travailler ici. Au fur et à mesure que le nombre de serveurs et de services augmente, vous trouvez de plus en plus de documentation obsolète, et avec cela vient l'attitude inévitable du personnel de ne pas faire confiance à la documentation, au moins la documentation technique sur les noms de serveurs, les groupes de serveurs, les réseaux, etc.
Nous avons commencé à développer un projet open-source appelé hotwire pour aborder cette...
- Système d'inventaire (serveurs, réseaux, etc.)
- Constructions de serveur - RHEL Kickstart, SuSE AutoYaST, (TODO : Debian Preseed, Solaris Jumpstart)
En combinant le système d'inventaire avec le système de construction, nous nous assurons que ce qui se trouve dans la base de données est cohérent avec ce qui se trouve dans nos centres de données, car nous devons maintenant entrer les données dans l'inventaire avant de pouvoir construire les serveurs.
Un programme client (funcwire) est ensuite installé sur tous les serveurs (dans le cadre du processus de construction) et surveille de manière dynamique le matériel du serveur, comme indiqué par Python-dmidecode et ce qui se trouve dans l'inventaire, de sorte que si quelque chose change, les administrateurs le sauront immédiatement.
Nous avons ensuite intégré notre système wiki afin que chaque serveur, rack, projet, modèle de matériel, etc. dans hotwire renvoie directement à la page wiki appropriée.
Nous avons donc "documenté" nos serveurs/réseaux/etc en utilisant hotwire + un wiki (nous utilisons confluence ici, mais tout wiki décent fera l'affaire). (Notez cependant qu'une fois que les serveurs sont construits - hotwire ne les modifie en aucune façon - la gestion continue se fait via cfengine).
6 votes
Aussi : La documentation vous permet de prendre des vacances un jour, ainsi que de protéger l'entreprise si vous êtes trop malade ou blessé pour travailler.