J'utilise Solaris SMF pour surveiller, signaler et redémarrer automatiquement les processus après un crash sur les systèmes Solaris. Y a-t-il quelque chose de similaire, soit en tant que logiciel source ouvert portable, soit dans le noyau Linux? Pour ceux qui ne sont pas familiers avec SMF, voici la fonctionnalité qui m'intéresse :
Le système exécute un script pour démarrer le service, puis garde une trace de tous les processus qu'il a créés, même s'ils créent leur propre groupe de processus. S'ils meurent tous, il exécute un script d'arrêt, puis le script de démarrage à nouveau.
Effectuer automatiquement un cycle d'arrêt/démarrage sur commande en attendant que tous les processus s'arrêtent avant d'initier le démarrage.
Un arbre de dépendance des services avec des règles de gestion des crash. Par exemple, le service "A" doit être en cours d'exécution avant que le service "B" puisse démarrer. Si "A" s'arrête, alors "B" doit être arrêté.
Obtenez une liste des services qui ne sont actuellement pas en cours d'exécution en raison de l'échec de leur script de démarrage.