Les réponses précédentes à cette question sont toutes valables, mais elles sont toutes colorées par une réflexion à grande échelle. Si vous n'avez qu'un seul hébergeur, fournissant des sites web dont la défaillance ne tuera pas immédiatement des chatons, vous pouvez penser un peu plus petit. Je vous suggère ce qui suit :
Utilisez logwatch ou un système similaire qui regroupe vos journaux et vous envoie un résumé par courrier. Lisez le résumé au moins tous les deux jours. Utilisez un outil qui broie vos weblogs (par exemple analogique) en un résumé lisible. Si vous voulez être un peu plus ambitieux, utilisez un service en nuage pour surveiller vos sites.
Cependant, l'essence de la maintenance des systèmes reste la même : tuer chaque problème qui se présente mort afin qu'il puisse jamais se reproduire . C'est un point important, car cela signifie qu'il ne devrait pas y avoir d'entretien "régulier".
Maintenant, à plus grande échelle :
L'un des premiers problèmes que vous rencontrez lorsque vous passez à l'échelle supérieure est que quelque chose se casse et que vous ne le savez pas. Cela ne doit plus jamais se reproduire. Il vous faut alors une solution de surveillance à grande échelle. En outre, après avoir constaté que le problème s'est produit sur un hôte, vous voulez empêcher qu'il ne se reproduise sur tout autre hôte. C'est là qu'intervient un système de gestion de la configuration.
Mais vous ne devez pas, à ce stade, vous reposer sur vos lauriers. Tous vos efforts doivent être consacrés à permanent solutions.