J'ai des problèmes avec quelques boîtes linux qui utilisent xen. Ils agissent en tant qu'hyperviseurs et sont connectés au SAN en utilisant une configuration multipath pour fournir du stockage aux vms invités.
De temps en temps, l'un des deux chemins échoue, mais il peut être rapidement rétabli en courant :
multipath
multipath -ll
Je dois aller au fond du problème et trouver pourquoi cela se produit. J'ai remarqué que cela ne se produit pas lorsque l'hyperviseur n'est pas trop occupé (au niveau du réseau et des E/S). J'ai également éliminé un éventuel problème matériel en déplaçant tous les services sur un nouveau châssis identique. J'ai recueilli quelques journaux système qui peuvent indiquer un problème de module NIC ou un problème de noyau et l'échec du multipath pourrait n'être qu'un résultat de ceci ! !!?? Voici un extrait du journal qui apparaît toujours lorsque le multipath tombe en panne :
kernel: BUG: soft lockup - CPU#0 stuck for 60s! [swapper:0]
kernel: BUG: soft lockup - CPU#2 stuck for 60s! [events/2:76]
Je vais coller les logs complets à la fin de ce post pour en faciliter la lecture. Maintenant, un peu plus sur mon installation :
- L'accès à l'Internet est configuré sur eth0 et eth2 (bonded).
- L'accès SAN multipath est configuré sur eth1 et eth3.
Serveur :
-
Supermicro SuperServer 6016T-NTRF
-
Processeur Intel(R) Xeon(R) E5645
-
Intel Corporation 82576 Gigabit Network
-
CentOS version 5.7 (Final) 2.6.18-274.18.1.el5xen
-
le nom du fichier : /lib/modules/2.6.18-274.18.1.el5xen/kernel/drivers/net/igb/igb.ko
-
version : 3.0.6-k2-1
Si vous avez besoin de plus de détails, n'hésitez pas à nous contacter. Toute aide sera très appréciée.