J'utilise Ubuntu 10.04 et j'essaie d'installer Sun Grid Engine à partir du répertoire Ubuntu. Il fonctionne sur une seule machine, je peux soumettre des travaux, etc. Mais je n'arrive pas à le faire fonctionner avec d'autres machines. J'ai ajouté un autre hôte d'exécution et installé gridengine-client gridengine-common gridengine-exec
mais il n'arrive pas à communiquer avec le maître. J'ai même désactivé tous les pare-feu pour m'assurer qu'il ne s'agit pas d'un problème.
Quand j'essaie qstat -f
sur le nœud maître, j'obtiens :
queuename qtype resv/used/tot. load_avg arch states
---------------------------------------------------------------------------------
standard@neuron1 BIP 0/0/2 0.04 lx26-amd64
---------------------------------------------------------------------------------
standard@neuron2 BIP 0/0/2 -NA- -NA- au
Lorsque je redémarre deamon sur le nœud neuron2, j'obtiens :
error: can't find connection
error: can't get configuration from qmaster -- backgrounding
Quand j'essaie d'exécuter qstat -f
à partir du nœud n2 (neurone2) j'obtiens :
error: commlib error: access denied (server host resolves destination host "n1" as "neuron1")
error: unable to contact qmaster using port 6444 on host "n1"
J'ai deux noms d'hôte pour cette machine et il semble que la première erreur y soit pour quelque chose, mais il serait étrange qu'elle cause ce genre de problème. J'ai essayé telnet n1 6444
et il se connecte.
Quelqu'un sait-il ce qui se passe ici ? Est-ce que je rate quelque chose ?