Sur un cluster, un travail est soumis pour s'exécuter sur N CPUs. qstat -f ne montre pas combien de ressources CPU le travail utilise autre que le temps. Comment vérifier si 100% de la puissance de chaque CPU est utilisée? Il est essentiel de déterminer les ressources requises pour la tâche.
Réponse
Trop de publicités?
Utilisateur non enregistré
Points
0
Cette documentation a donné la solution, utilisez pdsh pour voir la sortie de 'top' sur le nœud, ou utilisez la commande 'all' si un travail s'exécute sur plusieurs nœuds.
pdsh -j 123456 top -b -n 1 -u usr1234