J'ai un serveur uniquement terminal fonctionnant dans une machine virtuelle (je ne suis pas celui qui l'a configuré). J'ai accès à un GPU Tesla T4 pour exécuter du Machine Learning. Le problème est que même si le pilote Nvidia 440 recommandé est installé, il semble avoir des problèmes de communication avec la carte :
user1@server1:~/log$ nvidia-smi
NVIDIA-SMI a échoué car il n'a pas pu communiquer avec le pilote NVIDIA. Assurez-vous que le dernier pilote NVIDIA est installé et en cours d'exécution.
Mais la carte est correctement installée et apparaît même dans lspci :
02:02.0 Contrôleur 3D: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)
J'ai essayé de réinstaller le pilote et de faire des mises à jour, mais de toute façon, le pilote ne semble pas démarrer.
Quel est un bon moyen de diagnostiquer le problème ?