3 votes

Problème de Mok Manager / Pilote NVIDIA après l'installation de CUDA

Lors de l'installation de CUDA 10.1 (via le deb réseau) sur Ubuntu 18.10, on m'a demandé de configurer un mot de passe pour Mok. Lorsque j'ai redémarré mon ordinateur, j'ai été accueilli par l'écran bleu du gestionnaire Mok, où je suppose que je devais utiliser le mot de passe précédemment configuré. Cependant, au lieu de choisir Enroll MOK, j'ai continué par accident avec le démarrage.

Après le démarrage, nvcc --version a renvoyé la sortie correcte (10.1) mais lorsque j'ai essayé de vérifier mes pilotes en utilisant nvidia-smi, j'ai obtenu :

NVIDIA-SMI a échoué car il ne pouvait pas communiquer avec le pilote NVIDIA. Assurez-vous que le dernier pilote NVIDIA est installé et en cours d'exécution.

J'ai pensé que c'était le résultat de l'omission de l'enrôlement MOK, donc j'ai essayé de redémarrer mais l'écran bleu MOK n'est pas réapparu. J'ai essayé de suivre certains guides dans le but de revenir à cet écran, mais je n'ai pas réussi. De plus, de manière intéressante, maintenant en exécutant nvcc--version renvoie

Commande 'nvcc' non trouvée, mais peut être installée avec :

sudo apt install nvidia-cuda-toolkit

C'est particulièrement étrange car un exécutable nvcc peut être trouvé dans /usr/local/cuda/bin. Je ne suis pas sûr de la marche à suivre à partir de là. J'ai restreint les options suivantes :

  1. Désactiver le démarrage sécurisé (apparemment cela peut perturber les pilotes nvidia). Je ne sais pas si cela aidera ou aggravera la situation. Je ne sais pas non plus comment le faire sur mon système.
  2. D'une manière ou d'une autre, revenir à l'écran bleu MOK et choisir l'option d'enrôlement MOK. J'ai essayé de le faire mais je n'ai pas réussi.
  3. Supprimer tout ce qui est lié à nvidia de mon ordinateur et réinstaller les pilotes nvidia, puis réinstaller CUDA. Je ne suis pas sûr si cela est suffisant ou s'il y a un problème plus profond.
  4. Il est possible que le problème/la solution correct(e) soit tout à fait autre chose, auquel cas l'une des options ci-dessus pourrait aggraver le problème.

S'il est utile, voici la sortie de ubuntu-drivers devices (à l'exclusion du modalias) :

constructeur   : NVIDIA Corporation
modèle    : GM107M \[GeForce GTX 960M\]
pilote   : nvidia-driver-418 - tiers gratuit recommandé
pilote   : nvidia-driver-390 - non-libre de la distribution
pilote   : xserver-xorg-video-nouveau - intégré libre de la distribution 

Je suis actuellement sur un système à double amorçage avec Windows 10 et Ubuntu 18.10 (ce qui pourrait avoir des implications pour ma situation MOK/GRUB). Selon lspci -nnk | grep -i vga -A3 mon pilote graphique Intel est actuellement utilisé. Voici la sortie de lspci | grep -i nvidia :

01:00.0 Contrôleur 3D : NVIDIA Corporation GM107M \[GeForce GTX 960M\] (rev a2)

Mon objectif final était de configurer CUDA et cuDNN pour PyTorch. Je serais très reconnaissant pour toute aide sur la manière de progresser.

4voto

Andy Jones Points 141

J'ai aussi raté l'écran MOK et il n'est pas apparu au prochain redémarrage. La solution était d'exécuter

sudo mokutil --import /var/lib/shim-signed/mok/MOK.der

à partir d'un terminal. Vous serez invité à choisir un mot de passe, puis lorsque vous redémarrez, l'écran d'inscription au MOK réapparaîtra. Choisissez de vous inscrire, choisissez la clé et saisissez à nouveau le mot de passe.

Crédit à ce post sur les forums NVIDIA pour m'avoir aidé à trouver la clé.

3voto

squared Points 61

Il s'est avéré que la solution était assez simple.

"Disparition" de nvcc :

J'avais ajouté la variable de chemin vue ci-dessous à mon instance de terminal actuelle, mais je ne l'avais pas ajoutée à ~/.bashrc (cela signifie que nvcc ne fonctionnait que dans cette instance de terminal, d'où le problème de "disparition" plus tard). Il peut également y avoir un fichier ~/.profile, mais il semble que bashrc soit lu en premier s'il est présent, donc vous devrez peut-être l'ajouter à un fichier différent en fonction des fichiers disponibles. C'est une bonne ressource si vous n'êtes pas sûr : https://stackoverflow.com/questions/14637979/how-to-permanently-set-path-on-linux-unix

export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}

Problèmes de pilotes :

J'ai résolu tous mes problèmes de pilotes en désactivant le Secure Boot. Dans mon cas, je n'avais pas besoin d'appuyer sur une touche pendant le démarrage pour ouvrir les paramètres liés à cela. Au lieu de cela, lorsque je démarre et arrive à l'écran GRUB pour choisir mon OS, je choisis les Paramètres système. Ici, le réglage du Secure Boot est disponible. Il suffit de le désactiver, d'appliquer les changements et de quitter. Cela peut être une astuce, mais nvidia-smi fonctionne correctement maintenant, et j'ai vérifié que PyTorch est connecté à CUDA et utilise correctement le GPU. Je suis assez sûr que cela signifie également que je n'ai plus besoin de m'inquiéter de cet écran MOK Enroll.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X