59 votes

NVIDIA-SMI a échoué car il n'a pas pu communiquer avec le pilote NVIDIA. Assurez-vous que le dernier pilote NVIDIA est installé et fonctionne.

Je viens d'installer CUDA dans un ordinateur portable comme celui-ci :

sudo apt-get install cuda

Comme dit aquí .

La compilation fonctionne très bien mais quand j'essaie de l'exécuter, j'ai le problème suivant : CUDA error at file.cu:128 code=35(cudaErrorInsufficientDriver) "cudaStreamCreate(&(stream[i]))"

Ma version de nvcc :

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Informations sur la carte graphique :

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

J'ai également installé VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Suivant ce .

Lorsque j'essaie d'exécuter quelque chose sur Bourdon, j'obtiens ceci : optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

Le pilote nvidia ne fonctionne pas.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Il semble que la version nvidia 375 soit installée mais je n'arrive pas à la faire fonctionner.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Et quelques informations sur le conducteur.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Je pense que ça peut être un problème de version du pilote :

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Qu'est-ce que je rate ?

28voto

Phúc Lê Points 389

Si votre nvidia-smi n'a pas réussi à communiquer mais vous avez installé le pilote tant de fois, vérifiez prime-select .

  1. Exécuter prime-select query pour obtenir toutes les options possibles. Vous devriez voir au moins nvidia | intel .
  2. Elija prime-select nvidia .
  3. S'il est écrit nvidia is already selected sélectionnez-en un autre, par ex. prime-select intel puis revenir à nvidia prime-select nvidia
  4. Redémarrez et vérifiez nvidia-smi .

27voto

Jack Chan Points 471

Vous pouvez vouloir installer cuda toolkit. Utilisez la commande suivante pour l'installer.

sudo apt install nvidia-cuda-toolkit

Une fois l'installation terminée, redémarrez la machine. nvidia-smi devrait fonctionner.

17voto

Rodolfo Points 873

J'ai désactivé le démarrage sécurisé et ça a bien fonctionné.

@rod-smith a répondu un autre question plus spécifique expliquant comment faire, il s'agit essentiellement d'une configuration d'installation, mais il a également écrit un bon article sur la façon de le faire en aquí .

10voto

markus Points 119

Comme je ne peux pas commenter la réponse de @Rodolfo ci-dessus (pas assez de réputation), j'ajoute une nouvelle réponse.

Sur ma machine, j'ai dû configurer Boot sécurisé en fonction de mon système d'exploitation. J'ai une carte mère ASUS qui tourne sous Ubuntu 18.04 et j'ai essayé d'installer NVIDIA CUDA 10.1 Update 2 avec le pilote NVIDIA fourni. J'ai rencontré le même problème que celui décrit ci-dessus. Il s'est avéré que, Boot sécurisé a été réglé sur le mode Windows UEFI. En le changeant en Autres OS l'a réparé pour moi.

7voto

w-sky Points 778

La solution de Markus m'a conduit à une meilleure solution. Cela a donc à voir avec Secure Boot, mais il n'est pas nécessaire de le désactiver.

Pour résoudre le problème, il suffit de suivre 3 étapes : Désactivez le pilote Nvidia en choisissant X.Org avec l'outil Pilotes supplémentaires, redémarrez, puis activez le pilote Nvidia, redémarrez et inscrivez la clé dans Secure Boot.

En général, lorsque vous activez le pilote Nvidia avec l'outil Additional Drivers, on vous demande un (nouveau) mot de passe pour Secure Boot. Après le redémarrage, le PC passe aux paramètres Secure Boot et il vous est demandé d'enregistrer une nouvelle clé MOK, qui doit être confirmée par ce même mot de passe. Ensuite, le pilote aura accès à la carte Nvidia et fonctionnera.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X