首页 文章

错误:NVIDIA-SMI失败,因为它无法与NVIDIA驱动程序通信

提问于
浏览
7

NVIDIA-SMI抛出了这个错误:

NVIDIA-SMI因为无法与NVIDIA驱动程序通信而失败 . 确保已安装并运行最新的NVIDIA驱动程序

我按照提到的步骤here清除了NVIDIA并再次安装 .

我的设备规格如下:

  • 带特斯拉M40的服务器

  • 在Ubuntu 16.04上运行

  • 内核版本Linux 4.4.0-116-通用x86_64

  • 司机:nvidia-384

有人可以帮忙解决错误吗?

2 回答

  • 4

    尝试

    • here下载驱动程序

    • sudo apt-get purge nvidia* - 删除当前安装

    • dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_amd64.deb - 安装您之前下载的内容

    • sudo apt-get update

    • sudo apt-get install cuda-drivers

    在此之后,继续并重新启动计算机 . 当它再次启动时, nvidia-smi 命令应该顺利运行

  • 6

    该问题可能是由于4.4.0-116补丁中已确认的"bug" . 我遇到了与nvidia-390相同的问题 . 如果您仍想使用较新版本的Nvidia驱动程序,我按照说明here设法解决了问题 . 通常,请使用以下步骤:

    • 如果无法登录桌面并进入故障循环,请按ctrl alt F1登录命令行模式 .

    • 检查gcc的版本是否过时,如果是,请更新它: gcc --version

    • 如果gcc版本为5,请先卸载nvidia驱动程序: sudo apt-get remove nvidia-390

    • 清除4.4.0-116内核: sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic

    • 重新安装内核: sudo apt-get install linux-generic linux-signed-generic

    • 重新安装nvidia-390: sudo apt-get install nvidia-390

    • 检查 modinfo nvidia-390 -k 4.4.0-116-generic | grep vermagic 是否解决了问题,请确保 retpoline 此时显示

    • 重启: sudo reboot

    希望这适用于您和遇到同样问题的其他人 . 论坛上的帖子节省了我的周末 .

相关问题