NVIDIA-SMI抛出了这个错误:
NVIDIA-SMI因为无法与NVIDIA驱动程序通信而失败 . 确保已安装并运行最新的NVIDIA驱动程序
我按照提到的步骤here清除了NVIDIA并再次安装 .
我的设备规格如下:
带特斯拉M40的服务器
在Ubuntu 16.04上运行
内核版本Linux 4.4.0-116-通用x86_64
司机:nvidia-384
有人可以帮忙解决错误吗?
尝试
从here下载驱动程序
sudo apt-get purge nvidia* - 删除当前安装
sudo apt-get purge nvidia*
dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_amd64.deb - 安装您之前下载的内容
dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda-drivers
在此之后,继续并重新启动计算机 . 当它再次启动时, nvidia-smi 命令应该顺利运行
nvidia-smi
该问题可能是由于4.4.0-116补丁中已确认的"bug" . 我遇到了与nvidia-390相同的问题 . 如果您仍想使用较新版本的Nvidia驱动程序,我按照说明here设法解决了问题 . 通常,请使用以下步骤:
如果无法登录桌面并进入故障循环,请按ctrl alt F1登录命令行模式 .
检查gcc的版本是否过时,如果是,请更新它: gcc --version
gcc --version
如果gcc版本为5,请先卸载nvidia驱动程序: sudo apt-get remove nvidia-390
sudo apt-get remove nvidia-390
清除4.4.0-116内核: sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
重新安装内核: sudo apt-get install linux-generic linux-signed-generic
sudo apt-get install linux-generic linux-signed-generic
重新安装nvidia-390: sudo apt-get install nvidia-390
sudo apt-get install nvidia-390
检查 modinfo nvidia-390 -k 4.4.0-116-generic | grep vermagic 是否解决了问题,请确保 retpoline 此时显示
modinfo nvidia-390 -k 4.4.0-116-generic | grep vermagic
重启: sudo reboot
sudo reboot
希望这适用于您和遇到同样问题的其他人 . 论坛上的帖子节省了我的周末 .
2 回答
尝试
从here下载驱动程序
sudo apt-get purge nvidia*
- 删除当前安装dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_amd64.deb
- 安装您之前下载的内容sudo apt-get update
sudo apt-get install cuda-drivers
在此之后,继续并重新启动计算机 . 当它再次启动时,
nvidia-smi
命令应该顺利运行该问题可能是由于4.4.0-116补丁中已确认的"bug" . 我遇到了与nvidia-390相同的问题 . 如果您仍想使用较新版本的Nvidia驱动程序,我按照说明here设法解决了问题 . 通常,请使用以下步骤:
如果无法登录桌面并进入故障循环,请按ctrl alt F1登录命令行模式 .
检查gcc的版本是否过时,如果是,请更新它:
gcc --version
如果gcc版本为5,请先卸载nvidia驱动程序:
sudo apt-get remove nvidia-390
清除4.4.0-116内核:
sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
重新安装内核:
sudo apt-get install linux-generic linux-signed-generic
重新安装nvidia-390:
sudo apt-get install nvidia-390
检查
modinfo nvidia-390 -k 4.4.0-116-generic | grep vermagic
是否解决了问题,请确保 retpoline 此时显示重启:
sudo reboot
希望这适用于您和遇到同样问题的其他人 . 论坛上的帖子节省了我的周末 .