- 之前有在阿里云GPU服务器上弄过: 点击查看, 这里从装
Nvidia
开始一、 安装Nvidia驱动
1.1 查找需要安装的Nvidia版本
1.1.1 官网
- 官网上查找: https://www.nvidia.com/Download/index.aspx?lang=en-us
- 这里是
GeForce GTX 1080 TI
- 如下图,推荐
410
版本的
- 这里是
1.1.2 命令行查看推荐驱动
查看驱动:
ubuntu-drivers devices
, 如下图123456789101112ubuntu@ubuntu-System-Product-Name:~$ ubuntu-drivers devices== cpu-microcode.py ==driver : intel-microcode - distro free== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==vendor : NVIDIA Corporationmodalias : pci:v000010DEd00001B06sv00001458sd0000374Dbc03sc00i00driver : nvidia-410 - third-party free recommendeddriver : nvidia-384 - distro non-freedriver : xserver-xorg-video-nouveau - distro free builtindriver : nvidia-390 - third-party freedriver : nvidia-396 - third-party free注意这里添加了
ppa
, 若是没有,可能最新的只有nvidia-384
, 但是若想安装cuda-9.0
需要大于384.81
, 不然后面安装tensorflow-gpu
之后也会报错
- 添加
ppa
:sudo add-apt-repository ppa:graphics-drivers/ppa
(注意联网,去掉代理)sudo apt update
- 然后执行
ubuntu-drivers devices
就可以看到如上的结果 - 安装:
- 可能需要的依赖:
sudo apt install dkms build-essential linux-headers-generic
- 有些可能需要禁用
nouveau
模块,查看:https://blog.csdn.net/u012235003/article/details/54575758 sudo apt-get install linux-headers-$(uname -r)
sudo apt install nvidia-410
- 重启机器
- 可能需要的依赖:
- 查看:
nvidia-smi
- 显示如下结果
|
|
- 跑个程序的使用情况
|
|
二、安装cuda
- 官网: https://developer.nvidia.com/cuda-toolkit-archive
- 选择想要安装的版本,这里选择的是
cuda-9.0
, 下载 - 安装
chmod +x cuda_9.0.176_384.81_linux-run
sudo ./cuda_9.0.176_384.81_linux-run
- 根据提示安装选择即可
- 添加环境变量
vim ~/.bashrc
- 加入环境变量
|
|
测试1
nvcc -V
- 如下图,版本为
V9.0.176
12345(wangyongzhi_ml) ubuntu@ubuntu-System-Product-Name:~/wangyongzhi/software$ nvcc -Vnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2017 NVIDIA CorporationBuilt on Fri_Sep__1_21:08:03_CDT_2017Cuda compilation tools, release 9.0, V9.0.176
测试2
- 如果上面安装过程中选择了安装
Examples
, 会在~
文件夹下生成测试NVIDIA_CUDA-9.0_Samples
的文件 - 进入:
cd NVIDIA_CUDA-9.0_Samples
make
- 进入
NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release
文件夹- 执行:
./deviceQuery
, 可以看到类似如下信息
- 执行:
- 如果上面安装过程中选择了安装
|
|
三、安装cudnn
- 官网:https://developer.nvidia.com/rdp/cudnn-download
- 选择
cuda
对应的版本, 我的选择如下图
- 安装
tar -zxvf cudnn-9.0-linux-x64-v7.3.1.20.tgz
- 将解压得到的
cuda
文件夹下的内容拷贝到对应的/usr/local/cuda-9.0
文件夹下即可
四、安装Anaconda和tensorflow-gpu
- 官网: https://www.anaconda.com/download/#linux
- 下载安装即可,我这里选择的是
python3.7
版本 - 安装之后添加到环境变量:
|
|
创建虚拟环境,防止污染他人使用环境
conda create -n xxx python-3.6
conda install tensorflow-gpu
测试
|
|
- 打印如下信息:
|
|
五、 多个cuda版本切换
安装
cuda-9.0
会在/usr/local/
目录下- 如下图,它会创建一个软连接指向了
/usr/local/cuda-9.0/
12345678910111213141516(wangyongzhi_ml) ubuntu@ubuntu-System-Product-Name:/usr/local$ ll总用量 48drwxr-xr-x 12 root root 4096 10月 25 14:51 ./drwxr-xr-x 13 root root 4096 10月 25 09:39 ../drwxr-xr-x 2 root root 4096 4月 21 2016 bin/lrwxrwxrwx 1 root root 19 10月 25 00:41 cuda -> /usr/local/cuda-9.0/drwxr-xr-x 19 root root 4096 10月 25 14:52 cuda-10.0/drwxr-xr-x 18 root root 4096 10月 25 00:41 cuda-9.0/drwxr-xr-x 2 root root 4096 4月 21 2016 etc/drwxr-xr-x 2 root root 4096 4月 21 2016 games/drwxr-xr-x 2 root root 4096 4月 21 2016 include/drwxr-xr-x 4 root root 4096 4月 21 2016 lib/lrwxrwxrwx 1 root root 9 10月 24 14:52 man -> share/man/drwxr-xr-x 2 root root 4096 4月 21 2016 sbin/drwxr-xr-x 8 root root 4096 4月 21 2016 share/drwxr-xr-x 2 root root 4096 4月 21 2016 src/
- 如下图,它会创建一个软连接指向了
所以正常安装
cuda
其他版本,然后创建软连接指向对应的版本即可12sudo rm -rf cudasudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
Reference
- https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
- https://blog.csdn.net/u012235003/article/details/54575758
- 本文链接: http://lawlite.me/2018/10/25/Ubuntu16.04安装Nvidia驱动cuda, cudnn和tensorflow-gpu/
- 版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 许可协议 。转载请注明出处!