机器学习|ubuntu 教你如何10分钟搭建深度学习环境

曾经有没有被搭建环境搞得晕头转向?装了无数次什么乱七八糟的死机?各种界面显示不对?一堆的命令要敲?什么进入F1模式啊,什么下载什么乱七八糟的文件啊,nvidia,cudnn,cuda..... 其实基本不需要, 你要下载的就一样,Anaconda。往下看就知道了,首先搞明白驱动driver和cudnn,cuda的区别和关系。
1.驱动和显卡有关系,要根据自己的显卡找到适合自己版本的驱动最重要,不要以为驱动越高越好,你显卡虽然能装上,但是后期还是会出现各种各样头疼的问题,所以合适你的才是最好的
2.cuda 和cudnn是根据显卡版本来确定版本的,不要自己装最高的版本。要根据版本去调整
3.tensorflow 版本不向下兼容,所以需要考虑cuda版本安装。pytorch不需要考虑,一般来说装默认版本就可以,有特殊需求自己调整。
1.安装NVIDIA驱动
一.官方版本(适用于阿里云,各种云。。还有你的显卡是市面上1-2年内出来的) 1). 登录google的tensorflow网站,网址在这里tensorflowGPU安装地址
往下滑,找到自己对应ubuntu系统版本,楼主用的18.04。

# Add NVIDIA package repositories wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub sudo apt-get update wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb sudo apt-get update# Install NVIDIA driver sudo apt-get install --no-install-recommends nvidia-driver-418 # Reboot. Check that GPUs are visible using the command: nvidia-smi# Install development and runtime libraries (~4GB) sudo apt-get install --no-install-recommends \ cuda-10-0 \ libcudnn7=7.6.2.24-1+cuda10.0\ libcudnn7-dev=7.6.2.24-1+cuda10.0# Install TensorRT. Requires that libcudnn7 is installed above. sudo apt-get install -y --no-install-recommends libnvinfer5=5.1.5-1+cuda10.0 \ libnvinfer-dev=5.1.5-1+cuda10.0

copy下这段代码,然后打开终端。
输入命令
vim start.sh

将上面的代码copy进去,保存退出。然后运行start.sh文件开始安装。地址什么的无所谓,中间会让你输入几个y,输入进入回车就完事了。
全部装完之后,重新打开终端
输入nvidia-smi。出现下面这个界面就OK了
机器学习|ubuntu 教你如何10分钟搭建深度学习环境
文章图片

二.带桌面版本 适合带图形界面,官方版本可以纯终端安装还是需要学习一下
看好,打开软件与更新app,
打开附加驱动这个标签,找到适合自己最新的版本,点击安装或者更改应用,等待安装完成就OK了,是不是很简单,哈哈。一定要这么干,千万别去下载,新学者你不懂配置,安装1-2可能还装不好,就这个,最简单。装好后,重新输入nvidia-smi,就ok
机器学习|ubuntu 教你如何10分钟搭建深度学习环境
文章图片

【机器学习|ubuntu 教你如何10分钟搭建深度学习环境】ps,没有出现驱动的,进入终端,sudo apt-get update 更新一下
还有记得进入第一个标签软件与驱动,将源改成国内源,我一般使用阿里源

好了,驱动安装好了。我们进入下一个环节。
2.安装Anaconda。(没错,是安装Anaconda,而不是cuda,cudnn) 我要下班了,剩下的下次再写,先快速写一个最简单的办法
1.网上下载Anaconda,去官网,下载速度很快。默认安装直接安装好。可以参考其他教程安装Anaconda。
2,安装完之后,打开你的终端前面会出现(bash)这个标志。去其他地方找一个别人导出来的虚拟环境。后缀是.yaml 结尾的文件。然后输入
conda env create -f environment.yaml#最后这个换成自己的yaml文件的文件名

安装好后。你会发现cudnn,cuda也安装好了。在你的虚拟环境下面。要使用这个虚拟环境
首先conda env list。查看所有的环境
然后输入source activate xxx,xxx是你上面找到conda下面的环境名称,安装完成。
conda好处就是你可以无限的换环境,安装多个环境,安装多个不同版本的tensorflow,cuda,cudnn,都不会影响。
附上我自己目前在用的yaml文件。cuda9.0,cudnn7.3.tensorflow1.11足够应付99%的gitghub代码。适合自己的才是最好的,还是那句话。
剩下的详细安装下次有时间再来继续补充,不使用yaml的,其实也很简单。就是自己进入虚拟环境。conda install xxx 或者 pip install xxx 一个一个安装就完事了
我的yaml上传申请通过了,下面是地址,有需要的可以自己去下载下下载地址

    推荐阅读