win10设置CUDA+Tensorflow2.0的一些履历
如何构建阿里小蜜算法模型的迭代闭环?
问题形貌
网上已许多关于设置CUDA的文章,本身这篇文章只是个大抵的装置步骤,文章重点是装置和设置的一些细节,而至于详细的步骤(比方软件怎样下,环境变量怎样配等)请自行搜刮,我置信人人也不会只参考一篇文章,若有斧正或疑问请批评留言,感谢!
- 装置 tensorflow-cpu
- 装置 tensorflow-gpu-2.0,并设置 CUDA
- 编译 Nvidia Samples
- 环境:Win10;GPU--Nvidia 940MX
装置 tensorflow-cpu-2.0
- 装置 anaconda
- 激活 conda 环境
- 发起新建一个环境,如
conda create -n env_name python=3.7
。 - 新环境的 python 版本和要装置的 tensorflow 的版本是相干的,所以假如要装置最新版的 tensorflow-2.0,须要运用 python3.7 及以上。
- pip 的更新和换源自行搜刮即可。Linux 的 pip 更新见本身的另一篇文章。
- 发起新建一个环境,如
- 装置 tensorflow-2.0
- 最简朴的装置要领是运用 pip 装置。如许的问题是:运用的时刻会有 AVX Warning,缘由是:pip 要领会供应的适配性最高的装置包,然则当前 CPU 支撑更高效的 tensorflow 运用体式格局(AVX),所以才会有这个 Warning
- 解决方案是下载官方 tensorflow 的源码,从新编译。固然网上也供应了编译好了的版本,自行搜刮下载,装置即可。
- 检测是不是装置胜利
- 能够在 python 中输入以下代码,能一般运转即可
import tensorflow as tf a = tf.constant(1) b = tf.add(a, a) print(b)
装置 tensorflow-gpu-2.0
- 体系搜检
- 电脑必需带N卡,且装置了驱动。发起装置最新的N卡驱动,如许做的缘由是支撑的CUDA的版本也响应的较高。
- 翻开体系的 Nvidia控制面板,点击左下角 体系信息 -- 组件 -- NVCUDA.DLL,本身的是 NVIDIA CUDA 10.2.115 driver. 这代表着 最高的CUDA版本是 10.2.115
- 软件预备
- 依据查到的这个版本,搜刮下载CUDA。不过当时本身装置的时刻,为了稳定性斟酌,运用的是 CUDA10.0,所以请依据本身状况合理斟酌。
- 下载 CUDNN。这个须要运用 Nvidia 的账号。请注重:CUDNN 和 CUDA 是婚配的,一定要下载对应的最新版本。比方 V7.6.6 和 V7.6.4 都是 CUDA10.0 的CUDNN,那末挑选第一个。
- 本身第一遍装置的时刻是依据其他文章所言的“版本对应”,然则测试的时刻
import tensorflow
报错,找不到 cudnn64_7.dll文件 。假如你在今后的测试中也是这个毛病,请斟酌是不是是 CUDNN 的版本错了,或者是CUDNN的装置位置错了。
- 装置 CUDA & CUDNN
- 挑选 自定义装置 ;假如不想装置在 C盘,然则为了今后运用方便,能够在D盘等其他位置新建响应目次,比方:
D:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.0
- 假如没有刚需,像是 NVDIA PHYSX,NVIDIA GEFORCE EXPERIENCE如许的软件没有必要装置;个中** VS Integration 不要勾选,NVIDIA 驱动也不要勾选**,由于我们已装置好了驱动。
- 将 CUDNN 复制到响应的 CUDA 装置文件位置。
- 设置环境变量,测试CUDA是不是装置胜利等善后工作置信你也能在其他文章见到。
- 挑选 自定义装置 ;假如不想装置在 C盘,然则为了今后运用方便,能够在D盘等其他位置新建响应目次,比方:
- 在 conda 环境中装置 tensorflow-gpu 版本,测试可否运用 N卡盘算
编译 Nvidia Samples
- 装置 VS2017,装置中注重挑选装置 Windows 10 SDK(10.0.15063)
- 最主要的一步 运用解压缩软件翻开 CUDA.exe ,解压 MSBuildExtensions 这个文件夹出来(这就是上一步没有挑选装置 vs integration的缘由),将这个文件夹下的文件复制到 vs2017 的装置目次,本身的是
D:Program Files (x86)Microsoft Visual Studio2017CommunityCommon7IDEVCVCTargetsBuildCustomizations
- 翻开 Samples_vs2017.sln,能够在项目上右键--生成,假如报错可检察10.0.15063这个 SDK 版本是不是装置胜利。生成胜利的解决方案(.exe文件)能够在 ..SamplesV10.0binwin64Debug 这个文件夹下检察
相干资本和其他问题
- 关于 AVX 问题,人人能够在这个站点高低载到对应的 .whl 文件,运用 pip install xxx.whl 即可装置。请注重:这个站点的装置包关于 CUDA 和 CUDNN 的版本是有划定的,一定要对应好!
【5min+】 设计模式的迷惑?Provider vs Factory