深度学习装机指南：我们为普通青年和土豪准备了两套方案

2018-01-09 2119

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

深度学习，始于装机。

研究深度学习该买一台什么样的电脑？我的笔记本能满足需求吗？

量子位请来小伙伴，为当前的深度学习网络训练提供了两套最新的装机方案。

第一套方案是预算为8000元的深度学习标准型台式机，这款台式机能够运行市面上几乎所有的大型游戏，完美全特效不掉帧，同时还可以顺便玩一下深度学习应用，例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。

第二套方案是预算为20000左右的土豪版台式机，这款台式机为工作站主板，极其稳定，能够长时间开机稳定训练。

话不多说，直接上配置。

第一套·标准型

配件名	品牌型号	数量	价格
机箱	美商海盗船 400C 中塔侧透机箱	1	749 京东
主板	华硕 Z170I PRO GAMING Mini-ITX主板	1	1299 天猫
CPU	英特尔 I7 7700K 酷睿第7代处理器	1	1799 - 2799
内存	美商海盗船复仇者8G DDR4 2400	2	798 京东
SSD	三星850 EVO 250G M.2 固态硬盘	1	699 京东
机械硬盘	西部数据蓝盘 2TB 64M 台式机硬盘	1	499 京东
GPU	七彩虹GTX1060 6G超频版游戏显卡	1	1799 天猫
电源	美商海盗船VS650 额定650w电源	1	399 京东
CPU风冷器	乔思伯 HP625日食红 CPU散热器	1	159 京东
显示屏	AOC I2279VW 21.5英寸显示器	1	699 天猫

总计：8200 - 9200元（不包括显示器）

第二套·土豪版

配件名	品牌型号	数量	价格
机箱	美商海盗船 600C 中塔侧透机箱	1	999 京东
主板	华硕 /Asus X99-M WS/USB 3.1主板	1	2599 天猫
CPU	英特尔 I7 6800K 酷睿第7代处理器	1	3399 天猫
内存	美商海盗船复仇者16G DDR4 3000	2	1878 京东
SSD	三星960 EVO 500G M.2 NVMe SSD	1	1799 京东
机械硬盘	西部数据黑盘 2TB 64M台式机硬盘	1	999 京东
GPU	NVIDIA TITAN X 12G Pascal（可替1080TI）	1	9699 京东
电源	美商海盗船额定750W金牌电源	1	969 京东
CPU散热器	美商海盗船H80i V2 CPU水冷散热器	1	759 京东
显示屏	AOC I2279VW 21.5英寸显示器	1	699 天猫

总计：23100元（不包括显示器）

下面我们对这些配件分别进行分析：

1. 机箱

机箱的选取需要考虑两个问题：

1. 主板、CPU散热器是否能够装得下；

2. 整体散热性和稳定性是否满足需求。

先说标准版配置，在进行入门研究只用一块显卡的情况下，散热不存在问题，推荐海盗船400C的中塔机箱，小巧稳定。

对于土豪版配置，由于采用了华硕的M款工作站主板，后期具有增加到两块显卡的可能性，适当地增大机箱的空间，建议选海盗船600C中塔机箱。

如果有上四路TITAN X的打算，那么需要选取散热条件更好、空间更大的机箱，可以用跟Nvidia DevBox同款的机箱，即Corsair Carbide Air 540，也可以是追风者PK515E或515ETG中塔机箱，个人觉得后者的颜值高一些，这两款都可以用来组装具有四路TITAN X的深度学习工作站。

2. 主板

主板的基本要求是稳定性足够好，具有较多的PCI-E Gen3 x16接口。

由于标准版配置只计划选用一块显卡，故选取了游戏级别的华硕 Z170I主板，该款主板只具有一个PCI-E Gen3 x16接口。

当按工作站要求来选择主板时，有两个指标：最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板，分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。

所以，我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板，可以扩展到两路TITAN X或者是GTX 1080 TI。

具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板，当有计划上四路TITAN X打算的话，主板可以选用Asus X99-E WS/USB 3.1工作站大板，避免由于后期扩展显卡但是主板存在局限性的问题。

3. CPU

选择CPU，主要是观察三个指标：主频，核心数和总线带宽。

在第一套标准配置中，由于是单机单卡，所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799，质保一年；盒装价格为2799，质保三年。据销售称，这两者没有实质性的差异，可根据自身需求进行选择。

在单机多卡进行训练时，总线带宽是瓶颈，所以CPU的PCI-e lane越多越好，一般消费级的CPU，PCI-e总线根数是16, 28或40，最大就是40，进一步提升带宽就需要上服务器CPU或者双路至强CPU了。

有40带宽的这个条件下，有5款CPU入围，分别是：

i7-5930K（2014.3 3.5G 15mb 6核）
i7-5960X（2014.3 3.0G 20mb 8核）
i7-6850K（2016.2 3.6G 15mb 6核）
i7-6900K（2016.2 3.2G 20mb 8核）
i7-6950X（2016.2 3.0G 25mb10核）

还有一款为28带宽的CPU i7-6800K（2016.2 3.4G 15mb 6核）。

Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K，由于版本的更新，所以经过参数比较，第二套土豪级配置最多使用两块显卡，上手i7-6800K是比较合适的。

如果有上四块显卡的可能，建议使用上述所提到的5款总线带宽为40的CPU。

4. 内存

消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧：内存大约为显存的两倍。

因此，我们在第一套标准版配置中使用了16G DDR4 3000的内存，在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强，可以在使用中根据实际的占用情况来进行增减。

5. SSD

系统盘需要使用一块SSD，能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜，不过由于上述的两个主板都具有一个M.2接口，可以买一个M.2 NVMe的SSD，速度比SATA III接口也有所提升。

利用主板的这个接口，可以根据容量的需求来选择容量为256G或者是500G的SSD，例如三星960 EVO 500G M.2 NVMe SSD。

6. 机械硬盘

机械硬盘分为日常蓝盘（家用存储）、NAS红盘（网络数据存储）、企业金盘（密集读取型）、监控紫盘（存储密集型）、游戏黑盘（高端存储型）。

硬盘数据存储要求稳定，不存在数据丢失。

蓝盘为日常家用，最为通用；黑盘极其稳定，但是在运行过程中声音较大；红盘多用服务器数据存储，声音较小。故在第一套标准版配置中选择家用蓝盘即可，在第二套土豪级配置中最为高端稳定的黑盘作为存储盘，同时金盘也是不错的选择。

7. GPU

Tesla GPU性能很强劲，双精度计算能力非常优秀，适用于研究深度学习的超级计算机，但是Tesla K卡（K40，K80）十分昂贵，K40的价格为27000，K80的价格为37000。据一部分科研工作者反馈，对于网络计算的精度不需要达到这么高。

国内的公司和科研机构一般是使用一块Titan X Pascal，或者是两块GTX 1080，随着新品的面世，GTX1080 TI也是一个不错的选择。

GPU是计算的关键要素，利用台式机GPU来研究深度学习，就是通过足够的CUDA单元，以及配套的显存资源，来进行深度计算。尽管GPU也存在频率和显存带宽的差异，但是对于大部分的网络训练，6G及以上都是满足要求的。下图是对常用显卡的一个比较，可见如果是大量扩展时，1080TI和1070是比较合适的。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在标准版配置中，只能上一块GPU，建议显存大于等于6G，版本高于等于GTX 1060，即可满足日常实验研究，训练VGG网络或者Alexnet网络都不是问题。

上升到X99工作站主板后，最多可插两块Titan X或者四块 GTX 1080TI（当然仍然可以使用GTX 1080），上面选择的PCI-e总线为40的规定用于此处。

GTX1080 8G显存的价格是4100元左右；GTX 1080 TI显卡的价格是5700元左右，性能可以和Titan X相媲美，目前性价比最高；Titan X 12G显卡的价格是9700元，比较适用单次任务显存占用量高的网络，运行速度大约是GTX1080的1.6倍。

因此，我们在第二套土豪版配置中上了一块TITAN X，当然你也可以换成GTX 1080 TI，这也是不错的选择，根据实际训练情况再进行添置GPU。

特别需要注意的是，千万别买同级别的AMD卡！

NVida对深度学习计算的支持远远好于AMD，不然你会沉浸于无穷无尽的加速库安装和环境配置之中。

8. 电源

电源最高功率的计算可以通过鲁大师的功率计算功能得出，将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。

在第一种标准版配置中，实际功率大约为150+150+100=400w，保留充足的余量，选择海盗船VS650w的电源。

在第二种土豪版配置中，实际功率大约为250+150+100=500w，选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡，那么你可能要考虑到这个问题，最多加装两个TITAN X的话，1000w电源已经足够了。

9. CPU散热器

考虑到台式机运行过程中CPU散热量较大，可以进行加装CPU风冷，如第一套配置里所用的，也可以进行加装CPU水冷，在第二套土豪级配置中用到了海盗船的水冷散热器。

以上是对深度学习装备的分析，以及面对8000和20000元分别推荐的配置清单。

其实，作者自己曾经花费4万元组装了一台深度学习工作站，更土豪的朋友可以点击阅读原文查看知乎上所提到的具体配置，或者进群一起讨论性能更高的配置方案。

本文作者：王新民

原文发布时间：2017-03-28