深度学习装机指南:我们为普通青年和土豪准备了两套方案

简介:
本文来自AI新媒体量子位(QbitAI)

深度学习,始于装机。


研究深度学习该买一台什么样的电脑?我的笔记本能满足需求吗?

量子位请来小伙伴,为当前的深度学习网络训练提供了两套最新的装机方案。

第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。

第二套方案是预算为20000左右的土豪版台式机,这款台式机为工作站主板,极其稳定,能够长时间开机稳定训练。

话不多说,直接上配置。

第一套·标准型

配件名 品牌型号 数量 价格
机箱 美商海盗船 400C 中塔侧透机箱 1 749 京东
主板 华硕 Z170I PRO GAMING Mini-ITX主板 1 1299 天猫
CPU 英特尔 I7 7700K 酷睿第7代处理器 1 1799 - 2799
内存 美商海盗船 复仇者8G DDR4 2400 2 798 京东
SSD 三星850 EVO 250G M.2 固态硬盘 1 699 京东
机械硬盘 西部数据 蓝盘 2TB 64M 台式机硬盘 1 499 京东
GPU 七彩虹GTX1060 6G超频版游戏显卡 1 1799 天猫
电源 美商海盗船VS650 额定650w电源 1 399 京东
CPU风冷器 乔思伯 HP625日食红 CPU散热器 1 159 京东
显示屏 AOC I2279VW 21.5英寸显示器 1 699 天猫

总计:8200 - 9200元(不包括显示器)

第二套·土豪版

配件名 品牌型号 数量 价格
机箱 美商海盗船 600C 中塔侧透机箱 1 999 京东
主板 华硕 /Asus X99-M WS/USB 3.1主板 1 2599 天猫
CPU 英特尔 I7 6800K 酷睿第7代处理器 1 3399 天猫
内存 美商海盗船 复仇者16G DDR4 3000 2 1878 京东
SSD 三星960 EVO 500G M.2 NVMe SSD 1 1799 京东
机械硬盘 西部数据黑盘 2TB 64M台式机硬盘 1 999 京东
GPU NVIDIA TITAN X 12G Pascal(可替1080TI) 1 9699 京东
电源 美商海盗船 额定750W金牌电源 1 969 京东
CPU散热器 美商海盗船H80i V2 CPU水冷散热器 1 759 京东
显示屏 AOC I2279VW 21.5英寸显示器 1 699 天猫

总计:23100元(不包括显示器)

下面我们对这些配件分别进行分析:

1. 机箱

机箱的选取需要考虑两个问题:

1. 主板、CPU散热器是否能够装得下;

2. 整体散热性和稳定性是否满足需求。

先说标准版配置,在进行入门研究只用一块显卡的情况下,散热不存在问题,推荐海盗船400C的中塔机箱,小巧稳定。

对于土豪版配置,由于采用了华硕的M款工作站主板,后期具有增加到两块显卡的可能性,适当地增大机箱的空间,建议选海盗船600C中塔机箱。

如果有上四路TITAN X的打算,那么需要选取散热条件更好、空间更大的机箱,可以用跟Nvidia DevBox同款的机箱,即Corsair Carbide Air 540,也可以是追风者PK515E或515ETG中塔机箱,个人觉得后者的颜值高一些,这两款都可以用来组装具有四路TITAN X的深度学习工作站。

2. 主板

主板的基本要求是稳定性足够好,具有较多的PCI-E Gen3 x16接口。

由于标准版配置只计划选用一块显卡,故选取了游戏级别的华硕 Z170I主板,该款主板只具有一个PCI-E Gen3 x16接口。

当按工作站要求来选择主板时,有两个指标:最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板,分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。

所以,我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板,可以扩展到两路TITAN X或者是GTX 1080 TI。

具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板,当有计划上四路TITAN X打算的话,主板可以选用Asus X99-E WS/USB 3.1工作站大板,避免由于后期扩展显卡但是主板存在局限性的问题。

3. CPU

选择CPU,主要是观察三个指标:主频,核心数和总线带宽。

在第一套标准配置中,由于是单机单卡,所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799,质保一年;盒装价格为2799,质保三年。据销售称,这两者没有实质性的差异,可根据自身需求进行选择。

在单机多卡进行训练时,总线带宽是瓶颈,所以CPU的PCI-e lane越多越好,一般消费级的CPU,PCI-e总线根数是16, 28或40,最大就是40,进一步提升带宽就需要上服务器CPU或者双路至强CPU了。

有40带宽的这个条件下,有5款CPU入围,分别是:

  • i7-5930K(2014.3 3.5G 15mb 6核)
  • i7-5960X(2014.3 3.0G 20mb 8核)
  • i7-6850K(2016.2 3.6G 15mb 6核)
  • i7-6900K(2016.2 3.2G 20mb 8核)
  • i7-6950X(2016.2 3.0G 25mb10核)

还有一款为28带宽的CPU i7-6800K(2016.2 3.4G 15mb 6核)。

Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K,由于版本的更新,所以经过参数比较,第二套土豪级配置最多使用两块显卡,上手i7-6800K是比较合适的。

如果有上四块显卡的可能,建议使用上述所提到的5款总线带宽为40的CPU。

4. 内存

消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧:内存大约为显存的两倍。

因此,我们在第一套标准版配置中使用了16G DDR4 3000的内存,在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强,可以在使用中根据实际的占用情况来进行增减。

5. SSD

系统盘需要使用一块SSD,能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜,不过由于上述的两个主板都具有一个M.2接口,可以买一个M.2 NVMe的SSD,速度比SATA III接口也有所提升。

利用主板的这个接口,可以根据容量的需求来选择容量为256G或者是500G的SSD,例如三星960 EVO 500G M.2 NVMe SSD。

6. 机械硬盘

机械硬盘分为日常蓝盘(家用存储)、NAS红盘(网络数据存储)、企业金盘(密集读取型)、监控紫盘(存储密集型)、游戏黑盘(高端存储型)。

硬盘数据存储要求稳定,不存在数据丢失。

蓝盘为日常家用,最为通用;黑盘极其稳定,但是在运行过程中声音较大;红盘多用服务器数据存储,声音较小。故在第一套标准版配置中选择家用蓝盘即可,在第二套土豪级配置中最为高端稳定的黑盘作为存储盘,同时金盘也是不错的选择。

7. GPU

Tesla GPU性能很强劲,双精度计算能力非常优秀,适用于研究深度学习的超级计算机,但是Tesla K卡(K40,K80)十分昂贵,K40的价格为27000,K80的价格为37000。据一部分科研工作者反馈,对于网络计算的精度不需要达到这么高。

国内的公司和科研机构一般是使用一块Titan X Pascal,或者是两块GTX 1080,随着新品的面世,GTX1080 TI也是一个不错的选择。

GPU是计算的关键要素,利用台式机GPU来研究深度学习,就是通过足够的CUDA单元,以及配套的显存资源,来进行深度计算。尽管GPU也存在频率和显存带宽的差异,但是对于大部分的网络训练,6G及以上都是满足要求的。下图是对常用显卡的一个比较,可见如果是大量扩展时,1080TI和1070是比较合适的。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在标准版配置中,只能上一块GPU,建议显存大于等于6G,版本高于等于GTX 1060,即可满足日常实验研究,训练VGG网络或者Alexnet网络都不是问题。

上升到X99工作站主板后,最多可插两块Titan X或者四块 GTX 1080TI(当然仍然可以使用GTX 1080),上面选择的PCI-e总线为40的规定用于此处。

GTX1080 8G显存的价格是4100元左右;GTX 1080 TI显卡的价格是5700元左右,性能可以和Titan X相媲美,目前性价比最高;Titan X 12G显卡的价格是9700元,比较适用单次任务显存占用量高的网络,运行速度大约是GTX1080的1.6倍。

因此,我们在第二套土豪版配置中上了一块TITAN X,当然你也可以换成GTX 1080 TI,这也是不错的选择,根据实际训练情况再进行添置GPU。

特别需要注意的是,千万别买同级别的AMD卡!

NVida对深度学习计算的支持远远好于AMD,不然你会沉浸于无穷无尽的加速库安装和环境配置之中。

8. 电源

电源最高功率的计算可以通过鲁大师的功率计算功能得出,将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。

在第一种标准版配置中,实际功率大约为150+150+100=400w,保留充足的余量,选择海盗船VS650w的电源。

在第二种土豪版配置中,实际功率大约为250+150+100=500w,选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡,那么你可能要考虑到这个问题,最多加装两个TITAN X的话,1000w电源已经足够了。

9. CPU散热器

考虑到台式机运行过程中CPU散热量较大,可以进行加装CPU风冷,如第一套配置里所用的,也可以进行加装CPU水冷,在第二套土豪级配置中用到了海盗船的水冷散热器。

以上是对深度学习装备的分析,以及面对8000和20000元分别推荐的配置清单。

其实,作者自己曾经花费4万元组装了一台深度学习工作站,更土豪的朋友可以点击阅读原文查看知乎上所提到的具体配置,或者进群一起讨论性能更高的配置方案。

本文作者:王新民 
原文发布时间:2017-03-28
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
人工智能知识图谱之信息抽取:基于Labelstudio的UIE半监督深度学习的智能标注方案(云端版),提效。
人工智能知识图谱之信息抽取:基于Labelstudio的UIE半监督深度学习的智能标注方案(云端版),提效。
|
传感器 计算机视觉 机器学习/深度学习
ECCV18 | 谷歌普林斯顿提出首个端到端立体双目系统深度学习方案
本文是计算机视觉顶会ECCV 2018录取论文中备受关注的一篇,来自谷歌&普林斯顿大学的研究人员提出了第一个主动双目立体成像系统的深度学习解决方案,在诸多具有挑战性的场景中展示出最先进的结果。
4519 0
|
3天前
|
机器学习/深度学习 存储 边缘计算
深度学习在图像识别中的应用与挑战
【4月更文挑战第23天】 随着人工智能技术的飞速发展,深度学习作为其重要分支之一,在图像识别领域取得了显著的成果。本文将探讨深度学习在图像识别中的应用,分析其优势和面临的挑战,并展望未来的发展趋势。
|
2天前
|
机器学习/深度学习 运维 监控
深度学习在图像识别中的应用与挑战
【4月更文挑战第25天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的核心动力。本文旨在探讨深度学习技术在图像识别任务中的创新应用及其面临的主要挑战。我们将首先回顾深度学习的基本原理和关键技术,随后通过实际案例分析其在图像分类、目标检测及语义分割等方面的应用效果。最后,文中将讨论当前技术瓶颈,如数据不平衡、模型泛化能力以及计算资源限制等,并提出可能的解决方案。
|
2天前
|
机器学习/深度学习 自动驾驶 算法
探索基于深度学习的图像识别在自动驾驶中的应用
【4月更文挑战第25天】 随着人工智能技术的飞速发展,深度学习已成为推动自动驾驶领域革新的核心力量。本文旨在深入探讨深度学习技术在图像识别领域的最新进展及其在自动驾驶系统中的实际应用。通过分析卷积神经网络(CNN)和递归神经网络(RNN)等先进算法,我们揭示了如何有效提升自动驾驶汽车在复杂环境中的视觉感知能力。文中还将讨论深度学习模型在处理实时数据时所面临的挑战,以及为解决这些挑战而采取的创新方法。
|
3天前
|
机器学习/深度学习 安全 计算机视觉
深度学习在图像识别中的应用与挑战
【4月更文挑战第24天】 随着计算机视觉技术的飞速发展,深度学习已成为推动图像识别领域进步的核心动力。本文旨在探讨深度学习技术在图像识别中的关键应用,并分析当前面临的主要挑战。通过回顾卷积神经网络(CNN)的基础架构及其在图像分类、目标检测和语义分割中的创新应用,文章揭示了深度学习模型如何优化视觉信息处理流程。同时,针对训练数据需求、计算资源限制、模型泛化能力及对抗性攻击等问题,本文提出了一系列解决策略和技术方向,为未来研究提供了参考框架。
8 0