一万元搭建深度学习系统:硬件、软件安装教程,以及性能测试

简介:
本文来自AI新媒体量子位(QbitAI)

Macbook这种轻薄的笔记本,是搞不了深度学习的。亚马逊P2云服务,会给堆积越来越多的账单,换个便宜的服务,训练时间又太长……

没办法,已经十多年没用过台式机的我,只能重新着手DIY装机,搭建一套自己的深度学习系统。以下是我的系统搭建和测试过程。

硬件清单

之前,我在AWS亚马逊云服务上的花费是每月70美元(约480元人民币)。按照使用两年计算,我给这套系统的总预算是1700美元(约11650元)。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

GPU

肯定得买Nvidia,没有其他选择。买两块还是一块?我想了想,还是先买一个性能更好的,以后有钱了再增加。综合显存、带宽等因素,我最终选了GTX 1080 Ti,跟Titan X相比,性能差不了多少,但价格便宜不少。

CPU

虽然比不上GPU,但CPU也很重要。从预算出发,我选了一颗中端产品英特尔i5 7500。相对便宜,但不会拖慢整个系统。

内存

两条16GB容量的内存,总共是32GB。

硬盘

两块。

一块SSD硬盘运行操作系统和当前数据,我选的是MyDigitalSSD NVMe 480GB。一块速度较慢的2TB容量HDD硬盘存储大的数据集(例如ImageNet)。

主板

为了以后的拓展,我得选能支持两块GTX 1080 Ti的主板。最后的选择是:华硕TUF Z270。

电源

得为GPU何GPU们提供足够的电力供应。英特尔i5 7500功耗是65W,一块1080Ti需要250W(以后还想加一块),所以最后选择了Deepcool 750W Gold PSU。

机箱

我听从朋友的建议,选了Thermaltake N23机箱。只是没有LED灯,伤心。

组装

组装过程按下不表,装机也是个手艺,最后效果如下图所示。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

安装软件

提示:如果你想装Windows系统,最好先安装Windows,再装Linux。要不然Windows会搞乱启动分区。

安装Ubuntu

大部分深度学习框架都工作在Linux环境中,所以我选择安装Ubuntu。一个2GB容量的U盘就能搞定安装,如何制作?

  • OSX用户参考这里:

https://www.ubuntu.com/download/desktop/create-a-usb-stick-on-macos

  • Windows用户参考这里:

https://rufus.akeo.ie/

我写这个教程的时候,Ubuntu 17.04版本刚刚发布,但是我选择了之前的16.04版本,因为老版本的相关文档可能更全一点。另外,我选择的是Ubuntu桌面版本,不过关闭了图形界面X,电脑启动会进入终端模式。

如果需要图形界面,只需要输入:startx

及时更新

更新可以使用下面这个命令

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

深度学习堆栈

为了展开深度学习,我们需要如下软件来使用GPU:

  • GPU驱动:让操作系统和显卡可以对话
  • CUDA:能让GPU运行通用目的代码
  • CuDNN:CUDA之上的神经网络加速库
  • 深度学习框架:TensorFlow等

安装GPU驱动

最新的驱动,可以参考官网

http://nvidia.com/Download/index.aspx

或者直接使用如下代码安装:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

安装CUDA

可以从Nvidia下载CUDA,地址如下:

https://developer.nvidia.com/cuda-downloads

或者直接运行如下的代码:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

安装好CUDA之后,下面的代码能把CUDA添加到PATH变量:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

现在可以检验一下CUDA装好没有,运行如下代码即可:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

删除CUDA或GPU驱动,可以参考如下代码:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

安装CuDNN

我用的是CuDNN 5.1,因为最新的TensorFlow不支持CuDNN 6。下载CuDNN,你需要创建一个免费的开发者账号。下载之后,用如下命令安装。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

Anaconda

Anaconda是一个很棒的Python软件包管理器,我现在使用了Python 3.6版本,所以对应的使用Anaconda 3版本,安装如下:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

TensorFlow

最流行的深度学习框架,安装:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

为了检查一下TensorFlow安装好没有,可以运行MNIST看看:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

应该能在训练过程中,看到loss的逐渐减少:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

Keras

一个高级神经网络框架,安装非常简单:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

PyTorch

深度学习框架届的新兵,但也值得推荐,安装命令:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

Jupyter notebook

Jupyter是一个交互式的笔记本,随着Anaconda安装,我们要配置和测试一下:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

现在打开 http://localhost:8888 ,应该就能看到Jupyter的界面。

我们可以把Jupyter设置成自动启动,使用crontab来设置。运行crontab -e,然后把如下代码添加在最后。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

测试

现在基本上准备妥当了,是时候测试一下了。参加此次对比的几个选手是:

  • AWS P2实例GPU(K80)
  • AWS P2虚拟CPU
  • 英伟达GTX 1080 Ti
  • 英特尔i5 7500

MNIST多层感知器

MNIST数据集由70000手写数字组成。我们在这个数据集上运行了一个使用多层感知器(MLP)的Keras案例,代码地址:

https://github.com/fchollet/keras/blob/master/examples/mnist_mlp.py

MLP的意思是只使用全连接的层,而不用卷积。这个模型在这个数据集上进行了20次训练,实现了超过98%的准确率。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

可以看到在训练这个模型时,GTX 1080 Ti比AWS P2 K80快2.4倍,这有点惊人,因为两个显卡的性能应该差不多,我觉得可能是AWS上有降频或者受到虚拟化的影响。

CPU的表现比GPU慢9倍。有趣的是,i5 7500比亚马逊的虚拟CPU快2.3倍。

VGG微调

为Kaggle猫狗识别竞赛而微调一个VGG网络。使用相同的batch在CPU上运行这个模型不可行,所以我们在GPU上微调了390个batch,在CPU上是10个batch。代码如下:

https://github.com/slavivanov/cats_dogs_kaggle

640?wx_fmt=png&wxfrom=5&wx_lazy=1

这次1080 Ti比AWS P2 K80快5.5倍。CPU在这个环节的表现,最多慢了200倍。

Wasserstein GAN

生成对抗网络(GAN)用来训练模型产生图像。Wasserstein GAN是原始GAN的一个改进版。我这里用了一个PyTorch实现,代码地址:

https://github.com/martinarjovsky/WassersteinGAN

这个模型需要50步训练,CPU在这个训练中不予考虑。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

GTX 1080 Ti比AWS P2 K80快5.5倍。

风格迁移

最后一个测试是在TensorFlow上的风格迁移实现,代码地址:

https://github.com/slavivanov/Style-Tranfer

640?wx_fmt=png&wxfrom=5&wx_lazy=1

GTX 1080 Ti比AWS P2 K80快4.3倍。CPU比GPU慢30-50倍。

好啦,关于万元打造一个深度学习系统的分享,就先到这里。

各位端午节快乐。

【完】

本文作者:Slav Ivanov@blog.slavv.com
原文发布时间:2017-05-30
相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
4天前
|
Java 测试技术 Python
《手把手教你》系列技巧篇(三十六)-java+ selenium自动化测试-单选和多选按钮操作-番外篇(详解教程)
【4月更文挑战第28天】本文简要介绍了自动化测试的实战应用,通过一个在线问卷调查(<https://www.sojump.com/m/2792226.aspx/>)为例,展示了如何遍历并点击问卷中的选项。测试思路包括找到单选和多选按钮的共性以定位元素,然后使用for循环进行点击操作。代码设计方面,提供了Java+Selenium的示例代码,通过WebDriver实现自动答题。运行代码后,可以看到控制台输出和浏览器的相应动作。文章最后做了简单的小结,强调了本次实践是对之前单选多选操作的巩固。
14 0
|
1天前
|
机器学习/深度学习 传感器 边缘计算
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第3天】 随着人工智能技术的飞速发展,深度学习已经成为推动技术创新的关键力量。特别是在图像识别领域,深度学习技术通过模仿人脑处理视觉信息的方式,显著提升了机器识别和理解图像的能力。本文主要探讨了深度学习在自动驾驶系统中图像识别的应用,包括车辆检测、行人识别、交通标志识别等关键功能,并分析了当前的挑战及未来的发展趋势。
|
2天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第2天】 随着人工智能技术的飞速发展,深度学习已经成为推动多个科技领域进步的关键力量。特别是在图像识别技术方面,深度学习的应用已经极大地改善了算法的准确性和效率。本文将探讨深度学习在图像识别中的核心机制,并重点分析其在自动驾驶系统中的具体应用,包括车辆检测、行人识别以及交通标志识别等关键技术点。通过综合现有研究成果与最新技术动态,本文旨在为读者提供一个关于如何利用深度学习提升自动驾驶系统性能的全面视角。
|
2天前
|
机器学习/深度学习 自动驾驶 算法
基于深度学习的图像识别在自动驾驶系统中的应用
【5月更文挑战第2天】 随着人工智能技术的飞速发展,深度学习在图像识别领域取得了突破性进展。这些技术的应用不仅局限于日常的智能设备中,更在自动驾驶系统的发展中扮演着关键角色。本文旨在探讨深度学习算法如何提升自动驾驶汽车的图像识别能力,以及这一进步如何促进自动驾驶系统的整体性能和安全性。通过分析最新的研究成果和实际案例,我们阐述了深度学习模型在处理复杂交通场景中的优势,并讨论了未来可能的发展趋势。
|
3天前
|
机器学习/深度学习 自动驾驶 安全
基于深度学习的图像识别技术在自动驾驶系统中的应用网络安全与信息安全:防御前线的关键技术与意识
【4月更文挑战第30天】随着人工智能技术的飞速发展,深度学习已成为推动多个技术领域革新的核心力量。特别是在图像识别领域,深度学习模型已展现出超越传统算法的性能。在自动驾驶系统中,准确的图像识别是确保行车安全和高效导航的基础。本文将探讨深度学习在自动驾驶中图像识别的应用,分析关键技术挑战,并提出未来的发展方向。
|
3天前
|
机器学习/深度学习 自动驾驶 安全
深入理解操作系统内存管理:策略与实现基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第30天】 在现代计算机系统中,操作系统的内存管理是确保系统高效、稳定运行的关键组成部分。本文将深入探讨操作系统中内存管理的多种策略及其实现机制,包括但不限于分页、分段和段页式结合等技术。我们将剖析内存分配的原理,讨论虚拟内存技术的实现以及它如何提供更大的地址空间并允许内存的交换。同时,我们还会涉及内存保护机制,它们是如何防止程序访问未授权的内存区域。最后,文中将对现代操作系统如Linux和Windows中的内存管理实践进行比较分析,以期给读者提供全面而深入的理解和参考。 【4月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已经
|
4天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已成为推动技术创新的核心动力之一。特别是在图像识别领域,深度学习技术已经取得了显著的成就。本文旨在探讨基于深度学习的图像识别技术在自动驾驶系统中的应用,并分析了该技术对提升自动驾驶汽车环境感知能力的重要性。通过构建高效准确的深度神经网络模型,实现对道路场景中各种物体的快速识别与分类,从而为自动驾驶决策提供可靠的数据支持。
|
4天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第30天】 随着人工智能技术的不断进步,深度学习在图像处理与分析方面取得了革命性的突破。尤其是在自动驾驶领域,基于深度学习的图像识别技术已经成为实现车辆环境感知的关键。本文将探讨深度学习模型如何改善自动驾驶系统中的图像识别任务,包括物体检测、分类及追踪,并分析这些技术对提高自动驾驶汽车安全性和可靠性的影响。我们还将讨论目前面临的挑战以及未来的发展趋势。
|
4天前
|
机器学习/深度学习 数据采集 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第30天】 本文深入探讨了深度学习技术在自动驾驾驶车辆图像识别系统中的应用,重点分析了卷积神经网络(CNN)的结构优化、训练策略和在实际场景中的部署问题。通过对比不同深度学习模型的性能表现,揭示了数据处理、模型泛化能力和实时性要求之间的平衡机制。文章不仅总结了现有技术的局限性,还提出了未来研究的方向,旨在为自动驾驶领域的技术进步提供理论支持和实践指南。
|
4天前
|
机器学习/深度学习 算法 计算机视觉
m基于Yolov2深度学习网络的智能零售柜商品识别系统matlab仿真,带GUI界面
MATLAB 2022a中展示了YOLOv2目标检测算法的仿真结果,包括多张检测图像。YOLOv2是实时检测算法,由卷积层和全连接层构成,输出张量包含边界框坐标和类别概率。损失函数由三部分组成。程序使用75%的数据进行训练,剩余25%作为测试集。通过ResNet-50预训练模型构建YOLOv2网络,并用SGDM优化器进行训练。训练完成后,保存模型为`model.mat`。
19 2