深度学习提速280%!阿里云性能怪兽GN6 V100 GPU实例深度测试

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

高性价比深度学习神器!阿里云GPU实例V100 最深度评测

在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间。V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷。

近期,国内云计算一哥阿里云开启了新一代高性能 GPU 计算云服务器 GN6 系列的公测,也是国内运营商中首个提供最新 NVIDIA V100 GPU 的云服务提供商。

8345939ca2f952dfd6440a24f058a20cbb5538eb

GPU 云服务器 V100

据悉,新的计算实例搭载最新的 NVIDIA V100 计算核心,宣称可带来数倍的深度学习性能提升。究竟搭载英伟达V100的阿里云GPU实例有几把刷子,我们申请了一台最新的GN6系列云服务器,进行了深度测试,一起来看下。

人工智能市场爆发 GPU云服务器成香饽饽

66773c6a849306b24f437d78f813bd9a10408162
国内云厂商上线实例列表

随着人工智能的发展,基于 GPU 的异构计算开始不断升温。特别是传统的 CPU 通用计算由于受到半导体工艺、存储带宽瓶颈等问题,开始在人工智能的运算中显露疲态。而 GPU 由于省去了 CPU 中复杂的控制流,可以将所有算力都投入到深度学习所需要的矢量运算中去,大大提高了算力和算力利用率。

除了性能之外,带来的更多的还是成本的降低。按照传统方案,云服务商可以采购4个机架、共160个CPU服务器,在功耗65千瓦的情况下提供每秒45000张照片的处理能力。而如果换成GPU的产品,你可能只需要一个装有8片GPU的服务器,同样的每秒45000张照片处理能力,但是你只需要7个服务器插槽,总共的功耗也只有3千瓦。

c8df7f3729b2be8d4ca72d22ad0f875579252652

阿里云人工智能布局

在公测期间,用户可以登陆阿里云平台提交测试申请,提交申请的用户会拿到阿里云异构计算平台提供的 GN6 云服务器,进行业务和平台验证。如果你像我一样,忍受不了长时间的计算,那么GN6系列可能是在目前所有的选择中最合适的那一款。

得益于搭载的 NVIDIA V100 GPU 拥有的新的 VOLTA 架构及新增的 Tensor 单元等因素,GN6 云服务器相比前代 GN5 云服务器拥有更加强劲的性能,能够以更少的时间花费来完成计算。

从P100到V100 性能提升近300%

4e7ce3486d838bd5502c296217e2cb5bcd5cea34

 V100 P100 性能对比

我们也通过申请拿到了一台 GN6 云服务器( 实例 ID ecs.gn6p-c8g1.2xlarge,8 vCPU ,32GB 内存)来测试,同时我们还购买了几个同配置的其他机型,来进行对比测试,具体的测试结果如下:

使用 MXNet 框架,测试 Inception-V3 网络在 ImageNet 数据集的图像分类训练的 Benchmark 性能

 6fcc262f95f82c2be27bd26017329c5108967bb0

MXnet 对比结果

使用 NVCaffe 框架,测试 GoogLeNet 网络在 ImagNet 数据集的图像分类训练性能
71ecbdcb485c6cb0cfea31d94244a9935e3b4ced

目前来说,社区的框架还没有更新到能够完全利用 TensorCore 的水平,所以性能无法达到在发布会上声称的十数倍的提升,不过即使是在这种情况下,我们测试到的结果依然表现不俗,性能相比于前代 GN5 云服务器提升了接近 3 倍。同样工作量的训练任务工作时间将压缩过半。

随着后续机器学习框架不断升级优化,TensorCore 的性能将得到全面发挥,将会给机器学习带来再一次大幅度提速。

姗姗来迟的基础镜像 云服务器开箱即用

一直以来,我们购买 GPU 云服务器后,都需要花费大量的时间来进行基础环境的配置、安装 NVIDIA 的驱动。在此处更新中,阿里云还上线了新的基础镜像,新的基础镜像预装了 NVIDIA GPU 驱动和深度学习框架的系统镜像,我们在云服务器启动随即可以准备开始进行深度学习的计算,大大节省了环境配置的时间,减少重复工作,GPU 云服务器也终于做到了开箱即用。

创建云服务器时,开发者可以直接在选择镜像时在镜像市场搜索“深度学习”,就可以找到预装深度学习框架的系统镜像,点击使用就可以直接创建开箱即用的 GPU 云服务器。

d2f11acb6874df611adf6d5e5b38e7eec84ca7bc

 

我们在使用 GPU 云服务器进行深度学习所需要的准备时间从原来的数个小时缩短到了不到五分钟,确确实实节省了大量的工作时间。

总结

就目前人工智能而言,已然进入战国时代,而且各家的产品都有可能在这个广阔的市场中找到自己的定位和细分市场,从跑分来看,阿里云的 GN6系列云服务器是市面上性能最强的GPU云服务器,,没有之一。在易用性上,一键部署、镜像市场等服务都有不俗的表现。

在价格方面,阿里云GN6相比同类的V100服务器要低上不少,让我们看到了作为云计算领军者的诚意。同时我们也相信未来会有更多的云厂商推出类似的服务,让整个人工智能市场拥有强大的计算能力。


 转自:https://mparticle.uc.cn/article.html?spm=a2s0i.db_contents.content.10.223acc71aV9IZJ&uc_param_str=frdnsnpfvecpntnwprdssskt&wm_id=c9c44564ca234df0be219e38392383ae&wm_aid=05c612bc356a4e649bfe6ed6e7d591b9

 

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
7天前
|
存储 弹性计算 运维
深度解读:阿里云服务器ECS经济型e实例配置整理和性能参数表
阿里云推出经济型ECS e系列服务器,适用于个人开发者、学生和小微企业。该系列采用Intel Xeon Platinum处理器,支持多种CPU内存配比,性价比高,2核2G3M配置只需99元/年,新老用户不限量购买且续费不涨价。提供相同可用性SLA和安全标准,具备ESSD Entry云盘等企业级特性。适合中小型网站、开发测试和轻量级应用
|
7天前
|
分布式计算 Hadoop 测试技术
|
7天前
|
分布式计算 Hadoop 测试技术
|
7天前
|
分布式计算 Hadoop 测试技术
Hadoop节点网络性能的带宽测试
【4月更文挑战第23天】
21 1
|
7天前
|
SQL DataWorks Java
DataWorks操作报错合集之在阿里云 DataWorks 中,代码在开发测试阶段能够成功运行,但在提交后失败并报错“不支持https”如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
22 1
DataWorks操作报错合集之在阿里云 DataWorks 中,代码在开发测试阶段能够成功运行,但在提交后失败并报错“不支持https”如何解决
|
8天前
|
分布式计算 Hadoop 测试技术
Hadoop节点网络性能的带宽测试
【4月更文挑战第22天】
25 4
|
8天前
|
存储 弹性计算 运维
阿里云服务器ECS经济型e实例特点、适用场景和使用常见问题解答
阿里云新推经济型e系列服务器,适用于个人开发者、学生和小微企业。该系列基于Intel Xeon Platinum处理器,提供1:1、1:2、1:4内存比选项,性价比高,不限购,续费不涨价。2核2G3M配置只需99元/年,企业用户2核4G5M服务器199元/年。具备价格优惠、品质保障、充足供应和多样化配置等特点。支持IPv4/IPv6,仅限专有网络VPC。实例规格和性能指标详表见原文,适合中小型网站、开发测试和轻量级应用。更多信息访问阿里云ECS页面。
|
8天前
|
弹性计算 运维 Serverless
Serverless 应用引擎产品使用之在阿里函数计算中,使用阿里云API或SDK从函数计算调用ECS实例的服务如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
34 4
|
8天前
|
存储 弹性计算 运维
阿里云服务器ECS经济型e实例详细介绍
阿里云新推经济型e系列服务器,适用于个人开发者、学生和小微企业。该系列采用Intel Xeon Platinum处理器,支持多种CPU内存配比,性价比高,不限购,续费不涨价。2核2G3M配置仅需99元/年,企业用户2核4G5M服务器199元/年。具备价格优势、品质保障和充足供应,但性能可能不及企业级实例。支持IPv4/IPv6,仅限专有网络VPC。更多规格和性能指标可见官方文档。
阿里云服务器ECS经济型e实例详细介绍
|
8天前
|
机器学习/深度学习 算法 TensorFlow
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)