为深度学习而生——详解阿里云异构计算GN5规格族

简介:

随着深度学习对人工智能的巨大推动,深度学习所构建的多层神经网络模型的参数空间已从百万级上升到百亿级,这对计算能力提出了新的挑战。相比CPU,GPU更适合深度学习的神经网络模型,可进行高度统一、相互无依赖的大规模并行计算。

阿里云发布的最新一代异构计算通用GPU实例GN5规格族就是一款用于搭建深度学习加速平台的云端利器。

image


“品学兼优”的GN5采用了NVIDIA Pascal架构旗舰级P100 GPU,可在云端按需构建敏捷弹性、高性能和高性价比的深度学习平台,让用户以最简便地方式享用阿里云遍布全球的高效、稳定的云基础设施资源。

与上一代相比,GN5的单实例性能拓展了5倍,单实例最多可提供8个 NVIDIA P100 GPU,提供2万多个并行处理核心,最高75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和38 TFLOPS FP64双精度浮点运算能力。

自建GPU物理服务器经常会遇上扩容难、适配难的难题,GN5规格族提供了灵活弹性的系列化配置,可以根据深度学习计算力的要求,按需选择合适的规格,分钟级即可完成实例的创建,并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。

为了更好地发挥GN5多GPU卡并行计算效率,GN5支持GPUDirect,通过GPU卡之间点对点通信,可让GPU之间在无需CPU干预下,直接通过PCIe的总线进行高带宽低时延的互联通信,极大地提升了深度学习训练中模型参数交换效率。

image


除了GPU外,深度学习还需要有海量的数据存储能力、业务服务能力、监控能力等,这在传统模式下复杂度高、工作量大、费时费力。而GN5实现了与ECS弹性计算生态的完美结合,可与OSS对象存储、NAS文件存储等打通,满足深度学习海量训练数据的低成本存储和访问要求;通过EMR服务进行预处理;通过云监控服务进行GPU资源的监控与告警;通过负载均衡、弹性伸缩、资源编排等快速在云端搭建完整弹性GPU服务;并可搭配容器服务使用,简化部署和运维的复杂度,提供资源调度服务等。


image

GN5实例支持灵活的使用支付方式,用户可以按年支付以获得最高的使用折扣;也支持按月周期付费,以降低用户的计算资源使用一次性投入成本,并且具有相对较低的单位小时使用价格;同样支持按小时的付费方式使用户以最低的单次使用成本来应对临时性的短期使用需求。

原文链接

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
5月前
|
机器学习/深度学习 弹性计算 云计算
阿里云ECS实例规格
阿里云ECS实例规格
|
7月前
|
存储 缓存 弹性计算
阿里云服务器经济型e和通用算力型u1实例规格区别及选择参考
经济型e和通用算力型u1实例是目前阿里云的活动中,除轻量应用服务器之外,活动价格相对于其他云服务器实例规格更低的两个实例规格,很多个人和初创企业用户都会优先考虑选择这两个实例规格的云服务器,那么它们之间有什么区别呢?本文为大家介绍下经济型e和通用算力型u1实例规格的区别及选择参考。
1558 0
阿里云服务器经济型e和通用算力型u1实例规格区别及选择参考
|
1月前
|
弹性计算 固态存储 调度
阿里云服务器部署配置选择全攻略,ECS实例规格、CPU内存配置
阿里云服务器部署配置选择全攻略,ECS实例规格、CPU内存配置,CPU内存、公网带宽和系统盘怎么选择?个人用户选择轻量应用服务器或ECS通用算力型u1云服务器,企业用户选择ECS计算型c7、通用型g7云服务器,阿里云百科分享阿里云服务器配置选择方法
|
1月前
|
弹性计算 固态存储 调度
2024年阿里云服务器配置选择指南_个人和企业如何选择ECS实例规格?
2024年阿里云服务器配置选择指南_个人和企业如何选择ECS实例规格?CPU内存、公网带宽和系统盘怎么选择?个人用户选择轻量应用服务器或ECS通用算力型u1云服务器,企业用户选择ECS计算型c7、通用型g7云服务器,阿里云百科分享阿里云服务器配置选择方法
|
1月前
|
弹性计算 缓存 测试技术
阿里云2核4G配置云服务器ECS实例规格、收费标准及最新活动价格参考
阿里云2核4G配置云服务器ECS实例规格、收费标准及最新活动价格参考,阿里云服务器2核4G配置不是指e实例和u1实例,还可以选择计算型c7、计算型c6、计算型c8i、AMD计算型c8a、性能增强计算型c8ae、高主频计算型hfc8i、AMD计算型c7a、高主频计算型hfc7等规格,
|
3月前
|
机器学习/深度学习 人工智能 分布式计算
阿里云PAI:一站式AI研发平台,引领深度学习潮流
阿里云PAI:一站式AI研发平台,引领深度学习潮流 随着人工智能的飞速发展,深度学习框架已经成为AI研发的核心工具。然而,选择合适的深度学习框架并不容易,需要考虑的因素包括计算性能、易用性、支持的算法组件等多种因素。今天,我们就来介绍一款一站式AI研发平台——阿里云PAI,看看它如何解决这些痛点。
115 1
|
5月前
|
存储 安全 网络协议
阿里云计算型c8i/c8a、通用型g8i/g8a实例规格性能及适用场景介绍
在阿里云2023年的金秋云创季活动中,除了以往有的轻量应用服务器和经济型e、通用算力型u1、计算型c7/c8y、通用型g7/g8y、内存型r7/r8y实例之外,阿里云还新增了计算型c8i/c8a、通用型g8i/g8a实例规格,折扣为7折,那么这几个云服务器实例规格的性能及适用场景是怎样的呢?本文为大家介绍阿里云计算型c8i/c8a、通用型g8i/g8a实例规格性能及适用场景。
阿里云计算型c8i/c8a、通用型g8i/g8a实例规格性能及适用场景介绍
|
6月前
|
存储 弹性计算 对象存储
阿里云服务器申请免费试用注意事项及规格介绍
阿里云服务器可以试用吗?当然是可以的,我们在阿里云主页和社区等平台都能看到阿里云产品试用的活动,目前已经开放试用的云产品已经有100多款,小编上个月也申请了一台云服务器,用着还不错,不过试用完了之后,小编也发现一些前期没有注意到的注意事项,因此,通过本文为大家分享几点免费试用注意事项及规格,特别是试用云服务器产品的用户,一定要先看下规则。
阿里云服务器申请免费试用注意事项及规格介绍
|
7月前
|
存储 弹性计算 编解码
阿里云七代云服务器实例、倚天实例、通用算力型等实例规格介绍
目前阿里云云服务器的可选实例规格中,既有五代六代实例规格,也有七代和八代倚天云服务器,同时还有通用算力型及经济型这些刚推出不久的新品云服务器实例,其中第五代和六代实例规格属于上一代实例规格,现在官方主要推荐的是七代、八代倚天云服务器实例和新品通用算力型和经济型实例,本文为大家重点介绍一下七代云服务器实例、倚天云服务器实例和通用算力型及经济型实例主要特点及性能情况,以供大家参考和选择。
阿里云七代云服务器实例、倚天实例、通用算力型等实例规格介绍
|
7月前
|
存储 弹性计算 编解码
阿里云五代、六代、七代、八代云服务器实例规格性能提升介绍
阿里云服务器有多种实例规格可选,这些实例规格主要以五代、六代、七代和最新第八代倚天云服务器为主,当下主售的是以七代和八代云服务器为主,那么我们在购买阿里云服务器时所看到的各种云服务器实例具体属于那一代云服务器呢?有的用户可能并不清楚哪些实例规格分别属于哪一代实例,下面小编为大家介绍下阿里云五代、六代、七代、八代云服务器实例规格分别有哪些以及每一代云服务器在性能方面具体有哪些提升,以供大家参考和了解。
阿里云五代、六代、七代、八代云服务器实例规格性能提升介绍