单颗GPU计算能力太多、太贵?阿里云发布云上首个轻量级GPU实例

简介: 当地时间3月18日,在硅谷举办的2019年NVIDIA GPU技术大会(GTC)上,阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。

当地时间3月18日,在硅谷举办的2019年NVIDIA GPU技术大会(GTC)上,阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。

在该实例发布之前,业内均采用以单颗物理GPU为单位的云端异构计算服务,这有利于客户获得强有力的计算能力。如阿里云在2017年10月推出了业界最全的异构计算家族,以及基于一个异构平台的高性能计算平台E-HPC,为用户提供单颗起步至超大规模的弹性计算服务。当用户业务遇到业务高峰时可以在数分钟内实现扩容,大幅降低了企业使用异构计算能力的门槛,目前已服务于新浪微博、旷视科技、中国工程院等众多企业和机构。

然而,在不少使用异构计算服务的场景中,“计算资源过剩”问题也尤为明显。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算;人工智能领域也存在类似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,轻量级计算异构产品可以提升系统灵活性,并大幅降低成本。

而阿里云本次首家提供云上轻量级GPU实例,意味着用户可以用更细粒度的计算资源开启业务。该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业可以按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工作站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。

阿里云表示,5月还将发布基于NVIDIA T4的GPU异构计算产品VGN6i实例,NVIDIA T4采用最新的Turing架构,在虚拟化环境中更为灵活,可加速深度学习和推理工作流程的Tensor Core,以及可加速光线追踪和批量渲染的RT Core。

该产品由阿里云与NVIDIA合作研发,集成了阿里云智能资源调度技术,用户可以按需选择适量的计算资源;同时,还采用了安全隔离技术,实现不同用户之间的强隔离,有效防止信息泄漏;除此之外,QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。

阿里云智能异构计算产品专家张新涛表示,“随着轻量级GPU异构计算产品的推出,阿里云实现了GPU的异构计算场景全覆盖,可以为用户提供从从轻量到高性能计算的服务。”

云端异构计算并非单纯地堆积硬件性能,需要做深度的软硬件结合及优化才能发挥其性能优势。阿里巴巴集团在异构计算领域拥有多年研发经验,该技术大规模应用于拍立淘、商品分类等场景。

作为全球前三、国内第一的云服务商,阿里云拥有丰富的异构计算产品,具备智能调度、自动运维、实时扩容等能力,结合业界首个自研的异构计算加速框架Ali-Perseus,可以同时支持TensorFlow、Caffe、MxNet、Pytorch等流行机器学习框架在集群训练和推理时的加速,最高可以将深度学习任务成本降低50%以上。

2018年12月,在斯坦福大学发布的最新DAWNBench深度学习推理榜单,阿里云异构计算获得了图像识别性能及成本双料冠军。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
5月前
|
监控 调度 异构计算
节省数千 GPU 卡资源,快手如何进行 FinOps 落地
节省数千 GPU 卡资源,快手如何进行 FinOps 落地
|
6月前
|
监控 Serverless
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(3)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(3)
275 0
|
6月前
|
监控 Serverless API
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(2)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(2)
258 0
|
6月前
|
监控 Serverless
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(4)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》一、弹性之上的弹性---近乎无限的资源(4)
229 0
|
7月前
|
云安全 存储 弹性计算
小鱼深度产品测评之:阿里云新款通用算力型ECS云服务器Universal实例,实力与能力并存的一款产品。
小鱼深度产品测评之:阿里云新款通用算力型ECS云服务器Universal实例,实力与能力并存的一款产品。
547 1
|
8月前
|
人工智能 弹性计算 Cloud Native
平头哥杨平超:倚天CPU架构以及产品特性介绍
2023年8月8日,【倚天实例迁移课程】首节课程《倚天CPU架构以及产品特性介绍》正式上线,由平头哥倚天解决方案架构师杨平超主讲,内容涵盖:倚天710芯片概述;倚天710的主要特点;倚天710应用落地介绍,本期节目也在阿里云官网、阿里云微信视频号、阿里云钉钉视频号、InfoQ官网、阿里云开发者微信视频号、阿里云创新中心直播平台&微信视频号同步播出。
平头哥杨平超:倚天CPU架构以及产品特性介绍
|
11月前
|
存储 弹性计算 缓存
阿里云弹性计算通用算力型u1实例性能评测,算力成本最高降40%
通用算力型u1实例是阿里云当下主推的一款云服务器实例,官方定义这个实例规格属于高性价比实例,使用这个实例的云服务器单位算力成本最高可下降40%,无需进行复杂的资源配置,满足通用上云需求,小编通过本文来详细说下阿里云弹性计算通用算力型u1实例性能评测说明:
|
Web App开发 机器学习/深度学习 人工智能
|
存储 弹性计算 运维
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化(二)
《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化(二)
267 0
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化(二)
|
存储 监控 安全
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化(一)
《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化
515 0
带你读《弹性计算—无处不在的算力》第三章:计算产品和技术3.3弹性裸金属服务器和神龙虚拟化(一)