【杭州云栖】异构计算:软硬件结合全栈助力AI大爆发

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 2018杭州云栖大会,异构计算专场精彩回顾

9月20日上午,杭州云栖小镇E1-2会场,备受业界关注的2018年杭州云栖大会异构计算专场召开。

近年来,人工智能持续爆发,对算力提出了更高的要求。异构计算作为大计算时代的解决方案,意在打破传统通用计算的限制,融合不同指令集和体系架构的计算单元,完美支持大计算场景。
___px_2018_09_21_1_

让每一个芯片都发挥最大效能

首先,阿里云弹性计算负责人,阿里云研究员余锋,带来了精彩的开场。余锋以摄影来打开话题:每一个镜头都会有特别的定位,在某个场景下合适但是另外场景会力不从心,异构计算的精髓也是如此,即让每一个芯片都发挥最大效能,扬长避短。

5A8A3433

余锋说:异构计算带来的计算效率提升是指数级的,但是需要有配套工具,基础设施等等。阿里云正在逐渐让这个门槛变低,并且和业内一起构建技术生态,让异构计算普惠行业,帮助合作伙伴和客户不断创新。

GN6实例 F3实例全面商业化

议题阶段,首先登场的是阿里云高级产品专家潘岳。潘岳首先介绍了正在全面商业化推进的GN6实例和F3实例。GN6实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例搭载Xilinx 16nm Virtex UltraScale+器件VU9P,对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。

5A8A3513

两大平台:昊天 和 舜天,全面助力企业创新

随后,潘岳首次揭秘了阿里云异构计算两大平台:昊天EGS平台和舜天FaaS平台;分别对应异构计算领域两大热门芯片方案:GPU和FPGA。潘岳指出,阿里云异构计算平台技术在阿里巴巴内部已经完成和多项业务的顺利融合,历经大范围高压测试,已然非常成熟。除此之外,异构计算全系产品与阿里云生态深度无缝融合,可以和传统的通用计算共用云上的全套服务。

_

在改善用户使用体验上,阿里云异构产品持续提供多种工具,来让异构产品更易用,这其中包括了方便开发部署的容器镜像工具,实时监测GPU状态的运维工具,以及神经网络框架优化的增值服务等。此后,潘岳分享了阿里云FPGA云服务器落地的业务场景。最后,在异构生态建设上,潘岳强调,阿里云积极引入国内外众多的解决方案供应商,共同构建完善异构生态体系,为企业客户提供高性能的加速解决方案。

昊天平台揭秘

论坛的第二个议题由阿里云资深技术专家龙欣带来,对昊天EGS平台进行了详细的剖析。龙欣指出阿里云异构计算的GPU云服务,在算力水平扩展趋势背景下,已经从GPU加速器的单点突破,向全面的平台体系演进。

5A8A3586

今天的演讲第一次披露了阿里云昊天EGS平台的服务体系:昊天平台在集群计算上,为不同规模的客户提供了从GPU集群运维监控,到底层CUDA驱动,再到中间框架加速层快速一键部署,和GPU集群分布式业务层定制化调优的全面专业服务。演讲还分享了昊天平台在底层基础设施层的技术架构:GPU虚拟机的热升级技术、与AMD联合开发的公共云首个基于SRIOV的GPU热迁移技术、神龙GPU技术与超级计算GPU集群技术。

成熟客户案例立体呈现

来自微博的资深技术专家黄波,从客户的角度,详细介绍了基于阿里云异构计算平台的深度学习案例。同时,黄波先生还从自身体验出发,总结了云端深度学习的优势:弹性,集群化管理,高性能,和专业服务等等。

5A8A3614

舜天平台揭秘

第四个登场的是阿里云资深技术专家张振祥,带来了对阿里云FaaS舜天平台的详细剖析。议题指出阿里云FaaS舜天平台是云上输出FPGA高性价比算力的使能器,大幅降低了FPGA的应用门槛。围绕着“易用性、稳定性、可扩展性和安全性”的设计理念,舜天平台做了大量的软硬件创新。

5A8A3669

张振祥强调,以舜天平台为依托,阿里云愿与业界的合作伙伴和客户并肩携手,打造FPGA异构计算的健康而强大的生态圈。随着云计算和人工智能的进一步普及,FPGA的器件和技术将获得进一步的提升和改善,更好地适用大算力的应用场景,服务更多的垂直市场。演讲过程中,现场反应热烈,业界同仁对共建生态圈体感强烈。

舜天平台助力阿里高性能时序数据库

最后,阿里巴巴技术专家钱赟介绍了基于阿里云舜天平台的高性能时序数据库。从实际案例出发,再次验证了舜天平台的性能极致,资源易用,IP安全,同时又可以大幅降低计算成本等特性。

5A8A3709

阿里云在异构计算上的逐步深入和成熟,正在帮助越来越多的企业在云上实现创新和突破。比如刚刚在MS COCO大赛获得4项世界冠军的旷视科技就是阿里云异构计算的深度用户。客户的成功一直是阿里云的诉求和共同目标,一起来用异构计算开启大计算时代吧。

相关阅读
【杭州云栖】弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石
AI技术出海 - 阿里云GPU服务器助力旷视勇夺4项世界第一
FPGA资源平民化的新晋- F3 技术解析
【FPGA-F3】阿里云FAAS平台,极大简化FPGA开发部署流程
扫盲人工智能的计算力基石--异构计算

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
5月前
|
存储 分布式计算 运维
【2023云栖】刘一鸣:Data+AI时代大数据平台建设的思考与发布
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:刘一鸣 | 阿里云自研大数据产品负责人 演讲主题:Data+AI时代大数据平台应该如何建设
101430 7
|
5月前
|
人工智能 大数据 调度
【云栖2023】林伟:大数据AI一体化的解读
本文根据2023云栖大会阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人---林伟演讲实录整理而成,演讲主题:”大数据AI一体化的解读“。
|
5月前
|
新零售 人工智能 智能设计
2023云栖现场 | 阿里巴巴企业智能带你探索AI在企业办公数字化的实践
企业数字化是企业提升竞争力的必然选择,AI 技术的发展,更是为企业数字化转型提供了新的思路。 在2023年的云栖大会上,阿里巴巴企业智能展示了AI驱动下,在“人、财、法、事、物、场”等领域的数字化办公最新实践。将AI 技术与企业数字化各领域深度结合,碰撞出新的火花,让人眼前一亮。
|
5月前
|
人工智能 分布式计算 新制造
AI算力爆发,新职业出现,你发现了吗?
AI算力?听起来高大上的名字它究竟是什么呢?人工智能(Artificial Intelligence)英文缩写为AI,人工智能(AI)是一种模拟人类智能的技术,它是利用计算机科学和相关技术研究、开发的一种智能型系统。人工智能技术在现代社会中的应用已经变得越来越广泛如:在医疗领域中,可以使用AI技术进行医学影像分析、诊断、预测等;在金融领域中,可以利用AI技术进行风险管理、欺诈检测、信用评估等;在制造业中,可以使用AI技术进行智能制造和智能化管理等;在智能家居中,可以为普通消费者提供人性化、主动管家式的服务系统,还在交通、运动、游戏等方面感受着AI的高效与便捷。
|
6月前
|
人工智能 云栖大会 云计算
倒计时3天!@AI创业者,请查收你的云栖攻略
倒计时3天!@AI创业者,请查收你的云栖攻略
376 0
|
7月前
|
存储 机器学习/深度学习 人工智能
摆脱 OpenAI 依赖,8 分钟教你用开源生态构建全栈 AI 应用
大模型时代的到来使得 AI 应用开发变得更加轻松、省时,尤其是在 CVP Stack 的范式下,开发者甚至可以用一个周末的时间做出一个完整的应用程序。
238 1
|
10月前
|
人工智能 自然语言处理 前端开发
如何构建全栈 AI 应用
本文展示任何具有基本编程知识的人都可以构建 AI 驱动的软件。 学习了如何使用 React 和 Nodejs 构建聊天机器人,我们讨论了每种技术的优缺点。 最后,我们构建了一个既实用又安全的聊天应用
140 0
如何构建全栈 AI 应用
|
11月前
|
机器学习/深度学习 人工智能 达摩院
达摩院发布2023十大科技趋势!生成式AI将进入爆发期
达摩院发布2023十大科技趋势!生成式AI将进入爆发期
156 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能、ChatGPT等火爆的当下 AI大模型爆发
4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。
136 0
|
机器学习/深度学习 人工智能 自然语言处理
人工智能、ChatGPT等火爆的当下 AI大模型爆发
4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。
152 2