深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

德州扑克人机大战,在海南激战正酣(貌似人类又被吊打)。

然而这个受创新工场李开复之邀来到中国的德扑AI冷扑大师,只不过是一个“阿凡达”,它的真身远在万里之外的美国。

深入冷扑大师的大脑

匹兹堡郊外,一处连Uber都叫不到的园区里,量子位走进一栋两三层的建筑,搭乘电梯来到地下,穿过一道两重密码的门,再打开一道门:噪音骤起。

当你走进冷扑大师的大脑里,两耳充斥的就是这种声音。

在匹兹堡超算中心轰鸣不已的机房里,左手边的三排,是一部被称为“Bridges”的超级计算机。其中有两排主要提供计算资源,还有一排提供存储资源。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

冷扑大师(英文名:Libratus)就藏身在这一部超级计算机中。量子位在现场拍了几张图,大家可以管窥一下这个超算中心。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

匹兹堡超算中心(PSC)高级研究总监Nick Nystrom,用一张图从全局的角度向量子位展示了Bridges到底是怎么构成的。

“整体的架构就是这个状态,可以随时进行调整,这个取决于使用者有怎样的计算需求”,Nystrom表示在这个架构中,最关键的是桔色的节点:六核英特尔OPA边缘交换机,通过两个链路实现彼此的全连接。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

计算方面,冷扑大师使用了RSM类型的节点,基本的配置是:2 × Intel Xeon E5-2695 v3 (14c, 2.3/3.3 GHz, 35MB LLC)+128GB内存(RAM)。

冷扑大师没有用到深度学习技术,所以也没有用到GPU的计算资源。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在年初的人机大战中,Libratus使用了600-700个节点,一个节点每小时的运行成本大概是0.94美元。也就是说,Libratus的运行成本约为:564-658美元/小时。

冷扑大师此次在海南挑战6个对手,而年初只挑战4个对手,所以如果按照700个节点计算,冷扑大师目运行一天的成本,约为:4.5万元人民币。

声明一下,这是量子位强行估算的。几天前量子位和Nick Nystrom交流时,他说冷扑大师之父Sandholm还没决定具体用什么配置。

免费使用的超算资源

虽然算起来不便宜,但冷扑大师之前并不需要为超算付费。

因为匹兹堡超算中心,更像是一个“公益”项目。不光是美国,理论上来自全球的科研人员,都可以向PSC发出申请,使用这里的超算资源。

而且都是免费的,只要是科研目的。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

今年1月,Libratus在河流赌场与四位人类顶尖高手的对决,共使用了1900万核时间(core-hour),这是另一个计算口径,其中包括赛前使用1500万核时间,以及比赛中使用1400万核时间。

因为也算科研的一部分,所以全部免费。

这次在海南举行的人机大战,定位是一场表演赛,所以PSC表示会收取成本费用,但这家超算中心绝对不会赚取利润。

不是不想,而是不能。匹兹堡超算中心,是美国国家科学基金会(NSF)拨款1720万美元设立的机构,目的就是要求推动科研创新。目前PSC应在硬件上花费960万美元,其他费用用于每年硬件升级和运营成本。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在PSC出现之前,美国大多数科研工作者并不容易用上超算。现在只要你的申请得到批准,就可以借助超算的力量完成科学计算。

据说这个申请是向全球开放的。

目前已经有750个项目运行在匹兹堡超算中心,包括来自匹兹堡大学、卡内基梅隆大学、耶鲁大学等学校的科研项目,以及来自NIH(美国国立卫生研究院)与脑肺部癌症相关的研究工作等。“都是超大型的数据项目”,Nystrom对量子位介绍说。

此外还包括基因测序、糖尿病治疗、环境保护等各种研究项目。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

“过去一年人工智能的项目数量增长巨大,深度学习的项目也非常多”,Nystrom有点忧心忡忡地说,已经在PSC登记要使用GPU的项目太多了,而PSC急需购买更多的GPU满足需求。谈到黄仁勋能感觉他两眼放光。

购买更多的GPU,这是Nystrom今年的目标。量子位问:还要买多少?

Nystrom说:“三倍以上”。

好吧,希望他尽快完成采购。最后放个小视频,一起看看冷扑大师的大脑长什么样。


对了,跟Bridges同在一个机房里,还有一个看起来更科幻的超算:Anton2。不过不让拍照,据说是一个逆天的分子动力超算。

本文作者:舒石 希拉
原文发布时间:2017-04-08 
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
2天前
|
人工智能 JavaScript 架构师
流水线运行出错排查难?AI 来帮你
目前云效流水线 Flow 内 Java 构建、Node.js 构建、Java 单元测试、Node.js 单元测试这 4 个步骤均接入了智能排查的能力。
|
1月前
|
人工智能 编解码 物联网
Stability AI推出新的AI图像生成模型Stable Cascade,对比 SD2.1 的算力成本降低了10倍左右!
Stability AI推出新的AI图像生成模型Stable Cascade,对比 SD2.1 的算力成本降低了10倍左右!
|
1天前
|
人工智能 监控 数据可视化
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
4 0
|
4月前
|
人工智能 自然语言处理 测试技术
通过 4-bit 量化加载和运行 Mistral 7B AI
通过 4-bit 量化加载和运行 Mistral 7B AI
544 0
|
4月前
|
存储 人工智能 自然语言处理
掌握AI摘要技术解锁个人第二大脑
掌握AI摘要技术解锁个人第二大脑
134 0
|
5月前
|
人工智能 JavaScript Java
DevOps流水线运行出错怎么办?AI帮你智能排查
目前云效流水线Flow内Java构建、Node.js构建、Java单元测试、Node.js单元测试这4个步骤均接入了智能排查的能力。运行流水线时,如果在这4个步骤上出错,均可获得智能排查建议。
416 2
DevOps流水线运行出错怎么办?AI帮你智能排查
|
9月前
|
人工智能 并行计算 PyTorch
【AI 大模型】离线运行ChatGLM2-6B(清华大模型)
【AI 大模型】离线运行ChatGLM2-6B(清华大模型)
1804 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
成本直降70%的秘密:这些企业找到了一种高性价比的AI打开方式
成本直降70%的秘密:这些企业找到了一种高性价比的AI打开方式
|
10月前
|
人工智能 Linux 应用服务中间件
u1实例安装docker环境,并使用modelscope镜像运行AI任务
u1实例安装docker环境,并使用modelscope镜像运行AI任务
1063 0
|
11月前
|
人工智能 边缘计算 安全
【年终特辑】看见科技创新力量 洞见时代创业精神—航空航天—星测未来:给卫星装上AI大脑瞄准卫星智能化专业市场
【年终特辑】看见科技创新力量 洞见时代创业精神—航空航天—星测未来:给卫星装上AI大脑瞄准卫星智能化专业市场
143 0

热门文章

最新文章