围棋人机大战一周年：被AlphaGo改变的世界

2018-01-09 1240

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

去年今日，三连败的李世乭扳回一局。

然而这一针兴奋剂很快失效，随后李世乭再折一阵，最终以1:4输给AlphaGo。在围棋的人机大战中，顶级人类选手完败给人工智能。

人工智能一战成名，李世乭留下落寞侧影。为AlphaGo落子的黄士杰一年后回忆说：“当时我代表AlphaGo下棋，必须保持冷静”。

从那时起到现在，人类始终生活在一个被AlphaGo改变的世界。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

一年回望

站在围棋人机大战一周年的节点上，该如何回顾过去、展望未来呢？量子位先把几个问题抛给创新工场AI工程院副院长王咏刚。

量子位：一年后再看AlphaGo有何改变？有什么记忆犹新的片段？

王咏刚：AlphaGo出世一年，其实进入大家视野的是三个版本：5:0击败樊麾的内测版本，4:1击败李世石的版本，以Master网名60:0快棋挑落中日韩高手的版本。三个版本演进脉络明显，每次迭代都有重大升级。

最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进，远远将人类选手甩在身后。电脑计算“大局观”的方式，和人类培养“大局观”的思路，有根本的差别。人类没可能在这方面赶上电脑。

和樊麾对局的棋谱基本上还看不出AlphaGo的大局观有多强，和李世石对局就下出了聂卫平赞不绝口的五路肩冲，到了Master的60局，大局观体现在两个地方：

1）从始至终对局势的把握，比如第60局古力用AlphaGo的思路对付AlphaGo，把中央撑得很满，但AlphaGo不紧不慢，总是恰到好处地保持胜势。

2）已经深刻影响人类对布局的思考，大飞守角之类的变化迅速被人类棋手模仿，这和当年深蓝问世后，国际象棋的布局革命是一样的。

量子位：过去一年，有什么具体产品或研究，是基于AlphaGo的么？

王咏刚：AlphaGo用的是AI领域应用非常普遍的算法：深度学习、蒙特卡洛算法、增强学习等。

从概念上可以说，机器视觉相关的深度学习技术，包含环境-决策-反馈的智能系统，里面都有AlphaGo的影子。当然，直接的代码实现层面，肯定没有复制、粘贴这样直接借用的关系，因为AlphaGo的深度学习模型毕竟是围绕围棋的特征建立的。

DeepMind去年发布的读唇术LipNet，与英国国家医疗服务体系NHS合作推出的医疗辅助应用Streams，与眼科医院合作帮助眼部疾病诊断等等，可以说都是与AlphaGo同源的技术。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

量子位：AlphaGo是否已经攻克围棋？未来可提升的空间还有哪些？

王咏刚：“攻克围棋”，如果说战胜人类选手的话，AlphaGo已经实现了，而且现在“绝艺”，DeepZen之类的程序对人类胜率也很高了。

未来最多三年必将发生的是，手机上的本地APP就可以战胜人类职业高手，现在热闹的网上围棋对弈平台都会死掉（因为对手可以轻易用手机作弊），人类围棋将回归现场竞赛，围棋培训讲师将更重视普及教育，因为中高级的提高训练完全可以用机器代练。

不过，如果说“攻克围棋”是像计算机可以穷举西洋跳棋的所有变化那样，让电脑成为围棋“上帝”，这个应该还不大可能。现在AI大部分的招数，还在人类高手可以理解的范畴内。AI也有一些可疑的“弱点”，比如官子水平到底如何等等。

以后AI和AI之间的竞赛，应该会不断促进AI提高（但这种没有太多商业利益的事情，有没有持续投入是个问题）。人类应该望尘莫及，但可以不断从AI中学习新的思想。

不止下棋

“AlphaGo给大家最大启发，不是赢棋，而是如何构建一个智商超过300的机器”，HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威说。

构建的方法有两个：一是训练、二是数据。张智威最近在清华的一次分享（传送门）中说，“如果能做好这件事，各位都是亿万富翁。最近两年，我们每天都在想，哪些领域可以拿到无限的数据”。

而在AAAI Fellow、IEEE Fellow、香港科技大学杨强教授看来，DeepMind在创造AlphaGo的过程中，引入一个新的概念：利用深度学习+强化学习，来判断现状和预测未来。这与未来的商业模式有着明确的关联：

通过对大数据的分析，对现实的判断和对商业未来走向进行预估。

杨强还试图基于AlphaGo归纳出一套人工智能的应用流程：算法的目标是什么？有没有数据？数据在哪里？问题的边界是否清晰？什么叫合理的走法、什么叫犯规的走法？你的特征在哪里？又如何得到这些特征？是否可以得到一个持续的反馈？

但也有人沿着另一条路前进。

围棋也好、国际象棋也好、国际跳棋也好，所有这些都是完美信息博弈。现实世界中，不完美信息才是常态，各种看不见的隐藏信息产生了大量的不确定性，而德州扑克代表的就是这种类型的博弈。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

今年初，在德州扑克的人机大战中，人工智能Libratus击败了四位顶级人类玩家。创造了这个AI的卡内基梅隆大学Sandholm教授说，能够处理不完美信息的AI，未来可以用于商业谈判、网络安全、医疗方案制定等领域。

人工智能发展的终极目标，是通用人工智能（AGI）。通用人工智能可以解决任何一个问题。想要实现AGI就得让人工智能学会解决不确定性问题，这也是德州扑克人机大战的重大意义之一。

对于已届不惑的Demis Hassabis来说，创立DeepMind的目标绝不仅限于创造AlphaGo。过去的一年里，DeepMind还搞出了很多有意思的创新。

比方说可以模拟任意一种人类声音的WaveNet；以及与英国国家医疗服务体系合作，使用人工智能来改善医疗行业等。

继续战斗

过去的一年里，仅仅在围棋界，出彩的人工智能就不止AlphaGo一家。比方说量子位此前报道过的首个围棋十段：腾讯绝艺（传送门），就是一个AI。

而对于AlphaGo来说，挑战也还没结束。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

现在的围棋江湖里，中日韩三强中，无疑中国军团占据了绝对的优势。刚刚结束的第18届农心杯三国围棋擂台赛上，中国队仅上场两位选手，就将日韩两队悉数全灭。连笑、柁嘉熹、柯洁等重量级棋手尚未登场，就已经拿下冠军。

不在正式场合对阵世界排名第一的柯洁，对于AlphaGo来说始终不够完美。去年AlphaGo挑战李世乭前，各方还就谁赢谁输打赌。

当时《连线》记者在报道中描述道：

一位名叫周峰的中国记者在观战室拦下了我，开心地和我这种将AlphaGo视为科技奇迹而非围棋杀手的人进行对话。

但是当我询问看见李世石输了比赛他作何感想时，他指着心口说：“我很难过。”

四月，新的人机大战又要启幕了。

量子位很想问问，如果柯洁这次也输给AlphaGo，周峰还会特别难过么？

这一次，在人工智能和人类顶级高手之间，你觉得谁会赢呢？

“我们不关心输赢。输赢其实不用看的，AI想赢它就肯定能赢”，云从CEO周曦说，“关键问题是AlphaGo会不会有些新的想法”。

好戏又要上演，而未来的人机大战，势必不止于围棋。

插播广告

还有个大新闻：《马云爸爸神秘计划曝光，组建新团队研发人工智能》

详情见量子位微信公众号(ID：QbitAI)今日推送的二条。

本文作者：舒石、若朴

原文发布时间：2017-03-13

围棋人机大战一周年：被AlphaGo改变的世界

一年回望

不止下棋

继续战斗

插播广告

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景