阿里云资深数据专家闵万里:阿里云与中国人工智能的未来息息相关

yq传送门 2017-03-22

阿里云 人工智能 阿里巴巴 电商 淘宝 云服务 客服

阿里云与中国人工智能的未来息息相关

1b9cdc411491869bfa4229e4ebb2e707eb1b250b

面对采访,阿里云资深数据挖掘专家闵万里博士信心满满:“阿里云今天选择的,就是中国人工智能未来产生价值的必经之路,这也决定了阿里云与中国人工智能接下来的发展息息相关。”

如果非要问一个问题:“谁才是中国目前人工智能技术积累最强的公司?”你心中或许第一个出现的是常打技术牌的百度,或是刚靠围棋人工智能程序“绝艺”刷了屏的腾讯,相比之下,阿里的基因似乎和人工智能显得“画风不符”。可你或许不知道,2015年,双11收到的500多万人次的客服咨询中,94%都通过人工智能解决的;2016年,双11有35亿个淘宝页面由人工智能“量身定制”;2017年,阿里云让光伏巨头协鑫良品率提升1%、带来直接利益超过1亿元。

此外,城市交通、光伏切片、炼钢工艺,都是阿里云在人工智能领域与众不同的着力点。这些存在已经数十年乃至上百年的“老古董”或许在你心中很难与“人工智能”新概念联系在一起,可它们却构成了阿里云人工智能所瞄准的靶心——人工智能应用场景中的“硬骨头”。

前不久,阿里云就自身人工智能发展状况接受了全面专访。阿里云资深数据挖掘专家闵万里博士说:“啃硬骨头才是阿里云的最大价值,因为这些事创业公司基本做不了。”

2016,阿里云的人工智能元年

我们必须承认的是,阿里云是目前中国人工智能领域最重要的玩家之一。2009年成立的阿里云,一直以来都是阿里巴巴的重要组成部分,提供网站云端流量支持、大数据分析等一系列云业务。但就在去年,这个看起来距离日常生活很遥远的技术形象却在发生着巨变。原因只有一个,阿里云和人工智能“好上了”。究竟阿里云在2016年利用人工智能干了哪些事儿呢?这里有个简单汇总:

  • 去年4月,阿里云人工智能原型“小AI”成功对《我是歌手》决赛的冠军结果进行了实时预测。在关键的7进6、两两PK、三选一,三个最重要的比赛节点中,预测结果与观众评选完全一致。
  • 同在去年4月,阿里云召开了自己的2016年年会,“小AI”正式改名“阿里云ET”,成为阿里云一个重锤产品。
  • 去年8月,合众人寿在客服岗位引入了阿里云的人工智能ET,后者肩负起了响应用户在线提问,提供智能解答,检查客服质量,优化用户体验,提高客服效率等一系列任务。
  • 去年9月,广州市交警上线“互联网+信号灯”控制优化平台,引入阿里云ET对路口车辆运行分析,并输出红绿灯的实时调整方案。
  • 还是去年9月,浙江105家法院全面上线通过阿里云ET驱动的智能语音识别系统。系统甚至能针对特定案件提前学习,比如案件基本信息、当事人信息、承办法官信息等。
  • 去年10月,与杭州市政府达成合作,建立杭州城市数据大脑,初步试验中,将萧山区部分路段车辆通行速度提升11%。
  • 还是去年10月,阿里云联合广东省政府主办了航空大数据创新大赛,用人工智能为广州白云机场内运转的1000架飞机提供安全的秒级停机位分配。模拟中,17%的乘客不再需要乘坐摆渡车、飞机在跑道滑行时的冲突率也从42%减少到5%。
  • 今年1月,阿里云同饿了么合作研发出人工智能ET新的调度引擎。任务订单不再按照时间排布,而是根据骑手现有任务、路径重新规划。配送路径更短,配送时间也更快。
  • 今年2月,阿里云和国内光伏产业巨头协鑫完成第一阶段合作,生产中的良品率提升了1%,每年可以为协鑫多带来超过1亿元的收益。

以上,只是阿里云ET对外业务所取得的重点进展;在阿里内部,阿里云人工智能也占据了非常重要的地位:阿里巴巴、蚂蚁金服的客服体系中相当一部分任务由人工智能完成,大幅减少对客服人员的数量要求,同时阿里巴巴还能对自身客服质量进行监控;另一方面,基于阿里云建设的“阿里电商大脑”可以精确挖掘每一个客户的需求,为消费者提供差异化的营销和服务。

虽然屡屡在人工智能上取得进展,但是相比BAT阵营中的百度,阿里云的声势要小得多。这与阿里巴巴本身整体的电商平台形象有一定关系,但更关键的是阿里云自身的“务实”风格。正如闵万里在采访中表示的:“我们有必要对人工智能发展进行引导,强调实战与理论的结合,专注有真正价值的事。而不是去搞一个人工的娃娃,特别像女孩子,摸上去有弹性的,这种东西跟人工智能一点关系都没有。”

就爱“硬骨头”

在去年四月“小AI”成功对《我是歌手》决赛冠军结果进行实时预测后,阿里云就“变心了”,似乎再未对娱乐节目燃起兴趣,而一股脑投入到了“解决问题”的状态当中。城市交通,成为了阿里云人工智能的第一个目标。让我们从一个例子入手:

广州,和很多大城市一样,因为上下班时间集中、地点集中、汽车保有量高、街道老旧等多个原因,陷入尴尬的“潮汐式拥堵”——一个方向堵得像“停车场”,一个方向却空如“机场跑道”。一边是严峻的现状,一边却是落后的红绿灯控制方法:人工调校,全凭经验,牵一发而动全身。为了尽快缓解交通压力,城市往往只能选择拓宽和新建道路。最终被财政和城市本身的空间所限制。阿里巴巴技术委员会主席王坚曾在去年云栖大会上用了一个幽默的方式概括:“世界上最遥远的距离是红绿灯跟那个交通监控摄像头的距离,它们都在一根杆子上,但是从来就没有通过数据被连接过。”那么,人工智能能带来什么改变呢?去年9月9号,广州市交警对外宣布“互联网+信号灯”控制优化平台试点成功。这套平台中最重要的就是引入人工智能技术——阿里云ET。随之而来的,是一套全新的红绿灯工作方式:

首先,通过摄像头、预埋磁感线圈、GPS数据等对道路实时状况关键信息(车流量、车速、道路特殊情况等)进行感知;接着,根据第一步获知的信息,分析路口通行情况,判断红绿灯时长和路口通过效率是否合理;进一步,实时调整红绿灯运转规则,核心是让绿灯与需要通行的车流匹配。比如如果十字路口南北走向车流量很少,东西走向非常拥堵,就可以将南北走向的绿灯时间留给东西走向的。

这只是其中一个路口的操作方式,阿里云ET还会根据车流速度、两个路口之间的距离,调整两个路口的信号灯,保证部分车辆尽量能够一直遇到绿灯,让他们以最快的速度到达目的地,从而减少道路负荷。最极限情况也被计入考虑:假如前方路段已经堵死,绿灯的时间就会大幅度缩减。因为只有阻止更多的车辆进入,前方路段才有可能逐渐疏通起来。从而避免了单一路段的堵塞扩展开来。

最后让我们看看效果:以海珠区路口失衡现象最严重的南华中路-宝岗大道路口为例。南华中路非常拥堵,但宝岗大道方向却运行顺畅。通过将拥堵时段的南华中路放行时间加到70秒,同时还将直行与左转进行拆分放行。最终这个路口9时-13时和15时-20时的平均拥堵指数分别下降了25.75%和11.83%。“活起来”的红绿灯系统,就像一剂特效药,帮助城市用最小的改动疏通“血脉”。

这并非阿里云ET第一次涉足交通领域。2015年底,阿里云ET已在浙江实现了对高速各路段未来1小时车速的预测,准确率超过90%;2016年10月,阿里云还为杭州打造了“城市数据大脑”,萧山区的市心路成为第一个实验对象,部分路段车辆通行速度提升了11%。

工业生产上“出人意料”的进展

在交通领域颇具成果的“城市大脑”之外,阿里云ET也在工业生产上所取得的进展则更加“出人意料”。

协鑫集团,是一个国内大型的能源巨头,2007年便开始进行光伏产品的制造与生产。如何进一步提升光伏产品的生产合格率?是协鑫与阿里云一起研究的课题。光伏生产中“切片”这个关键工艺成了第一阶段需要攻克的目标。这个场景看起来似乎并不复杂:一根钢丝不断运动,利用砂浆中的小颗粒变成一把“利刃”,最终切出一片又一片薄薄的光伏基板。在这个过程中,成品合格率的大小只掌握在加工师傅的手上,他们的经验同样是通过一次又一次的失败摸索出来。一旦机器或人员不稳定,次品率就会随之上升。这种“经验决定一切”的逻辑实际上也存在于其他工业生产环境中。而阿里云ET的到来却改变了这一切。

第一步,是生产参数的细分:上部砂浆温度、下部砂浆温度、上部导轮温度、下部导轮温度等等。这些参数之前并未加入监测,因为操作人员并不可能掌握这些参数,但正是这些参数反映着生产的实际状态;接着,阿里云ET的数据分析能力就派上了用场,通过一定数量生产过程的学习,这些生产参数与最终良品率的关系最终被细化;通过这套阿里云为苏州协鑫搭建的参数曲线模型,后者得以在生产过程中监测变量,一旦变量超出模型范围,监测系统就会及时预警,这就像给协鑫的生产环节中加入了一个新“大脑”。

通过第一阶段的合作,协鑫光伏良品率已经提升了1个百分点。“数据看上去的确不算大,但对于光伏产业来说,良品率每提高千分之一,就能节省上千万的生产成本。”闵万里博士说。这也意味着,协鑫这套去年才引入阿里云大数据分析能力的系统,已经创造了1个亿以上的价值。

实用≠傻,其实是满满的野心

看到这里,你或许已经发现阿里云在人工智能上最大的一个特点:实用、落地、深入实际场景。在很多人眼中,这实在是一种吃力不讨好的做法,阿里云为什么不专心做平台呢?闵万里说出了阿里云自己的思考:

“平台我们也有做,但是‘啃硬骨头’也是我们决心要做的。这些场景在我们选择的时候,就已经考虑到了横向拓展性。如果他们不具备横向拓展性,那我们自然也不可能去做。”就拿城市交通来说,虽然城市之间的交通状况千差万别,但是它们的核心目标同样没有改变——如何在有限的道路资源下尽可能快的将所有人运送到目的地。即便广州和北京、上海乃至深圳的交通结构有一定差异,但车流量分析、红绿灯调整机制等一系列基础功能都是通用的。有了广州的经验,想要去适应别的城市自然也会简单许多。而工业生产更是如此,工序、工位是各种工业生产过程中的基础单元和定义。而像阿里云在苏州协鑫“切片”中,用人工智能重新定义加工程序的策略,对很多有自动化基础的加工步骤都能适用。

实际上,阿里云自身也在做着下一步的规划。闵万里透露:“我们接下来在工业生产中还会有动作,会瞄准钢铁行业。这是一个产能高度过剩、产效极度低下的产业。我们已经在跟这个领域中的大企业在沟通了。”

究竟人工智能能否为19世纪中期启航的现代炼钢工艺再次注入动力?这的确值得期待。城市交通、光伏切片、炼钢工艺……让阿里云的人工智能路看起来独辟蹊径,这些存在已经数十年乃至上百年的“老古董”却是阿里云所瞄准的靶心——人工智能应用场景中的“硬骨头”。闵万里直言:“‘啃硬骨头’才是阿里云的最大价值,因为这些事别的创业公司基本做不了。”那么,究竟是什么样子的“杀手锏”,让阿里云如此自信自己“啃得了硬骨头”?

两大“杀手锏”之云硬件

相比其他互联网巨头、人工智能行业公司,阿里自身的最大优势是什么?答案非常简单——极度强大的云硬件资源。电子商务的蓬勃发展,成就了阿里巴巴帝国;而在这一过程中阿里巴巴投入的大量基础研发,又造就了自身强大的技术和云计算服务能力。放眼全球,阿里云只排在亚马逊AWS以及微软Azure之后。根据去年年底摩根士丹利的统计,阿里云目前在中国公共云市场已经占到了50%的市场份额,成为中国云服务市场当之无愧的霸主。但这跟人工智能又有什么关系呢?

这就要从人工智能的需求说起。作为当下最火的概念,人工智能本身并不新,而其基层技术你同样不会陌生:大数据和运算。就拿之前“大红大紫”的围棋人工智能AlphaGo来说,为了让其进行足够的计算,进而得出超过人类的围棋技能,Google旗下的200多台专用服务器很可能已经运行了数个月乃至一年。

彩云AI CEO袁行远曾表示:“新产品彩云小译之所以能够在中英互译上取得突破,其中一个最重要的关键就在于GPU硬件性能的提升,让我们能够直接将每个字丢进神经网络中分析,一方面大大提升了翻译效果,又解决了棘手的中文分词问题。”既然要增加运算能力,最简单的做法就是每个人工智能创业公司自己多买几张显卡,用GPU来做加速——但这并不现实。

瑞为信息CEO詹东辉表示:“其实创业公司并不是一直都需要那么强大的计算能力。我们通常是在初期打造产品、后续升级产品过程中需要研究大量数据,如果这部分需求全部自己购买,我们自己必须承担很高的硬件成本。”

通过为互联网世界提供“水电煤”服务的云计算来完成这一任务,几乎是顺理成章的事。这对于早几年已经开始为用户提供GPU算力的阿里云并不困难,他们甚至还给出了一个更前瞻的升级解决方案:异构云计算。

低耗高效的FPGA阵列

异构的意思也很简单,目前阿里云的云端硬件中不仅有传统云服务中最基础的CPU(中央处理器),同时还有大数据、人工智能背后的“推手”GPU(图形处理器)、最后是新晋的专业运算芯片FPGA(可编程逻辑门阵列)。你不需要深刻了解这一堆专业术语,你只需要知道:

  • 1.CPU不太适合进行人工智能运算;
  • 2.GPU是目前人工智能运算的主力;
  • 3.FPGA相对于GPU的优势在于“能效比”,但同时开发成本比GPU更高。

看起来,引入FPGA而不单独只用GPU是顺其自然,但“能效比”对于云服务商来说并不算很关键,反倒是用户会更关心这个参数,因为它同时代表了后期运行费用。阿里云工程师龙欣采访中表示:“我们积极推进FPGA主要就是为了能效比,而不是为了好看。这其实体现了我们以用户为主的思考——从这一点出发,能效比远比硬件是否最新重要。”

当然,“性能”还不是阿里云唯一的核心元素。在“弹性需求”、“易用性”、“安全性”几个重要特性上,阿里云也投入了很多力量。“弹性需求”指上文中提到的、时大时小的人工智能创业公司需求。既然他们不可能一口气买那么多硬件,自然也不可能长期使用一个峰值服务。唯一的办法就是用弹性的资源去响应弹性的需求,阿里云自己的弹性计算和容器服务就能完成这一点——一旦需求上升,用户只需要简单的步骤就能申请并使用更多资源。这让整个阿里云看起来就像一台“巨型电脑”,其所包含的海量资源根据用户的不同需求进行分配。2016年“双11”购物节上满足最高17.5万笔/秒交易的阿里云,在“满足需求”这件事上完全没有对手。

“易用性”则是阿里云硬件的另外一个坚守

为了方便用户使用,阿里云投入了很多用户看不见的努力。对于这一点的重要性,龙欣用超算中心举了个例子:

“当下实际有一个云和超算互相渗透的现象。比如现在国内领先的一些超算中心,为了方便用户应用,他们正在大力推进易用性。而云服务本身易用性就比较强,专注性能发展的我们也在朝超级计算机的能力前进。”

最后是“安全性”。因为任务拆分和节点调用的关系,实际操作中同一台硬件服务器上可能跑着数位、数十位用户,而他们每个人的数据、计算安全都需要靠阿里云来守护。飞天OS内含的虚拟化、容器和专有网络等技术为他们提供全方位保护。

在几大特性之外,阿里云面对海外市场也显露出“积极出击”的心态。截至去年年底,阿里云又在欧洲、中东、日本和澳大利亚建立了自己的数据中心。至此阿里云已经在全球拥有了14个数据中心

龙欣在采访中对表示:“亚马逊、微软实际上都在尝试进入中国市场。我们不可能在家里等着他们打进来,而是应该勇敢打出去。同时我们也能为一些已经在使用阿里云服务的企业提供出海的基础。”从硬件的使用、到飞天系统、再到阿里云的一系列核心策略贯彻,最终打造出一个利于人工智能的肥沃土壤。可如果只有土壤没有水分,很多植物也生长不出来,而“水”这个角色——就是由阿里云ET来扮演的。

两大“杀手锏”之阿里云ET

去年8月召开的云栖大会上,“阿里云ET”正式诞生。你可以把“阿里云ET”当做阿里云旗下一个专攻人工智能技术的部门,但这并不代表阿里云从这一刻才开始做人工智能。早在3、4年前,阿里云已开始涉足人工智能,但场景主要集中在自身需求之上:商品图片美观度打分、客户投诉语音识别、文本识别、文本语意情感分析。这些融于业务线的人工智能技术,直接给阿里巴巴带来了很多利益:

比如现在手机客户端中的“拍立淘”功能,用户无需进行搜索,只需给心仪商品拍个照,淘宝则会根据照片进行分析,搜索出与之相似的可购买商品。这个过程实际上就是一个非常复杂的人工智能图片搜索功能。这个功能,使用户购物步骤简化,用时更短,也让淘宝能够赚得更多交易量。

另一个例子是淘宝官网客服。目前淘宝客服有很大一部分是人工智能。一旦遇到售后问题,他们可以通过语音或者文本的方式向淘宝官方反馈,并获得一些常见问题的语音文本解决方案,直到仍然无法解决,才会进入人工服务步骤。

方便用户购物,节约人工服务资源以便为最需要的顾客服务,光这两点已价值连城。但因场景分散,阿里巴巴的人工智能力量也曾经十分分散,如何对外对接、输出技术就成了棘手的问题。建立一个涵盖各种人工智能技术能力,同时具有整体统筹架构的“大产品”就是一个不错的解决方案——于是,便有了千呼万唤始出来的“阿里云ET”。少数人可能还有一个疑问:为什么阿里云一定要将人工智能技术输出呢?好好自己赚钱不好吗?

对此,闵万里说出了阿里云的考虑:“如果今天阿里云只是关起门来自己服务自己,那我们这些技术的沉淀价值就被打了折扣。如果想要输出,阿里云其实是一个最好的出口,因为从它成立的第一天起,就是要做中国计算机的‘水电媒’,这件事本身就是我们的责任。”为了做好中国人工智能中的“水电煤”,阿里云也进行了一系列的努力:

首先就是“天池大赛”,这个去年10月第一次举行的人工智能大赛,并不限制是否来自阿里,同时面对社会。学生、创业公司、独立开发者。整个比赛围绕着一系列任务展开。“如何为广州白云机场内运转的1000架飞机提供安全的秒级停机位分配”就是其中一个主题。最终,复旦大学、浙江大学以及另外一家创业公司的4位参赛者同时获得了冠军。通过这种创新模式,阿里云一方面能够提供自身强劲的硬件资源,一方面又能解决问题,同时还能推进人工智能技术的应用。

此外,大赛含有另一层含义。iDST(数据科学与技术研究院)是阿里巴巴内部“最神秘的部门”,同时也是最多科学家的部门,在中美都设有研究室。同时,它也是“天池大赛”背后的推手,在比赛中表现优异者也会尝试吸纳进这个神秘的部门,进而为阿里云的人工智能发展提供充沛的脑动力。

闵万里对Xtecher格外强调:“从某种程度上来说,我觉得今天的阿里云在给业界一个信号:那些有信心在人工智能这个行业做出大事的人,都应该到阿里云来!”

阿里云,中国人工智能的未来?

在去年的乌镇大会上,马云说过两段话:“我们用技术、梦想和勤奋,做到了前人不能做到的事情。我们把这家公司定位成为一个经济体的建设者、参与者和运营者,我们只是有幸参与了这个经济体的建设,把我们拥有的一切普惠化,分享我们的技术,共同来促进新商业文明的建设。”

“一场技术革命周期大概都是五十年的,前二十年是技术公司的革命、创新,但是后面的三十年是技术在社会方方面面巨大的应用,谁能够应用好技术、谁能够把技术进行普惠化,我认为这才是未来。”

说出这两番话的马云自然不可能忽略掉人工智能。有中国最强大的云硬件、有自己专门的人工智能部门,一边将硬件资源卖给从业者使用、一边自己啃着“硬骨头”,同时还不忘用新模式驱动人工智能普及,并促进人才成长——这一切,才是潜藏在阿里巴巴“电商巨头”表面之下的人工智能全貌。究竟阿里云对中国人工智能有多重要?闵万里给出了自己的看法:

“阿里云今天选择的,就是中国人工智能未来产生价值的必经之路。这也决定了阿里云与中国人工智能接下来的发展息息相关。”


来源:今日头条 作者:Xtecher
原文链接
登录 后评论
下一篇
云攻略小攻
2087人浏览
2019-10-21
相关推荐
杭州造云记 | 甲子光年
1575人浏览
2018-09-25 10:19:25
2
10
0
3203