专访阿里云闵万里:云上逐鹿,ET大脑要做行业化、垂直化的创新运用

简介: 闵万里将在10月的云栖大会·阿里云生态峰会上分享阿里云ET大脑的项目实践,并重点介绍ET大脑的应用场景、技术挑战和未来发展。

编者按:1011-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲。从今天开始,云栖社区将会对大会嘉宾做一系列专访(关注云栖大会”社区公众号了解更多大会信息)。本期我们采访的是阿里云人工智能科学家闵万里,他将在10月的云栖大会·阿里云生态峰会上分享阿里云ET大脑的项目实践,并重点介绍ET大脑的应用场景、技术挑战和未来发展。

0ab0bb8c73cd8405578d4e65b268e60eb05c72e9

2017杭州云栖大会详情请戳这里

闵万里,阿里云人工智能科学家,ET大脑负责人。2004年博士毕业以后加入IBM,参与IBM智慧城市研究,主攻大数据的研发和运用,2010-2012年在IBM新加坡做智慧城市,推动创新项目落地。2012年加入Google,担任数据科学家,做广告竞价的竞价模型。2013年9月加入阿里巴巴,组建了数据科学团队,支持聚划算和天猫做数据化运营。2015年加入阿里云,组建大数据孵化器团队,探索DT技术在垂直行业的创新及落地。2017年开始担任阿里云大数据事业部的总经理继续推动DT技术在各行各业的普及应用。

6426ddc2abd1c3fc8cb784282ad9194c9af8f53d

数据智能在阿里云的应用

闵万里加入阿里后,便迅速组建了一直能够兼顾项目研究和商业化落地的人工智能团队,这其中不得不提阿里云ET。

2016年4月,阿里云ET首次亮相,与此同时这也是首次以人工智能技术为背景,在歌唱比赛垂直业务场景中运用ET。

“这是ET首次直面公众,风险还是比较高的。”闵万里回忆道。

而最后的结果还是在这支团队的意料之中,最终ET以42%的胜率一举命中总决赛歌王李玟,并且在三轮比赛中都预测准确。“这个项目集合了阿里巴巴实时流计算的能力和多元数据实时分析的能力,还有实时预测的能力”,闵万里表示,这也阿里巴巴实时数据处理能力的一个集中展示。

和阿里巴巴其它人工智能应用场景不同,ET的首次亮相综合运用了多数据来源,包括互联网采集数据、湖南卫视的收视率数据、还有ET对上百万首歌曲的学习和理解(包括每首歌好听的层度、演绎好坏的层度、现场歌手的声调)。闵万里告诉云栖社区,ET能够对多种信号做实时解析,动态更新,每五秒做一次预测更新,而要处理这样的任务对技术的挑战是巨大的。

“这里体现了很多能力,包括对歌曲的理解,以及对歌手每一句唱得好不好的分析。因为歌曲唱得好不好本身是很主观的判断,没有明显的客观标准。”在开始比赛之前的一次性预测是很好实现的,但要收集这么大的数据量,五秒预测一次并更新,这就非常有挑战性了。

闵万里提到,为此,前期项目团队花了很长的时间来准备数据,以及让ET学习歌曲并且做出预测。用机器学习歌曲的特征,需要结合网络上歌曲的点播量、下载量、好评量等指标来判断这是不是一首好的歌,这个主要体现了项目的实时计算能力。

2016年,正值人工智能最火的那段时间,而ET凭借优异的表现毫无悬念的成为了业界关注的焦点。

不过对于闵万里而言,如何把技术对外赋能,如何让人工智能成为普惠技术,才是最终的目的。

阿里云ET项目之后,闵万里便开始推动ET大脑项目。ET大脑起初是从几个垂直行业中孵化出来的,如城市大脑、工业大脑、环境大脑、医疗大脑这些具有明显行业背景的。可以说,ET可以归属于音乐大脑。

在闵万里看来,ET用于音乐,而城市大脑用于城市管理,工业大脑用于工业生产线,它们都是实时数据、活数据、在线更新的。云栖社区了解到,ET城市大脑项目在杭州、萧山、苏州等地与相关部门合作,用城市大脑协助城市管理,具体内容包括实时信号灯控制——用互联网、高德数据实时控制信号灯,这也意味着,大脑能消费的数据变得更多。

除了信号灯的控制,利用iDST团队研发的专有算法, ET大脑还可以自动巡检几千路的视频信号,自动发现其中的异常点,极大降低人工巡查的时间和精力;另外,城市大脑还能分析市民的出行意愿,调整公交班次,自动调配;除此之外,闵万里还透露,他们正在做一些新的尝试,比如在杭州某地最近进行的城市绿波带尝试,把单个智能设备、单个智能系统串联起来,形成一个全局的智能系统,形成智能设备之间的有效联动,来最大限度的服务社会,激发数据的价值。

在这样的复杂场景下,ET大脑集成了多种人工智能技术,而这样的项目研发所遇到的挑战包括技术上的挑战和社会环境的挑战。

闵万里谈到,技术上的挑战主要来自数据源和产品化两方面:数据源的挑战是指在很多垂直场景下,很多数据拿不出来,或者没办法实时拿出来。一是因为数据获取比较复杂,或者数据拥有者有很多顾虑;二是因为有的数据拥有者虽然积极配合,但是数据残次不齐,例如说有的城市的交警数据,地面上很多线圈已经坏了,有的工业上的数据读取中有很多工业协议读取不了。

而产品化的挑战则是大多人工智能应用场景的通病:很多先进的人工智能技术和算法在实验室里效果很好,但是移植到实战当中部署的时候,需要面临实验室产品运用到行业的挑战,包括运行效率、稳健性等,比如出现数据断传的情况怎么办,出现数据被污染的情况怎么办,这些都是项目需要解决的问题。除了技术上的挑战,团队也面临环境的挑战。很多人对这种出现的新技术是质疑的,当大家看不到价值的时候都喜欢问做这些有什么价值。对于一个创新者来说,没有机会去证明他自己是很难回答这个问题的。

坚持普惠的ET大脑项目应用

目前,ET大脑涵盖了城市大脑、工业大脑、医疗大脑以及环境大脑。对于这些领域的选择,闵万里给出了他的解答:第一,项目始终坚持普惠的理念,这些行业服务的是全人类,工业制造的效率提升可以让老百姓从中受益;第二,技术上说这几个行业都是数据密集型行业,数据密度够高,价值密度也很大;第三,这些行业痛点尤其突出,因为大量的数据没有被利用起来,数据不流动就成为了“库存”,就会导致资产负担,所以要把负债变成价值。

迄今各个大脑的进展都很顺利,并且表现出了惊人的成绩。城市大脑方面,项目在杭州和苏州与相关单位已经开始合作,逐步推广落地。目前在部分区域的视频自动巡检和交通状态报警已经初见成效。工业大脑方面已经有不少成功的案例,比如流程制造的中策橡胶、协鑫、天合光能。除此之外,在装备制造、离散制造中也开始了初步尝试。医疗大脑方面,项目通过生态的力量推进医疗大脑在各个细分领域的研发,提供计算能力与算法服务。项目举办的医疗肺结节诊断大赛,在本次云栖大会中即将完美收官,并且在肺结节的诊断上已经取得了阶段性成果。环境大脑方面正在推进内蒙古自治区和阿里云ET环境大脑的合作,通过人工智能技术寻找保护环境的新方式,还利用环境大脑在江苏对固废污染源实现了智能感知。

事实上,现在的ET大脑已然成为了阿里云人工智能的代名词,它很好地解决了两方面的问题。第一,ET大脑能够解决更多行业的问题,创新性的问题;第二,ET大脑能够承载一个平台的使命,让更多有想法的人利用ET大脑的开放架构来探索更多创新应用。ET大脑的身先士卒,在一些垂直行业做出了创新的示范,极大证明了阿里云计算及大数据产品的潜力。此外,城市大脑、工业大脑、交通大脑、医疗大脑则会在接下来的航空、能源、新零售甚至安全领域做一些创新性的示范。闵万里表示,“我们希望通过这些示范能够激活更多的外脑,让社会上一些有创造性想法、有技术的公司能在ET大脑的架构上做自主创新,让ET大脑不仅仅成为阿里云自主创新的大脑,更是成为一个平台支持全民创新。”所以可以说,ET大脑希望的是把公共数据资源的价值与业务的场景快速结合,产生实战效果。

拨云见“智”,人工智能协同共生的未来

谈到阿里云ET大脑时,闵万里表示,这实质上都属于数据智能范畴——用新技术(云计算和数智技术)加上新能源(数据),来打造新物种(新零售、新制造等等)。他认为,在数据智能的实践上,要找准业务场景、痛点以及最佳应用场景,要场景化和垂直化,因为数据智能不止是一门技术,它还是技术与业务的结合,更是一种理念。

除了阿里集团本身拥有更多的算法和和计算能力之外,闵万里的成功秘诀就是敢于想别人不敢想的事儿,挑战不可能。“当所有人都说不可能的时候,有可能你就要成功了。”

当然,现在的人工智能远远没有达到大众的预期。而对于未来的趋势,闵万里也给出了他的答案——语言视频图像等单维度功能的综合协调是人工智能的下一步。

“未来的人工智能不止是视频或者语音,一定是多种功能的协同,其核心就是协同。另外,人工智能要回归到认知的本质,要在类脑的研究上下功夫。”他所带领的团队已经做出了下一步规划:一是ET大脑要产品化,要开放,ET大脑产品化正在推进中,同时项目会开放平台,邀请和鼓励生态伙伴一起在ET大脑的架构上做行业化、垂直化的创新运用;二是在一些从没有涉及的垂直领域,预计会去率先打造一些垂直示范的项目,再激活对应行业中的ISV(独立软件开发商)。

而项目的具体情况他将在杭州云栖大会上逐一公布,届时闵万里将分享拨云见“智”的话题,聚焦数据智能的生态和复合多体智能。

PS:ET大脑是一个普惠科技,致力于让更多的人在这个平台上成功,包括有想法的数据科学家、数据爱好者和合作伙伴。此外,项目天池能够提供平台、课程、数据并且定期发布任务,已经吸引了全球73个国家和地区的十万多名开发者,借助人工智能和大数据解决生产生活中的实际问题。另一方面,复合多体智能是团队对人工智能在具体场景中落地的终极判断,最近也有了一些新的尝试和实地试运行:通过对单个智能设备的串联形成了一个全局的智能系统,让系统内的各个智能设备可以群策群力,形成从感知、指挥、全局协调的智慧城市。

云栖大会购票通道请戳这里

云栖大会报道:

专访阿里云雁杨:因需求而进化,ECS云服务器追求弹性极致

安全人工智能应用之我见:时代“风口”的交叉点

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
19天前
|
安全 云栖大会 云计算
阿里云创业者计划:数字化时代的创新助推器
阿里云创业者计划助力初创企业数字化转型,提供最高100万上云抵扣金,1对1技术服务,及品牌曝光等综合支持。通过降低上云成本与技术指导,该计划旨在帮助企业在竞争中站稳脚跟,促进创新与行业发展。尽管面临审核流程及技术利用的挑战,该计划仍为创业创新提供了关键推动力。
178 4
阿里云创业者计划:数字化时代的创新助推器
|
1月前
|
消息中间件 Cloud Native Kafka
活动报名|AutoMQ x 阿里云云原生创新论坛(2024.03.09)见证“新一代云原生 Kafka ”重磅发布!
新一年, AutoMQ 首场线下活动重磅来袭!2024年3月9日,由 AutoMQ 与阿里云联合举办的云原生创新论坛将于杭州与大家见面,双方联合重磅发布新一代云原生 Kafka ——AutoMQ On-Prem 版本 !现场将会分享如何通过云原生和存算分离架构实现 Kafka 产品的10倍成本优化,并保持秒级分区无损迁移。另外,活动现场还有来自得物的技术专家分享 AutoMQ 在生产场景中的应用实践,以及阿里云的资深专家为大家剖析多 AZ 块存储的原理。
120 0
活动报名|AutoMQ x 阿里云云原生创新论坛(2024.03.09)见证“新一代云原生 Kafka ”重磅发布!
|
2月前
|
数据采集 供应链 机器人
阿里云 RPA 对企业流程的影响:提升效率与创新的新利器
在数字化时代,企业面临着越来越高的效率和创新要求。为了在激烈的市场竞争中脱颖而出,企业需要不断优化业务流程,提高工作效率,并寻求创新的解决方案。阿里云 RPA(机器人流程自动化)的出现,正为企业带来了前所未有的机遇。
|
2月前
|
机器学习/深度学习 弹性计算 搜索推荐
灵活选择与创新设想——我对阿里云ECS的付费方式有话说
随着企业越来越多地采用云计算服务,选择适合自身业务场景的付费方式变得至关重要。阿里云ECS作为一种广泛使用的云计算服务,提供了多种付费方式供用户选择,包括按量付费、包年包月、抢占式实例和节省计划。那么本文就来聊聊关于灵活选择和创新设想的阿里云ECS付费方式,并提出对付费方式的设想,并评估其优缺点,以解决不同业务问题。
399 1
灵活选择与创新设想——我对阿里云ECS的付费方式有话说
|
4月前
|
存储 人工智能 文件存储
阿里云吴结生:面向大规模数据智能的阿里云存储创新
近年来,越来越多人意识到,我们正处在一个数据爆炸式增长的时代。IDC 预测 2027 年全球产生的数据量将达到 291 ZB,与 2022 年相比,增长了近 2 倍。其中 75% 的数据来自企业,每一个现代化的企业都是一家数据公司。
427 8
阿里云吴结生:面向大规模数据智能的阿里云存储创新
|
4月前
|
消息中间件 监控 Cloud Native
阿里云云原生助力安永创新驱动力实践探索
阿里云云原生助力安永创新驱动力实践探索
|
4月前
|
新能源 大数据 调度
阿里云IDC“数据中心低碳用能与任务调度“创新成果荣获“年度低碳解决方案”荣誉
阿里云IDC“数据中心低碳用能与任务调度“创新成果荣获“年度低碳解决方案”荣誉
|
4月前
|
存储 人工智能 运维
阿里云大模型数据存储解决方案,为 AI 创新提供推动力
阿里云大模型数据存储解决方案,为 AI 创新提供推动力
60931 3
|
4月前
|
存储 人工智能 文件存储
云栖速递,面向大规模数据智能的阿里云存储创新
云栖速递:面向大规模数据智能的阿里云存储创新
683 2
云栖速递,面向大规模数据智能的阿里云存储创新
|
5月前
|
大数据 调度 数据中心
阿里云数据中心算电协同创新成果荣获联合国大奖
阿里云数据中心算电协同创新成果荣获联合国大奖
阿里云数据中心算电协同创新成果荣获联合国大奖

热门文章

最新文章