在阿里做博士后是一种怎样的体验?

简介: 上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。

上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。

阿里博士后工作站的优势在于真实丰富的业务场景和数据,这对技术研究至关重要,却为高校和科研院所欠缺。因此,打通学术界和工业界就很有必要。这正是阿里这些年努力的方向。

image

阿里巴巴博士后“企业导师”名单

早在2008年,阿里就建立了博士后工作站。2017年10月,立足基础科学、颠覆性技术和应用技术研究,“致力于探索科技未知”的阿里巴巴达摩院成立。得益于此,阿里可以为工作站提供顶尖科学家组成的“明星导师团”:世界顶级量子科学家施尧耘、美国密歇根州立大学前终身教授金榕、亚马逊前最高级别华人科学家任小枫、新加坡南洋理工大学终身教授王刚……在阿里,可以担任企业博士后导师的海内外学术带头人、研发管理人才已有百余人。

针对人才,阿里也开出了丰厚的条件。除了提供“具有市场竞争力的薪酬福利”,协助申请国家级、省级和市级多种科研经费之外,阿里还将协助博士后解决北京或杭州户口。

阿里博士后工作站是阿里博士人才引进和培养的重要平台。现有北京站和杭州站,并与中国科学院、清华大学、浙江大学、上海交通大学、新加坡南洋理工大学等顶尖高校达成了联合培养计划。目前阿里技术团队拥有数百名博士。未来3年博士后工作站计划引入200位青年科学家。

那么,在阿里做博士后究竟是一种怎样的体验?两位阿里博士后和我们聊了聊他们的故事。

做真正影响用户的技术和产品
—— 薛少飞
(阿里北京站第一批出站博士后)

我是去年11月份出站的,现在的Title是阿里达摩院机器智能技术实验室算法专家,主要负责语音识别的技术创新和产品落地。我在这个领域已经做了快十年——本科是中国科学技术大学电子信息专业,大三就进了实验室,后来保送硕博连读,在中科大一直读完博士。

image


薛少飞(左一)参加ICASSP2017国际学术会议

我不完全是个技术男。我喜欢文学、历史,会看很多人文的书,我相信技术能够解决很多的问题:比如可以用规则和统计建模方法解决的问题,技术很大程度上都能够解决。但我觉得技术的作用并不是要取代人类,而是将人类从重复性劳动中解放出来。读了研究生之后,我开始想自己到底要做什么样的工作。过程中也经历了很多尝试,最后我给自己的定位是——做能真正影响用户的技术和产品。

到阿里做博士后,我看重的是阿里这个平台。它有很多的应用场景,有很多的数据。我们做语音识别需要大数据以及资源、平台,阿里都具备,而且我在进入之前就对我们团队有所了解,这是一群能够做出事情的人。

我是阿里北京站第一批博士后,2015年9月进站。刚到阿里做的第一个项目就很有成就感。那是一个智能客服的项目,在用户咨询人工客服之前,先去分析用户的行为,猜测他遇到了哪些问题,推荐给用户一些解决方案。这在当年的“双11”就体现了价值。做项目过程中跟支付宝团队有很多协作,会和他们一块儿头脑风暴。这个过程非常有自我价值实现的感觉,一个做技术的人最希望的就是自己做的东西能够体现出它的价值。

2016年阿里云年会上,我们做的语音识别系统和金牌速记员去做了一个PK,在识别准确率上以微弱优势战胜了人类速记员。我们在业界首个采用了LC-BLSTM声学模型。在当时这个语音识别模型很前沿,在学术研究上也是正在进行当中的。我们首先需要从学术的角度去判断这个东西会不会比现有的模型有一个明显的提升,然后你要迅速地去实现和证明,并进行落地。后来这套模型也用到了其他的产品里面。

LC-BLSTM声学模型相关的技术干货:
为提升在线语音识别效率,他创造了两种升级版算法模型

image

薛少飞(左九)与他所在的机器智能技术实验室团队

现在我的工作与博后期间的研究是有延续的。这两年我做了好几个远场语音识别的项目,最近在云栖大会上亮相的“阿里AI收银员”、“上海地铁语音购票机”都是我参与的项目,我负责其中的远场语音识别部分。上海地铁站的环境非常嘈杂,在那种环境下作出一个非常准确的识别,其实非常难。而且真正的用户行为可能和我们想象的很不一样。比如开始我们会设想很多正常交互的场景,但实际上用户可能很随意,比如只说了地铁站名字,或者中间带许多语气词和停顿。这个过程中我们踩了很多坑。

这是一个根据用户反馈不断迭代的过程。在大学里不会有这些机会。在学校里进行研究的时候,通常你是在做某一个点,其他的都是fix(固定)的——在这种情况下进行这个点的创新。在阿里你会跳出来,跳到一个系统的层面去考虑问题。这个可能涉及学术创新、工程创新、方法创新……它会更全面地要求你,思考的方式是完全不一样的。

到工业界做科研是趋势
——裴昶华
(阿里北京站博士后)

我是2017年7月进站的,经历比较简单,清华计算机2008级本科,然后直博,2017年从清华毕业。我导师现在跟阿里、腾讯和其他公司也有一些深度的合作,他喜欢科研跟企业结合的方式。受导师影响,我也觉得科研应该做一些实际的问题,真正能够影响人们现实生活的问题。

image

裴昶华参加阿里年会

博士的时候,我研究怎么将机器智能用到网络领域,提高网络性能和可用性。来阿里之后,在搜索事业部,研究个性化推荐的问题。很多人都问我,你博士毕业了为什么不去学校,他们理解不了博士为什么要去工业界。大家一般认为去工业界就是写代码,科研能力相当于荒废了。其实不是这样的,我们也写论文,前段时间我刚投了一篇论文。以后企业招的博士后会越来越多,到工业界做科研肯定是一种趋势了。

在阿里的好处是,你不用刻意地去找问题,问题就自动地找上你了。

去年“双11”之前,我们做了一个百万级QPS(每秒查询率)的智能调度系统。“双11”有很多的用户会买买买,后台服务器压力就会突增。以前都是人工调度,看某个场景,比如手淘购物车——压力太大了,就多加点机器。有个人拿个本,在那儿记。我们就想,这是可以用算法解决的。当时就联合另一个团队做了一个调度算法。这个智能调度系统,并不是我们想着去做它,是备战“双11”的时候,人力成本太大,自然而然就想起这个问题。

image

2017年“双11”平稳度过后的凌晨,裴昶华(左二)与参与项目的其他同事合影留念

在阿里,现实问题推动创新的例子有很多。就在上个月,我们做了一个手机淘宝的项目,为了让推荐给用户的商品更精准,我们用了一个新模型­——强化学习模型,算法上线之后,商品点击率提升了7%。这个工作现在我在总结,准备投一篇论文。

到阿里做博士后,对我的影响是比在学校时更重视细节了。在公司你做的项目是真实在线的,做产品对细节要求很严。比如这个调度系统,一旦出什么问题的话,那就会给公司带来直接的损失。那段时间,整天脑子里都是这个,睡觉想着这个东西,去食堂、在办公室里都是想着这个事情,想着哪里有遗漏,哪里还没解。后来“双11”平稳度过,凌晨从办公楼出来,当时就觉得很有成就感。自己做的东西被用上了,用到人们的生活里面,是一种不一样的感觉。

原文发布时间为:2018-07-18
本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
弹性计算 物联网 Linux
阿里云体验
阿里云带给我的体验
|
弹性计算 Linux 数据安全/隐私保护
飞天计划的体验
我是来自福建的一名大三学生,就读的专业是软件技术,在本学期我们开通了一门新的专业课《Linux操作系统》,通过老师的介绍我了解到了阿里云的飞天计划,阿里云的飞天计划给我们大学生提供了一个非常好的平台,可以让我们在校学生体验并在云服务器上进行实践,对我有着非常大的帮助。在大二开学之初因为专业课的需要,我需要云服务器才能能够让我进行学习和实践,但我没有这样的平台,在这种情况下老师向我们推荐了阿里云飞天计划,阿里云飞天计划对我这样的大学生十分友好,让我们学生在没有资金的情况下仍然能够学习云服务器的操作。飞天计划中有着非常详细的教程,让我们这种小白也能十分轻松的进行操作和学习。感谢阿里云的飞天加速计划
92 0
|
弹性计算 Linux 云计算
阿里云学习体验
对阿里云服务器的学习,了解。
|
弹性计算 Shell Linux
EXS体验
通过学生认证获得了一台ECS服务器,安装了docker部署微服务项目,在性能方面获得了很好的体验.
131 0
|
Web App开发 IDE Linux
ChromeOS 体验
ChromeOS 是后发的桌面级操作系统,它的 UI 是现代化的。在诞生之处,ChromeOS 目标是可以在廉价的设备上流畅运行,因此流畅度没有问题。最后,ChromeOS 内核基于 Linux,且系统相对封闭,在专用设备上稳定性应该有所保证(FydeOS for PC 这种无法面向一大类机器的发行版,无法保证稳定性)。 ChromeOS 系统层面,通过虚拟机技术,提供了具有独立内核的 Linux 子系统。 ChromeOS 就是对 Chrome 浏览器的操作系统化的产品,浏览器的体验毋庸置疑。
900 0
|
弹性计算 安全 前端开发
我的体验
服务器使用
110 0
|
存储 弹性计算 固态存储
esct体验心得
云服务器,是一种简单高效,处理能力可以弹性伸缩的计算服务。
|
双11 云计算
体验
一、阿里云在国内起步最早。通过阿里系产品的这么多年大流量、高并发应用,阿里云的基础架构已经很成熟+稳定了。你想啊,都可以应对双12 双11 那么大的瞬间并发,屹立不倒,跑个你的个人博客、大中小型网站还不是 so easy。二、名气大。毕竟是阿里系的一家兄弟,加上多年之间紧密合作,阿里集团旗下的所有应用应该都奔跑在阿里云上面了。包括涉及金融的支付宝在内,可见阿里云的稳定性、速度、安全性都是很棒的。三、老魏说说缺点吧。有点贵,这个算是一个缺点吧。毕竟起步早,技术成熟,2018年国内云计算市场占比一半左右,半壁江山都是阿里云的,很多人就是冲着这个名气也会首选阿里云。
|
弹性计算 人工智能 运维
阿里云的体验
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录
|
机器学习/深度学习 搜索推荐