阿里巴巴的AI算法程序媛是怎样的一种存在?

简介: 一个专注人脸识别技术长达11年的程序媛。

程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?

在见到于鲲之前,我的脑子里是各种的想象,萌妹纸?御姐?还是?尽管于鲲说话语速有点快,但干脆利落,逻辑清楚,所以“干练”是她留给我的最深的印象。
IMG_0742
阿里安全图灵实验室的AI算法程序媛于鲲

在阿里巴巴这几年的锤炼,于鲲已经成长为国内人脸核心算法领域的顶级专家。作为阿里安全图灵实验室的核心成员,研发了业界顶级水准的人脸识别技术和算法,无论是1:1人脸比对还是1:N人脸搜索的算法,效果都在业内处于优势地位。目前,线上的人脸比对核心算法模型,就是于鲲和小伙伴们一起训练和开发的。

不仅如此,于鲲还出色地紧贴业务场景,将技术成果完美落地。她主导了新零售(如未来美家、银泰百货、盒马等)和其他1:N线下业务(包括园区门禁,菜鸟快递取件柜等)的人脸比对算法;同时,还协同了1:1实人认证(手淘扫脸登录等)和1:N敏感人脸检测(内部和绿网)等重要业务算法的研发。

与用户直接互动“很刺激”

2014年,于鲲接触到阿里巴巴,然后被深深地吸引。

“我觉得实人认证和内容管控是非常有前景的,而且可以和终端用户直接互动。”于鲲说,“这对于做技术的人来说,是非常有吸引力的,也挺有成就感的。”

于鲲认为,像是实人认证这种,如果技术层面没有做好,就会导致体验下降。但不管是技术原因还是业务原因,导致客户的流程没有走下去,用户就会给到最为直接的反馈。比如扫脸登录,用户的反应是最为直观的,用户所能接受的极限时间为2秒钟,这对技术提出了极高的要求。

“对于技术人员来说,来自于用户的直接反馈是一种最为难得的体验。“于鲲强调。

由于算法是偏后端的,所以和前台用户的互动,让于鲲觉得是一种“很刺激“的体验。

在于鲲眼中,阿里巴巴这种大平台确实很吸引人。比如实人认证,规模很大,有数亿人在使用。对于绝大多数技术人员来说,这并不是一个很容易得到的机会。

在阿里巴巴是一种全新的体验

从2007年到现在,于鲲一直在做人脸识别技术的研究和开发。

从技术层面来看,于鲲算是轻车熟路,但这并不意味着前面是一片坦途。“对我来说,其实还是蛮挑战的,因为需要角色有巨大的转变。”于鲲说。

于鲲介绍,她之前一直在传统企业做人脸技术的研发,但是到了阿里巴巴这种头部互联网公司后,需要对自己进行革新。包括企业的文化、工作的流程等,这些对于鲲都是全新的体验。

“总体感觉是阿里的节奏非常快,开始还有些不太适应。”于鲲说。她觉得自己每天都是在小跑着前进,面对的业务比较复杂,对接的团队也很多。每天多数时间都在开会中度过,基本上晚饭后的时间才是属于自己的,此时才会坐下来做一些事情。“基本上,白天不是在开会就是在去开会的路上。“于鲲笑称。

万事开头难。但通过不断的交流和磨合,于鲲和小伙伴们越来越有默契,沟通越来越顺畅,对业务也越来越了解,项目推动起来也就“得心应手”了。两年之后,于鲲完全适应了这里,适应了快节奏,适应了新环境。心里也就自然而然地认为,“本来就应该是这样的。”

“现在,如果是慢节奏,我反而不习惯了,会觉得是在浪费时间,浪费生命。”于鲲说,“工作就应该是这样的。”

于鲲告诉我,她觉得到了阿里巴巴就是打开了新的一页,体会到了不同的人生。

程序媛并不是一种独特的存在

阿里安全图灵实验的研究方向非常稳定,就是专注于计算机视觉、自然语言处理、机器学习和深度学习;其聚焦的业务也非常稳定,就是为手淘、天猫、支付宝、闲鱼、优酷土豆、UC、阿里妈妈等核心业务线提供技术支撑,并对外输出AI能力。因此,整个团队也非常稳定。
IMG_0184
阿里安全图灵实验室的部分技术同学

这几年,于鲲一直在阿里安全图灵实验室。据她介绍,整个团队有5个程序媛,3个Base杭州,2个Base北京。“我们团队的氛围特别好,大家在一起就是‘哥们儿’,会互相分享好的idea,像一家人似的。”于鲲说,“所有人同心协力,朝着同一个方向,同一个目标发力。”

于鲲认为,大家在团队大目标之下,只有分工的不同,小伙伴们更多的是相互补位和背靠背的方式进行协作。“这个事情交给你,这个事情到此为止。就是这么简单的逻辑。”于鲲说。

于鲲笑着说,她之所以留着长发只是想保留自己女生的特征,但干活儿从来没有把自己当成一个特殊的存在,要享受特殊待遇。相反地,她认为自己从业的时间比较长,所以应该更多地去承担一些事情。

有想法就尽情去发挥

团队稳定与否,Leader很重要。这是于鲲的观点。

在她眼中,阿里安全图灵实验室的负责人奥创是一个很有想法,有大局观的人。正因为如此,整个团队的氛围很和谐,也没有什么职级之分。

于鲲还记得,某年的中秋节,奥创拎着大闸蟹来到公司,然后分给团队的小伙伴们。“Leader有什么事情,都会想到团队成员,这非常棒!”于鲲说。

对比传统企业和互联网公司,于鲲也谈了自己对于技术团队的一些理解。她认为,团队好不好,要看Leader有没有远见,有没有前瞻性。传统企业的技术团队,Leader把任务拿来,然后给到团队成员去落实,这是一种自上而下研发模式。但是在阿里巴巴不一样,这里是一种自下而上的模式,也就是说,组织的目标就在那里,每个团队成员都能看到,每个人能为这个目标做什么?团队成员是自发的,也就是阿里巴巴一直强调的自组织、自驱动,每个人都内心驱动。

“整个团队都是这样的,整个阿里也是这样的。”于鲲说,“虽然有KPI的考核,但每个团队都在思考还可以做些什么?每个人也在想我可以做些什么?这个力量是无穷的。”

于鲲认为,自上而下的指令,很多时候只是Leader一个人的思考,所以具体落地的时候可能结果并不好;但如果是自下而上,那么每个人的想法都能得到充分发挥,每个人都会贡献自己的智慧去为大目标做有益的工作,这是一种积少成多的力量。

“阿里巴巴的工作模式就是,有想法就尽情去发挥。”于鲲说。

算法人靠“数字”说话

在阿里巴巴西溪园区,刷脸设备已经替代了传统的刷卡门禁,这就是于鲲和团队小伙伴们的杰作。实际上,这是经过了内部激烈的技术PK之后,最终被阿里安全图灵实验室拿下的。
DINGTALK_IM_664966376
于鲲和小伙伴研发的人脸识别技术应用于阿里巴巴门禁系统

“算法人是要靠数字说话的,谁的准确率高,谁就上。”于鲲告诉我,阿里安全图灵实验室研发的人脸识别系统在准确率方面拔得头筹,因此才拿下了园区的门禁刷脸项目。

不仅在内部取得不俗的成绩,在与外部友商的竞争中,阿里安全图灵实验室也顺利拿下了某机场的安检项目,而实验室还通过阿里云上的“实人认证”和“内容安全”两大产品,服务了数万家企业客户。

“我们的业务都依托于我们的技术,因此,我们的技术并不是为了在某个竞赛得奖而进行研发的,而是为了充分保障业务的顺畅应用,为用户提供极致的体验。”于鲲告诉我,阿里安全图灵实验室实际上也经常会在一些大赛上斩获殊荣,但通常情况下,这些都不过是技术小伙伴们做好业务项目之余的“副业”而已。

于鲲告诉我,阿里安全图灵实验室的目标是要做最顶尖的算法团队,并保持领先的地位。

用技术改变生活

于鲲向我普及了一下人脸识别技术的发展简史。

90年代初,手机还未普及,关于人脸识别的应用还非常初级,通常都是简单的特征分类,比如几何或者灰度特征。

2003年到2004年的时候,人脸识别技术开始转向图像领域的传统特征,那时,更多的是需要看工程师对图像的理解,是非常挑战的。不过,已经有一些比较初级的商业应用,比如一些考勤机。

到了2012年,深度学习进入到爆发期。随着这一波的大发展,人脸识别也是获益最为典型的应用之一。那个时候,不管是数据还是算法,人脸识别都已经准备好了,可以随时“起飞”。

最近的两三年,人脸识别主要是在做用户习惯的培养,毕竟还是有很多人不太能够接受,但这个现状正在发生着巨变。比如扫脸支付、扫脸转账等,它们具备的便捷性是以往任何一种技术都无法比拟的。

于鲲告诉我,在人脸识别技术方面,中国是非常领先的,在用户习惯的培养方面也是领先的。每年,国家在这一领域的科研投入,比如论文数量或专利数量在全球来看都是处于前列。

事实上,于鲲从事人脸识别技术的研究与开发已经11年,因此很多人都会奇怪她会不会厌烦了?或者说是否需要换一个方向?她并没有这样的想法。她认为,人脸识别并不是一个单点的技术,而是一整套的解决方案,除了方案本身,它底层的技术也是复合型的。

“人脸一直会在持续的变化,比如化妆、比如美容、比如衰老,比如光照等,这些都会导致人脸的变化。这些变化,远比其他模型要复杂得多。这对于机器来说,是极大的挑战。”于鲲说,“正因为人脸识别所具备的复杂性,所以才会有这么长时间,这么多人去研究。”

于鲲觉得,人脸识别是一个非常好的点,应用场景非常多,商业的可能性也很多,所以它能够成为当前的热点。

“这几年人脸的应用越来越广,其实并不是我们站在这个风口,而是说整个行业站在了这个风口。资本疯狂追逐,各大公司也巨额投入,这些都说明其市场前景巨大。”于鲲表示。

“我想能够用技术服务大众,真正的用技术改变生活,用技术去除恶扬善,这是我的梦想,相信也是每个技术人的梦想。”于鲲说。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
AI算法分析,智慧城管AI智能识别系统源码
AI视频分析技术应用于智慧城管系统,通过监控摄像头实时识别违法行为,如违规摆摊、垃圾、违章停车等,实现非现场执法和预警。算法平台检测街面秩序(出店、游商、机动车、占道)和市容环境(垃圾、晾晒、垃圾桶、路面不洁、漂浮物、乱堆物料),助力及时处理问题,提升城市管理效率。
AI算法分析,智慧城管AI智能识别系统源码
|
4月前
|
机器学习/深度学习 存储 人工智能
极智AI | 周易AIPU算法部署仿真测试
本教程详细记录了使用周易 AIPU 进行算法部署仿真测试的方法,带大家尝尝鲜。
190 0
|
10天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
21 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
3月前
|
机器学习/深度学习 人工智能 监控
【AI 现况分析】AI 算法偏见和歧视分析
【1月更文挑战第27天】【AI 现况分析】AI 算法偏见和歧视分析
|
3月前
|
机器学习/深度学习 存储 人工智能
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法(三)
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法
|
3月前
|
存储 人工智能 搜索推荐
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法(二)
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法
|
3月前
|
存储 人工智能 算法
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法(一)
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法
|
3月前
|
人工智能 算法 安全
训练数据集污染与模型算法攻击将成为AI新的棘手问题
【1月更文挑战第11天】训练数据集污染与模型算法攻击将成为AI新的棘手问题
66 3
训练数据集污染与模型算法攻击将成为AI新的棘手问题
|
3月前
|
人工智能 算法 Java
数据结构与算法面试题:给定 n 个非负整数 a1,a2,a3,...,an,每个数代表坐标中的一个点(i, ai),请找出两个点之间的最大距离。(提示:动态规划)
数据结构与算法面试题:给定 n 个非负整数 a1,a2,a3,...,an,每个数代表坐标中的一个点(i, ai),请找出两个点之间的最大距离。(提示:动态规划)
49 1
|
3月前
|
人工智能 运维 监控
可观测实践,如何利用 AI 算法解决告警配置三大难题
本文介绍了如何利用 AI 算法解决“不知道该监控哪些指标”、“不知道该设置什么阈值”、“指标正常情况下就起伏不定,怎么配告警”告警配置三大难题。
141911 0

热门文章

最新文章