为什么你的机器学习商业应用会失败?来听一听

简介: 在应用机器学习方面,最困难的部分是知道你想要做什么,以及在你为顾客服务之前,你打算怎么做。作者从几个方面探讨了企业应该如何挑选合适的机器学习方面的人,值得深思。

现实场景中,企业在应用机器学习方面会遇到两种情况:

(1)机器学习研究

(2)机器学习应用。这两种是截然不同的方式,大多数企业其实只是想要使用机器学习解决他们的商业问题,对机器学习研究兴趣不大,但大多数想自己从头到尾创建研究机器学习算法,这样子,很多企业很难从机器学习中获得价值,因为它们没有意识到机器学习应用方面与算法研究方面是两个非常不同的方向。

在应用机器学习方面,最困难的部分是知道你想要做什么,以及在你为顾客服务之前,你打算怎么做。作者从几个方面探讨了企业应该如何挑选合适的机器学习方面的人,值得深思。

首先,我想告诉你一件事:当人们谈论到“机器学习”时,听起来好像只是一门学科,其实是两门,如果企业不理解这其中的差异的话,他们会很麻烦。

【关于“两个”机器学习的故事】

想象一下这样的情况,雇一个厨师给你做烤箱,或者找个电气工程师帮你烤面包。同样的在机器学习方面,许多企业都会犯这样的错误。

如果你要开一家面包店,你需要雇一个有经验的面包师,他要熟悉制作美味的面包和糕点的技能,此外还需要一个烤箱。虽然烤箱是一个关键的工具,我打赌你绝对不会让你的顶级糕点师来学习如何制作烤箱。但是在机器学习方面,为什么许多企业会让“面包师”来学习制作“烤箱”呢? 这是很对企业都会犯的错误,他们首先需要搞清楚的是自己究竟是做“面包”的还是做“烤箱”的?

image

【机器学习研究】

现如今,几乎所有的机器学习课程和教科书都是关于如何从头开始建造烤箱(以及微波炉、搅拌机、烤面包机、水壶……厨房水槽!),而不是教你如何烹饪和创新配方。
如果你是专注于机器学习算法,那么你的关注点就是如何制作出让大家可以使用的通用工具 (比如说,厨房用具)。这项工作被称为机器学习研究,通常是由像学术界或谷歌这样的研究型大公司完成的。

从事这一项工作需要受长期大量的教育,因为机器学习的研究有着很长的历史。一些流行的算法已经存在了几个世纪。例如,用于回归的最小二乘法,最初发表于1805年。相信我,人类在200年内走过了漫长的道路。

如今,市面上有一些相当先进的设备……但是如果你不知道这台烤箱是如何工作的,你怎么才能制造造一台更好的烤箱呢?所以你所需要的是沉浸式学习! 成为一名研究人员需要花费数年的时间。

【机器学习应用】

大多数企业其实只是想要烹饪——解决他们的商业问题。他们对销售烤箱毫无兴趣,但却常常犯从零开始制造这些电器的错误。其实这很也不能怪他们,因为机器学习当前的炒作和教育方式主要集中在研究而不是应用上。

如果你致力于创新配方,就不要重新发明基础设施。烤箱已经存在,甚至你可以从很多地方免费得到它们。如果你觉得建造自己的机器学习厨房听起来很繁琐,你可以求助一些像谷歌云平台一样的供应商,它们会提供现成的电器,配料和食谱书。

对于大多数机器学习应用程序,你的团队不需要了解神经网络中反向传播的数学原理,正如厨师不需要了解烤箱的接线图一样。但是如果你打算经营一个工业规模的厨房,那么从食材的准备到菜肴上桌,这里的每个过程你都要做到面面俱到。

你的企业销售哪些产品?这决定了你选择什么样的团队。

【机器学习的崩溃和燃烧】

不幸的是,我看到很多企业未能从机器学习中获得价值,因为它们没有意识到应用方面与算法研究方面是两个非常不同的学科。相反,领导者试图通过雇佣那些一辈子都在制作烤箱的人来制作糕点和蛋糕。这样的结果往往会很糟糕。如果成功了,那是因为你很幸运,意外地雇佣了一位很会烹饪的工程师。

但通常你并不是如此幸运。一个人一生中只有这么多的时间,如果你花时间去学习烤箱的制造原理,你就没有那么多时间去掌握制作糕点或面包的艺术了。所以你招聘的AI博士研究员是否具备应用机器学习所需的技能呢? 答案是否定的,因为没有足够的时间。如果你一心想要招聘在这两方面都是专家的混合型人才,那么难怪你会抱怨人才短缺!

如果你想要开一家餐馆,雇佣那些一辈子都在做烤箱,但从来没有做过一道菜的人……可能会出什么问题呢?

你应该雇佣谁呢?就像在工业厨房一样,你需要一个具有领导才能的跨学科团队才能理解这个领域。否则就会导致项目失败,毫无进展。

【雇佣合适的团队】

如果你在销售尖端设备,请雇佣研究人员。如果你要创新食谱大规模销售食物,那么你就需要雇佣知道什么食物值得做的人(决策者和产品经理),了解供应商和客户的人(领域专家和社会科学家), 可以处理大规模配料的人(数据工程师和分析师), 能够尝试许多不同的配料组合并迅速产生潜在食谱的人(机器学习应用工程师), 检查配方的质量是否符合人们的口味的人(统计学家),将潜在的食谱变成数以百万计菜肴的人(软件工程师),让跨学科团队正常运作的人(项目经理),即使送货卡车送错货的情况下,确保菜肴质量稳定的人(可靠性工程师)。

虽然这些岗位不一定非得有一个专门的人员来做,但一定要确保以上的每个角色都有团队中的成员都能涵盖。

如果您的团队已经尝试了所有现有的工具,并且不能制定出满足业务目标的食谱,那么考虑增加懂得制作烤箱的技术人员(研究人员)是有意义的。雇佣研究人员作为正式员工,还是把工作外包给有经验的算法研究公司,这取决于公司的经营规模和成熟度。

与研究人员建立联系的另一个原因是,你希望你的产品在定制设备上进行大规模操作,并且取得很好的运行效果。(这真是个大问题!)

【决策智能】

专家们应该讨论这个问题,但他们没有。他们不承认有两种机器学习的存在,所以促使人们去构建机器学习算法,而不是使用它们。

我的团队正在努力解决这个问题。我们创建了一个新的学科来覆盖应用领域,我们已经有超过15000名会员。我们称之为决策智能工程,它涵盖了机器学习和数据科学的所有应用方面。

换句话说,如果研究机器学习是制作微波炉,应用机器学习是使用微波炉,那么决策智能工程就是利用微波炉安全地实现你的目标,并且在你不需要微波炉的时候使用其他的工具。

【祝好运,玩得开心!】

在应用机器学习方面,最困难的部分是知道你想要做什么,以及在你为顾客服务之前,你打算怎么做。这部分其实并不难,只是别忘了做。

至于其他方面,用机器学习解决业务问题比大多数人想象的要容易得多。就像在真正的厨房里一样。每次我遇到这样的人,他们都认为他们需要学习传统的机器学习算法课程——或者为此修一个完整的学位。为了开始,我不禁想象他们拒绝使用微波而偏偏要自己制造一个。不要相信那样的谎言,说你需要一个博士学位才能在机器学习上做出惊人的事情。相反,你真正需要的是一点人类的创造力。祝你好运,玩得开心!

原文发布时间为:2018-07-10
本文作者:Cassie Kozyrkov
本文来自云栖社区合作伙伴“专知”,了解相关信息可以关注“专知

相关文章
|
2天前
|
机器学习/深度学习 算法 数据挖掘
【C 言专栏】C 语言与机器学习的应用
【5月更文挑战第6天】C语言在机器学习中扮演关键角色,以其高效性、灵活性和可移植性实现底层算法、嵌入式系统和高性能计算。在神经网络、决策树和聚类算法等领域的实现中不可或缺。C语言被用于TensorFlow和OpenCV等知名库的底层,常与C++、Python结合使用。尽管面临开发难度和适应新算法的挑战,但C语言在机器学习领域的价值和潜力将持续展现,为科技进步贡献力量。
【C 言专栏】C 语言与机器学习的应用
|
6天前
|
机器学习/深度学习 运维 自然语言处理
探索机器学习在金融欺诈检测中的应用
【5月更文挑战第3天】 随着金融科技的迅猛发展,机器学习作为其核心推动力之一,正逐渐改变着我们对金融服务安全与效率的理解。本文将深入探讨机器学习技术在金融欺诈检测领域内的应用现状与前景。通过分析多种算法和实际案例,我们揭示了如何利用机器学习提高识别欺诈行为的准确率,降低金融机构的风险损失。同时,文章还将讨论在此过程中遇到的挑战及未来的发展趋势,为读者提供一个全面而深入的视角。
|
6天前
|
机器学习/深度学习 自然语言处理 算法
机器学习算法原理与应用:深入探索与实战
【5月更文挑战第2天】本文深入探讨机器学习算法原理,包括监督学习(如线性回归、SVM、神经网络)、非监督学习(聚类、PCA)和强化学习。通过案例展示了机器学习在图像识别(CNN)、自然语言处理(RNN/LSTM)和推荐系统(协同过滤)的应用。随着技术发展,机器学习正广泛影响各领域,但也带来隐私和算法偏见问题,需关注解决。
|
8天前
|
机器学习/深度学习 算法 自动驾驶
探索机器学习在图像识别中的应用
【5月更文挑战第1天】 随着人工智能技术的飞速发展,机器学习已成为其最活跃的分支之一。特别是在图像识别领域,机器学习技术已展现出强大的能力与广泛的应用前景。本文将深入探讨机器学习在图像识别中的关键作用,从基础原理到实际应用案例,剖析其背后的算法和模型。同时,我们将讨论当前面临的挑战和未来的发展趋势,为读者提供一个全景式的技术分享。
16 3
|
8天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习在金融欺诈检测中的应用
【4月更文挑战第30天】 随着金融科技的迅猛发展,机器学习技术在金融行业中的应用变得日益广泛。特别是在金融欺诈检测领域,机器学习以其强大的数据处理能力和智能识别功能,正逐渐成为防范和打击金融欺诈的重要工具。本文将深入探讨机器学习在金融欺诈检测中的关键作用,分析其优势及面临的挑战,并提出未来发展趋势。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在图像识别中的应用与挑战探索机器学习中的自然语言处理技术
【4月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已经成为计算机视觉领域的核心动力。本文将探讨深度学习在图像识别任务中的关键技术、应用实例以及面临的主要挑战。我们将重点讨论卷积神经网络(CNN)的架构优化、数据增强技术以及迁移学习的策略,并通过具体案例分析其在医疗影像、自动驾驶和面部识别等领域的应用成效。同时,我们也将指出当前模型泛化能力不足、对抗性攻击以及算力资源需求等挑战,并提出潜在的解决方向。 【4月更文挑战第30天】 在人工智能领域,自然语言处理(NLP)是赋予机器理解和响应人类语言能力的关键技术。本文将深入探讨NLP的发展历程、核心技术及其在不同领域的应用案例。我们将从
|
8天前
|
机器学习/深度学习 数据采集 算法
【Python 机器学习专栏】机器学习在医疗诊断中的前沿应用
【4月更文挑战第30天】本文探讨了机器学习在医疗诊断中的应用,强调其在处理复杂疾病和大量数据时的重要性。神经网络、决策树和支持向量机等方法用于医学影像诊断、疾病预测和基因数据分析。Python作为常用工具,简化了模型构建和数据分析。然而,数据质量、模型解释性和伦理法律问题构成挑战,需通过数据验证、可解释性研究及建立规范来应对。未来,机器学习将更深入地影响医疗诊断,带来智能和精准的诊断工具,同时也需跨学科合作推动其健康发展。
|
8天前
|
机器学习/深度学习 自然语言处理 搜索推荐
【Python机器学习专栏】迁移学习在机器学习中的应用
【4月更文挑战第30天】迁移学习是利用已有知识解决新问题的机器学习方法,尤其在数据稀缺或资源有限时展现优势。本文介绍了迁移学习的基本概念,包括源域和目标域,并探讨了其在图像识别、自然语言处理和推荐系统的应用。在Python中,可使用Keras或TensorFlow实现迁移学习,如示例所示,通过预训练的VGG16模型进行图像识别。迁移学习提高了学习效率和性能,随着技术发展,其应用前景广阔。
|
8天前
|
机器学习/深度学习 传感器 自动驾驶
【Python机器学习专栏】深度学习在自动驾驶中的应用
【4月更文挑战第30天】本文探讨了深度学习在自动驾驶汽车中的应用及其对技术发展的推动。深度学习通过模拟神经网络处理数据,用于环境感知、决策规划和控制执行。在环境感知中,深度学习识别图像和雷达数据;在决策规划上,学习人类驾驶行为;在控制执行上,实现精确的车辆控制。尽管面临数据需求、可解释性和实时性挑战,但通过数据增强、规则集成和硬件加速等方法,深度学习将持续优化自动驾驶性能,并在安全性和可解释性上取得进步。
|
8天前
|
机器学习/深度学习 自然语言处理 PyTorch
【Python 机器学习专栏】自然语言处理中的深度学习应用
【4月更文挑战第30天】本文探讨了深度学习在自然语言处理(NLP)中的应用,包括文本分类、情感分析和机器翻译等任务。深度学习的优势在于自动特征学习、强大的表达能力和处理大规模数据的能力。常见模型如RNN、LSTM、GRU、CNN和注意力机制在NLP中发挥作用。Python的TensorFlow、PyTorch、NLTK和SpaCy等工具支持NLP研究。然而,数据稀缺、模型解释性和计算资源需求高等挑战仍待解决。随着技术进步,未来深度学习将进一步推动NLP发展,实现更智能的语言交互。

热门文章

最新文章