这次,罗永浩一句人工智能也没提

简介:
本文来自AI新媒体量子位(QbitAI)

罗振宇:有没有人认为罗永浩是一个外行?

罗永浩:第一代硬件发布会的时候,有人说你懂个屁手机。我不懂人工智能,人家问,我就聊了。有人就说你聊什么人工智能,你还是说相声去吧。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

罗永浩这次一句“人工智能”也没提。

上周,锤子科技新款手机发布。照例,有褒有贬。关于手机本身,量子位不想过多评论,我们更关心期间展示的一些人机交互方式。

罗永浩谈论的很多“软性”卖点,招招式式全跟AI有关。

这位锤子科技创始人的观点是:如果一个全知全能的“语音助手”还不能实现,那就先通过工具性产品提升用户效率。

去年10月,也是锤子的一场发布会,突然让科大讯飞火了一把。这次锤子新品背后,又是哪些人工智能公司在支撑?

AI伙伴

在坚果Pro发布会上,锤子科技在手机上的AI变革,一目了然。

首先可以从系统层面来看,锤子的打法是通过系统功能,让锤子手机用户在具体场景中体验更好、效率更高。其次是工具性产品打造,通过工具性产品,解决用户核心痛点和改善用户体验。

这些应用的背后技术方案提供商,也无一例外来自人工智能领域;而软件交互方面的创新,都与人工智能最新进展密不可分,在此量子位一一拆解挖掘:

1)短信退订

“短信退订”背后的技术提供商是小源科技,这是一家垂直于短信、利用语义分析场景、建立机器模型的公司,他们更加为人所知的产品名称是“信析宝”,主要应用形式是将航班信息等短信卡片化——更美观、更实用、并且可以直接跳转到相关App。

不过,这一次放在锤子科技发布会上展示的是“短信退订”的问题,这是目前短信骚扰最头疼的问题之一,而锤子和小源的结合,则为功能式解决首开案例。

小源科技负责对外战略合作的合伙人段旭告诉量子位,“短信退订”背后主要涉及的是“自然语言理解”和“场景识别”等两大内容。

首先是“自然语言理解”,即通过机器“读取”短信内容,判断短信内容、类型和所属场景。

其次是“场景识别”,需要判断短信是一般退订短信,还是带有通知内容的退订短信,再在用户最终决策后,一键完成退订,并且不会给发送短信方造成“回复证明活跃”的现象。

小源方面称,这背后是短信内容大数据的积累,以及内容场景模型的精准构建。

2)虚拟来电

“虚拟来电”是发布会会中和会后受到争议的功能,在“道德与否”的问题上,引发了广泛讨论。然而就技术而言,这已然是人工智能领域相对成熟、且被广泛应用的技术。

具体提供商方面,锤子引用了科大讯飞的“配音阁”,这是讯飞主打语音合成方案的平台名称,该平台可以按需提供个性化语音合成,能够通过简单而基本的语料信息,合成具体语言、具体语种和具体个人口音的语音信息。

更早之前,在锤子科技去年10月的新品发布会后,科大讯飞的“配音阁”已经在锤子科技系列新品发布会前后大放异彩,主要是通过合成罗永浩、奥巴马等的口音,实现机器语音的“个性化”。

值得注意的是,虽然锤子科技功能化产品“虚拟来电”受到争议,但该技术的实际应用却广泛得多。

比如现在不少快递企业,已经在通过“虚拟来电”的方式,让机器来通知物流快递信息,而一些售后和客服任务较重的行业,也已经上马了该技术。

这也是客服行业和配音行业正在经历的大变革。

除了科大讯飞,宣布AI转型的百度也在这方面秀过肌肉,在2016年百度世界大会上,李彦宏就展示过人工智能充当客服带来的效果,不仅成本降低,而且准确度,以及对用户非结构化数据的整合方面,效果都极其明显。

此外,就着当红演艺明星胡歌的面,李彦宏还让机器模仿胡歌的“口音口吻”,除了感情色彩上稍逊一筹,已属惟妙惟肖——李彦宏说,人工智能正在抢走配音师的饭碗。

3)智能语义拖拽

当然,锤子发布会听起来最具普惠意义的莫过于“智能语义拖拽”,这是一个高速公路一样的功能,在分割林立的手机App之间架起直通管道,减轻App间切换的痛苦,同时提升手机使用效率。

具体来看,“智能语义拖拽”就是把微信、短信等对话过程中产生的信息进行分析,按照所属直接在地图导航、美食评价和日程日历等产品中使用。

但值得注意的是,锤子最终展现的“智能语义拖拽”是一个一步到位的功能,用户可以直接将一段文字拖入相关App中,而机器会在该过程中分析信息内容、提取核心相关信息、并且让各个App各司其职——快速帮助用户完成目的。

实际上这个过程中,锤子还进一步整合了上次推出的“大爆炸”和“一步”两大功能。

此次智能语义拖拽背后的技术提供方是三角兽科技,这是这家初创公司第二次出现在锤子发布会上,上一次双方合作的产品是“Big Bang”(大爆炸)。

据量子位了解,主打智能语义分析三角兽,在该功能从无到有诞生的过程中,总共向锤子科技派出了3名工程师,共计耗时3个月,最大挑战来自手机场景下的技术方案落地问题——在此之前并没有厂商做出过尝试。

三角兽技术负责人称:智能语义拖拽涉及的是NLP中最核心最具挑战的问题,通俗来讲就是让机器断句,且学会中文语境下的“预感”,进而才能搭建机器学习模型。

不过,在和锤子一起开发“智能语义拖拽”的过程中,最大的挑战来自如何在手机场景下,最低限度降低机器模型对CPU、计算功耗等方面的消耗。

而且作为一个功能型产品,还需要考虑联网和本地两种交替情况下如何保证速度,因为反应速度会直接影响用户体验。

“更倾向于合作方是使用网络版的接口,但因为手机涉及用户隐私,或网络情况不佳,就可能需要用到离线版本。

然而紧接着需要解决的问题是离线版本对系统资源的占用,此外运算速度如果太长就会比较伤害用户体验。”三角兽工程师说,同时表示这是最大的考验。

然而,这个最大考验解决后,获利方也将最大化。

在锤子方面的合作实现后,三角兽工程师也坦言,可以无障碍适配到更多的手机产品中。

虽然之前并没有其他手机厂商拥有这样的需求,但在此次坚果Pro的合作中,三角兽和锤子一起完成了从最低配版本的坚果手机,但最高配版本的旗舰机M1L的适配——迁移的成本已经很小了。

这也意味着,一旦其他手机厂商跟进迁移该功能,未来大量涉及不同应用间切换的内容,都将变得 so easy,比如微信中约定吃饭的时间地点,同时将内容拖拽入“日历”、“地图”和“大众点评”等应用中即可。

4)闪念胶囊

“闪念胶囊”是个新鲜事,但伟大的是解决问题的出发点,而非实现的技术难度上。

坦白讲,这只是一次“语音备忘录”和“语音识别”的功能综合,但正如罗永浩所言,这几年来,并没有人为此付出过实际性举动,并且难能可贵的是,锤子将通过开源,让跟多非锤子手机用户也能使用。

这也是锤子AI工具产品思路中的集大成之作。除了语音识别,“闪念胶囊”背后还应用了智能语音拖拽、大爆炸和一步。

在接受量子位的采访中,科大讯飞方面的负责人表示,此次也在“闪念胶囊”中和锤子进行了协作,主要涉及语音识别方面。

与“智能语义拖拽”面临的问题相似,“闪念胶囊”最大的问题是如何在手机设备下实现对资源的合理调用。

如罗永浩发布会上所言,最后锤子和讯飞给出的方案是:首选联网识别,但如果网络情况不佳,则先使用讯飞语音识别本地方案,再在网络情况良好时联网修正。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

语音识别和自然语言理解

不难发现,锤子新品发布会上重点推出的工具产品/功能,背后的主要技术是语音识别和自然语言理解及处理,这也是目前人工智能最成熟、进展最快的两大领域,也是中国人工智能公司全球领先的领域。

语音识别方面,从科大讯飞、百度,到搜狗,都已经在大语料数据库的基础上,将语音识别的准确率提升到了97%以上,这在国际公认的标准参数都已然处于领先,并且讯飞还实现了方言领域的高识别率,可以说这是锤子可以实现一系列语音交互为基础的产品的底气所在。

通常情况下,相比键盘为代表的文字输入,语音要高效很多。这也是目前最被看好的新一代人机交互技术,包括亚马逊、谷歌、微软、百度和讯飞在内的公司,都在积极推动语音识别为核心的交互平台的运用,希望自己的语音交互平台,会成为下一个iOS、下一个安卓。

自然语言理解方面,百度的度秘、微软的小冰,以及三角兽等为代表的创业新势力,都已经取得了不俗的进展。无论是小冰的聊天,百度的“读”新闻,三角兽的中文断句,都在自然语言理解、自然语义处理方面,为锤子的产品式整合扫清了障碍。

可以说,这是人工智能进展给于锤子的机会,但同时也是手机行业正在经历的技术变革——与芯片、工业设计等硬件大战不同,这一次革命将体现在“软件”上。

智能手机正迎来新时代

今年3月,量子位曾有文章称《没有人工智能的硬件,未来可能不配叫智能硬件》,当时三星新旗舰Galaxy S8发布会上,安卓阵营巨头推出了人工智能助手Bixby,这是一个类似苹果Siri的产品。

同时也是罗永浩所称的全局性解决问题的语音助手产品,即便他暂时不看好,也已经赛道密集潮水汹涌。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

在国内,华为率先在国产手机中推出了语音助手产品“小E”,让用户用自然语言的方式,向它求助在手机使用过程中遇到的各种问题,但具体使用情况来看,用户需求度还不高,场景尴尬的问题始终没有得到解决。

此外,另一种利用AI全局性解决问题的产品是“系统优化”,通过个性引擎,在用户使用习惯的基础上形成用户画像,然后在使用过程中实现“预判”和“推荐”。

比如从EMUi5.0系统开始,华为便开始对外宣称手机系统能够学习用户的操作行为,通过这种方式,系统将可以实现对用户操作的提前预判,依此进行资源的合理分配,从而为用户带来更加流畅的体验。

同样方向出发的还有魅族。这家总部位于珠海的手机厂商,在2016年年底伴随手机系统Flyme6推出了“One Mind”,这是一个通过用户画像帮助手机用户完成分析、决策的内置程序,最突出的亮点是帮助CPU提升运行效率、进而提升用户体验。

当然,没有在系统方面明确宣称人工智能进展的小米,也在利用AI提升用户体验,比如在个性拍照和相册归类等方面的应用,背后是机器视觉方面的能力。而且值得注意的是,小米已经在电视等产品中实现了语音助手、兴趣引擎等方面的落地,相信手机场景下的应用,也只是时间问题而已。

最后,让我们再回到锤子科技的坚果Pro发布会。虽然长达3小时的演讲展示中,罗永浩只字未提“人工智能”,但通不难看出锤子科技想要改变的现状——智能手机产品创新遭遇瓶颈的现状,需要新技术新交互提升易用性的现状。

罗永浩说,锤子只有现在做好准备,才能在下一代人机交互革命中成为上桌选手,才能由此实现“大到吓人”的野心。

想这么干的不止罗永浩。

下一代人机交互革命正在加速到来,正在AI浪潮中日渐清晰。

【完】

本文作者:允中 假装
原文发布时间:2017-05-15
相关文章
|
4月前
|
机器学习/深度学习 人工智能 算法
【周末闲谈】人工智能热潮下的AIGC到底指的是什么?
【周末闲谈】人工智能热潮下的AIGC到底指的是什么?
89 0
|
10月前
|
人工智能
当世上最强AI,遇上中国2023高考作文
当世上最强AI,遇上中国2023高考作文
57 0
|
机器学习/深度学习 人工智能 算法
人工智能出现“涌现”能力,该慌吗
人工智能大模型涌现的越来越多,很多人担心大模型出现了“智慧”、“思想”,那真实情况是这样吗?我们应该害怕吗?
人工智能出现“涌现”能力,该慌吗
|
机器学习/深度学习 传感器 存储
华为老司机:白话人工智能
华为老司机:白话人工智能
163 0
|
人工智能 自动驾驶 机器人
会玩儿,这些人工智能“能文能武”
在AlphaGo成功挑战世界第一围棋选手柯洁后,眼下人工智能又公开挑战高考数学考试。但问题来了,从围棋到数学,人工智能涉足的领域看起来更偏向“理科生”的专长。
140 0
会玩儿,这些人工智能“能文能武”
|
机器学习/深度学习 人工智能 自动驾驶
去英国访人工智能公司,与 AI 大牛同行[3 月 19 日出发]
人工智能不仅是美国在引领未来。过去十年,英国一直是欧洲AI的研发中心,AI创业公司屡获谷歌、亚马逊、苹果等巨头青睐,并购和投资消息频传。2017年3月19-26日,英途推出英国AI考察,深入伦敦与剑桥,探访深度学习、机器视觉、智能机器人和无人驾驶等领域领先公司。
253 0
去英国访人工智能公司,与 AI 大牛同行[3 月 19 日出发]
|
人工智能 芯片
中国人工智能计划,我来说几句
中国人工智能计划,我来说几句
|
机器学习/深度学习 人工智能 自然语言处理
人工智能(AI)遇上仿制药
人工智能(AI)遇上仿制药
205 0
人工智能(AI)遇上仿制药
|
机器学习/深度学习 人工智能 算法
AlphaGo获胜是人工智能的重大突破?业内专家提醒要理性对待
谷歌 DeepMind AlphaGo 战胜人类围棋冠军李世石(目前比分3:1)的消息受到了媒体的广泛关注和大肆报道,在 AlphaGo 第三局战胜李世石之后,《连线》杂志在一篇文章中提到:机器已经征服了人类最后一款游戏;而Slashdot上的一条评论则更加夸张:我们现在确信,在实现真正人工智能的道路上,我们已经不再需要任何重大突破了。但微软研究院著名机器学习专家John Langford和Facebook人工智能实验室负责人Yann LeCun则提醒我们要冷静对待,报道中的不准确会导致我们对人工智能的失望,甚至是引发再一次的「人工智能寒冬」。
196 0
AlphaGo获胜是人工智能的重大突破?业内专家提醒要理性对待
|
机器学习/深度学习 传感器 人工智能
AlphaGo背后这项核心技术,后来怎么样了?
近年来,深度学习(Deep Learning, DL)作为机器学习的一个重要研究领域,得到了长足的发展,为强化学习(Reinforcement Learning, RL)提供了强有力的支撑,使RL能够解决以前难以处理的问题,例如学习直接从像素玩视频游戏。

热门文章

最新文章