偶然与必然:亚马逊Echo缘何脱颖而出?

简介:

随着被誉为“互联网女皇”的玛丽?米克(Mary Meeker)2016年《互联网趋势》(Internet Trends)报告的人工智能语音识别部分中对于亚马逊Echo的热捧,这款在2014年底推出的基于语音识别的音响再次引发了业内的关注,甚至被喻为未来智能家居的真正入口。那么问题来了,作为同样是以语音识别技术作为基础的谷歌、苹果、微软等为何没有推出一款类似Echo畅销的硬件产品?

提及语音识别技术,业内恐怕首先想到是苹果的Siri、谷歌的Google Now和微软的Cortana,至少在Echo热销之前,这些巨头在语音识别上的名气和曝光度要远远高于亚马逊。而实际上,Amazon的语音技术在2011年就已经起步,其先是收购语音识别公司Yap,Yap成立于2006年,主要提供语音转换文本的服务。之后的2012年,Amazon又收购了语音技术公司Evi,继续加强语音识别在商品搜索方面的应用,不得不提的是,Evi这家公司也曾经应用过Nuance的语音识别技术。2013年,Amazon继续收购语音技术公司Ivona Software,Ivona是一家波兰公司,主要做文本语音转换,其技术已被应用在Kindle Fire的文本至语音转换功能、语音命令和Explore by Touch应用之中,其Echo也是利用了这项技术。需要说明的是,虽然使用了一些来自于收购的Ivona等初创公司的技术,但Echo涉及的大多数技术均由亚马逊技术人员自主开发。这其中就包括了能够在10英尺甚至更远的地方分辩声音的麦克风阵列技术。

由此不难看出,亚马逊很早就已经通过并购与自研的方式进入到语音识别领域,只是此前相当低调而已,更为关键的是,其拥有自己语音识别的核心技术——采用了非线性排列的远程麦克风阵列(7个麦克风)。这使得相比Siri、Google Now、Cortana这些存在于手机的语音助手,Echo最大的优势还在于它超强的听力。

有了好的技术,如何通过或者说通过什么样的产品形态去体现就显得尤为重要。众所周知,苹果的Siri、谷歌的Google Now基本都是面向智能手机这类移动设备,微软的Cortana除了智能手机,还面向传统PC。而亚马逊则是通过音响这种特立独行的形态来体现,这样做,一来是避免了其在智能手机中与苹果和谷歌的正面交锋,即除了在语音识别技术上直接在智能手机等移动设备上的比较,同时又避免了在硬件本身与谷歌、苹果、微软这些注重硬件设计、材质、交互等相比的差距(从亚马逊之前推出的Kindle、Kindle Fire等硬件设备看,其并不是一家注重过度设计的公司),毕竟对于一款以语音识别为主的硬件设备,用户既不需要触控,也无需在意它的外观,只需要在一定距离内与其交互即可。

其次是更顺应了语音识别的应用场景。就像玛丽?米克(Mary Meeker)2016年《互联网趋势》报告里提及的,语音识别最常用的应用场景是在家中(占据应用场景中的43%)。实际上,基于家中(主要是室内)环境的应用场景,无形中又会放大亚马逊在语音识别技术和体验上与苹果、谷歌和微软(主要是移动和嘈杂的室外环境)的优势。

当然,我们在此并非否认亚马逊在语音识别技术上与苹果、谷歌、微软等相比处于弱势,而是说在技术不相上下时,如何以合适的产品形态和使用场景切入市场对于其未来能否成功的重要性。

如果说上述技术和产品形态是亚马逊Echo成功的必然因素,那么Echo产品的定位或者说想要这款产品达到什么样的预期则更多是偶然因素所致。与现在业内对于Echo是未来智能家居真正入口的评价不同,当初Echo发布时,不要说业内,就是亚马逊自己对于该产品的前景也并没抱有多大希望,亚马逊的初衷很简单,就是利用Echo为用户到亚马逊购物提供一条更方便的方式而已,所以其最初的应用并不多。而正是这种“小理想”让亚马逊采取了比苹果、谷歌和微软在语音识别上更加开放的策略。例如其向第三方开放API,同时投入1亿美元的资金对开发者进行支持。据最新统计,目前Echo整合的第三方功能数,已从 2015 的14 个增加到了目前的 950 个,而随着功能的增加,其销量也是一路攀升。据市场调研公司Consumer Intelligence Research Partners预计,亚马逊已销售出了大约300万台Echo,其中在今年的第一季度就销售了100万台。

直到今天,我们依旧不能确定亚马逊Echo未来究竟能否成为未来智能家居的真正入口,毕竟谷歌、苹果、微软在此领域的野心和实力都不容小视。但亚马逊的Echo无疑是让市场和用户体验到语音识别的最佳方式,也正是Echo背后亚马逊对于一个技术或者产业的偶然与必要因素的结合,谁又敢说亚马逊不能引领下一个智能家居产业的潮流呢?
本文转自d1net(转载)

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
大数据 云计算
阿里云的十年对比 从“忽悠”到世界第三
长期以来中国只有阿里在做云计算产业,而就如马云语言的那样,云计算不仅变成一个企业的竞争力,也变成了一个国家的竞争力,云计算是未来,要和谷歌微软等国际巨头们竞争,这是必须要走的一步。
3734 0
|
区块链 芯片
专家:建议中国搞x86与Intel竞争的,都是在忽悠国家的钱
为美国制裁中兴事件,对国内集成电路产业影响多大?芯片的基本生态是谁先做出一个超出同行的东西,大家都会自动地转入这个生态。即便ARM这样成功的公司背后,是无数产业链公司艰辛的活着。本文作者有多年芯片从业经验,他认为:所有建议中国搞x86的,与Intel竞争的,在行业内看来,都是忽悠国家/VC 钱的。
1085 0
|
新零售 大数据 数据库
阿里云谷歌亚马逊同步大降价上演三国杀
本文讲的是阿里云谷歌亚马逊同步大降价上演三国杀 3月28日,阿里云通过官方博客宣布,将云服务器,云储存和云数据库价格全面大幅下调,标志着来自中国的力量,加入了这场在美国正酣的云计算价格比拼。IT时代的摩尔定律仿佛又轮回到了云计算时代:“每隔18个月,性能翻一倍或者价格降一半”。
1864 0