谷歌io开发者大会2018:AI无处不在

简介:

中国时间5月9日凌晨,谷歌一年一度的I/O开发者大会在旧金山山景城开幕。在两个小时的KeyNote演讲中,谷歌着重介绍了谷歌助手(Google Assitant)、安卓新版本Android P Beta的更新,以及一些谷歌软件(谷歌地图、谷歌新闻、谷歌摄像头)的更新,同时还谈到了谷歌在自动驾驶领域和TPU芯片研发的新进展。

  AI无处不在

  谷歌将AI作为公司的重点发展方向,在这场KeyNote演讲中,处处体现着这个特征。

  谷歌首席执行官Sundar Pichai首先登场,一上场,Sundar Pichai就谈了谷歌AI在不同领域的应用。

\
  比如在医疗领域,谷歌AI可以在糖尿病视网膜病变和心血管风险方面帮助诊断,还能帮助医生预测患者再次入院的可能性。又例如,通过AI与NLP技术,谷歌现在可以讲两个人同时讲话时的声音分割开来用文字显示。而且现在语言残障人士能够通过谷歌键盘(G-borad)用摩斯电码合成自己的声音。Sundar Pichai还提到了Gmail运用AI技术生成自动回复的功能。

  这些都是谷歌在AI领域的一些尝试,但大会的重点还是放在谷歌助手(Google Assitant)、安卓新版本Android P Beta上,尤其是谷歌助手,一度掀起大会现场的高潮。尤其是Pichai在现场展示的一段谷歌助手给人类打电话的视频DEMO,无论是答案合理的回复还是高度像人的语音语调,都足以骗过电话那头的人类、以假乱真。

  谷歌助手(Google Assitant)七大更新

  Google Assitant的更新发布是本次大会的重点。目前,已有超过5亿设备搭载Google Assitant,其中有超过5000种家居设备。Google Assitant今天的日常使用量同比翻了两番。目前,Google Assitant进入了80个国家,支持30余种语言。以下是Google Assitant的一些新进展。

  1.Google Assitant通过WaveNet可以合成更加自然的AI语音。目前,Google Assitant口音库中加入了6种口音类型,适应各地发音习惯,而且都非常自然。

  2.Google Assitant支持更自然的交流。为了与用户更好的交互,不仅是口音的多样化,Google Assitant比原来更了解人们的生活与表达习惯。例如,用户与Google Assitant进行多轮对话时,不再需要每句话都以“Hey Google”开头。这破解了之前AI语音助手难以进行多轮对话的问题。

  3.Google Assitant能更好的执行多重任务,它能辨别出用户发出指令中的多重并列指令,并做出相应的反应。

  4.Google Assitant更加适用于家庭教育场景。Google Assitant可提供超过13万儿童故事,而且新加入了Pretty please功能,鼓励小孩对Google Assitant进行礼貌提问。

  5.Google Assitant成为了可听化与可视化结合的助手。Google Assitant加入了Visually assistant功能,使Google Assitant不只对用户进行语音提示,并且在设备屏幕上显示相应的信息,更方便使用,例如显示导航路线、显示菜谱视频。

  6.三款搭载Google Assitant的带屏音箱将会于今年7月上市发售,包括JBL、联想、LG,Google旗下的YouTube资源也会向这些音箱开放。这些音箱都在今年CES上展示过。

  7.Google Assitant支持用户通过它进行订餐与预约,Doordash、711、星巴克等餐饮品牌都与Google Assitant进行了合作。

  为了展示Google Assitant的智能化程度,谷歌首席执行官Sundar Pichai播放了用Google Assistant打电话预约发廊服务和定餐厅的演示视频。Google Assistant在给发廊和餐厅的真人服务员打电话进行预约的过程中,让人几乎感觉不到这是AI与人的对话,而是人与人的对话。

  这个功能是通过谷歌开发许久的AI系统Google Duplex实现的,目前尚处于内测阶段。但这段演示已经吊足了人们的胃口,让人不禁更加期待Google Assitant带来的更多可能性。

  AI加持Android P Beta系统

  Android系统已有10年历史。谷歌副总裁Dave Burke上台谈到了谷歌发布的全新系统Android P Beta,他说,这可能是Android近几年来最大的更新。

  Dave Burke说,Android P Beta将成为谷歌把移动应用与AI结合的主要部分。Android P Beta有这些变化:

  1.预测几个小时内用户要用的应用,智能分配手机资源,节省电量;

  2.根据使用环境自动调节手机屏幕亮度;

  3.预测用户行为,为用户推荐应用;

  4.类似iPhone X的操作手势;

  5.管控用户花在手机上的时间,比如夜晚把手机屏幕调成灰色,降低用户对手机的欲望。

  6.谷歌还特别向开发者提供了一系列和AI相关的API:ML Kit,常见的AI功能都包含其中,而且更适合不太熟悉AI技术的开发者使用。

  Google News:AI做新闻

  谷歌此次推出了以AI驱动的新版Google News应用,有三项重点关注领域:让用户时刻关注新动态、理解新闻事件全貌、享受并支持你喜爱的媒体。跟今日头条很相似,Google News使用信息流的方式,用算法来推荐最适合你的新闻、短视频、深度文章、相关信息等。今天,Google News已在127个国家中上线。

  其中,News_cast功能会将新闻进行梗概,帮助用户快速了解信息。Full coverage功能则会打通网络上各种散乱信息之间的时间、逻辑联系,建立新闻专题,帮助用户了解新闻的来龙去脉。

  谷歌地图(Google Map):AI融入地图

  在使用地图应用的时候,用户最害怕的一点就是——不准确!

  然而,通过AI算法,Google Maps现在已经可以自动添加新开张的一些店铺,显示某一地点的路线变化,完善地图的准确性和完整性。除了告知用户到达目的地的路线之外,现在Maps还能向用户描述商店的开张时间、顾客在店内滞留的平均时长等信息。

\
  它还能为不同的用户定制他们关心的信息,比如居住地附近新开了什么店铺,推荐附近的美食——这一些都是建立在机器学习之上的,通过比对用户个人偏好的大量数据。用户也可以与朋友快速分享地图上的美食,并且在地图上进行实时标注。这能帮助用户快速做出决定并下单,也能为商户带来新的商机。

  此外,谷歌还介绍了“视觉定位系统”(Vision Position System,简称VPS)。简单来说,其就是通过手机摄像头,用AR技术来为用户进行导航。

  谷歌摄像头(Google Lens)

  此次大会对Google Lens的着墨也不少。

  谷歌介绍了Google Lens如何让摄像头、Google Map、GPS信息进行融合。Google Lens可以在真实街景上叠加左转、右转或者前行标志,使用户更直观地了解到自己该怎么去往目的地。为了使用户体验更有趣,谷歌还开发了一只虚拟狐狸给用户指路。

  同时Google Lens能进行更快更准确的文本识别。而且,在进行划词识别后,Google Lens不仅能理解字面意思,更能了解文本的背景和相关信息等,然后对文本相关信息进行展示。

  Google Lens不仅能识别文本,而且运用通过AI加持的VPS(视觉处理系统),还能识别图像、地标、食物等。

  Google Lens还推出了类似淘宝的用图片搜索相关商品的功能。

  无人驾驶:车自己预判路况

  值得一提的是,这是Waymo首次登上谷歌I/O大会。Uber和特斯拉、以及Waymo近来一直被爆出无人车事故,因此外界一直对自动驾驶相关技术争议颇大。不过,这并没有影响Waymo对新技术的憧憬。

  Waymo CEO John Krafcik描述了如何利用AI技术来解决无人驾驶研发中的各种各样的问题。

  Waymo提到,无人驾驶汽车对周边物体和环境的感知非常重要,通过不断的数据训练,其可以预测路上人与车的行动。其无人驾驶汽车已经积累了600万英里行驶里程,同时在仿真系统中已经行驶50亿英里。

\
  即使在极端恶劣的环境下,Waymo 的算法依旧能识别出车辆和道路。Waymo 无人车的算法训练使用了 Google TPU,这使得训练效率提高了 15 倍,有了 AI 算法的帮助,Waymo 即使在暴雪这样的恶劣环境中,都能将测试和训练继续进行下去。

  目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果:无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判,防止在过十字路口时候撞到闯红灯人或车。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

目录
相关文章
|
3月前
|
人工智能 自然语言处理 安全
【AI 现况分析】AI 如何帮助开发者完成自动化测试
【1月更文挑战第27天】【AI 现况分析】AI 如何帮助开发者完成自动化测试
|
25天前
|
人工智能 文字识别 安全
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的SIMA项目旨在创建一个通用AI代理,该代理能在多种3D环境中执行复杂任务,通过语言指令与环境交互。目标是让AI理解并执行600多种动作,包括导航和建造等。使用多样化的3D环境训练,结合零基础训练和预训练模型,如SPARC和Phenaki,以增强语言理解和行动执行。评估方法多角度,包括人类评估,但也面临效率和成本挑战。项目注重伦理安全,但AI在复杂环境中的性能仍有提升空间。DeepMind将继续优化代理的鲁棒性,扩大研究范围,以推动通用人工智能的发展。
21 2
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
|
1月前
|
人工智能 API
谷歌SIMA:一种适用于 3D 虚拟环境的通用 AI 智能体
【2月更文挑战第24天】谷歌SIMA:一种适用于 3D 虚拟环境的通用 AI 智能体
40 1
谷歌SIMA:一种适用于 3D 虚拟环境的通用 AI 智能体
|
1月前
|
存储 人工智能 数据库
生成式AI「人人可用」的时代,企业与开发者该怎么做?
有研究称:生成式AI正在从“第一幕”走向“第二幕”,“快速展示正被真正的价值和完整的产品体验所取代”,第二阶段中“生成式AI普惠”应该怎么做呢?
生成式AI「人人可用」的时代,企业与开发者该怎么做?
|
1月前
|
人工智能 安全 搜索推荐
OpenAI、谷歌、微软、Meta联名签署AI公开信
【2月更文挑战第16天】OpenAI、谷歌、微软、Meta联名签署AI公开信
22 2
OpenAI、谷歌、微软、Meta联名签署AI公开信
|
1月前
|
人工智能 搜索推荐 智能硬件
谷歌发布最新读屏AI
【2月更文挑战第15天】谷歌发布最新读屏AI
33 2
谷歌发布最新读屏AI
|
2月前
|
人工智能 自然语言处理 计算机视觉
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
【2月更文挑战第3天】TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
42 1
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
|
2月前
|
机器学习/深度学习 人工智能 开发者
英伟达依托AI市值超谷歌,这波AI浪潮,你赶上了吗
随着人工智能(AI)技术的迅猛发展,全球科技行业的竞争格局正在发生着翻天覆地的变化。英伟达依托AI市值超谷歌,这波AI浪潮,你赶上了吗
39 2
|
2月前
|
人工智能 BI 开发者
|
3月前
|
人工智能 开发者 Docker
电子好书发您分享《AI开发者的Docker实践》
电子好书发您分享《AI开发者的Docker实践》
38 1

热门文章

最新文章