【智能语音】泡沫下的破浪者，智能语音产品到底落地何处？

2019-03-08 3308

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 如今的科技在各个方面的发展都非常的迅速，越来越多“不切实际”的幻想也在被实现！而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音，这条路就摆在我们面前。

前言：

如今的科技在各个方面的发展都非常的迅速，越来越多“不切实际”的幻想也在被实现！而作为现代人信息获取以及沟通需求最为方便快捷的路径-智能语音，这条路就摆在我们面前。

演讲嘉宾：
盛京，阿里云达摩院-机器智能技术专家

达摩院语音组成立于2014年，具有语音识别、语音合成、声纹识别、自然语言处理、语音交互等等的能力。

以下内容根据演讲嘉宾视频分享以及PPT整理而成。

本次主要内容分为四部分：
一．公共云方案
二．智能语音本地化部署方案
三．智能互动大屏
四．语音自学习平台

一、公共云方案

在公共云方面，服务于集团34个BU，107个业务，包括手淘、支付宝、菜鸟、钉钉、口碑、高德、UC、优酷土豆、天猫精灵等；除了内部外，还有映客直播、一号互联等用户。

从2014年手淘上线后，我们的语音识别覆盖了各种各样的场景。这里面有单纯的手机APP，也有车载，包括18年的时候，包括地铁通过语音购票、甚至最新款的汽车。

给大家具体介绍下，服务于客服方面，我们是如何利用智能语音能力的？

在智能客户领域，我们两个最典型的的案例就是支付宝95188和菜鸟的1518。
支付宝是一个呼入的场景，他是一个电话的、智能的客服。大家如果有打过支付宝电话的一定知道，打完之后，电话另一方会说“请用一句话来描述您的问题”。这时候您可以说：“我的密码忘了”，这时候会有机器人和你对话，告诉你具体的方法。这个就是支付宝电话客服的应用场景。

那么呼出场景，就是菜鸟的智能语音助手，去年双11的时候，我本人就接到过菜鸟打来的电话，他会说：先生，您的某某快递放在小区的蜂站了。如果您说可以，他会礼貌的挂机；如果您说不可以的，他会问你：先生，您什么时候在家，我会把快递给您送过去等等。

这两个应用都节省了大量的人力，在双11时，支付宝智能客服自主率达到了97%；菜鸟机器人替200W快递员打电话。在过去11快递员工作主要就是打电话，现在通过菜鸟助手，就能解决绝大多数问题。

二、智能语音本地化部署方案

除了刚刚介绍的公共云的情况，我们在本地化部署上也有很多应用的场景。
我们提供的主要是一套软件，有能力的开发公司可以把我们语音的能力集成到你们的产品中，这样我们可以共同深入打造各行各业各个场景下的解决方案。
我们提供的能力包括语音识别、语音合成、MRCP、防串音、最重要的还有语音自学习平台。

我们最主要的是聚焦于语音的核心能力，紧靠行业伙伴，我们是一起打造产品的。
我们和友商的区别主要是：友商做语音产品都是端对端的，所有东西都是自己做；而我们只做最核心的，语音识别或者语音合成。然后把能力开放出来，让合作伙伴基于这样的能力来做各种各样的应用。

我们本地化部署方案的标杆是有：智慧法院的一个解决方案，目前我们深度合作了法院领域头部的ISV，包括了华宇、云嘉等等。

我们标杆案例有浙江高院、福建高院等等，覆盖了300家法院，有超过1万家法庭应用了我们语音识别。

这是我们在法院的一些场景，所做的一些事情。同时全国的几大互联网法院，包括第一家杭州互联网法院，北京、广州互联网法院，用的都是我们的语音识别。

在智能客服领域，我们联合阿里小蜜，和ISV为中国移动、中国平安做了智能电话机器人、外呼以及金牌话术。

金牌话术还是要再提一下，在客服领域，不同人的交流沟通能力也不一样的，反馈到结果上就是有的人业绩比较好，有的人差一些。我们金牌话术要做的就是：基于客服和客户的聊天，来把沟通弄技巧挖掘出来。每当你和客户交流的时候，就会提示你应该怎么说，应该做什么样的引导。

三、智能互动大屏

除了刚才介绍的客服和司法，我们还有达摩院全球首创多模态语音交互方案，能够实现在强噪音环境下的免唤醒人机交互。
比如说在公共空间，地铁购票、肯德基点餐，都能够通过我们这套解决方案实现人机交互，我们这个产品的优势，就是强噪音语音环境下的语音识别、同时免唤醒、以及长句子的流失理解。
这套语音交互产品模式就是：我们提供软硬件一体的套件，再加上定制的外壳，我们有一个官方标准的，合作伙伴也可以根据各种需求来定制，之后我们就可以对接到客户的系统里面。
这时候就能有各行各业的应用，比如对接客户的支付系统。图书管理系统、导航系统。