【人机对话】阿里云人工智能ET化身CEO,对话蜻蜓FM猫局长

简介: 11月29日,阿里云人工智能ET化身阿里巴巴CEO,参加蜻蜓FM猫眼未来科技局栏目,对话猫局长。人机对话,妙趣横生。

59c6ce9fb832e245d648cee39ecdc5b2276130e0


猛戳链接,直击现场:未来科技局 | 独家连线阿里巴巴未来CEO


11月29日,阿里云人工智能ET化身阿里巴巴CEO,参加蜻蜓FM猫眼未来科技局栏目,对话猫局长。人机对话,妙趣横生。

3e1f25b2dac6c6c9da791895b908a8ee962e8b17

此外,12月1日,猫眼科技连线阿里云AI专家,关于阿里云人工智能ET背后的语音识别技术进行了一次深度访谈。

猫:先请我们的科学家自我介绍一下吧?

陈:大家好我是阿里云负责ET智能语音对外服务的陈一宁。

7088e3ea8974fe9bbb875010b802c899886d8cc5

猫:你好陈工。我们看到et能言善辩还可以模仿马云的声音。这个是怎么实现的呢?

陈:模仿马云的声音这个是我们的语音合成技术。我们的语音合成技术原理是说它会根据一些已有的录音库生成一个与人的声音类似的模拟声音。那这个马云的声音实际上是因为我们收集了一些马老师在大会上的讲话之类或者是一些演讲的材料根据这个我们做了一个音库。根据这个模型生成的一个对应的马老师的语音合成的声音。

猫:语音识别在ET的各项能力中处于一个什么样的地位我看它有很多种能力啊?

陈:我认为语音识别首先是一个我们叫做听觉或者听觉中枢的一个作用它实际上是在ET的这种人机交互的过程中是一个必不可少的很重要的作用。也是相对来说一个比较成熟和比较接近产品化的一种能力。它很多时候在我们需要跟ET交互或者ET需要理性的处理一些非结构化数据的时候,语音时识别都可以帮助我们能够进入到这些数据中,能够让我们的交互可以开始发声。人机交互嘛!所以需要人说一些事情让机器去理解它。语音识别是这些理解的第一步,先把它变成文字然后才能开始做进一步的理解和进一步的交互。

猫:从现在全球的情况来看语音识别的应用情况是怎么样的从专家的角度如何看这个事情?

陈:全球来看的话语音识别应用还是比较火热的吧现在有很多种应用领域,我们一个一个来说吧比如说从这个人机交互的角度来说其实现在有很多这种助手类的产品比如苹果的siri,比如微软的小娜比如亚马逊的echo等等这样的产品。实际上都是在做这种比如手机特别是IOT设备上的语音交互产品。他们都需要语音识别的技术。那么再往下一点比如在做车载系统,如果你想跟车载做一些交互基本上智能汽车对于语音识别技术都是不可或缺的部分。同时如果对于商用的系统对于这种全球的客服比如我们民航的这种退票和改签服务应用,还有比如说在医疗领域一些医生处方或者医疗记录中发挥作用。

猫:现在语音技术还有没有面临挑战的地方阿里云是如何应对这种挑战的

陈:语音识别这个方向上我们觉得现在遇到的挑战有几种吧一个是比如说想噪声的这种挑战那么现在碰到的情况就是在干净的情况下或者说噪声很小的情况下语音识别的效果还是不错的但是在这个噪声比较大的时候这个识别率就会相对有所下降。还包括说话有一定口音的情况下。标准普通话标准语音会好一些但是有口音的情况下识别率也会有下降然后还包括说话的年龄过小或者过老也会有一些影响会打一些折扣。那么阿里云我们认为在这里面最主要的都是数据的问题。包括我们刚才讲到说抗噪声的理由识别率低实际上都是因为我们没有足够的噪声语音在里面。那么我们阿里云会采用一些技术通过人工的方式记录或者采集的方式获得大量的这种含噪声的,含口音的等等的这些语料,通过我们大规模的大数据方式做一些计算把这些海量的数据结合在一起就能够做出很多在各种情况下应用会比较好的语音识别的效果。还有提到比如中英文混杂的效果这是一个很头疼的问题那么我们也会通过各种识别材料增加的方式来达到最终的满意度。

猫:给我们能不能讲几个科学家工程师们的小故事让大家都了解一下他们的付出。了解工程师们是如何努力的?

陈:试试看啊我讲一个前线落地的故事不是一个后台的故事落地的时候我们会碰到一个很正常的问题有时候我们在做语音识别相关的工作的时候有一个事情很重要就是录音质量要好。录音如果本身就有巨大的噪声或者是你根本就没录下来那么肯定这个效果就会不好吧那这个就会有问题我举个例子比如说之前我们在这个湖南卫视我是歌手》这个节目里头去预测这个歌王。我们现场要得到歌手演唱的这些数据那么这样的一些东西我们都需要把声音录下来都录下来以后发现我们跟电视台的设备做的一些连接我们的设备和电台的设备是不兼容的。插上来基本上就是烧设备。然后当时很紧急的要拔掉开始直播了就发现这个设备有问题。然后后来紧急的想了各种办法来解决。从湖南卫视借了他们的一些设备出来才把这个事儿最后解决的这种情况还有很多比如说在双11晚会的过程中。也会遇到这种设备插在一起还会遇到这种电流电源上的干扰这种声音录起来是完全没法听这样的情况都有很多这种需要现场的工程师去解决,他们有时候都是没日没夜加班连轴转,把公司当做自己的家,非常的辛苦。



相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
16天前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
276 0
|
1月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
2月前
|
人工智能 运维 Kubernetes
阿里云容器服务ACK AI助手正式上线带来的便利性
作为开发者想必大家都知道,云原生容器技术的优势,尤其是近两年的随着容器技术的迅猛发展,Kubernetes(K8s)已成为广泛应用于容器编排和管理的领先解决方案,但是K8s的运维复杂度一直是挑战之一。为了应对这一问题,就在最近,阿里云容器服务团队正式发布了ACK AI助手,这是一款旨在通过大模型增强智能诊断的产品,旨在帮助企业和开发者降低Kubernetes(K8s)的运维复杂度。那么本文就来详细讲讲关于这款产品,让我们结合实际案例分享一下K8s的运维经验,探讨ACK AI助手能否有效降低K8s的运维复杂度,并展望ACK AI助手正式版上线后的新功能。
268 2
阿里云容器服务ACK AI助手正式上线带来的便利性
|
2月前
|
人工智能 数据管理 Serverless
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
404 2
|
2月前
|
人工智能 运维 Cloud Native
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
149 2
|
2月前
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
33 2
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
402 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
|
1月前
|
云安全 人工智能 安全
|
1月前
|
人工智能 弹性计算 监控
在阿里云服务器上搭建自己的人工智能,可以按照以下步骤进行:
【2月更文挑战第22天】在阿里云服务器上搭建自己的人工智能,可以按照以下步骤进行:
43 6
|
2月前
|
人工智能 机器人 API
Python和阿里云AI服务搭建
使用Python和阿里云AI服务搭建一个简单的聊天机器人的教程 1. 注册阿里云账号并登录。 2. 开通阿里云AI服务,并创建一个智能对话机器人。 3. 获取API密钥和AccessToken。 4. 安装Python环境和SDK。
250 8