聚能聊

现在AI的阅读理解做的都比人类好了,它能用在那些方面呢?

32个月前 44回答 6918关注

在斯坦福大学发起的SQuAD(Stanford Question Answering Dataset)评测中,阿里巴巴iDST-NLP团队的SLQA模型位列榜首。阿里巴巴机器阅读理解精确匹配为82.44%,人类精确匹配为82.30%。负责SQuAD挑战赛的负责人斯坦福大学 Pranav Rajpurkar在推特发文称,这是强势开局,2018年第一个模型(SLQA+)在精确匹配上超越了人类水平,下一个目标就是要在模糊匹配上超越人类现在领先的2.5分
f7d7dc3fd231e70e4326252dee92d020_JPEG
阿里巴巴 iDST NLP 团队于 1 月 5 日提交的 SLQA + 在 EM 值(Exact Match, 表示预测答案和真实答案完全匹配)上也获得了 82.440 的优秀成绩,F1 值(F1-score,评测模型的整体性能)则为 88.607。

SQuAD(Stanford Question Answering Dataset)是行业内公认的机器阅读理解领域的顶级水平测试,被誉为机器阅读理解领域的 ImageNet。SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。

机器阅读理解技术拥有广阔的应用场景,比如在精准问答上能为用户提供极大的帮助;另外,它也能推动很多 NLP 相关领域的进步,如知识的表示、上下文篇章理解、知识推理等。

阿里巴巴自然语言处理首席科学家司罗表示,未来希望能向终极目标迈进,即机器真正对通用内容「能理解会思考」。据了解,阿里巴巴 iDST NLP 团队在本次 SQuAD 的榜单上获得第一,主要得益于其提出的「基于分层融合注意力机制」的深度神经网络模型。这一模型能够模拟人类在阅读理解中所产生的行为,包括审题、带着问题阅读文章,对文章进行标注等。

这样一来,模型能够在找寻问题与文章关联的同时,借助分层策略,逐步集中注意力,使答案边界清晰;另外,采用「融合方式将全局信息加入注意力机制」,以确保关注点正确。这一技术实际上已被应用于阿里巴巴内部,例如顾客在双十一期间对活动规则进行咨询,阿里小蜜通过机器阅读理解技术,帮助顾客进行相关问题的解答。又如,这一技术能够帮助顾客阅读商品详情页,智能提取信息,为顾客直接解答基础问题等。

大家一起聊一下:
大家是否了解NLP,它都有那些主要的应用场景?
畅想一下,超越人类的阅读理解AI都能够用在那些方面,有那些应用场景?
大家觉得未来除了阅读理解,未来还有那些方面AI会超过人类?
大家觉得在阅读理解上超越了人类的AI,是否具有了一定的推理能力?

专家已赏出8个礼品,剩余0个可抢

活动规则

阿里云代金券5个
手机话费2个
云栖帽衫1个
点击加载更多