《中国人工智能学会通讯》——第1章 从图灵测试到智能信息获取 1.1 图灵测试与问答

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第1章,第1.1节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

第1章 从图灵测试到智能信息获取

随着计算机科学与互联网技术及产业的蓬勃发展,大数据相关的信息智能处理给人类的生活带来了天翻地覆的变化。在这个洪流中,人工智能技术的发展和贡献有目共睹,也同时得到了各大 IT 企业的强烈关注。其中,智能问答越来越受到关注,甚至于被预见为下一代互联网信息服务的基本形式。本文试图从图灵测试开始,探讨理解问答形式本身的性质、发展和未来。

1.1 图灵测试与问答

图灵(Turing),伟大的计算机科学家,1950 年发表了题为《计算机器与智能》的论文,提出了著名的“图灵测试(Turing Test)” [1] (见图 1)。所谓图灵测试,就是测试人与被测试者在相互隔离的情况下,对被测试者进行自然语言的提问,如果被测试者能够在 5 分钟的问答后,以超过 30% 的可能性让一位普通的测试者误以为其是人类,则说明机器通过了测试,并被认为具有人类的智能。
image
图灵测试最初作为测试计算机系统智能的标准、衡量真理的试金石而诞生,虽然饱受争议,但同时也是智能系统不断进步、不断完善的目标与动力。半个世纪以来伴随着人工智能的发展潮起潮落,每当人工智能的研究取得了重要突破时,图灵测试就会被提出来小试牛刀[2] ;而当人工智能的研究处于暂时的停滞时,图灵测试就会落满灰尘、束之高阁。

我们试图从不同的角度理解机器智能与图灵测试的辩证关系。其一,机器智能和图灵测试是统一的。一般认为,图灵测试是被作为机器智能的充分条件,通过了图灵测试,说明机器有足够的能力骗过人类,而不需要去关心底机器是用什么样的机理与方法。这和人工智能学派中“弱人工智能假设”目标一致:即实现一个机器,使得它可以表现出不低于人类的智能行为表现。例如,我们只需要造出可以飞的飞机,而不必让飞机和鸟儿一样的用扇动翅膀的方式飞翔。其二,机器智能和图灵测试也有不一致的一面。机器所表现出来的智能行为,很多情况下不在图灵测试的范畴中。例如,深蓝已经可以战胜国际象棋大师,或者通过大数据关联计算可以找到超市啤酒与尿布的销售关系,这些机器能够实现的智能行为,并不是普通人类所必备的,自然也不会用类似问题进行图灵测试。

多年来图灵测试被认为难以实现的原因在于它测试的是人类的认知智能,而不是感知智能或智能行为。在进行图灵测试时,提问的目的不在于得到某种实际的收益,而是要千方百计辨别被测试者是否具有人类的特征,包括知识、推理、规则和学习能力,甚至主观的非智能行为特征,包括情感、情绪等。所以,人工智能的研究者,既热衷于尝试图灵测试,从而体现当前智能研究水平,同时又冷漠甚至疏远图灵测试,畏惧于它的难度。一个有点令人沮丧的例子,现在大家纷纷吐槽的 12306 购票网站验证码,就可以看作一个简化版的测试:在精心挑选的问题集中,机器的智能表现与人类智能表现差异越大,验证码的设计就越成功。 假设我们设计不出用来区分人和机器的验证码,那么机器在一定意义上就通过了图灵测试,而其智能水平就真的高到了可怕。

当前智能研究水平,同时又冷漠甚至疏远图灵测试,畏惧于它的难度。一个有点令人沮丧的例子,现在大家纷纷吐槽的 12306 购票网站验证码,就可以看作一个简化版的测试:在精心挑选的问题集中,机器的智能表现与人类智能表现差异越大,验证码的设计就越成功。 假设我们设计不出用来区分人和机器的验证码,那么机器在一定意义上就通过了图灵测试,而其智能水平就真的高到了可怕。

图灵测试通常是作为人工智能的象征或者图腾存在的。它就在那里,我们要不断去接近它。而问答系统和图灵测试有什么关系呢?一方面,图灵测试的场景本身就是问答。如果我们有了和人一样智能的问答系统,那么就相当于通过了图灵测试。因此问答相关研究始终受到人工智能学者的重视。从知识工程、推理机、专家系统,到搜索引擎,智能助手甚至机器人,问答系统贯穿了人工智能的整个发展历程。另一方面,问答作为人类最自然的交互方式,有非常广泛的应用需求。问答系统所体现的智能行为,不是为了通过图灵测试而存在的,而是为了更加有效地解决现实中的任务。简而言之我们不能离开图灵测试背后的人类智能去研究问答系统,也不应该局限在图灵测试的角度去考量问答系统。

相关文章
|
18天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能,应该如何测试?(六)推荐系统拆解
该文介绍了推荐系统的基本概念和实现思路。推荐系统通过预处理筛选候选集合,然后利用二分类模型预测用户对内容的喜好概率,再按概率排序选择Top N内容推荐给用户。文中提供了一个使用Spark ML库的简单模型训练DEMO,涉及数据预处理、特征工程和逻辑回归模型。此外,还提及了词向量在处理文本特征中的重要性,它能捕捉词与词之间的关联性。推荐系统的实际应用远比示例复杂,但这个例子有助于理解其核心流程。
21 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习:开启智能新时代的密钥
人工智能与机器学习:开启智能新时代的密钥
28 0
|
2月前
|
机器学习/深度学习 人工智能 安全
中国信通院联合金橙果科技等十七家单位发起人工智能大模型安全基准测试
2024年2月20日下午,AIIA“SafetyAI Bench”(人工智能大模型安全基准测试)线上研讨会成功举办。来自中国信息通信研究院(以下简称“中国信通院”)、厦门大学、北京大学、北京交通大学、360、百度、蚂蚁集团、VIVO、西门​子、小鹏汽车、马上消费、浪潮科技、海信视像、交通银行、商汤科技、邮储银行、普华永道、科大讯飞、金橙果科技、万商天勤律所、中兴通讯、博特智能、开源网安、云天励飞等单位40余位科研机构专家及企业代表参加了本次会议。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
springboot基于人工智能和自然语言理解技术的医院智能导医系统源码
智能导诊系统可为患者提供线上挂号智能辅助服务,患者根据提示手动输入自己的基本症状,通过智能对话方式,该系统会依据大数据一步步帮助患者“诊断”,并最终推荐就医的科室和相关专家。患者可自主选择,实现“一键挂号”。这一模式将精确的导诊服务前置,从源头上让医疗服务更高效。
371 2
|
1月前
|
人工智能 自然语言处理 人机交互
吴泳铭:拥抱人工智能驱动的产业智能革命
吴泳铭:拥抱人工智能驱动的产业智能革命
108767 475
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
未来智能时代:人工智能技术的新趋势与挑战
在当今数字化快速发展的时代,人工智能技术正逐渐渗透到我们生活的方方面面。本文将探讨人工智能技术的新趋势和挑战,分析其对未来社会和产业的影响。
23 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能大模型引领智能时代的革命
随着AI技术的飞速发展,人工智能大模型正成为推动社会进步和经济发展的重要力量,比如GPT-3、BERT和其他深度学习架构,正在开启一个全新的智能时代。在人机交互、计算范式和认知协作三个领域,大模型带来了深刻的变革。那么本文就来分享一下关于大模型如何提升人机交互的自然性和智能化程度,以及它们如何影响现有的计算模式并推动新一代计算技术的演进,并探讨这些变革对未来的意义。
41 1
人工智能大模型引领智能时代的革命
|
2月前
|
机器学习/深度学习 人工智能 物联网
《未来智能时代下的人工智能发展趋势与挑战》
【2月更文挑战第5天】随着人工智能技术的不断发展,我们迎来了智能时代的到来。本文将探讨人工智能在未来的发展趋势和面临的挑战,分析其在各个领域的应用前景和影响。
263 1
|
18天前
|
人工智能 搜索推荐 算法
人工智能,应该如何测试?(七)大模型客服系统测试
这篇文稿讨论了企业级对话机器人的知识引擎构建,强调了仅靠大模型如 GPT 是不够的,需要专业领域的知识库。知识引擎的构建涉及文档上传、解析、拆分和特征向量等步骤。文档解析是难点,因文档格式多样,需将内容自动提取。文档拆分按语义切片,以便针对性地回答用户问题。词向量用于表示词的关联性,帮助模型理解词义关系。知识引擎构建完成后,通过语义检索模型或问答模型检索答案。测试环节涵盖文档解析的准确性、问答模型的正确率及意图识别模型的性能。整个过程包含大量模型组合和手动工作,远非简单的自动化任务。
32 0
|
18天前
|
人工智能 自然语言处理 算法
人工智能,应该如何测试?(五)ASR 效果测试介绍
ASR是自动语音识别技术,将语音转化为文本,涉及多学科知识。数据收集是关键,包括特定人/非特定人、词汇量大小、发音方式、方言和情感等多种类别,高质量数据成本高。ASR流程包括数据收集、标注、输入算法得到文本输出并评估。常用评估指标有字错率(WER)、字正确率及插入/删除/替换率。数据标注需严格遵循规范,工作量大,而Levenshtein库可用于自动化效果评测。在AI领域,大部分时间投入在数据处理上。
29 0