独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?

简介:

雷锋网AI科技评论按:苹果第一篇AI论文一经投放,便斩获CVPR 2017最佳论文。随后便有外界不断猜测苹果的论文质量有水分,似乎不能匹配最佳论文的头衔。雷锋网记者随后从学术角度采访了几位学术界人士。看看他们怎么说。

苹果的AI研究消息首次进入公众视野的是在去年的12月初。

  • 2016年12月8日,在西班牙NIPS 2016大会上,苹果AI研究负责人Russ Salakhutdinov承诺将会公布和分享他们的最新AI研究成果。

  • 2016年12月22日,首篇机器学习论文通过康奈尔大学图书馆出版,显示的提交时间是11月15日。

  • 2017年7月19日,苹果开通机器学习博客(Apple Machine Learning Journal ),同时发表一篇题为“Improving the Realism of Synthetic Images”的文章。这篇文章用更通俗的语言介绍了之前发表的论文。

  • 2017年7月22日,苹果的这篇论文获CVPR 2017最佳论文。

回顾一下这篇论文的主要内容:

这篇题为《通过对抗训练从模拟的和无监督的图像中学习》是图像识别领域的论文。论文中,提出了一个“模拟+无监督学习”(simulated + unsupervised learning)的学习方法,使用的是如今非常火的深度学习“对抗训练”。GANs(对抗训练)发明者Ian Goodfellow得知苹果的第一篇机器学习论文是关于GANs,也十分兴奋,并在自己的推特中第一时间转了这篇论文。

GANs模型,简单的说就是让两个网络相互竞争,玩一个“猫鼠游戏”。

一个叫做生成器网络G( Generator Network),它不断捕捉训练库里真实图片的概率分布,将输入的随机向量转变成新的样本。一句话,G负责生成假图片。

另一个叫做判别器网络D(Discriminator Network),它可以同时观察真实和假造的数据,判断这个图片到底是不是真的。

G尝试用自己的生成的仿品来“蒙骗”D,而D也不断提高自己鉴别真伪的水平。这样G的造假能力和D的鉴别能力都会越来越高超。

而苹果的“对抗训练”是对原有的GANs模型做了稍加的修改,形成了自己的SimGANs模型。其中sim是单词 Simulator的缩写,即模拟器的意思。

苹果的SimGANs其实包括三部分:模拟器(Simulator)和精制器(Refiner),然后再加上一个判别器(Discriminator)。模拟器合成图像,再用精制器做优化使得更像真实图片,最后再由判别器做识别训练。

苹果也在自己的论文摘要中提到: “我们的模拟+无监督学习方法,使用的对抗网络跟GANs很类似。但是,输入值是合成图像,而不是随机向量。

随后便有学术界人士质疑,指出苹果的创新并不是具有突破性的,似乎不够资格评选为“最佳论文”。

甚至在知名问答社区知乎上有人从论文的第一作者背景开始怀疑,最佳论文评选过程有暗箱操作的嫌疑。

独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?

点赞数最多的答主回答:

独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?

独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?

论文第一作者Ashish Shrivastava,马里兰大学计算机视觉博士

随后雷锋网驻国外记者也就「今年的CVPR 最佳论文是否实至名归」这个问题采访了几位学术界人士:

CrowdAI 研究员Jigar Doshi接受采访说:

(因为总共有两篇最佳论文,他先从第一篇谈起)第一篇Densely Connected Convolutional Networks(密集连接的卷积网络)中,DenseNet模型有两大贡献,一个是计算效率提升,大幅度地减少了参数数量,模型训练出来的精确度和质量都要比之前好。还有就是模型能够泛化,研究者用了好几个数据集,用来展示研究成果可以用到其他数据集和场景中。这是一个大家都能用,一个通用的方法。大家都在看,都在讨论,这篇论文是值得评为最佳论文的。

谈到苹果的SimGANs,Jigar评论到:SimGANs的优点是无需标注自动生成新数据,但是他在演示过程中只用了一个数据集,对它的泛化能力表示存疑。半年前自己也试过类似的方法,不过不起作用,不理解为什么在苹果的试验中起了作用。同时很奇怪为什么这篇论文能评为最佳论文。

南洋理工大学一位研究手势识别的计算机视觉博士评价苹果论文说道:

苹果SimGANs的手势识别效果并不好,还没有自己做的模型效果好。

另一位MIT生物图像博士:

感觉SimGANs并不是很有意义(not very meaningful),相比其他方法并没有很大的提升。

不过也有AI学界人士支持苹果获最佳论文,一位亚马逊研究员告诉记者:

SimGANs 很简单。但也开了一个新口子,针对一个具体问题有了新方法,未来其他人可以研究如何把类似方法用到其他领域,算是“抛砖引玉”。另外,由于该方法的特殊性,需要做许多工作才能用于某一领域,因此确实难以在一个研究中提出一个通用方案,解决一个具体问题已经可以了。

来自国内的一位中科院教授说道:

SimGANs 论文第一作者 Ashish Shrivastava 的导师是 CVPR 大会主席 Rama Chellappa,算是“举贤不避亲”(意思是只要是真正有本领的贤能人才,不管与举荐人是否有关系,都可以正常举荐,让贤能的人才发挥其作用。)雷锋网(公众号:雷锋网)记者也跟其他参会的学生老师提了这个疑问,很多人认为论文评审流程严格,未必有多大不公平。

最后采访的几位大牛总结了一下今年的两篇最佳论文:这两篇论文没什么理论突破,只是技术上的提升改进。同时也表示,今年的CVPR创新突破已经很少,差不多都是在原有的基础上有一点点提升。

雷锋网小结:三位反对苹果获最佳论文的统一看法是:苹果SimGANs的泛化能力差,只能用到具体的某个领域。另外单从表现效果上看,和其他方法相比也没有很大的提升。两位支持者看法是:由于SimGANs方法的特殊性,确实难以形成一个通用方案,不过苹果给出了一个新思路,能启发大家就够了。这届CVPR总体来说没有学术界期待的那种划时代的研究成果出现,苹果论文之所以不那么出色也能从中脱颖而出,恐怕不是苹果“有关系”,而是“矮子里面选高个”的原因吧!

雷锋网

本文作者:杨文

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
1天前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
15 3
|
2天前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
13 0
|
3天前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
27 11
|
3天前
|
数据采集 人工智能 数据挖掘
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
29 0
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
|
3天前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
32 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
3天前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
116 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
3天前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
21 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
苹果放弃十年造车计划,转向生成式AI
【2月更文挑战第10天】苹果放弃十年造车计划,转向生成式AI
36 2
苹果放弃十年造车计划,转向生成式AI
|
3天前
|
人工智能 数据可视化 算法
苹果Vision Pro携Sora引领AI的新浪潮,XR硬件未来探索之旅
苹果Vision pro刚刚发布,一跃成为迄今最先进的虚拟现实和增强现实眼镜,苹果公司将其称为“空间计算机”。 OpenAI的创始人兼首席执行官山姆·奥特曼评价:苹果Vision pro是自iPhone以后第二惊艳的技术。实际上手体验时,当你带上眼睛后,沉浸式呈现眼前是一个虚拟空间,它以高分辨率屏幕,支持重放事件和人物的三维视频录像,看起来就像置身其中,只需要通过简单的眼神和隔空手势操作。
|
3天前
|
机器学习/深度学习 人工智能 文字识别
通过CSIG—走进合合信息探讨生成式AI及文档图像处理的前景和价值
通过CSIG—走进合合信息探讨生成式AI及文档图像处理的前景和价值
78 1

热门文章

最新文章