快醒醒,一大波最新 AI 论文加开源代码来袭!

简介:

ETH-DS3Lab at SemEval-2018 Task 7: Effectively Combining Recurrent and Convolutional Neural Networks for Relation Classification and Extraction
@theodoric008 推荐
Relation Extraction

本文来自苏黎世联邦理工学院 DS3Lab,文章针对实体关系抽取任务进行了非常系统的实验,并在第十二届国际语义评测比赛 SemEval 2018 的语义关系抽取和分类任务上获得冠军。本文思路严谨,值得国内学者们仔细研读。

论文链接
https://www.paperweekly.site/papers/1833

Personalizing Dialogue Agents: I have a dog, do you have pets too?
@yihongchen 推荐
Dialogue System

本文是 Facebook AI Research 发表于 NIPS 2018 的工作。论文根据一个名为 PERSONA-CHAT 的对话数据集来训练基于 Profile 的聊天机器人,该数据集包含超过 16 万条对话。

本文致力于解决以下问题:

聊天机器人缺乏一致性格特征

聊天机器人缺乏长期记忆

聊天机器人经常给出模糊的回应,例如 I don't know

论文链接
https://www.paperweekly.site/papers/1802
数据集链接
https://github.com/facebookresearch/ParlAI/tree/master/parlai/tasks/personachat

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding
@zhkun 推荐
Natural Language Understanding

本文是悉尼科技大学发表于 AAAI 2018 的工作,这篇文章是对 Self-Attention 的另一种应用,作者提出一种新的方向性的 Attention,从而能更加有效地理解语义。

论文链接
https://www.paperweekly.site/papers/1822
代码链接
https://github.com/shaohua0116/Group-Normalization-Tensorflow

DetNet: A Backbone network for Object Detection
@chlr1995 推荐
Object Detection

本文来自清华大学和 Face++,文章分析了使用 ImageNet 预训练网络调优检测器的缺陷,研究通过保持空间分辨率和扩大感受野,提出了一种新的为检测任务设计的骨干网络 DetNet。
实验结果表明,基于低复杂度的 DetNet59 骨干网络,在 MSCOCO 目标检测和实例分割追踪任务上都取得当前最佳的成绩。

论文链接
https://www.paperweekly.site/papers/1844

Imagine This! Scripts to Compositions to Videos
@chlr1995 推荐
Video Caption

本文以《摩登原始人》的动画片段作为训练数据,对每个片段进行详细的文本标注,最终训练得到一个可以通过给定脚本或文字描述生成动画片段的模型。

模型称为 Craft,分为布局、实体、背景,三个部分。虽然现阶段模型存在着很多问题,但是这个研究在理解文本和视频图像高层语义方面有着很大的意义。

论文链接
https://www.paperweekly.site/papers/1838

Generating Diverse and Accurate Visual Captions by Comparative Adversarial Learning
@Aidon 推荐
Image Caption


本文来自华盛顿大学和微软,文章提出一个基于 GAN 的 Image Caption 框架,亮点如下:
  1. 提出用 comparative relevance score 来衡量 image-text 的质量从而指导模型的训练,并且在训练过程中引入 unrelated captions;
  2. 利用 human evaluations 评估 caption 的 accuracy,给出了和传统的六个评价指标的结果对比;
  3. 提出通过比较 caption feature vectors 的 variance 来评估 caption 的 diversity。

论文链接
https://www.paperweekly.site/papers/1842

Simultaneously Self-Attending to All Mentions for Full-Abstract Biological Relation Extraction
@robertdlut 推荐
Self-Attention

本文是 Andrew McCallum 团队应用 Self-Attention 在生物医学关系抽取任务上的一个工作。这篇论文作者提出了一个文档级别的生物关系抽取模型,作者使用 Google 提出包含 Self-Attention 的 transformer 来对输入文本进行表示学习,和原始的 transformer 略有不同在于他们使用了窗口大小为 5 的 CNN 代替了原始 FNN。

论文链接
https://www.paperweekly.site/papers/1787
代码链接
https://github.com/patverga/bran

Evaluation of Session-based Recommendation Algorithms
@Ttssxuan 推荐
Recommender System

本文系统地介绍了 Session-based Recommendation,主要针对 baseline methods, nearest-neighbor techniques, recurrent neural networks 和 (hybrid) factorization-based methods 等 4 大类算法进行介绍。

此外,本文使用 RSC15、TMALL、ZALANDO、RETAILROCKET、8TRACKS 、AOTM、30MUSIC、NOWPLAYING、CLEF 等 7 个数据集进行分析,在 Mean Reciprocal Rank (MRR)、Coverage、Popularity bias、Cold start、Scalability、Precision、Recall 等指标上进行比较。

论文链接
https://www.paperweekly.site/papers/1809
代码链接
https://www.dropbox.com/sh/7qdquluflk032ot/AACoz2Go49q1mTpXYGe0gaANa?dl=0

On the Convergence of Adam and Beyond
@chlr1995 推荐
Neural Network

本文是 ICLR 2018 最佳论文之一。在神经网络优化方法中,有很多类似 Adam、RMSprop 这一类的自适应学习率的方法,但是在实际应用中,虽然这一类方法在初期下降的很快,但是往往存在着最终收敛效果不如 SGD+Momentum 的问题。

作者发现,导致这样问题的其中一个原因是因为使用了指数滑动平均,这使得学习率在某些点会出现激增。在实验中,作者给出了一个简单的凸优化问题,结果显示 Adam 并不能收敛到最优点。

在此基础上,作者提出了一种改进方案,使得 Adam 具有长期记忆能力,来解决这个问题,同时没有增加太多的额外开销。

论文链接
https://www.paperweekly.site/papers/1841

Neural Baby Talk
@jamiechoi 推荐
Image Captioning

本文是佐治亚理工学院发表于 CVPR 2018 的工作,文章结合了 image captioning 的两种做法:以前基于 template 的生成方法(baby talk)和近年来主流的 encoder-decoder 方法(neural talk)。

论文主要做法其实跟作者以前的工作"Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning"类似:在每一个 timestep,模型决定生成到底是生成 textual word(不包含视觉信息的连接词),还是生成 visual word。其中 visual word 的生成是一个自由的接口,可以与不同的 object detector 对接。

论文链接
https://www.paperweekly.site/papers/1801
代码链接
https://github.com/jiasenlu/NeuralBabyTalk

Context Encoding for Semantic Segmentation
@wanzysky 推荐
Semantic Segmentation

本文提出了一种与类别预测相关的网络结构,使得在一定程度上降低了分割任务的难度。Channel attention 和空间 attention 形成互补,Global contextual loss 增强 context 信息,同时提高了小物体的分割精度。

论文链接
https://www.paperweekly.site/papers/1814
代码链接
https://github.com/zhanghang1989/PyTorch-Encoding

Adaptive Graph Convolutional Neural Networks
@VIPSP 推荐
Convolutional Neural Network

图卷积神经网络(Graph CNN)是经典 CNN 的推广方法,可用于处理分子数据、点云和社交网络等图数据。Graph CNN 中的的滤波器大多是为固定和共享的图结构而构建的。但是,对于大多数真实数据而言,图结构的大小和连接性都是不同的。

本论文提出了一种有泛化能力且灵活的 Graph CNN,其可以使用任意图结构的数据作为输入。通过这种方式,可以在训练时为每个图数据构建一个任务驱动的自适应图(adaptive graph)。

为了有效地学习这种图,作者提出了一种距离度量学习方法。并且在九个图结构数据集上进行了大量实验,结果表明本文方法在收敛速度和预测准确度方面都有更优的表现。

原文发布时间为:2018-04-19
本文作者:让你更懂AI的
本文来自云栖社区合作伙伴“PaperWeekly”,了解相关信息可以关注“PaperWeekly”。

相关文章
|
2天前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
23 11
|
3天前
|
人工智能 自然语言处理 算法
分享几个.NET开源的AI和LLM相关项目框架
分享几个.NET开源的AI和LLM相关项目框架
|
4天前
|
XML 人工智能 JSON
[译][AI OpenAI-doc] 代码解释器 Beta
代码解释器允许助手在受限执行环境中编写和运行 Python 代码。该工具可以处理具有不同数据和格式的文件,并生成带有数据和图形图像的文件。
34 17
|
7天前
|
人工智能 自然语言处理 IDE
如何让阿里云AI001号员工帮我写代码(含IDEA插件使用)
AI 智能时代,将改变所有人的思维方式,学习方式,更注重人的创造力和思考力,如果你懒,你将会被 AI 替代,如果你只想干简单不用动脑的活,你将会被 AI 替代,如果你只会打螺丝,更会被 AI 替代。当下的 AI 人工智能时代,被认为是第四次工业革命的到来,我们更应该看到的是机会,而非跳进焦虑、困惑、悲观的一群人潮中。
|
12天前
|
存储 人工智能 测试技术
【AI智能体】SuperAGI-开源AI Agent 管理平台
【4月更文挑战第9天】智能体管理平台SuperAGI简介及实践
|
13天前
|
人工智能 运维 自然语言处理
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
超70%代码问题,单纯靠基座大模型是解决不了的;未来3-5年,人类50%编程工作可以被替代,有些环节甚至完全自动化。蚂蚁集团代码大模型CodeFuse负责人李建国说道。当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。
31 0
|
13天前
|
人工智能 数据可视化 Windows
【AI Agent系列】【LangGraph】3. 一行代码让你的 LangGraph 结构可视化!
【AI Agent系列】【LangGraph】3. 一行代码让你的 LangGraph 结构可视化!
41 0
|
13天前
|
数据采集 人工智能 搜索推荐
【AI大模型应用开发】【综合实战】AI+搜索,手把手带你实现属于你的AI搜索引擎(附完整代码)
【AI大模型应用开发】【综合实战】AI+搜索,手把手带你实现属于你的AI搜索引擎(附完整代码)
13 0
|
14天前
|
人工智能 Python
【AI大模型应用开发】【LangChain系列】实战案例1:用LangChain写Python代码并执行来生成答案
【AI大模型应用开发】【LangChain系列】实战案例1:用LangChain写Python代码并执行来生成答案
22 0
|
14天前
|
存储 人工智能 API
【AI Agent系列】【MetaGPT多智能体学习】7. 剖析BabyAGI:原生多智能体案例一探究竟(附简化版可运行代码)
【AI Agent系列】【MetaGPT多智能体学习】7. 剖析BabyAGI:原生多智能体案例一探究竟(附简化版可运行代码)
166 0