送你6份最新开源代码!含NLP、ML、计算机视觉方向(附代码&论文)

简介: 自然语言处理 DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications@zhangjun 推荐Machine Reading Comprehension 大型中文阅读理解数据集,工作来自百度。


自然语言处理


DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications
@zhangjun 推荐
Machine Reading Comprehension

大型中文阅读理解数据集,工作来自百度。

论文链接
https://www.paperweekly.site/papers/1137
代码链接
https://github.com/baidu/DuReader


TransNets - Learning to Transform for Recommendation
@ccclyu 推荐
Transfer Learning

引入了迁移学习的隐含表示层来减少 test dataset 的稀疏性。

论文链接
https://www.paperweekly.site/papers/1181
代码链接
https://github.com/rosecatherinek/TransNets


计算机视觉


Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering
@xiaolu 推荐
Visual Question Answering

视觉问答任务(Viual Question Answering)是最近 2-3 年兴起的多模态任务。对于视觉问答任务,算法需要同时理解图片内容和语言信息,然后推理出正确的答案。目前常见的方法有多模态特征融合和以及视觉注意力机制。

已有的注意力机制主要有两类,一类是基于全图区域的注意力机制,一类是基于检测框区域的注意力机制,前者容易关注到物体的一部分,后者会缺少一些检测框。

本文第一次尝试将基于全图区域的与基于检测框区域的注意力机制融合在一个框架下,充分利用全图区域和检测框之间的互补信息;并且提出新的多模态特征融合方法,将问题特征、全图特征、检测框特征进行有效的融合。模型在 VQA 和 COCO-QA 两个主流数据集上实现了目前最好的结果。

论文链接
https://www.paperweekly.site/papers/1175
代码链接
https://github.com/lupantech/dual-mfa-vqa


Image Crowd Counting Using Convolutional Neural Network and Markov Random Field
@cornicione 推荐
People Counting

文章融合了 MRF 和 deep 网络,提出了一种统计静态图片中人数的方法。

论文链接
https://www.paperweekly.site/papers/1195
代码链接
https://github.com/hankong/crowd-counting


机器学习


Social Attention - Modeling Attention in Human Crowds
@zk5580752 推荐
Attention Model

本文是一篇基于 Social LSTM 的后续论文,Social LSTM 是李飞飞团队于 2016 年提出的行人路径预测方法。本文则在原文基础上改进了预测方式,不仅仅基于 RNN 模型,还引入了 Attention Model,使得预测更加精准和全面。

论文链接
https://www.paperweekly.site/papers/1115
代码链接
https://github.com/vvanirudh/social-lstm-tf


Breaking the Softmax Bottleneck: A High-Rank RNN Language Model
@paperweekly 推荐
RNN

本文尝试改进了语言模型在预测 next token 时用 softmax 遇到的计算瓶颈。

论文链接
https://www.paperweekly.site/papers/1112
代码链接
https://github.com/zihangdai/mos

原文发布时间为:2017-11-29
本文作者:刘卓然
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 编解码 资源调度
2024年3月的计算机视觉论文推荐
从去年开始,针对LLM的研究成为了大家关注的焦点。但是其实针对于计算机视觉的研究领域也在快速的发展。每周都有计算机视觉领域的创新研究,包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等。
37 0
|
1月前
|
机器学习/深度学习 监控 算法
开源计算机视觉库OpenCV详解
开源计算机视觉库OpenCV详解
33 3
|
8月前
|
机器学习/深度学习 算法 计算机视觉
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 14 日论文合集)
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 14 日论文合集)
|
8月前
|
机器学习/深度学习 算法 数据挖掘
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 11 日论文合集)
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 11 日论文合集)
|
8月前
|
机器学习/深度学习 自动驾驶 数据可视化
【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 11 日论文合集)
【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 11 日论文合集)
|
8月前
|
机器学习/深度学习 编解码 自然语言处理
【计算机视觉 | Transformer】arxiv 计算机视觉关于Transformer的学术速递(8 月 11 日论文合集)
【计算机视觉 | Transformer】arxiv 计算机视觉关于Transformer的学术速递(8 月 11 日论文合集)
|
8月前
|
机器学习/深度学习 传感器 人工智能
【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 10 日论文合集)(下)
【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 10 日论文合集)(下)
|
8月前
|
机器学习/深度学习 人工智能 算法
【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 10 日论文合集)(下)
【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 10 日论文合集)(下)
|
8月前
|
机器学习/深度学习 编解码 算法
【计算机视觉 | Transformer】arxiv 计算机视觉关于Transformer的学术速递(8 月 10 日论文合集)
【计算机视觉 | Transformer】arxiv 计算机视觉关于Transformer的学术速递(8 月 10 日论文合集)
|
8月前
|
机器学习/深度学习 传感器 算法
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 9 日论文合集)
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 9 日论文合集)

热门文章

最新文章