CNN高效感受野的惊奇发现-阿里云开发者社区

CNN高效感受野的惊奇发现

2017-11-28 4156

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在这篇文章中，“高效感受野”（ERF）的理念和在卷积神经网络（CNN）上自然产生的视觉有着惊人的关系。

更多深度文章，请关注云计算频道：https://yq.aliyun.com/cloud

感受野（receptive field）是怎样一个东西呢，从CNN可视化的角度来讲，就是输出featuremap某个节点的响应对应的输入图像的区域就是感受野。

卷积神经网络（CNN）的高效感受野是影响特定网络单元的输入空间的区域。请注意，这个输入区域不仅可以是网络，也可以是从网络中的其他单位的输出区域。因此，相对于我们所考虑的输入和作为这部分输入区域的“接收器”而言，这个感受野是能够计算的。通常，当提到感受野这个术语时，它考虑到的是与网络输入（即网络的输入图像）相关的最终输出单元（即一个二进制分类任务的单个单元）。

在CNN上，我们很容易看到可以使用不同的方法增加感受野，如：堆积层，抽样、扩张等。在理论上，当你叠加更多层，你可以线性增加你的感受野，然而，在实践中，事情远比我们想的要难，就像罗，文杰等人在文章中向我们展示的一样。文章中，他们阐述了“高效感受野”概念；而概念背后的直觉是：并不是所有的感受野的像素都是有助于输出单元的响应。在进行前向传递时，我们可以看到正是因为中心感受野是多输出单元的计算，它们才可以使用许多不同的路径将其信息传送并且输出。

在下面的图中，我们可以看到左边的输入像素，之后我们有一个特征映射使用一个3×3卷积滤波器的输入像素，最后输出另一个3×3的过滤结果。左图像中像素内部的数字表示这个像素是卷积步骤的一部分（滤波器的每个滑动步骤）。正如我们所看到的，一些中央的像素将通过网络中的许多不同路径传播它们的信息，而边界上的像素则沿着一条路径传播。

8464c926ed92e1009da8723481e9166257924ddf