独家 | 如何利用大规模无监督数据建立高水平特征？-阿里云开发者社区

独家 | 如何利用大规模无监督数据建立高水平特征？

2018-10-24 1864

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

46695fe26570a42a3df4d69e24581969f31d67d5

GIF来自：https://giphy.com/gifs/features-7BldZFcv2pof6

如何构建更厉害的特征检测器？我们可以通过无监督学习来做到这一点吗？

请注意，本文是一篇我自己留档用的回顾总结材料。

Paper来自此网站：

https://arxiv.org/pdf/1112.6209.pdf

摘要

这篇文章的作者们喜欢利用未标记数据制作特定的分类特征识别器。（例如，使用未标记的人脸图像制作人脸识别器。）为实现这一目标，作者在大型数据集上制作了一个9层的自动稀疏编码器。与普遍的认知相反，这可以在没有任何标签数据的情况下构建面部检测器，而且优于ImageNet数据的最新性能。（在2012年）。

介绍

这篇文章的目的是只依靠未标记图像构建一个特定的分类特征识别器，同时这也是神经科学的构想：“人类大脑中存在高度特定类的神经元”，通常被非正式地称为“母神经元”。在传统的计算机视觉中，大多数研究人员使用标记数据来获得这些识别器，然而大量数据时就比较困难。这个实验的成功说明，可以从未标记数据中学习高级特征和母神经元。大多数这些方法（如自动稀疏编码器）仅仅可以用于低级特征，如边缘或斑点（edges or blobs）。

作者假设深度学习花费如此多时间的原因是由于缺少高级特征，例如，图像被重新调整得更小，这样的降级会破坏高级特征的学习。作者没有缩小图像，也没有使用大量计算能力。经证明，有可能从未标记的数据中学习更高级别的特性。最后，使用学习过滤器，他们能够超越ImageNet数据集的最新技术性能。（2012年）。

数据集结构/算法

如上所述，来自1000万个Youtube视频随机选择的片段，他们通过使用OpenCV脸部识别得出结论，在1000万个采样片段中，面部出现的概率不到3％。

这里使用的算法的灵感来自不同类型的无监督学习算法的成功。（RBM，稀疏自动编码器等......）。作者的目的是学习更高水平的特征，而不仅仅是低水平。

d2728975559d2f283dcde85e84f991b29711c1fa

如上所述，作者使用的架构可以被认为是深度自动的稀疏编码器，带有一些转动（twist）同时它们也是局部感受器，池和局部响应归一化（使用了L2池）。堆叠（stacking）一系列统一模块，大脑所采用的架构是在选择性和允差层(tolerance layers)之间转换。有一件需要注意的重要的事是，虽然网络使用局部感受器，但是它们并不是卷积的（参数在图像中的不同位置不可共享），这在生物学上更合理。

学习和优化