备案控制台

开发者社区

开发者社区雷锋网文章正文

禅与奶罩识别艺术（上）

2017-08-02 1249

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

在昨天的卷积：如何成为一个很厉害的神经网络 - 知乎专栏中，热心网友提出了这样的问题：

禅与奶罩识别艺术（上）

该文在卷积神经网络的构成上讲解的比较直观，但是没有深入地探讨数学原理。本文将详细介绍卷积滤波器的具体机理，当然不要担心数学问题，只要能熟练掌握百以内加减法和九九乘法表就可以。

之前在微博上关于神经网络的探讨中，话题走向奇怪地走向了奶子（计划通り），并且王司图也做出了召唤柏木由纪的承诺，所以这次就以柏木由纪的照片为例，讲解图像处理的基本法。

禅与奶罩识别艺术（上）

01. 暗中观察

现在我们谈的“人工智能”都是弱人工智能，更确切地说，还是辅助计算工具。我们不能因为有了神经网络，就像卡兹一样停止思考。

所以不管借助神经网络解决任何问题，第一步也是最关键的一步，就是了解你的问题本身。反映在具体的应用上，就是要摸清业务背后的逻辑关系，而不是把数据往黑盒里一扔，开始准备炼丹。如果一遍摸不清，那就再摸一遍。

禅与奶罩识别艺术（上）

现在我们要做一个物体识别的程序，上图中可供识别的物体并不多，唯一凉鞋、一裤头、一奶罩而已，那就奶罩吧。作为一个入门程序，现在那么早就处理彩色图片，是不理智、不合适的。所以我们要进行一些简化，从皮相中剥离出骨相，把最核心的数学原理公然露出，放置Play。

经过“灰度->阈值”两步，彩图变成了黑白图。接下来我们要从计算机视觉的角度去司图，所以眼前的黑不是黑，你说的白也不是白，所见诸相非相，只是像素值，0 or 1。

禅与奶罩识别艺术（上）

02. 见微知著

暂时抛开图片背景，经过观察可知，要从人的身体上识别出奶罩和裤头，本质上是从白花花中寻找黑乎乎，其实就是从0中找到1。

那我们是不是需要整个奶罩呢？非也，只需要探测出奶罩的边缘就可以了，这就如同棋道，金角银边烂肚皮，只要围住了眼，就占住了气，从而控住了势。

卷积滤波器是一个比图片尺寸小的矩阵，这里设为3x3。我们把图片缩放至像素级（猜猜这是哪个部位），这里每一个小方格背后就是0或1了。卷积核在输入图像上来回滚动、摩擦，那么基本上会遇到三种区域（橙框）：

全白（肉体）
全黑（奶罩）
黑白（肉体和奶罩的边缘）

和下图的对应关系应该也很明显。

禅与奶罩识别艺术（上）

这时候，我们的卷积核就像情趣羽毛，扫遍每一个角落，撩拨你的动感地带。

禅与奶罩识别艺术（上）

03. 掐指一算

在上文的图表中，我们已经见识到了多种滤波器和对应的滤镜效果，比如边缘检测、锐化、均值模糊、高斯模糊。

禅与奶罩识别艺术（上）

来看第三种边缘检测卷积核，其矩阵为：

禅与奶罩识别艺术（上）

再取包含边缘的5x5区域，对应矩阵：

禅与奶罩识别艺术（上）

现在这个3x3矩阵（滤波器）要在5x5矩阵上摸一遍，当然摸不是为了爽，而是为计算一个值。计算方式如下图，黄色方格与红色数字即是卷积滤波器，而计算的方式就是重叠的对应元素相乘，再相加。（注意：这不是真正的「矩阵乘法」）

禅与奶罩识别艺术（上）

禅与奶罩识别艺术（上）

因为这里的image在竖直方向上是不变的，所以只需要让filter沿着最上端滑一圈就行了，总共有三次计算：

1.

禅与奶罩识别艺术（上）

2.

禅与奶罩识别艺术（上）

3.

禅与奶罩识别艺术（上）

最后生成的完整特征映射(Feature Map)将是：

禅与奶罩识别艺术（上）

特征映射的单元位置对应的是卷积核中心(8)的位置，特征映射的取值有三种：

-3：探测到奶罩边缘，且卷积核位于奶罩外侧
3：探测到奶罩边缘，且卷积核位于奶罩内侧
0: 没有探测到边缘特征

现在你应该已经明白了，为什么滤波器可以提取图片的特征。

====================================分割线================================

本文作者：AI研习社

本文转自雷锋网禁止二次转载，原文链接

文章标签：

人工智能

机器学习/深度学习

计算机视觉

玄学酱

目录

相关文章

楠竹11

|

1月前

|

人工智能机器人人机交互

哥大华人开发人脸机器人，照镜子自主模仿人类表情超逼真

【4月更文挑战第3天】哥伦比亚大学研究人员开发了一款名为Emo的机器人，能观察并模仿人类面部表情，实现更自然的人机交互。Emo配备26个面部执行器和高分辨率摄像头，通过“自我建模”学习模仿表情，并能预测人类表情变化。这一创新有望改善人机理解和响应情绪的能力，应用于教育、医疗等领域，但也引发了关于情感依赖和伦理问题的讨论。

楠竹11

32 4 6

哥大华人开发人脸机器人，照镜子自主模仿人类表情超逼真

红目香薰

|

3月前

|

物联网

ChilloutMix几个模型的区别——专注东方面孔人像生成

ChilloutMix几个模型的区别——专注东方面孔人像生成

红目香薰

189 0 0

y22d5jdczpqg6

|

8月前

|

机器学习/深度学习人工智能自然语言处理

让梦境绘入现实--AIGC人像绘画

在光怪陆离的梦境中，我们可以摆脱客观事实的约束，对自己的外在形象进行天马行空的畅想，有人化身威风凛凛的将军驰骋疆场，又有人化身亭亭玉立的公主正襟危坐，然而这些翩若惊鸿婉若游龙的美好瞬间却总是会随着一声闹钟的响声化为泡影。难道梦境中的自己总是不能被带回到现实之中吗？AIGC技术的快速发展使得这一点成为可能。

y22d5jdczpqg6

376 1 1

1730617107579634

|

算法 JavaScript 前端开发

日拱算法：什么是“情感丰富的文字”？

本篇带来算法题：“情感丰富的文字”

1730617107579634

66 0 0

是乃德也是Ned

|

机器学习/深度学习存储人工智能

『程序员对联』抽取你的专属新春对联

新春这个文章说实话，经历了蛮多的，一开始其实我是想用`three.js`做个老虎的，但是呢，失败了。废了好几个小时才搞出来两个`虎爪`，害，都怪我`three.js`的能力连基本上手都算不上，没咋玩明白，下次一定给大家做点好康的~

是乃德也是Ned

191 0 0

一个处女座的程序猿

|

算法计算机视觉

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

一个处女座的程序猿

152 0 0

CV：利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)

-开发达人-

|

机器学习/深度学习人工智能自然语言处理

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

-开发达人-

184 0 0

响铃：当AI翻译能识别“语境”，我们的“地球村”梦想就不远了

不脱发的程序猿

二次元界福音：MakeGirlsMoe创建动漫人物

二次元界福音：MakeGirlsMoe创建动漫人物

不脱发的程序猿

846 0 0

二次元界福音：MakeGirlsMoe创建动漫人物

码农小达人

|

安全定位技术计算机视觉

睫毛长度精准复刻！扫描面部数据，用特殊技术和3D打印制作人脸，“画皮”直呼内行

睫毛长度精准复刻！扫描面部数据，用特殊技术和3D打印制作人脸，“画皮”直呼内行

码农小达人

204 0 0

xxrjl

|

机器学习/深度学习人工智能自然语言处理

给 AI 讲故事，如何教它脑补画面？

视觉想象力是人与生俱来的， AI 能否拥有类似的能力呢？比如：给出一段故事情节，如何让机器展开它的想象力，“脑补”出画面呢？看看阿里AI Labs 感知实验室的同学们如何解决这个问题。

xxrjl

850 0 0

给 AI 讲故事，如何教它脑补画面？

雷锋网

热门文章

最新文章

哪种词向量模型更胜一筹？Word2Vec，WordRank or FastText?

《CMOS集成电路后端设计与实战》——3.3　标准单元设计流程

[Erlang 0044] Erlang Shell History

FOSCommentBundle功能包：指南索引页

安全是医疗服务提供商的第一要务，或本应如此

网络新高速：T比特网络技术实现成功测试

统计数据显示 Linux 还未能对 Windows 造成威胁

16位天才的思维创造让数据科学更简单

SpringBoot启动流程

CentOS下MongoDB的升级

【AI 场景】如何使用 AI 向客户推荐个性化产品？

【AI 场景】人工智能在自然语言理解方面的挑战和解决方案

透视Redis集群：心跳检测如何维护高可用性

【AI 场景】如何开发用于自动驾驶的人工智能系统？

阿里云服务器租用价格表，2024年5月最新报价整理

深度学习在图像识别中的应用及挑战

深入理解操作系统的内存管理

【AI 场景】设计一个 AI 系统来识别和分类图像中的对象

网络安全与信息安全：防御前线的技术与意识

【AI 场景】如何应用 AI 来优化供应链管理

相关课程

更多

跨越N次元一键变身AI漫画人

人机对话技术浅析

声纹识别技术

AI情绪鼓励师模型微调实操教学

【新人赛】工业蒸汽量预测建模算法代码开源分享合集

【科技少年】AI领航员探索教程（赛前训练）

相关电子书

更多

语义技术在儿童机器人上的突破

语义技术在儿童及其人上的突破

未来商业艺术的新形式-新媒体艺术

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

使用PAI-DSW x EasyPhoto快速完成AIGC人物写真生成

基于阿里云DeepGPU实例，用AI画唯美国风少女

一键创建和部署高分电影推荐语音技能

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考