禅与奶罩识别艺术(上)

简介:

在昨天的卷积:如何成为一个很厉害的神经网络 - 知乎专栏中,热心网友提出了这样的问题:

禅与奶罩识别艺术(上)

该文在卷积神经网络的构成上讲解的比较直观,但是没有深入地探讨数学原理。本文将详细介绍卷积滤波器的具体机理,当然不要担心数学问题,只要能熟练掌握百以内加减法和九九乘法表就可以。

之前在微博上关于神经网络的探讨中,话题走向奇怪地走向了奶子(计划通り),并且王司图也做出了召唤柏木由纪的承诺,所以这次就以柏木由纪的照片为例,讲解图像处理的基本法。

禅与奶罩识别艺术(上)禅与奶罩识别艺术(上)

  01. 暗中观察

现在我们谈的“人工智能”都是弱人工智能,更确切地说,还是辅助计算工具。我们不能因为有了神经网络,就像卡兹一样停止思考。

所以不管借助神经网络解决任何问题,第一步也是最关键的一步,就是了解你的问题本身。反映在具体的应用上,就是要摸清业务背后的逻辑关系,而不是把数据往黑盒里一扔,开始准备炼丹。如果一遍摸不清,那就再摸一遍。

禅与奶罩识别艺术(上)

现在我们要做一个物体识别的程序,上图中可供识别的物体并不多,唯一凉鞋、一裤头、一奶罩而已,那就奶罩吧。作为一个入门程序,现在那么早就处理彩色图片,是不理智、不合适的。所以我们要进行一些简化,从皮相中剥离出骨相,把最核心的数学原理公然露出,放置Play。 

经过“灰度->阈值”两步,彩图变成了黑白图。接下来我们要从计算机视觉的角度去司图,所以眼前的黑不是黑,你说的白也不是白,所见诸相非相,只是像素值,0 or 1。

禅与奶罩识别艺术(上)

  02. 见微知著

暂时抛开图片背景, 经过观察可知,要从人的身体上识别出奶罩和裤头,本质上是从白花花中寻找黑乎乎,其实就是从0中找到1。

那我们是不是需要整个奶罩呢?非也,只需要探测出奶罩的边缘就可以了,这就如同棋道,金角银边烂肚皮,只要围住了眼,就占住了气,从而控住了势。

卷积滤波器是一个比图片尺寸小的矩阵,这里设为3x3。我们把图片缩放至像素级(猜猜这是哪个部位),这里每一个小方格背后就是0或1了。卷积核在输入图像上来回滚动、摩擦,那么基本上会遇到三种区域(橙框):

  • 全白(肉体)

  • 全黑(奶罩)

  • 黑白(肉体和奶罩的边缘)

和下图的对应关系应该也很明显。 

禅与奶罩识别艺术(上)

这时候,我们的卷积核就像情趣羽毛,扫遍每一个角落, 撩拨你的动感地带。

禅与奶罩识别艺术(上)

  03. 掐指一算

在上文的图表中,我们已经见识到了多种滤波器和对应的滤镜效果,比如边缘检测、锐化、均值模糊、高斯模糊。 

禅与奶罩识别艺术(上)

来看第三种边缘检测卷积核,其矩阵为:

禅与奶罩识别艺术(上)

再取包含边缘的5x5区域,对应矩阵:

禅与奶罩识别艺术(上)

现在这个3x3矩阵(滤波器)要在5x5矩阵上摸一遍,当然摸不是为了爽,而是为计算一个值。计算方式如下图,黄色方格与红色数字即是卷积滤波器,而计算的方式就是重叠的对应元素相乘,再相加。(注意:这不是真正的「矩阵乘法」)

禅与奶罩识别艺术(上)

禅与奶罩识别艺术(上)

因为这里的image在竖直方向上是不变的,所以只需要让filter沿着最上端滑一圈就行了,总共有三次计算:

1. 

禅与奶罩识别艺术(上)

2.

禅与奶罩识别艺术(上)

3.

禅与奶罩识别艺术(上)

最后生成的完整特征映射(Feature Map)将是:

禅与奶罩识别艺术(上)

特征映射的单元位置对应的是卷积核中心(8)的位置,特征映射的取值有三种:

  • -3:探测到奶罩边缘,且卷积核位于奶罩外侧

  • 3:探测到奶罩边缘,且卷积核位于奶罩内侧

  • 0: 没有探测到边缘特征

现在你应该已经明白了,为什么滤波器可以提取图片的特征。




====================================分割线================================

本文作者:AI研习社
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
1月前
|
人工智能 机器人 人机交互
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
【4月更文挑战第3天】哥伦比亚大学研究人员开发了一款名为Emo的机器人,能观察并模仿人类面部表情,实现更自然的人机交互。Emo配备26个面部执行器和高分辨率摄像头,通过“自我建模”学习模仿表情,并能预测人类表情变化。这一创新有望改善人机理解和响应情绪的能力,应用于教育、医疗等领域,但也引发了关于情感依赖和伦理问题的讨论。
32 4
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
|
3月前
|
物联网
ChilloutMix几个模型的区别——专注东方面孔人像生成
ChilloutMix几个模型的区别——专注东方面孔人像生成
189 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
让梦境绘入现实--AIGC人像绘画
在光怪陆离的梦境中,我们可以摆脱客观事实的约束,对自己的外在形象进行天马行空的畅想,有人化身威风凛凛的将军驰骋疆场,又有人化身亭亭玉立的公主正襟危坐,然而这些翩若惊鸿婉若游龙的美好瞬间却总是会随着一声闹钟的响声化为泡影。难道梦境中的自己总是不能被带回到现实之中吗?AIGC技术的快速发展使得这一点成为可能。
376 1
|
算法 JavaScript 前端开发
日拱算法:什么是“情感丰富的文字”?
本篇带来算法题:“情感丰富的文字”
|
机器学习/深度学习 存储 人工智能
『程序员对联』抽取你的专属新春对联
新春这个文章说实话,经历了蛮多的,一开始其实我是想用`three.js`做个老虎的,但是呢,失败了。废了好几个小时才搞出来两个`虎爪`,害,都怪我`three.js`的能力连基本上手都算不上,没咋玩明白,下次一定给大家做点好康的~
|
算法 计算机视觉
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
|
机器学习/深度学习 人工智能 自然语言处理
响铃:当AI翻译能识别“语境”,我们的“地球村”梦想就不远了
响铃:当AI翻译能识别“语境”,我们的“地球村”梦想就不远了
184 0
响铃:当AI翻译能识别“语境”,我们的“地球村”梦想就不远了
|
安全 定位技术 计算机视觉
睫毛长度精准复刻!扫描面部数据,用特殊技术和3D打印制作人脸,“画皮”直呼内行
睫毛长度精准复刻!扫描面部数据,用特殊技术和3D打印制作人脸,“画皮”直呼内行
204 0
|
机器学习/深度学习 人工智能 自然语言处理
给 AI 讲故事,如何教它脑补画面?
视觉想象力是人与生俱来的, AI 能否拥有类似的能力呢?比如:给出一段故事情节,如何让机器展开它的想象力,“脑补”出画面呢?看看阿里AI Labs 感知实验室的同学们如何解决这个问题。
850 0
给 AI 讲故事,如何教它脑补画面?