快来围观！阿里云行业视觉智能诊断技术-阿里云开发者社区

快来围观！阿里云行业视觉智能诊断技术

2018-05-04 3871

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文整理自2018深圳云栖大会阿里巴巴达摩院MIT高级算法专家黄英的演讲。本文从视觉诊断的简介、行业现状、技术实现流程和案例几个方面进行了介绍。通过本文的阅读可以对视觉智能诊断和阿里云的视觉智能诊断技术平台有一个初步的了解。

摘要：本文整理自2018深圳云栖大会阿里巴巴达摩院MIT高级算法专家黄英的演讲。本文从视觉诊断的简介、行业现状、技术实现流程和案例几个方面进行了介绍。通过本文的阅读可以对视觉智能诊断和阿里云的视觉智能诊断技术平台有一个初步的了解。

演讲嘉宾简介：三湘（黄英），阿里巴巴达摩院MIT高级算法专家。

数十款阿里云产品限时折扣中，赶紧点击这里，领劵开始云上实践吧！

本次直播视频精彩回顾，戳这里！

本次分享主要包括以下内容：

1、视觉识别介绍

2、行业视觉诊断分析

3、阿里云视觉诊断技术平台

4、技术实现流程

5、案例分享

一、视觉识别介绍

视觉识别是以图像或视频作为输入，利用深度学习的方式实现对图像或视频内容的理解。现在阿里云已有许多视觉识别的商业化产品。在行业视觉诊断及解决方案方面的研究，也正在进行中。

dc1baa761f235923e5f3a99324421aeb84f4bc67

下图所示的是人脸/图像识别API服务的简单介绍，详情大家可以在阿里云的官网上找到，这里不再赘述。

406bb38157f2309354240057f484d134ee958c47

下图展示了人脸识别的一些解决方案包括上海申通地铁人脸识别闸机和杭州云栖大会闸机。

33a40be4bce11d6a4b1976c5c1820261b749479d

那么，什么是行业视觉诊断呢？

下面展示了几个例子。左上第一张图展示了一张电池板，一般来说，电池板上可能存在各种各样的缺陷，图中所示的电池板上存在一条明显的裂纹。目前，这样的缺陷识别都是依靠人眼一张一张去看的，一天可能需要看上千张。而以右下的列车故障诊断为例，一天可能需要看十万张这样的图片。这也就对人的要求非常高。因此，我们希望通过深度学习和图像识别算法实现全自动的生产流程，从而节省人力。

4e4c2473fbad2db291ade60615b1473d49a2c20d

二、行业视觉诊断现状

下面介绍一下行业视觉诊断的现状。通过与大量客户的接触，我们发现了以下三种主要的类型。第一种，无摄像头拍照，全人工实现。第二种，有摄像头拍照，全人工观察。第三种，有摄像头，有简单分析功能。

由这些现状带来了一些问题，首先，人力成本高，一年可能需要上百万，上千万甚至上亿的人力成本。其次，人的情绪对质控影响大。同时，由于大量的人工参与使得生产流程无法实现全自动化。

因此，智能诊断的价值就得以体现了。第一，智能诊断可以大幅节省人力。第二，可以促进产线自动化。第三，算法不断迭代，精度可逐渐稳定可靠。

67a25316712197151a2ab7eb8eeddc9d3fc65688

三、阿里云视觉诊断技术平台

下图展示了阿里云的视觉诊断技术平台。

98569ff66c592340909bc27db90d9a9442d37074

下图展示了技术实现方案，包括七个模块。下面对这七个模块进行详细介绍。

c2402bc61103199b0e95fc7ea677404faa5e3a33

可行性分析。

传统行业中，并不是所有图像或案例都可以用图像识别的方式来实现的。在接触一个新的行业、方向或新的客户时，首先要进行可行性分析。判断当前问题，以现有的技术水平，包括现有的数据处理水平，摄像头拍摄水平，能否实现解决。

下图展示了可行的三个案例，这些诊断内容都是肉眼可分辨的，以现有的技术水平而言都是可以实现的。

01e4234606adfde7c01dcb32eafc047e3afd6a1e

但有一些诊断内容是肉眼分辨困难的。下图左，组件间有一根头发丝，这样的情形依靠人眼是很难发现的。即使交给图像识别算法，精度也不会太高，属于“存疑”的范畴。下图右展示的是拉链方块断裂的情况。这也是比较难以识别的一个案例，在人工识别的过程中，可能也需要辅以触摸的方式才能发现。这样的案例就属于需要特别分析才能确定是否可行。