RPA之眼：AI-OCR，Fax-OCR概述-阿里云开发者社区

RPA之眼：AI-OCR，Fax-OCR概述

2019-11-07 1169

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 文丨马磊OCR是一种与RPA机器人协作的一项重要技术，相当于机器人的眼睛。OCR是英文“Optical Character Recognition/Reader”的简称，光学字符识别。从名字我们不难看出，OCR就是读取手写和印刷文字，并把读取的信息转换成可以在电脑的Excel，World等软件上使用的文字信息处理技术。

文丨马磊

OCR是一种与RPA机器人协作的一项重要技术，相当于机器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的简称，光学字符识别。从名字我们不难看出，OCR就是读取手写和印刷文字，并把读取的信息转换成可以在电脑的Excel，World等软件上使用的文字信息处理技术。

当前的信息化社会，大量的文件被电子化，纸质的文件越来越少。但事实上依然存在很多不得不使用纸质文件的情况，比如说街头调查问卷。OCR技术的诞生可以取代人工读取纸质文件的工作，并将纸质文件的信息电子化。

RPA之眼：AI-OCR，Fax-OCR概述

RPA和OCR的协作

RPA目前活跃在以金融机关代表的企业中，但是这些企业的纸质媒体和打印数据等非电子化的数据仅仅依靠RPA来进行业务处理的话还是相当困难的。这就为RPA技术与OCR技术的协同合作提供了契机。

在只有RPA的情况下，需要员工手动把纸质文件的信息录入到Excel，Word等电子文档中，然后运行RPA机器人读取电子文档中的信息实现业务的自动化处理。

而RPA + OCR的情况下，只需实现扫描好纸质文件，OCR会自动读取扫描文件，将图片信息读取并写入Excel等文档中，然后RPA机器人运行，进行业务处理。这个过程完全替代了人工手动录入，极大地节约了人力成本。

RPA之眼：AI-OCR，Fax-OCR概述

近年来， OCR引起了广泛关注，但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后，相信一定会解决这个课题。

Fax-OCR是什么？

RPA之眼：AI-OCR，Fax-OCR概述

Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司，很多都是网上接单了，但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。尤其是日本的小型公司依然采用这种老旧的接收订单的方式。如果把传真资料自动读入系统将减少大量人工录入的费时操作，同时人工失误也会大幅减少。

OCR的注意点

OCR技术确实可以自动实现数据的文本化，也是一项非常有效的效率改善的技术手段，但是现在的阶段OCR并非无所不能。

1、无法对应多份文件。

一般来说，OCR 需要读取文本内容以及文件内容的模板，并定义好抽出的对象数据的位置。但是，由于客户的文件模板并不统一，文件模板和数据坐标位置也不尽相同，这种情况应对起来就比较困难了。所以对于一些既有模板以外的文件要格外注意。

2、文字数据抽出后，必须进行人工确认。

虽然AI-OCR可以通过机器学习技术去识别手写文字，但是很多不清楚，或者写法不鲜明的文字还是很难做到完美识别。因此，数据抽出完毕后还是要通过人去确认数据的正确性。

原文地址：https://www.uibot.com.cn/news-7-1307.html

RPA之眼：AI-OCR，Fax-OCR概述

RPA和OCR的协作

Fax-OCR是什么？

OCR的注意点

热门文章

最新文章

相关课程

相关电子书

相关实验场景