RPA之眼:AI-OCR,Fax-OCR概述

简介: 文丨马磊OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。OCR是英文“Optical Character Recognition/Reader”的简称,光学字符识别。从名字我们不难看出,OCR就是读取手写和印刷文字,并把读取的信息转换成可以在电脑的Excel,World等软件上使用的文字信息处理技术。

文丨马磊

OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的简称,光学字符识别。从名字我们不难看出,OCR就是读取手写和印刷文字,并把读取的信息转换成可以在电脑的Excel,World等软件上使用的文字信息处理技术。

 当前的信息化社会,大量的文件被电子化,纸质的文件越来越少。但事实上依然存在很多不得不使用纸质文件的情况,比如说街头调查问卷。OCR技术的诞生可以取代人工读取纸质文件的工作,并将纸质文件的信息电子化。

RPA之眼:AI-OCR,Fax-OCR概述

RPA和OCR的协作

RPA目前活跃在以金融机关代表的企业中,但是这些企业的纸质媒体和打印数据等非电子化的数据仅仅依靠RPA来进行业务处理的话还是相当困难的。这就为RPA技术与OCR技术的协同合作提供了契机。

在只有RPA的情况下,需要员工手动把纸质文件的信息录入到Excel,Word等电子文档中,然后运行RPA机器人读取电子文档中的信息实现业务的自动化处理。

而RPA + OCR的情况下,只需实现扫描好纸质文件,OCR会自动读取扫描文件,将图片信息读取并写入Excel等文档中,然后RPA机器人运行,进行业务处理。这个过程完全替代了人工手动录入,极大地节约了人力成本。

RPA之眼:AI-OCR,Fax-OCR概述

近年来, OCR引起了广泛关注,但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后,相信一定会解决这个课题。

Fax-OCR是什么?

RPA之眼:AI-OCR,Fax-OCR概述

Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司,很多都是网上接单了,但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。尤其是日本的小型公司依然采用这种老旧的接收订单的方式。如果把传真资料自动读入系统将减少大量人工录入的费时操作,同时人工失误也会大幅减少。

OCR的注意点

OCR技术确实可以自动实现数据的文本化,也是一项非常有效的效率改善的技术手段,但是现在的阶段OCR并非无所不能。

1、无法对应多份文件。

一般来说,OCR 需要读取文本内容以及文件内容的模板,并定义好抽出的对象数据的位置。但是,由于客户的文件模板并不统一,文件模板和数据坐标位置也不尽相同,这种情况应对起来就比较困难了。所以对于一些既有模板以外的文件要格外注意。

2、文字数据抽出后,必须进行人工确认。

虽然AI-OCR可以通过机器学习技术去识别手写文字,但是很多不清楚,或者写法不鲜明的文字还是很难做到完美识别。因此,数据抽出完毕后还是要通过人去确认数据的正确性。

原文地址:https://www.uibot.com.cn/news-7-1307.html

相关实践学习
基于阿里云短信服务的防机器人验证
基于阿里云相关产品和服务实现一个手机验证码登录的功能,防止机器人批量注册,服务端采用阿里云ECS服务器,程序语言选用JAVA,服务器软件选用Tomcat,应用服务采用阿里云短信服务,
目录
相关文章
|
3月前
|
人工智能 API 数据安全/隐私保护
Azure AI - Azure人脸识别任务概述与技术实战
Azure AI - Azure人脸识别任务概述与技术实战
149 1
|
传感器 人工智能 算法
AI概述:阿里文娱智能算法的新应用
阿里巴巴文娱-智能算法的新应用方向
AI概述:阿里文娱智能算法的新应用
|
1月前
|
人工智能 前端开发 PyTorch
AI加速引擎PAI-TorchAcc:整体介绍与性能概述
PAI-TorchAcc(Torch Accelerator)是阿里云人工智能平台PAI开发的Pytorch上的大模型训练加速框架。PAI-TorchAcc提供了一套基于Pytorch的简洁、易用的接口,无需进行模型转换就可以无缝地接入HuggingFace上的模型,并用多种分布式策略进行训练加速。本文详细介绍PAI-TorchAcc的产品能力与性能。
|
2月前
|
人工智能 文字识别 Java
AI工具【OCR 01】Java可使用的OCR工具Tess4J使用举例(身份证信息识别核心代码及信息提取方法分享)
【2月更文挑战第1天】Lept4J和Tess4J都是基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,本次介绍Tess4J
97 0
|
9月前
|
机器学习/深度学习 存储 人工智能
|
9月前
|
人工智能 智能设计 达摩院
|
4月前
|
人工智能 文字识别
阿里云的 口算判题 AI能力(文字识别OCR)接口 返回数据的时候 没有正确答案只有 对错吗?
阿里云的 口算判题 AI能力(文字识别OCR)接口 返回数据的时候 没有正确答案只有 对错吗?
172 0
|
8月前
|
人工智能 自然语言处理 机器人
AIGC如何借AI Agent落地?TARS-RPA-Agent破解RPA与LLM融合难题
AIGC如何借AI Agent落地?融合LLM的RPA进化到了什么程度?来看看实在智能刚发布的TARS-RPA-Agent。
315 1
|
9月前
|
机器学习/深度学习 人工智能 达摩院
视觉AI技术体系及趋势概述
视觉技术是 AI 里应用最广,任务最多,技术方面非常复杂,发展非常快的一个AI的主要子方向。
|
10月前
|
机器学习/深度学习 传感器 存储
边缘AI概述
边缘AI概述
238 0

热门文章

最新文章