Python做简单的验证码识别(ocr)

简介:

1、环境:

系统:XP

Python版本:2.7.5

2、所需文件:

wKioL1Lc21LBEt2GAABXOaBfAgs848.jpg

(1)、pillow地址:https://pypi.python.org/pypi/Pillow/

(2)、tesseract地址:https://github.com/tesseract-ocr

(3)、pytesser地址:https://code.google.com/p/pytesser/

3、安装

(1)、pillow和tesseract直接双击安装,没什么值得注意的。

(2)、pytesser无需安装,解压到某个文件夹,让后添加环境变量(PYTHONPATH)。比如walker的PYTHONPATH环境变量值是 C:\Python27\Lib\site-packages\pytesser_v0.0.1

注意:将pytesser_v0.0.1目录下pytesser.py第6行的import Image改为from PIL import Image

4、测试

wKiom1Lc4KmikVlFAABl75YI0G4983.jpg

其中图片:

wKioL1Lc4M6iHsRoAAANN43JkXI931.jpg 3.jpg

wKiom1Lc4PHivm7uAAANEmofN3Q454.jpg 13.jpg

5、可以看到,识别并不是很精确。可以将得到的字符串转为大写,取出可能的字符,比如上面的验证码可能的字符集为 大写字母和数字,将两个字符串的大写字母和数字取出来是可以得到正确验证码的。

6、如果发现彩色图片不能识别,可以先将其转换为黑白图片再识别。(PIL模式介绍

1
2
3
4
5
from  PIL  import  Image
 
image  =  Image. open (r 'D:\tmp\in.jpg' )
image  =  image.convert( "1" )     #转换成黑白图片  
image.save(r 'D:\tmp\out.jpg' )


推荐阅读:

1、验证码图片字符识别两种python实现方法

2、tesseract-ocr tips

3、Python图像处理库PIL的基本概念介绍。(pillow.readthedocs.iopillow-zh-cn.readthedocs.io

4、Python图像处理库PIL中图像格式转换(一)


*** walker * 2014-01-20 ***

本文转自walker snapshot博客51CTO博客,原文链接http://blog.51cto.com/walkerqt/1353180如需转载请自行联系原作者


RQSLT

相关文章
|
4月前
|
数据采集 文字识别 PHP
Python(四十二)百度智能云OCR文字识别的坑
这篇的内容其实跟python的关系不是很大,是在使用python做文字识别的时候遇到的一个坑,这里大概记录一下,希望大家在使用百度智能云的OCR文字识别的时候,能够快速的解决这个问题。 业务需求大概是这个样子的,学生在使用仪器做完实验之后,仪器会将实验结果,打印在一张小票上。正常,学生需要将小票上边的数据,逐一输入到系统中,但是,客户觉得这个操作太麻烦了,想用文字识别将小票上边的数据识别出来,自动填入,学生只需要检查一遍识别的是否正确即可。 需求很简单,我这里的后端是使用PHP做的,这也不耽误我使用python做文字识别。最开始的python文字识别的尝试,我这里就不做赘述了,具体,请
45 0
|
11月前
|
机器学习/深度学习 文字识别 Python
【OCR学习笔记】5、OCR传统特征提取方法(文末附python源码实现下载)(二)
【OCR学习笔记】5、OCR传统特征提取方法(文末附python源码实现下载)(二)
239 0
|
11月前
|
文字识别 算法 Python
【OCR学习笔记】5、OCR传统特征提取方法(文末附python源码实现下载)(一)
【OCR学习笔记】5、OCR传统特征提取方法(文末附python源码实现下载)(一)
145 0
|
11月前
|
机器学习/深度学习 编解码 文字识别
【OCR学习笔记】3、OCR图像预处理之Python原生实现算法(中)
【OCR学习笔记】3、OCR图像预处理之Python原生实现算法(中)
321 0
python-简单验证码识别-保监会网站
python-简单验证码识别-保监会网站
51 0
|
文字识别 异构计算 Python
【Python案例】OCR提取图片中的文字
【Python案例】OCR提取图片中的文字
【Python案例】OCR提取图片中的文字
|
Python
关于Python验证码识别的一些解决方式
不劳而获的成功,谁都想要,问题是哪里有?
|
文字识别 Python
OCR接口全文识别高精版本地图片以及URL调用Python示例
官方完整项目似乎缺少了alibabacloud_darabonba_stream,直接导入项目,这边提示缺少依赖,后来手动导入后成功了
759 0
OCR接口全文识别高精版本地图片以及URL调用Python示例
|
Python
Python黑科技系列13-登录验证码识别技术
世界软件业巨头、微软公司创办人比尔·盖茨说:“人生是不公平的,习惯去接受它吧。请记住,永远都不要抱怨!” 每个人都是独一无二的,在这世界上你也真的很好,很优秀,因为你是唯一的。
Python黑科技系列13-登录验证码识别技术
|
文字识别 Python
python调用文字识别OCR,轻松搞定验证码
python调用文字识别OCR,轻松搞定验证码
python调用文字识别OCR,轻松搞定验证码

热门文章

最新文章