网站验证码的生成原理、难度控制,及python实现

简介: 图片验证码已经广泛的使用在各种反爬虫的场景中,验证码的的生成验证过程对于开发者来说是零成本的,对于用户体验来说可能稍差、但是对于爬虫来说是致命的和高成本的。下面将介绍使用python实现网站验证码的产生及验证的全过程,然我们对验证码的生成有所理解,同时对于机器识别在验证码利于的作用有个认识。

图片验证码已经广泛的使用在各种反爬虫的场景中,验证码的的生成验证过程对于开发者来说是零成本的,对于用户体验来说可能稍差、但是对于爬虫来说是致命的和高成本的。


下面将介绍使用python实现网站验证码的产生及验证的全过程,然我们对验证码的生成有所理解,同时对于机器识别在验证码利于的作用有个认识。


其过程是是用户请求验证后,生成验证码图片并后台session保存验证的字符串,当用户提交验证信息后,取出后台session中的字符集对比,相同的则验证通过。

def get(self):
    from PIL import Image, ImageDraw, ImageFont
    import random
    # 定义变量,用于画面的背景色、宽、高
    bgcolor = (random.randrange(20100), random.randrange(20100), 255)
    width = 100
    height = 25
    # 创建画面对象
    im = Image.new('RGB', (width, height), bgcolor)
    # 创建画笔对象
    draw = ImageDraw.Draw(im)
    # 调用画笔的point()函数绘制噪点
    for i in range(0100):
        xy = (random.randrange(0, width), random.randrange(0, height))
        fill = (random.randrange(0255), 255, random.randrange(0255))
        draw.point(xy, fill=fill)
    # 定义验证码的备选值
    str1 = 'ABCD123EFGHIJK456LMNOPQRS789TUVWXYZ0'
    # 随机选取4个值作为验证码
    rand_str = ''
    for i in range(04):
        rand_str += str1[random.randrange(0, len(str1))]
    # 构造字体对象
    font = ImageFont.truetype('static/fonts/STLITI.TTF'23)
    # 构造字体颜色
    fontcolor = (255, random.randrange(0255), random.randrange(0255))
    # 绘制4个字
    draw.text((52), rand_str[0], font=font, fill=fontcolor)
    draw.text((252), rand_str[1], font=font, fill=fontcolor)
    draw.text((502), rand_str[2], font=font, fill=fontcolor)
    draw.text((752), rand_str[3], font=font, fill=fontcolor)
    del draw
    session["verifycode"] = rand_str
    buf = io.BytesIO()
    im.save(buf, 'png')
    self.set_header('Content-Type''image/jpg')
    self.write(buf.getvalue())


session["verifycode"] = rand_str是在网站后台的session中保存正确的验证值,在post提交登陆后进行对比。


buf = io.BytesIO()、im.save(buf, 'png')是创建bytes类型的内存对象用于保存生成的图片数据。


self.set_header('Content-type','image/jpg')

self.write(buf.getvalue()),构件response相应对象返回前端。


效果如下:

2019-03-22-17_16_17.png

2019-03-22-17_16_17.png

2019-03-22-17_16_17.png

效果还是不错,生成验证码的复杂度和字符集相关、和字体相关、和噪点相关,也可以生成表达式类型的验证码,同时因为采取随机生成,几百万张图片中也不会存在相同的图片,可见验证码对于反爬虫而言任然是最简单、无成本的反爬虫措施。


------------------------------


ID:Python之战


|作|者|公(zhong)号:python之战 


专注Python,专注于网络爬虫、RPA的学习-践行-总结


喜欢研究技术瓶颈并分享,欢迎围观,共同学习。


独学而无友,则孤陋而寡闻!


---------------------------

相关文章
|
1月前
|
缓存 算法 测试技术
Python中的装饰器:原理与实践
【2月更文挑战第29天】 在Python编程领域,装饰器是一种强大的工具,它允许我们在不修改原始函数代码的情况下,增加或修改函数的行为。本文将深入探讨Python装饰器的概念、实现原理以及实际应用,帮助读者掌握这一技术并在实际项目中灵活运用。
|
1月前
|
数据采集 NoSQL Redis
Python爬虫-代理池原理和搭建
代理池架构,代理池的实现
42 0
|
1月前
|
Python
请解释 Python 中的生成器的工作原理。
【2月更文挑战第20天】【2月更文挑战第58篇】请解释 Python 中的生成器的工作原理。
|
1月前
|
Python 容器
解释一下Python中弱引用的工作原理。
解释一下Python中弱引用的工作原理。
36 2
|
1月前
|
数据采集 机器学习/深度学习 安全
Python爬虫之极验滑动验证码的识别
了解极验滑动验证码、特点、识别思路、初始化、模拟点击、识别缺口、模拟拖动。
60 0
|
14天前
|
机器学习/深度学习 人工智能 算法
|
23天前
|
前端开发 测试技术 数据库
【python】为什么使用python Django开发网站这么火?
【python】为什么使用python Django开发网站这么火?
|
1月前
|
算法 Python
深入理解Python虚拟机:super超级魔法的背后原理
深入理解Python虚拟机:super超级魔法的背后原理
|
1月前
|
Python
Python中的装饰器:原理与应用
【2月更文挑战第27天】 装饰器在Python中是一种强大而灵活的工具,它允许我们在不修改原始函数代码的情况下,增加函数的功能。本文将深入探讨装饰器的原理,并通过实例展示如何在Python中使用装饰器。
9 2
|
1月前
|
缓存 Python
Python中的装饰器:原理与应用
【2月更文挑战第26天】 装饰器在Python中是一种强大且灵活的工具,它允许我们在不修改函数代码的情况下增强函数的功能。本文将深入探讨装饰器的原理,并通过实例展示如何在实际项目中应用装饰器。
12 4