旋转验证码检测方法、设备及存储介质技术

技术编号:37988030 阅读:12 留言:0更新日期:2023-06-30 10:02
本发明专利技术公开了一种旋转验证码检测方法、设备及存储介质,所述旋转验证码检测方法包括:获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型;获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度;获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过。本发明专利技术通过模拟网络爬虫进行主动破解,自动化地对网站中的旋转验证码进行检测,可以高效且准确地衡量该旋转验证码的防御能力,确定该旋转验证码是否容易被网络爬虫绕开,并且不消耗人力成本。并且不消耗人力成本。并且不消耗人力成本。

【技术实现步骤摘要】
旋转验证码检测方法、设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种旋转验证码检测方法、设备及存储介质。

技术介绍

[0002]在大数据时代,信息的获取是一项非常重要的工作,由于互联网中的数据是海量的,故而诞生了专门用于信息采集的爬虫技术。网络爬虫,又被称为网络机器人,可以按照制定的规则自动化地浏览网络中的信息,从而根据使用者的需求采集使用者感兴趣的信息。
[0003]在信息采集领域,为了应对日益增多的网络爬虫,网站往往会使用验证码进行人机识别,以增加自身的数据获取难度,目前,旋转验证码、乱序拼图类验证码都是效果较好的反爬虫验证码类型。
[0004]针对旋转验证码,目前的破解手段包括:收集图片素材,再利用程序模拟旋转生成模型库,而后使用相似度算法检索该模型库,获取目标旋转角度,从而模拟用户旋转图片至目标角度或直接合成请求数据包进行验证,最终验证通过获得凭证。为了对抗上述破解手段,一般采用人工更换、新增图片素材的防御策略,然而,这种方式过于被动,无法较准确地衡量旋转验证码对于网络爬虫的防御能力,并且效率较低,所消耗的人力成本较高。

技术实现思路

[0005]本专利技术的主要目的在于提供一种旋转验证码检测方法、设备及存储介质,旨在实现自动化地检测旋转验证码是否容易被网络爬虫绕开,衡量其对于网络爬虫的防御能力。
[0006]为实现上述目的,本专利技术提供一种旋转验证码检测方法,所述旋转验证码检测方法包括以下步骤:
[0007]获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型;
[0008]获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度;
[0009]获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过。
[0010]优选地,所述基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过的步骤包括:
[0011]基于所述倾斜角度以及所述滑块总距离进行计算,获得滑动距离;
[0012]基于所述滑动距离控制滑块滑动,并确定是否验证通过。
[0013]优选地,所述基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度的步骤包括:
[0014]获取所述目标图片对应的图片参数;
[0015]基于所述目标图片以及所述图片参数在各个所述验证码模型中确定目标验证码模型;
[0016]基于所述目标验证码模型对所述倾斜角度进行预测。
[0017]优选地,所述基于所述目标验证码模型对所述倾斜角度进行预测的步骤包括:
[0018]对预设配置文件进行解析,获得所述目标验证码模型对应的加载路径以及图片预处理方式;
[0019]基于所述图片预处理方式处理所述目标图片,获得待输入图片;
[0020]基于所述加载路径加载所述目标验证码模型;
[0021]将所述待输入图片输入所述目标验证码模型,对所述倾斜角度进行预测。
[0022]优选地,所述获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度的步骤之前,还包括:
[0023]预先配置各个所述验证码模型对应的加载路径以及图片预处理方式,获得所述预设配置文件。
[0024]优选地,所述获取目标网站的目标旋转验证码对应的目标图片的步骤包括:
[0025]基于Selenium工具在无头模式下打开所述目标网站;
[0026]基于Requests框架下载所述目标图片。
[0027]优选地,所述原始图片信息包括原始图片以及旋转角度,所述获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型的步骤包括:
[0028]基于各个所述网站的接口获得所述原始图片以及所述旋转角度;
[0029]基于所述原始图片以及所述旋转角度进行图片预处理,获得各个所述网站对应的训练集以及测试集;
[0030]分别基于各个所述网站对应的训练集以及测试集进行模型训练,构建各个所述验证码模型。
[0031]优选地,所述获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过的步骤之后,还包括:
[0032]若验证通过,则重新生成所述目标网站的目标旋转验证码,并返回执行所述获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度的步骤。
[0033]此外,为实现上述目的,本专利技术还提供一种旋转验证码检测设备,所述旋转验证码检测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的旋转验证码检测程序,所述旋转验证码检测程序被所述处理器执行时实现如上所述的旋转验证码检测方法的步骤。
[0034]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述可读存储介质上存储有旋转验证码检测程序,所述旋转验证码检测程序被处理器执行时实现如上所述的旋转验证码检测方法的步骤。
[0035]本专利技术提出的旋转验证码检测方法,通过获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型;获取目标网站的
目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度;获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过。通过模拟网络爬虫进行主动破解,自动化地对网站中的旋转验证码进行检测,可以高效且准确地衡量该旋转验证码的防御能力,确定该旋转验证码是否容易被网络爬虫绕开,并且不消耗人力成本。
附图说明
[0036]图1是本专利技术实施例方案涉及的硬件运行环境中旋转验证码检测设备的结构示意图;
[0037]图2为本专利技术旋转验证码检测方法第一实施例的流程示意图;
[0038]图3为本专利技术一实施例旋转验证码检测系统的模块示意图。
[0039]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0040]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0041]如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境中旋转验证码检测设备的结构示意图。
[0042]本专利技术实施例终端可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。
[0043]如图1所示,该旋转验证码检测设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种旋转验证码检测方法,其特征在于,所述旋转验证码检测方法包括以下步骤:获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型;获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度;获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过。2.如权利要求1所述的旋转验证码检测方法,其特征在于,所述基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过的步骤包括:基于所述倾斜角度以及所述滑块总距离进行计算,获得滑动距离;基于所述滑动距离控制滑块滑动,并确定是否验证通过。3.如权利要求1所述的旋转验证码检测方法,其特征在于,所述基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度的步骤包括:获取所述目标图片对应的图片参数;基于所述目标图片以及所述图片参数在各个所述验证码模型中确定目标验证码模型;基于所述目标验证码模型对所述倾斜角度进行预测。4.如权利要求3所述的旋转验证码检测方法,其特征在于,所述基于所述目标验证码模型对所述倾斜角度进行预测的步骤包括:对预设配置文件进行解析,获得所述目标验证码模型对应的加载路径以及图片预处理方式;基于所述图片预处理方式处理所述目标图片,获得待输入图片;基于所述加载路径加载所述目标验证码模型;将所述待输入图片输入所述目标验证码模型,对所述倾斜角度进行预测。5.如权利要求4所述的旋转验证码检测方法,其特征在于,所述获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度的步骤之前,还包括:预先配置各个所述验证码模型对应的加载路...

【专利技术属性】
技术研发人员:白汶洪
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1