System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息处理,具体的说,是涉及一种网站滑块验证码破解方法。
技术介绍
1、在大数据时代,信息的获取是一项非常重要的工作,由于互联网中的数据是海量的,故而诞生了专门用于信息采集的爬虫技术。网络爬虫,又被称为网络机器人,可以按照制定的规则自动化地浏览网络中的信息,从而根据使用者的需求采集使用者感兴趣的信息。
2、在信息采集领域,为了应对日益增多的网络爬虫,网站往往会使用验证码进行人机识别,以增加自身的数据获取难度。目前,滑块验证码是效果较好的反爬虫验证码类型之一。由于滑块验证码操作简单流畅,可以极大提升安全验证环节的用户体验。滑块验证码对机器验证的判断,不只是完成前端的拼图,还有是在后端。不是说你滑动到正确位置就是验证通过,而是根据特征识别来区分是否为真用户,滑到正确位置只是一个必要条件。比如通过记录真人用户的滑动平均速度,用户鼠标点击情况,以及滑动后的匹配程度来识别是否是真实用户行为等。滑块验证码是如何实现的呢?首先在服务端随机生成滑块和带有滑块阴影的背景图片,然后将其随机的滑块位置坐标保存。前端实现互动的交互,将滑块把图拼上,获取用户的相关行为值。然后服务端进行相应值的校验。其背后的逻辑是使用机器学习中的深度学习,根据鼠标滑动轨迹,坐标位置,计算拖动速度,重试次数等多维度来判断是否人为操作。一般情况下,滑动验证码的工作原理通常包括以下步骤:生成验证码:服务器端随机生成一组验证数据,如一张带有缺口的图片或拼图,以及匹配的正确位置信息。展现给用户:在网页上呈现这个带有缺口的滑块,旁边有一个完整的图案片段。用户需
3、包括滑块(滑动)验证码在内的多种校验或验证方法虽然可以较完美地解决网站信息的安全问题或者减少非必要访问的问题,但是其副作用是直接破坏了基于互联网信息共享所能获得有效数据或者有价值信息的提供。绕开校验爬取信息这一行为的价值,主要取决于具体的应用场景和目的。在合法合规的前提下,这种技术手段在某些领域确实有价值:数据分析与研究:例如,对于市场调研、社会科学研究等,通过爬虫获取大量网络公开数据(如电商网站商品信息、社交媒体公开内容),即使存在一些反爬机制,但通过合理的技术手段绕过校验,可以高效、全面地获取所需数据,从而为决策分析提供详实的数据支撑。企业竞争情报:在商业环境中,可能需要获取竞品的价格、新品发布、用户评价等信息,这些数据往往分布在不同的网页中且有防爬措施,合法合规地绕过校验爬取,有助于企业快速掌握市场动态,制定相应策略。网络安全监测:网络安全公司或个人研究者可能会利用爬虫检测网站漏洞,模拟黑客攻击以提高系统的安全性。这时绕过校验是为了验证系统防护的有效性。因此,基于合法合规或者有着合法用途的情形下,对数据抓取行为是值得肯定和被支持的。
4、在申请号为cn 202310268422.6的中国专利提供了公开了一种旋转验证码检测方法、设备及存储介质,所述旋转验证码检测方法包括:获取多个网站的旋转验证码对应的原始图片信息,基于所述原始图片信息获得各个所述网站对应的验证码模型;获取目标网站的目标旋转验证码对应的目标图片,基于所述目标图片以及各个所述验证码模型预测所述目标旋转验证码对应的倾斜角度;获取所述目标旋转验证码对应的滑块总距离,基于所述倾斜角度以及所述滑块总距离进行验证,确定是否验证通过。本专利技术通过模拟网络爬虫进行主动破解,自动化地对网站中的旋转验证码进行检测,可以高效且准确地衡量该旋转验证码的防御能力,确定该旋转验证码是否容易被网络爬虫绕开,并且不消耗人力成本。但是其仅仅适应的是基于旋转检测的场合下,其并不能适用于更常见和大规模使用中的滑块(滑动)检测的场合或场景。
技术实现思路
1、针对上述现有技术中的不足,本专利技术提供一种滑块移动采用拟人优化的网站滑块验证码破解方法。
2、本专利技术所采取的技术方案是:
3、一种网站滑块验证码破解方法,包括如下步骤:
4、步骤1,抓取开始;
5、步骤2,访问目标网页;
6、步骤3,判定是否有登录拦截,有登录拦截跳转步骤4,无登录拦截跳转步骤11;
7、步骤4,点击打开登录框;
8、步骤5,填充账户和密码;
9、步骤6,点击登录;
10、步骤7,获取弹框图片和滑块图片;
11、步骤8,调取图片匹配,获取滑块需要移动的距离;
12、步骤9,拟人滑动滑块;
13、步骤10,判别滑动验证是否通过,验证通过跳转步骤11,验证无法通过,跳转步骤6;
14、步骤11,获取目标网页数据;
15、步骤12,结束。
16、优选的,变量定义:最大速度(topspeed,像素/步),距离(distance,像素);
17、所述拟人滑动滑块包括:加速阶段、均速阶段和减速阶段;
18、最高速度范围topspeed,[35,50];
19、加速阶段的加速度范围为(0,topspeed);
20、减速阶段的加速度范围为(0,topspeed);
21、加速阶段:速度从0加速至最大速度的过程;
22、第1步:加速度a1取值为0至最大速度除以2结果之间的随机数;
23、第2步:加速度a2为:最大速度/1步–加速度a1;
24、速度单位为px/步,除以1步,则表示加速度,单位就统一了。
25、经过2步加速过程后,达到最大速度,其中加速度a2>=加速度a1,表示含义为,缓慢加速至最大速度的过程;
26、匀速阶段:保持最大速度向右移动,匀速移动步数=距离-最大速度x2/最大速度;
27、减速阶段:速度从最大速度衰减至0的过程;
28、第1步:加速度b2取值为0至最大速度除以2结果之间的随机数;
29、第2步:加速度b1为:最大速度/1步-加速度b2;
30、经过2步减速过程后,最终速度为0,其中加速度b2>=加速度b1,表示含义为,缓慢减速至0的过程;
31、总移动步数=4+匀速本文档来自技高网...
【技术保护点】
1.一种网站滑块验证码破解方法,其特征在于包括如下步骤:
2.根据权利要求1所述网站滑块验证码破解方法,其特征在于:
3.一种权利要求1或2所述网站滑块验证码破解方法的网站滑块验证码破解系统,其特征在于包括:
4.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求2或3中任一项所述的网站滑块验证码破解方法的步骤。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求2或3中任一项所述的网站滑块验证码破解方法的步骤。
【技术特征摘要】
1.一种网站滑块验证码破解方法,其特征在于包括如下步骤:
2.根据权利要求1所述网站滑块验证码破解方法,其特征在于:
3.一种权利要求1或2所述网站滑块验证码破解方法的网站滑块验证码破解系统,其特征在于包括:
4.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算...
【专利技术属性】
技术研发人员:吴雨佳,付学,李主贺,于静微,耿露露,徐文德,贾兴荣,常坤辉,李建业,贾卫华,
申请(专利权)人:武汉之道在线教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。