【技术实现步骤摘要】
一种防爬虫方法及装置、计算机可读存储介质、电子设备
[0001]本公开涉及计算机
,特别涉及一种防爬虫方法、防爬虫装置、计算机可读存储介质及电子设备。
技术介绍
[0002]随着计算机技术的发展,出现了依靠用户的点击量进行收费的业务系统,在这些业务系统中,存在机器刷量爬取业务系统的页面数据模拟用户点击相应的链接,造成点击量虚假的情况。
[0003]现有技术中,业务系统的前端和后端约定一个固定的字段作为伪装数据的标识,后端将伪装数据打上伪装标识,前端利用该伪装标识来判断获取到的页面数据是否为伪装数据,根据判断结果进而控制将该页面数据显示或隐藏。并通过前端和后端定期更新作为伪装数据的标识字段,以及定期更新前端埋点方式。但是,作弊团队可以通过优化爬虫脚本,将该类页面数据剔除后再进行模拟点击,或对数据链接进行模拟点击,识别伪装数据标识,即可逃避现有技术中的反爬虫策略。并且,现有技术中的防爬虫技术定期更改字段和前端埋点方式,前端和后端均需要配合修改并上线,灵活性差,策略变更成本高。
[0004]鉴于此,本领域亟需 ...
【技术保护点】
【技术特征摘要】
1.一种防爬虫方法,其特征在于,包括:后端根据策略数据对页面信息进行封装,以得到封装页面信息,并将所述封装页面信息发送至前端,其中,所述策略数据包括埋点字段、混淆算法、预设数据段;所述前端根据所述预设数据段在所述封装页面信息中确定伪装数据,以及根据所述埋点字段和所述混淆算法配置埋点值;所述前端根据所述埋点值添加所述伪装数据的目标伪装样式,并根据所述目标伪装样式对所述伪装数据进行渲染。2.根据权利要求1所述防爬虫方法,其特征在于,所述页面信息包括多条页面数据,所述页面数据包括真实数据和所述伪装数据;后端根据策略数据对页面信息进行封装,以得到封装页面信息,包括:所述后端获取所述页面信息,以及所述埋点字段、所述混淆算法、所述预设数据段;通过第一随机函数和所述预设数据段生成与所述真实数据和所述伪装数据对应的目标数据;根据所述目标数据和所述策略数据对所述页面信息进行封装,以生成所述封装页面信息。3.根据权利要求2所述的防爬虫方法,其特征在于,通过第一随机函数和所述预设数据段生成与所述真实数据和所述伪装数据对应的目标数据,包括:若所述页面数据为所述真实数据,则通过所述第一随机函数生成所述预设数据段范围之外的第一数据,并将所述第一数据配置为与所述真实数据对应的目标数据;若所述页面数据为所述伪装数据,则通过所述第一随机函数生成所述预设数据段范围之内的第二数据,并将所述第二数据配置为与所述伪装数据对应的目标数据。4.根据权利要求3所述的防爬虫方法,其特征在于,前端根据所述预设数据段在所述封装页面信息中确定伪装数据,包括:所述前端获取所述封装页面信息中的所述目标数据,根据所述目标数据和所述预设数据段在所述封装页面信息中确定所述伪装数据。5.根据权利要求4所述的防爬虫方法,其特征在于,根据所述目标数据和所述预设数据段在所述封装页面信息中确定所述伪装数据,包括:判断所述目标数据是否在所述预设数据段范围内:若是,则判定所述目标数据对应的所述页面数据为所述伪装数据;若否,则判定所述目标数据对应的所述页面数据为所述真实数据。6.根据权利要求1所述的防爬虫方法,其特征在于,所述前端根据所述埋点字段和所述混淆算法配置埋点值,包括:所述前端利用所述混淆算法对所述埋点字段进行处理,以生成所述埋点值。7.根据权利要求1所述的防爬虫方法,其特征在于,所述前端根据所述埋点值添加所述伪装数据的目标伪装样式,包括:所述前端将所述埋点值插入所述伪装数据对应的区块中,并控制所述区块添加所述目标伪装样式,其中,所述目标伪装样式是根据第二随机函数在伪装样式数据库所获得的。8.根据权利要求1所述的防爬虫方法,其特征在于,所述方法还包括:策略中心采用第三随机函数对所述埋点字段、所述混淆算法、所述预设数据段进行更
新。9.一种防爬虫方法,其特征在于,包括:根据策略数据对页面信息进...
【专利技术属性】
技术研发人员:李瑞芳,董英姿,王浩,胡景贺,颜伟鹏,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。