【技术实现步骤摘要】
用于识别爬虫的方法、装置、设备、介质和产品
[0001]本公开涉及计算机
,具体为信息安全
技术介绍
[0002]爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。网页版本的小程序中通常具有一些公开数据供用户浏览,而爬虫攻击会导致这些公开数据被恶意使用。
[0003]然而,对于网页版本的小程序而言,并未配置相应的反爬虫手段,从而导致网页版本的小程序中的公开数据存在着一定的安全隐患。
技术实现思路
[0004]本公开提供了一种用于识别爬虫的方法、装置、设备、介质和产品。
[0005]根据本公开的一方面,提供了一种用于识别爬虫的方法,包括:获取请求访问页面数据的请求信息;按照预设的爬虫识别顺序,从预设的反爬虫操作集合中确定针对请求信息的目标反爬虫操作;基于目标反爬虫操作,对请求信息进行爬虫识别,得到识别结果;响应于确定识别结果指示请求信息为爬虫,将识别结果确定为目标爬虫识别结果。
[0006]根据本公开的另一方面,提供了一种用于识别爬虫的装置,包括:信息获取单元,被配置成获取请求访问页面数据的请求信息;操作确定单元,被配置成按照预设的爬虫识别顺序,从预设的反爬虫操作集合中确定针对请求信息的目标反爬虫操作;爬虫识别单元,被配置成基于目标反爬虫操作,对请求信息进行爬虫识别,得到识别结果;结果确定单元,被配置成响应于确定识别结果指示请求信息为爬虫,将识别结果确定为目标爬虫识别结果。
[0007]根据本公开的另一方面,提供了一种电子设备,包括:一个或多个 ...
【技术保护点】
【技术特征摘要】
1.一种用于识别爬虫的方法,包括:获取请求访问页面数据的请求信息;按照预设的爬虫识别顺序,从预设的反爬虫操作集合中确定针对所述请求信息的目标反爬虫操作;基于所述目标反爬虫操作,对所述请求信息进行爬虫识别,得到识别结果;响应于确定所述识别结果指示所述请求信息为爬虫,将所述识别结果确定为目标爬虫识别结果。2.根据权利要求1所述的方法,还包括:响应于确定所述识别结果指示所述请求信息不为爬虫、且所述预设的反爬虫操作集合未遍历完成,按照所述预设的爬虫识别顺序,从所述预设的反爬虫操作集合中重新确定针对所述请求信息的所述目标反爬虫操作。3.根据权利要求1所述的方法,还包括:响应于确定所述识别结果指示所述请求信息不为爬虫、且所述预设的反爬虫操作集合遍历完成,将所述识别结果确定为所述目标爬虫识别结果。4.根据权利要求1所述的方法,其中,所述目标反爬虫操作至少包括令牌识别操作;以及所述基于所述目标反爬虫操作,对所述请求信息进行爬虫识别,得到识别结果,包括:确定所述请求信息对应的令牌索引信息;基于所述令牌索引信息,确定目标字符;响应于确定所述目标字符和预设的字符不匹配,确定所述识别结果为所述请求信息为爬虫。5.根据权利要求4所述的方法,还包括:确定所述请求信息对应的目标小程序标识和目标时间戳;响应于确定所述目标小程序标识和预设的小程序标识不匹配、或者所述目标时间戳已过期,确定所述识别结果为所述请求信息为爬虫。6.根据权利要求1所述的方法,还包括:确定所述请求信息对应的加密网络地址;确定所述加密网络地址中的第一加密索引和第二加密索引;基于所述第一加密索引和所述第二加密索引,对所述加密网络地址进行解密,得到解密网络地址;基于所述解密网络地址,进行网络访问。7.根据权利要求1所述的方法,其中,所述目标反爬虫操作至少包括数据分析识别操作;以及所述基于所述目标反爬虫操作,对所述请求信息进行爬虫识别,得到识别结果,包括:获取爬虫分析数据;基于所述爬虫分析数据,对所述请求信息进行爬虫识别,得到所述请求信息对应的所述识别结果。8.根据权利要求1所述的方法,其中,所述目标反爬虫操作至少包括签名同步识别操作;以及
所述基于所述目标反爬虫操作,对所述请求信息进行爬虫识别,得到识别结果,包括:确定所述请求信息中的签名信息;基于所述签名信息和预设的签名信息,得到所述识别结果。9.根据权利要求1所述的方法,还包括:基于所述识别结果,确定所述请求信息对应的爬虫分数信息;输出所述爬虫分数信息。10.根据权利要求1所述的方法,其中,所述请求信息用于请求访问网页小程序的页面数据。11.根据权利要求1所述的方法,其中,所述预设的反爬虫操作集合中的反爬虫操作至少包括以下一项:端特征识别操作、令牌识别操作、人机特征识别操作、数据分析识别操作和签名识别操作。12.一种用于识别爬虫的装置,包括:信息获取单元,被配置成获取请求访问页面数据的请求信息;操作确定单元,被配置成按照预设的爬虫识别顺序,从预设的反爬虫操作集合中确定针对所述请求信息的目标反爬虫操作;爬虫识别单元,被配置成基于所述目标反爬虫操作,对所述请求信息进行爬虫识别,得到识别结果;结果确定单元,被配置成响应于确定所述识别结果指示所述请求信息为...
【专利技术属性】
技术研发人员:何永玄,薛志方,谭瑞兴,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。