【技术实现步骤摘要】
网络爬虫识别方法、系统、装置及计算机存储介质
[0001]本专利技术涉及网络安全
,具体涉及一种网络爬虫识别方法、系统、服务器及计算机存储介质。
技术介绍
[0002]网络爬虫,指按照一定的规则自动地抓取网站信息的程序或者脚本。网络爬虫在一定程度上会对网站造成负担,容易导致服务器崩溃,也容易导致数据泄露。目前,已有基于用户代理(User Agent,UA)匹配或者基于网际互连协议(Internet Protocol,IP)地址识别的网络爬虫识别方法。但是,基于UA匹配的方法可以通过伪造浏览器UA的方式破解,基于IP地址识别的方法可以通过更换IP地址的方式破解。因此,需要开发一种新的网络爬虫识别方法。
技术实现思路
[0003]本专利技术实施例公开了一种网络爬虫识别方法、系统、服务器及计算机存储介质,可以准确识别网络爬虫。
[0004]本专利技术实施例公开一种网络爬虫识别方法,所述方法包括:获取植入至客户端的前端系统回传的鼠标移动数据,所述鼠标移动数据包括若干个采样点分别对应的鼠标采样信息;按照预 ...
【技术保护点】
【技术特征摘要】
1.一种网络爬虫识别方法,其特征在于,所述方法包括:获取植入至客户端的前端系统回传的鼠标移动数据,所述鼠标移动数据包括若干个采样点分别对应的鼠标采样信息;按照预设的异常检测规则对所述若干个采样点分别对应的鼠标采样信息进行异常检测;在检测到所述鼠标移动数据存在异常时,将所述客户端识别为网络爬虫;拦截被识别为网络爬虫的客户端发送的访问请求。2.根据权利要求根据权利要求1所述的方法,其特征在于,所述异常检测规则包括:鼠标移动速度异常检测规则;所述鼠标采样信息包括鼠标位置及采样时刻;所述按照预设的异常检测规则对所述若干个采样点分别对应的鼠标采样信息进行异常检测,包括:根据两个连续的采样点分别对应的鼠标位置和分别对应的采样时刻,确定鼠标在每个采样区间中的移动速度;每两个连续的采样点构成一个采样区间;若鼠标在某一采样区间中的移动速度大于预设的速度阈值,则检测到所述鼠标移动数据存在异常;和/或,若根据鼠标在相邻的采样区间中的移动速度确定出鼠标移动速度异常,则检测到所述鼠标移动数据存在异常。3.根据权利要求2所述的方法,其特征在于,所述根据鼠标在相邻的采样区间中的移动速度确定出鼠标移动速度异常的情况包括以下一种或多种:鼠标在连续N个采样区间中的第一方向速度分量相同,N为大于等于2的正整数;鼠标在连续K个采样区间中的第二方向速度分量相同,K为大于等于2的正整数,所述第一方向和所述第二方向为相互垂直的方向;鼠标在第一个采样区间的移动速度大于等于鼠标在第二个采样区间的移动速度;鼠标在倒数第一个采样区间的移动速度大于等于鼠标在倒数第二个采样区间的移动速度。4.根据权利要求1所述的方法,其特征在于,所述异常检测规则包括:鼠标移动加速度异常检测规则;所述鼠标采样信息包括鼠标位置及采样时刻;所述按照预设的异常检测规则对所述若干个采样点分别对应的鼠标采样信息进行异常检测,包括:根据所述鼠标移动数据包括的若干个采样点分别对应的鼠标位置和分别对应的采样时刻确定鼠标在采样区间中的移动速度;每两个连续的采样点构成一个采样区间;根据鼠标分别在两个连续的采样区间中的移动速度确定每个区段对应的移动加速度;每两个连续的采样区间构成一个区段;若根据某一区段对应的移动加速度确定出鼠标移动加速度异常,则检测到所述鼠标移动数据存在异常;和/或,若存在两个连续的区段分别对应的移动加速度之间的变化值超过预设的移动加速度变化阈值,则检测到所述鼠标移动数据存在异常。5.根据权利要求4所述的方法,其特征在于,所述根据某一区段对应的移动加速度确定出鼠标移动加速度异常的情况包括以下一种或多种:存在某一区段对应的第一方向加速度分量超过预设的第一加速度阈值;
...
【专利技术属性】
技术研发人员:肖军,欧怀谷,王枭卿,张盼,
申请(专利权)人:云盾智慧安全科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。