【技术实现步骤摘要】
网络爬虫检测方法、网络爬虫检测装置及终端设备
本申请属于计算机
,尤其涉及网络爬虫检测方法、网络爬虫检测装置及终端设备。
技术介绍
网络爬虫,是一种按照一定的规则,自动地抓取网络信息的程序或者脚本。有些不法份子利用网络爬虫进行网络恶意的爬虫操作,例如:利用网络爬虫盗取用户的账户/个人信息,或者,利用网络爬虫在短时间内多次登录某个账号以占用网络资源进行刷单等活动。恶意的爬虫操作对网站的正常运行造成了极大的影响。现有的网络爬虫检测方法,主要有:通过监测超文本传输协议中请求头信息的异常来进行爬虫检测、通过验证码排除机器操作、或通过监测IP访问次数来进行爬虫检测等。随着爬虫的升级,现在的爬虫已经能够模仿真人行为、并进行浏览器自动化操作,对于这种情况,现有的网络爬虫检测方法的检测准确度大大降低。
技术实现思路
本申请实施例提供了一种网络爬虫检测方法、网络爬虫检测装置及终端设备,可以解决现有的网络爬虫检测方法的检测准确度较低的问题。第一方面,本申请实施例提供了一种网络爬虫检测方法,包括:当监测到目标网页的第一登录事件时,获取所述第一登录事件中的第一登录信息,其中,所述第一登录信息包括:所述目标网页中的预设区域被触发时的触发时刻集;判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果;根据所述判断结果确定所述第一登录事件的第一爬虫检测结果。在第一方面的一种可能的实现方式中,所述根据所述判断结果确定所述第一登录事件的第一爬虫检测结果,包括:r>若所述判断结果为所述第一登录信息中的所述触发时刻集满足预设条件,则将所述第一爬虫检测结果确定为所述第一登录事件为爬虫事件;若所述判断结果为所述第一登录信息中的所述触发时刻集不满足预设条件,则将所述第一爬虫检测结果确定为所述第一登录事件为非爬虫事件。在第一方面的一种可能的实现方式中,所述预设区域中包括多个预设位置,所述触发时刻集中包括每个所述预设位置被触发时的触发时刻;所述判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果,包括:判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果。在第一方面的一种可能的实现方式中,所述第一登录信息还包括用户账号;当所述用户账号为新建账号时,所述判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果,包括:计算所述触发时刻集中每两个相邻的触发时刻之间的间隔时间;根据计算出的所述间隔时间判断所述触发时刻集中的所述触发时刻是否满足所述预设条件,得到判断结果。在第一方面的一种可能的实现方式中,所述根据计算出的所述间隔时间判断所述触发时刻集中的所述触发时刻是否满足所述预设条件,得到判断结果,包括:从所述触发时刻集中选取目标时刻集,所述目标时刻集中包括连续的N个触发时刻,且ti~i+1=ti+1~i+2,其中,N为大于2的自然数,ti~i+1为所述目标时刻集中第i个触发时刻与第i+1个触发时刻之间的间隔时间,ti+1~i+2为所述目标时刻集中第i+1个触发时刻与第i+2个触发时刻之间的间隔时间,0<i<N-1,i+2≤N;将所述N除以所述触发时刻集中触发时刻的总个数,得到个数比值;若所述个数比值大于预设比值,则将所述判断结果确定为所述触发时刻集中的触发时刻满足所述预设条件。在第一方面的一种可能的实现方式中,所述第一登录信息还包括用户账号;当所述用户账号为非新建账号时,所述判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果,包括:获取所述用户账号对应的预设登录模型;判断所述触发时刻集中的所述触发时刻是否与所述预设登录模型匹配;若所述触发时刻集中的所述触发时刻与所述预设登录模型匹配,则将所述判断结果确定为所述触发时刻集中的触发时刻满足所述预设条件;若所述触发时刻集中的所述触发时刻与所述预设登录模型不匹配,则将所述判断结果确定为所述触发时刻集中的触发时刻不满足所述预设条件。在第一方面的一种可能的实现方式中,所述第一登录信息还包括用户账号;在根据所述判断结果确定所述第一登录事件的第一爬虫检测结果之后,所述方法还包括:若所述第一登录事件为爬虫事件,则在所述第一登录事件后的预设时间内,继续监测所述目标网页中所述用户账号的第二登录事件和所述第二登录事件的累积发生次数;当所述第二登录事件的累积发生次数大于预设次数时,根据监测到的各个所述第二登录事件确定第二爬虫检测结果。在第一方面的一种可能的实现方式中,所述根据监测到的各个所述第二登录事件确定第二爬虫检测结果,包括:分别获取每个所述第二登录事件中的第二登录信息;确定每组所述第二登录信息对各自对应的所述第二登录事件的第三爬虫检测结果;统计所述第二登录事件中目标事件的个数,其中,所述目标事件表示所述第三爬虫检测的结果为爬虫事件的第二登录事件;根据所述目标事件确定所述第二爬虫检测结果。在第一方面的一种可能的实现方式中,每个所述第二登录信息中还包括登录类型;所述根据所述目标事件确定所述第二爬虫检测结果,包括:确定每个所述目标事件各自对应的登录类型;分别计算每种所述登录类型对应的百分比,其中,所述登录类型对应的百分比为:属于所述登录类型的所述目标事件的个数与所述累积发生次数的百分比;若存在大于预设百分比的所述百分比,则将所述第二爬虫检测结果确定为爬虫事件。第二方面,本申请实施例提供了一种网络爬虫检测装置,包括:获取单元,用于当监测到目标网页的第一登录事件时,获取所述第一登录事件中的第一登录信息,其中,所述第一登录信息包括:所述目标网页中的预设区域被触发时的触发时刻集;判断单元,用于判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果;第一爬虫检测单元,用于根据所述判断结果确定所述第一登录事件的第一爬虫检测结果。第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的网络爬虫检测方法。第四方面,本申请实施例提供了一种计算机可读存储介质,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的网络爬虫检测方法。第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的网络爬虫检测方法。可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。本申请实施例与现有技术相比存在的有益效果是:本申请实施例中当监测到目标网页的第一登录事件时,获取所述第一登录事本文档来自技高网...
【技术保护点】
1.一种网络爬虫检测方法,其特征在于,包括:/n当监测到目标网页的第一登录事件时,获取所述第一登录事件中的第一登录信息,其中,所述第一登录信息包括:所述目标网页中的预设区域被触发时的触发时刻集;/n判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果;/n根据所述判断结果确定所述第一登录事件的第一爬虫检测结果。/n
【技术特征摘要】
1.一种网络爬虫检测方法,其特征在于,包括:
当监测到目标网页的第一登录事件时,获取所述第一登录事件中的第一登录信息,其中,所述第一登录信息包括:所述目标网页中的预设区域被触发时的触发时刻集;
判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果;
根据所述判断结果确定所述第一登录事件的第一爬虫检测结果。
2.如权利要求1所述的网络爬虫检测方法,其特征在于,所述预设区域中包括多个预设位置,所述触发时刻集中包括每个所述预设位置被触发时的触发时刻;
所述判断所述第一登录信息中的所述触发时刻集是否满足预设条件,得到判断结果,包括:
判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果。
3.如权利要求2所述的网络爬虫检测方法,其特征在于,所述第一登录信息还包括用户账号;
当所述用户账号为新建账号时,所述判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果,包括:
计算所述触发时刻集中每两个相邻的触发时刻之间的间隔时间;
根据计算出的所述间隔时间判断所述触发时刻集中的所述触发时刻是否满足所述预设条件,得到判断结果。
4.如权利要求3所述的网络爬虫检测方法,其特征在于,所述根据计算出的所述间隔时间判断所述触发时刻集中的所述触发时刻是否满足所述预设条件,得到判断结果,包括:
从所述触发时刻集中选取目标时刻集,所述目标时刻集中包括连续的N个触发时刻,且ti~i+1=ti+1~i+2,其中,N为大于2的自然数,ti~i+1为所述目标时刻集中第i个触发时刻与第i+1个触发时刻之间的间隔时间,ti+1~i+2为所述目标时刻集中第i+1个触发时刻与第i+2个触发时刻之间的间隔时间,0<i<N-1,i+2≤N;
将所述N除以所述触发时刻集中触发时刻的总个数,得到个数比值;
若所述个数比值大于预设比值,则将所述判断结果确定为所述触发时刻集中的触发时刻满足所述预设条件。
5.如权利要求2所述的网络爬虫检测方法,其特征在于,所述第一登录信息还包括用户账号;
当所述用户账号为非新建账号时,所述判断所述触发时刻集中的所述触发时刻是否满足预设条件,得到判断结果,包括:
获取所述用户账号对应的预设登录模型;
判断所述触发时刻集...
【专利技术属性】
技术研发人员:李飞,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。