【技术实现步骤摘要】
一种检测伪周期性访问行为的方法及装置
本专利技术涉及计算机网络安全
,尤其涉及一种检测伪周期性访问行为的方法及装置。
技术介绍
计算机网络技术的不断发展给人们的工作和生活带来了巨大的便利。然而,计算机网络中也普遍存在着非法访问、获取和破坏他人网络服务和/或网络数据的行为。例如,用户可以使用爬虫程序来爬取网页内容(例如,以自动获取网站的各种资源文件);不法用户可以通过人工操作计算机或者利用自动化攻击软件对服务器、个人电脑等进行网络攻击(例如,以获取网站的注册用户名、注册用户的其它个人信息、消耗或破坏网络资源)等。以检测爬虫程序为例,现有技术多基于爬虫的设计模式,采用以下方法进行检测:方法一:基于自建的爬虫IP数据库进行爬虫检测。将待检测IP与已知爬虫IP数据库中的IP地址逐一匹配,如果存在与之匹配的IP地址,则将来自该IP地址的访问判定为爬虫。在自建爬虫IP数据库时,尽管知名搜索引擎的IP地址较易获取,然而,用户真正希望检测的恶意爬虫的IP却难以获取,且这些恶意爬虫的IP经常发生变化,因此,这种方 ...
【技术保护点】
1.一种检测伪周期性访问行为的方法,其特征在于,包括:/n获取用户在指定时间段内的访问路径序列、以及与所述访问路径序列对应的访问时间戳序列;/n计算不同访问路径延迟序列与所述访问路径序列之间的各个第一延迟自相关系数,组成第一延迟自相关系数序列,其中,所述不同访问路径延迟序列对应于不同的序列延迟;/n基于所述时间戳序列计算时间差序列,计算不同时间差延迟序列与所述时间差序列之间的各个第二延迟自相关系数,组成第二延迟自相关系数序列,其中,所述不同时间差延迟序列对应于不同的序列延迟;/n当所述第一延迟自相关系数序列的周期大于或等于所述第二延迟自相关系数序列的周期时,确定所述用户具有 ...
【技术特征摘要】
1.一种检测伪周期性访问行为的方法,其特征在于,包括:
获取用户在指定时间段内的访问路径序列、以及与所述访问路径序列对应的访问时间戳序列;
计算不同访问路径延迟序列与所述访问路径序列之间的各个第一延迟自相关系数,组成第一延迟自相关系数序列,其中,所述不同访问路径延迟序列对应于不同的序列延迟;
基于所述时间戳序列计算时间差序列,计算不同时间差延迟序列与所述时间差序列之间的各个第二延迟自相关系数,组成第二延迟自相关系数序列,其中,所述不同时间差延迟序列对应于不同的序列延迟;
当所述第一延迟自相关系数序列的周期大于或等于所述第二延迟自相关系数序列的周期时,确定所述用户具有伪周期性访问行为。
2.如权利要求1所述的检测伪周期性访问行为的方法,其特征在于,基于访问日志,按照时间顺序获取用户在所述指定时间段内的所述访问路径序列和所述访问时间戳序列,
其中,访问路径是去除了“http://”协议字符串、“https://”协议字符串、“?”字符、以及“?”字符之后的字符的URL。
3.如权利要求1或2所述的检测伪周期性访问行为的方法,其特征在于,所述计算所述不同访问路径延迟序列与所述访问路径序列之间的各个第一延迟自相关系数的步骤包括:
以“/”字符为分隔符,将每个访问路径划分为由多个有序字符串组成的有序字符串序列;
计算每个访问路径延迟序列与所述访问路径序列的对应访问路径序列索引位置处的两个有序字符串序列之间的访问路径序列相似度的平均值;
将所述访问路径序列相似度的平均值作为所述第一延迟自相关系数,
其中,通过以下步骤计算所述两个有序字符串序列之间的访问路径序列相似度:
计算所述两个有序字符串序列之间的对应有序字符串序列索引位置处的字符串之间的Jaccard字符相似度的平均值。
4.如权利要求1或2所述的检测伪周期性访问行为的方法,其特征在于,计算所述不同时间差延迟序列与所述时间差序列之间的各个第二延迟自相关系数的步骤包括:
计算每个时间差延迟序列与所述时间差序列的对应序列索引位置处的时间差的值的相似度的平均值;
将所述时间差的值的相似度的平均值作为所述第二延迟自相关系数。
5.如权利要求1或2所述的检测伪周期性访问行为的方法,其特征在于,还包括:
当所述第一延迟自相关系数序列的周期大于或等于所述第二延迟自相关系数序列的周期、且当所述第一延迟自相关系数序列的所有峰值都大于...
【专利技术属性】
技术研发人员:刘鑫琪,丛磊,
申请(专利权)人:北京数安鑫云信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。