一种用户异常请求检测方法、装置、设备及存储介质制造方法及图纸

技术编号:31808510 阅读:12 留言:0更新日期:2022-01-08 11:10
本申请公开了一种用户异常请求检测方法、装置、设备及存储介质,包括:获取预设时段内不同用户的请求频次数据,将每个用户的所述请求频次数据按照时间顺序进行排列生成时序序列;利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,得到第一聚类结果;根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户。本申请仅需获取请求频次的时序数据无需其他特殊属性数据,保障用户隐私,进而利用改进后的能够度量时序数据之间相似度的无监督算法从时序维度进行特征工程分析,避免因单次异常行为产生误判从而提高异常请求检测精度,同时也能够识别出具有相同异常行为的用户群体。行为的用户群体。行为的用户群体。

【技术实现步骤摘要】
一种用户异常请求检测方法、装置、设备及存储介质


[0001]本专利技术涉及网络安全
,特别涉及一种用户异常请求检测方法、装置、设备及存储介质。

技术介绍

[0002]在当前互联网世界,电商平台或其他一些有价值网站经常遭到一些不法分子(黑产)通过技术手段薅羊毛(优惠券等)、刷投票以及爬取网站有价值数据,甚至恶意攻击网站。现有技术中主要通过请求日志和前端界面打点日志,包括抓取用户的点击行为、电池属性、陀螺仪、屏幕分辨率、设备指纹、cookie等数据来进行数据分析。一方面,这些数据需要额外耗费人力物力去获取,使得成本偏高。另一方面,获取的数据过多意味着用户的隐私数据暴露的也越多,存在隐私泄露的风险。
[0003]因此,如何安全、准确地对用户的异常请求进行检测是本领域技术人员亟待解决的技术问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种用户异常请求检测方法、装置、设备及存储介质,避免因单次异常行为产生误判从而提高异常请求检测精度,同时也能够识别出具有相同异常行为的用户群体。其具体方案如下:
[0005]本申请的第一方面提供了一种用户异常请求检测方法,包括:
[0006]获取预设时段内不同用户的请求频次数据,并将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列;
[0007]利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果;
[0008]根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户。
[0009]可选的,所述用户异常请求检测方法,还包括:
[0010]获取不同用户的请求日志;
[0011]根据所述请求日志确定不同用户对应的每秒查询率QPS,并将所述每秒查询率QPS存储至预设数据库中;
[0012]相应的,所述获取预设时段内不同用户的请求频次数据,包括:
[0013]从所述预设数据库中提取所述预设时段内不同用户反映请求频次的所述每秒查询率QPS。
[0014]可选的,所述将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列之后,还包括:
[0015]将每个用户的所述时序序列进行组合生成对应的特征矩阵,以便基于所述特征矩阵进行聚类分析。
[0016]可选的,所述利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果,包括:
[0017]将动态时间规整DTW作为相似度度量算法集成至Kmeans算法模型中,以得到改进后的Kmeans算法模型;
[0018]利用改进后的Kmeans算法模型对所述特征矩阵进行处理,以得到所述第一聚类结果。
[0019]可选的,所述根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户之前,还包括:
[0020]利用DBSCAN聚类算法对所述特征矩阵进行处理得到第二聚类结果,以便根据所述第一聚类结果和所述第二聚类结果确定在所述预设时段内存在异常请求的用户。
[0021]可选的,所述利用DBSCAN聚类算法对所述特征矩阵进行处理得到第二聚类结果,包括:
[0022]根据目标需求利用主成分分析算法对所述特征矩阵进行降维操作;
[0023]利用DBSCAN聚类算法对降维操作后的所述特征矩阵进行处理得到所述第二聚类结果。
[0024]可选的,所述根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户,包括:
[0025]将所述第一聚类结果中包含用户数量小于预设阈值的簇对应的用户确定为在所述预设时段内存在异常请求的用户。
[0026]本申请的第二方面提供了一种用户异常请求检测装置,包括:
[0027]获取模块,用于获取预设时段内不同用户的请求频次数据,并将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列;
[0028]第一聚类模块,用于利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果;
[0029]确定模块,用于根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户。
[0030]本申请的第三方面提供了一种电子设备,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述用户异常请求检测方法。
[0031]本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述用户异常请求检测方法。
[0032]本申请中,先获取预设时段内不同用户的请求频次数据,并将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列;然后利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果;最后根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户。可见,本申请仅需获取请求频次的时序数据无需其他特殊属性数据,保障用户隐私,进而利用改进后的能够度量时序数据之间相似度的无监督算法从时序维度进行特征工程分析,避免因单次异常行为产生误判,从而提高异常请求检测精度,同时也能够识
别出具有相同异常行为的用户群体。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0034]图1为本申请提供的一种用户异常请求检测方法流程图;
[0035]图2为本申请提供的一种具体的用户异常请求检测方法示意图;
[0036]图3为本申请提供的一种两小时内用户每秒查询率QPS示例图;
[0037]图4为本申请提供的一种用户异常请求检测装置结构示意图;
[0038]图5为本申请提供的一种用户异常请求检测电子设备结构图。
具体实施方式
[0039]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]现有技术中主要通过请求日志和前端界面打点日志,包括抓取用户的点击行为、电池属性、陀螺仪、屏幕分辨率、设备指纹、cookie等数据来进行数据分析。一方面,这些数据需要额外耗费人力物力去获取,使得成本偏高。另一方面,获取的数据过多意味着用户的隐私数据暴露的也越多,存在隐私泄露本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户异常请求检测方法,其特征在于,包括:获取预设时段内不同用户的请求频次数据,并将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列;利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果;根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户。2.根据权利要求1所述的用户异常请求检测方法,其特征在于,还包括:获取不同用户的请求日志;根据所述请求日志确定不同用户对应的每秒查询率QPS,并将所述每秒查询率QPS存储至预设数据库中;相应的,所述获取预设时段内不同用户的请求频次数据,包括:从所述预设数据库中提取所述预设时段内不同用户反映请求频次的所述每秒查询率QPS。3.根据权利要求1所述的用户异常请求检测方法,其特征在于,所述将每个用户的所述请求频次数据按照时间顺序进行排列生成与每个用户对应的时序序列之后,还包括:将每个用户的所述时序序列进行组合生成对应的特征矩阵,以便基于所述特征矩阵进行聚类分析。4.根据权利要求3所述的用户异常请求检测方法,其特征在于,所述利用改进后的能够度量时序数据之间相似度的无监督算法对不同用户的所述时序序列进行处理,以得到第一聚类结果,包括:将动态时间规整DTW作为相似度度量算法集成至Kmeans算法模型中,以得到改进后的Kmeans算法模型;利用改进后的Kmeans算法模型对所述特征矩阵进行处理,以得到所述第一聚类结果。5.根据权利要求4所述的用户异常请求检测方法,其特征在于,所述根据所述第一聚类结果中各个簇的用户数量确定在所述预设时段内存在异常请求的用户之前,还包括:利用DBSCA...

【专利技术属性】
技术研发人员:禹庆华
申请(专利权)人:上海微盟企业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1