【技术实现步骤摘要】
网站流量异常的检测方法和装置
本申请涉及计算机领域,具体而言,涉及一种网站流量异常的检测方法和装置。
技术介绍
在现有的流量异常检测方法中,通常选取网站地址(URL)的请求数量、流量、服务器的处理时间等指标作为分析网站流量异常的指标。在该方法中,简单的设定阈值,如果上述指标超过设定的阈值则认为网站流量异常。在上述方法中,设定的阈值没有概率统计的基础,均为程序员人为设置,随意性很大,结果不可靠。并且指标本身是随时间变化的,譬如在工作日和节假日,流量本身就不一样;晚上九点钟的流量和凌晨四点的流量,也不一样。而设定一定阈值来判断网站的流量是否异常必然带来误判。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种网站流量异常的检测方法和装置,以至少解决现有技术中检测网站流量异常准确率较低的技术问题。根据本申请实施例的一个方面,提供了一种网站流量异常的检测方法,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。进一步地,根据计算出的相似度从所述多个网站中确定出目 ...
【技术保护点】
一种网站流量异常的检测方法,其特征在于,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。
【技术特征摘要】
1.一种网站流量异常的检测方法,其特征在于,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。2.根据权利要求1所述的方法,其特征在于,根据计算出的相似度从所述多个网站中确定出目标网站包括:从所述多个网站中选择相似度小于预设比例阈值的网站,作为所述目标网站;对所述多个相似度从小到大进行排序,选择前n个相似度对应的网站作为所述目标网站,其中,n为大于或者等于1的正整数;或者对所述多个相似度从小到大进行排序,选择前m%个相似度对应的网站作为所述目标网站,其中,m为大于或者等于1,且小于或者等于100的正整数。3.根据权利要求1所述的方法,其特征在于,计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度包括:通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量;或者通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量。4.根据权利要求1所述的方法,其特征在于,在计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布之前,所述方法还包括:按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器;其中,计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布包括:计算使用所述多个目标浏览器访问所述多个网站的访问行为数据中使用所述多个目标浏览器中每个目标浏览器的访问行为数据的第一比值,得到所述第一访问行为数据分布。5.根据权利要求4所述的方法,其特征在于,所述多个目标浏览器包括第一目标浏览器和第二目标浏览器,按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器包括:将所述第一比值按照降序进行排序;确定前k-1个第一比值对应的浏览器为所述第一目标浏览器,其中,k为大于或者等于1的正整数;将剩余n-k+1个第一比值所对应的浏览器合并为所述第二目标浏览器,并将所述n-k+1个第一比值合并为所述第二目标浏览器的占比,其中,所述第二目标浏览器的占比...
【专利技术属性】
技术研发人员:祁国晟,饶峰云,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。