网站流量异常的检测方法和装置制造方法及图纸

技术编号:15794868 阅读:503 留言:0更新日期:2017-07-10 10:14
本申请公开了一种网站流量异常的检测方法和装置。其中,该方法包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与多个网站一一对应的多个第二访问行为数据分布;计算多个第二访问行为数据分布中每个第二访问行为数据分布与第一访问行为数据分布的相似度,得到与多个网站一一对应的多个相似度;根据计算出的相似度从多个网站中确定出目标网站。本申请解决了现有技术中检测网站流量异常准确率较低的技术问题。

【技术实现步骤摘要】
网站流量异常的检测方法和装置
本申请涉及计算机领域,具体而言,涉及一种网站流量异常的检测方法和装置。
技术介绍
在现有的流量异常检测方法中,通常选取网站地址(URL)的请求数量、流量、服务器的处理时间等指标作为分析网站流量异常的指标。在该方法中,简单的设定阈值,如果上述指标超过设定的阈值则认为网站流量异常。在上述方法中,设定的阈值没有概率统计的基础,均为程序员人为设置,随意性很大,结果不可靠。并且指标本身是随时间变化的,譬如在工作日和节假日,流量本身就不一样;晚上九点钟的流量和凌晨四点的流量,也不一样。而设定一定阈值来判断网站的流量是否异常必然带来误判。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种网站流量异常的检测方法和装置,以至少解决现有技术中检测网站流量异常准确率较低的技术问题。根据本申请实施例的一个方面,提供了一种网站流量异常的检测方法,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。进一步地,根据计算出的相似度从所述多个网站中确定出目标网站包括:从所述多个网站中选择相似度小于预设比例阈值的网站,作为所述目标网站;对所述多个相似度从小到大进行排序,选择前n个相似度对应的网站作为所述目标网站,其中,n为大于或者等于1的正整数;或者对所述多个相似度从小到大进行排序,选择前m%个相似度对应的网站作为所述目标网站,其中,m为大于或者等于1,且小于或者等于100的正整数。进一步地,计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度包括:通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量;或者通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量。进一步地,在计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布之前,所述方法还包括:按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器;其中,计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布包括:计算使用所述多个目标浏览器访问所述多个网站的访问行为数据中使用所述多个目标浏览器中每个目标浏览器的访问行为数据的第一比值,得到所述第一访问行为数据分布。进一步地,所述多个目标浏览器包括第一目标浏览器和第二目标浏览器,按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器包括:将所述第一比值按照降序进行排序;确定前k-1个第一比值对应的浏览器为所述第一目标浏览器,其中,k为大于或者等于1的正整数;将剩余n-k+1个第一比值所对应的浏览器合并为所述第二目标浏览器,并将所述n-k+1个第一比值合并为所述第二目标浏览器的占比,其中,所述第二目标浏览器的占比小于第k-1个第一比值。根据本申请实施例的另一方面,还提供了一种网站流量异常的检测装置,包括:获取单元,用于获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;第一计算单元,用于计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;第二计算单元,用于计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;第三计算单元,用于计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;确定单元,用于根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。进一步地,所述确定单元包括:第一选择模块,用于从所述多个网站中选择相似度小于预设比例阈值的网站,作为所述目标网站;第二选择模块,用于对所述多个相似度从小到大进行排序,选择前n个相似度对应的网站作为所述目标网站,其中,n为大于或者等于1的正整数;或者第三选择模块,用于对所述多个相似度从小到大进行排序,选择前m%个相似度对应的网站作为所述目标网站,其中,m为大于或者等于1,且小于或者等于100的正整数。进一步地,所述第三计算单元包括:第一计算模块,用于通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量;或者第二计算模块,用于通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量。进一步地,所述装置还包括:合并单元,用于在所述第一计算单元计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布之前,按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器;其中,所述第一计算单元包括:计算模块,用于计算使用所述访问行为数据集合中使用所述多个目标浏览器中每个目标浏览器的访问行为数据的第一比值,得到所述第一访问行为数据分布。进一步地,所述多个目标浏览器包括第一目标浏览器和第二目标浏览器,所述合并单元包括:排序模块,用于将所述第一比值按照降序进行排序;确定模块,用于确定前k-1个第一比值对应的浏览器为所述第一目标浏览器,其中,k为大于或者等于1的正整数;合并模块,用于将剩余n-k+1个第一比值所对应的浏览器合并为所述第二目标浏览器,并将所述n-k+1个第一比值合并为所述第二目标浏览器的占比,其中,所述第二目标浏览器的占比小于第k-1个第一比值。在本申请实施例中,采用获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站的方式,通过根据访问行为数据计算第一访问行为数据分布和第二访问行为数据分布,并根本文档来自技高网...
网站流量异常的检测方法和装置

【技术保护点】
一种网站流量异常的检测方法,其特征在于,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。

【技术特征摘要】
1.一种网站流量异常的检测方法,其特征在于,包括:获取预设时间段内使用多种浏览器访问多个网站的访问行为数据,得到访问行为数据集合;计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布;计算所述多个网站中每个网站的访问行为数据中使用每种浏览器的访问行为数据的第二比值,得到与所述多个网站一一对应的多个第二访问行为数据分布;计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度;根据计算出的相似度从所述多个网站中确定出目标网站,其中,所述目标网站为流量异常的网站。2.根据权利要求1所述的方法,其特征在于,根据计算出的相似度从所述多个网站中确定出目标网站包括:从所述多个网站中选择相似度小于预设比例阈值的网站,作为所述目标网站;对所述多个相似度从小到大进行排序,选择前n个相似度对应的网站作为所述目标网站,其中,n为大于或者等于1的正整数;或者对所述多个相似度从小到大进行排序,选择前m%个相似度对应的网站作为所述目标网站,其中,m为大于或者等于1,且小于或者等于100的正整数。3.根据权利要求1所述的方法,其特征在于,计算所述多个第二访问行为数据分布中每个第二访问行为数据分布与所述第一访问行为数据分布的相似度,得到与所述多个网站一一对应的多个相似度包括:通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量;或者通过公式计算所述相似度,其中,xi为所述第一访问行为分布中的第一比值、yi为所述第二访问行为分布中的第二比值,i依次取1至n,n为所述第一比值和所述第二比值的数量。4.根据权利要求1所述的方法,其特征在于,在计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布之前,所述方法还包括:按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器;其中,计算使用所述访问行为数据集合中使用每种浏览器的访问行为数据的第一比值,得到第一访问行为数据分布包括:计算使用所述多个目标浏览器访问所述多个网站的访问行为数据中使用所述多个目标浏览器中每个目标浏览器的访问行为数据的第一比值,得到所述第一访问行为数据分布。5.根据权利要求4所述的方法,其特征在于,所述多个目标浏览器包括第一目标浏览器和第二目标浏览器,按照所述第一比值对所述多种浏览器进行合并,得到多个目标浏览器包括:将所述第一比值按照降序进行排序;确定前k-1个第一比值对应的浏览器为所述第一目标浏览器,其中,k为大于或者等于1的正整数;将剩余n-k+1个第一比值所对应的浏览器合并为所述第二目标浏览器,并将所述n-k+1个第一比值合并为所述第二目标浏览器的占比,其中,所述第二目标浏览器的占比...

【专利技术属性】
技术研发人员:祁国晟饶峰云
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1