基于两阶段随机森林算法的网站恶意用户预测方法技术

技术编号:30410779 阅读:51 留言:0更新日期:2021-10-20 11:41
本发明专利技术公开一种基于两阶段随机森林算法的网站恶意用户预测方法,通过考虑特征之间的相关性的同时还考虑特征之间的交互作用,即在决策树进行节点划分时不是仅使用一个最优特征而是使用多个特征的组合,因此可增强数据特征提供的信息量从而提高决策树的精度,然后使用以上的决策树作为基分类器构造出两阶段随机森林,从而识别网站恶意用户可能通过多个非敏感操作的组合完成以往检测方案无法检测的攻击的问题。攻击的问题。攻击的问题。

【技术实现步骤摘要】
基于两阶段随机森林算法的网站恶意用户预测方法


[0001]本专利技术涉及机器学习
,具体涉及一种基于两阶段随机森林算法的网站恶意用户预测方法。

技术介绍

[0002]随着互联网的发展,企业网站作为企业在互联网上展示形象的门户在树立企业形象和获取潜在用户等方面越来越重要,OA(办公自动化)在线系统极大提升了人们办公事务的工作效率,诸如此类的网站应用越来越广泛,企业信息化的过程中各种应用都架设在Web平台上,使得Web安全威胁问题愈发凸显。以往检测方案判断网站用户是否为恶意用户,往往只使用用户在某一时刻的操作是否为恶意操作作为唯一判断标准,而随着恶意用户技术水平的提升,他们可使用多个非敏感操作的组合完成以往检测方案无法检测的攻击。
[0003]针对上述提到的问题,目前提出了现有基于随机森林算法的恶意用户检测方法,通过选择网站用户数据集中的最优特征来构造随机森林中的基分类器决策树,随后基于这些决策树构造出随机森林。然而现有基于随机森林算法的恶意用户检测方案存在如下的问题:1)仅考虑用户特征(feature)与用户类别(class)的相关本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于两阶段随机森林算法的网站恶意用户预测方法,其特征是,包括步骤如下:步骤1、令用于训练预测网站恶意用户任务的两阶段随机森林的用户训练数据集中每一个样本权重为1/Q;步骤2、在步骤1所确定的用户训练数据集中每一个样本权重的基础上,对用户训练数据集进行带权有放回抽样,得到αB个训练数据子集;步骤3、对于步骤2所得到的αB个训练数据子集,使用每一个训练数据子集分别训练出一个基分类器决策树,这些基分类器决策树构成两阶段随机森林的第一阶段基分类器决策树;步骤4、令用于训练预测网站恶意用户任务的两阶段随机森林的用户训练数据集中每一个样本权重为w
q
;其中步骤5、在步骤4所确定的用户训练数据集中每一个样本权重的基础上,对用户训练数据集进行带权有放回抽样,得到(1

α)B个训练数据子集;步骤6、对于步骤4所得到的(1

α)B个训练数据子集,使用每一个训练数据子集分别训练出一个基分类器决策树,这些基分类器决策树构成两阶段随机森林的第二阶段基分类器决策树;步骤7、将步骤3所得到的第一阶段基分类器决策树和步骤6所得到的第二阶段基分类器决策树组成两阶段随机森林预测模型;步骤8、将待预测的网站用户数据输入到步骤7所得到的两阶段随机森林预测模型中,并根据两阶段随机森林预测模型的每个基分类器决策树对待预测的网站用户数据的预测类别进行投票,最多票的类别即为该待预测的网站用户数据的最终类别,进而根据该待预测的网站用户数据的最终类别确定用户是否为网站恶意用户;其中,Q表示用户训练数据集的样本数量;α表示给定的两阶段随机森林的第一阶段基分类器决策树的数量占两阶段随机森林的全部基分类器决策树的数量的比例,α∈(0,1);B表示两阶段随机森林的全部基分类器决策树的数量;v
q
表示样本x
q
在第一阶段基分类器决策树中分类错误次数,当样本x
q
在第一阶段基分类器决策树中分类错误次数为0时,v
q
=1。2.根据权利要求1所述的基于两阶段随机森林算法的网站恶意用户预测方法,其特征是,步骤3和步骤6中,使用一个训练数据子集训练出一个基分类器决策树的过程如下:步骤1)计算当前训练数据子集的特征集中每个特征与类别标签集的对称不确定性,并将对称不确定性为0的特征从特征集中删除,得到当前初选特征集;步骤2)计算当前初选特征集的每个特征与类别标签集的特征权重,并选择特征权重较大的前p个特征构成当前候选特征子集;步骤3)先从当前训练数据子集选取包含当前候选特征子集中至少一个特征的样本构造当前保留数据子集;再分别使用线性判别分析法对当前保留数据子集进行降维,得到当前降维数据子集;步骤4)在当前降维数据子集上使用Boolean测试计算划分超平面,并将所得到的划分超平面加入到备选划分超平面集中;
步骤5)对当前初选特征集进行更新,即从当前初选特征集中删除特征权重较小的γn个特征,并返回步骤2);步骤6)重复执行步骤2)至步骤5)的迭...

【专利技术属性】
技术研发人员:王金艳韦全敏刘静刘朝晖李先贤
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1