【技术实现步骤摘要】
一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备
[0001]本专利技术涉及网络安全
,具体涉及一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备。
技术介绍
[0002]随着互联网在现代生活中的日益普及,大量的设备已经成为互操作的可通过网络进行交互,随之而来的就是大量的设备安全问题,因而网络空间的安全受到更多关注。入侵检测系统(IDS)用于有效检测网络上的各种恶意攻击,是维护网络空间安全的最关键系统之一。从机器学习(ML)的角度来看,IDS可以定义为旨在对网络流量进行分类的系统,一个简单的模型是二进制分类模型,用于区分正常和恶意网络流量,从而能够检测入侵流量。随着最近以ML为重点的研究进展,许多研究表明,可以设计ML算法以实现IDS。
[0003]对数据集进行预处理和分类的时候,采用机器学习的方法往往能取得更优的结果。虽然机器学习在流量异常检测领域有了一些研究成果,但是都存在一些问题:一是目前很少有研究工作提出十分有效的解决方法,来解决入侵检测问题下的样本不平衡问题;二是检测精度和误 ...
【技术保护点】
【技术特征摘要】
1.一种基于XGBoost和LGBM的入侵检测方法,其特征在于,包括步骤:获取数据集,对所述数据集进行数据预处理;根据信息增益和FCBF算法对预处理后的数据集进行特征选择;采用XGBoost和LGBM分类器对数据集的数据进行分类处理;优化XGBoost和LGBM分类器,根据分类器性能比较结果,选择性能更高的分类器进行分类结果输出。2.根据权利要求1所述的基于XGBoost和LGBM的入侵检测方法,其特征在于,所述获取数据集,对所述数据集进行预处理包括步骤:删除数据集中的空值、格式不正确的值及重复的值,使数据集中的每个值只保留一个有效数据;采用K
‑
Means聚类算法将数据集中数据分成K个聚类,并从每个聚类中随机选取数据作为实例化的子集;根据阿特曼Z
‑
score模型将数据集进行标准化处理;采用DSSTE算法对数据集进行数据平衡。3.根据权利要求2所述的基于XGBoost和LGBM的入侵检测方法,其特征在于,所述采用DSSTE算法对数据集进行数据平衡包括步骤:采用ENN算法将不平衡的训练集分为近邻集和远邻集,并且将近邻集定义为困难样本,将远邻集定义为简单样本;采用K
‑
Means聚类算法将困难样本里的多样本进行压缩,并以聚类中心替代聚类;将困难样本里的少样本进行放大,将简单样本、经过放大的困难样本及压缩后的困难样本组合形成一个新的训练集。4.根据权利要求3所述的基于XGBoost和LGBM的入侵检测方法,其特征在于,所述K
‑
Means聚类算法的超参数K由BO
‑
GP算法进行优化。5.根据权利要求1所述的基于XGBoost和LGBM的入侵检测方法,其特征在于,所述根据信息增益和FC BC算法对预处理后的数据集进行特征选择包括步骤:根据信息增益算法计算每个特征的IG值,将每个特征的IG值标准化为0
‑
1之间的值,并将所有特征的IG值进行排序,从数值大到数值小依次进行特征选择,直至到达第一阈值时停止选择,将未被选择的特征剔除;采用FCBF算法计算每两个特征的...
【专利技术属性】
技术研发人员:刘兰,吴亚峰,陈桂铭,胡峻涵,陈子力,林子萌,
申请(专利权)人:广东技术师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。