基于线性递减权重粒子群算法优化Xgboost模型方法技术

技术编号：23318351 阅读：19 留言：0更新日期：2020-02-11 18:57

本发明专利技术提供一种基于线性递减权重粒子群算法优化Xgboost模型方法，通过分析Xgboost模型参数的含义，选取了对模型影响较大的4个参数进行优化，并将优化后的模型应用于NSL‑KDD数据集中，在一定程度上可以找出较优参数，从而提高入侵检测的准确率，通过本发明专利技术线性递减权重粒子群优化参数后的Xgboost模型应用于NSL‑KDD测试集数据，能够有效的优化Xgboost模型参数，提升模型的性能。

Optimization of xgboost model based on linear decreasing weight particle swarm optimization

全部详细技术资料下载

【技术实现步骤摘要】
基于线性递减权重粒子群算法优化Xgboost模型方法
本专利技术涉及网络入侵检测领域，具体是一种基于线性递减权重粒子群算法优化Xgboost模型方法。
技术介绍
近年来随着计算机技术、大数据技术的发展，网络空间的规模呈现大幅度地增长，一系列网络安全问题也随之产生。网络入侵检测领域一直是学术界和工业界关注的重点，网络入侵检测的方法是将入侵行为转换为分类和识别的问题，通过有效的算法来准确的识别其攻击类型使得入侵检测系统能够更好地应对攻击。随着机器学习技术的日渐成熟，相关领域的学者已成功将其应用于网络入侵检测中，但是识别的准确率还有待提升。Xgboost模型是集成学习算法中的一种，将Xgboost模型应用于网络入侵检测数据集NSL-KDD中，识别的效果很大程度上取决于参数的选择。如果使用默认的参数，虽然取得的效果还不错，但是还有很大提升的空间，Xgboost模型由于其参数数量较多，人工进行调参的工作量巨大。目前机器学习模型的参数往往是根据人们的经验来进行调整，参数可调整的局限性较大，当参数数量较多时，人工调参基本是不太可行的方案。现有使用较多的一种优化参数的方法是网格搜索，该方法通过对所有的参数组合进行穷举来寻找效果最佳的参数组合，但是非常耗时，并且最后搜索的参数是预先指定的。本申请的专利技术人在实现本专利技术的过程中经过研究发现：线性递减权重粒子群优化(LinearDecrementWeightParticleSwarmOptimization，LDWPSO)算法采用群体智能策略，在基本粒子群算法(Par...

【技术保护点】
1.一种基于线性递减权重粒子群算法优化Xgboost模型方法，其特征在于：包括/n步骤一：选取对Xgboost模型影响较大的4个参数，分别为学习率eta、最大树深度max_depth、最小叶子节点权重和min_child_weight以及gamma值，根据要优化的参数数量确定粒子的维度为4，并初始化每个粒子的位置和速度；/n步骤二：根据下面等式来更新每个粒子的速度V

【技术特征摘要】
1.一种基于线性递减权重粒子群算法优化Xgboost模型方法，其特征在于：包括
步骤一：选取对Xgboost模型影响较大的4个参数，分别为学习率eta、最大树深度max_depth、最小叶子节点权重和min_child_weight以及gamma值，根据要优化的参数数量确定粒子的维度为4，并初始化每个粒子的位置和速度；
步骤二：根据下面等式来更新每个粒子的速度Vid和位置Xid：
Vid＝ωVid+C1random(0,1)(Pid-Xid)+C2random(0,1)(Pgd-Xid)(1)
Xid＝Xid+Vid(2)
其中C1和C2分别为个体和社会学习因子，Pid为第i个粒子个体极值的第d维，Pgd为全局最优解的第d维；
并根据下面等式对惯性权重因子ω进行变换：

其中ω为非负的惯性权重因子，iter为最大迭代次数，iteri为当前迭代次数，ωmax为ω的最大值，ωmin为ω的最小值；
步骤三：将粒子的新位置作为参数并赋值给Xgboost模型并计算验证集上的适应度值，然后将新的适应度值与之前进行比较来确定哪些粒子的个体最优值需要进行更新，并更新全局最优值；
步骤四：线性递减权重粒子群算法进行迭代并且在满足最大迭代次数或收敛时终止，得到算法的最优适应度值和对应的最优位置，并且最优位置的4个分量分别对应eta、max_depth、min_child_weight和gamma四个参数，然后使用四个最优参数值来构造LDWPSO-Xgboost模型，并将其通过网络入侵数据集NSL-KDD拟合后，应用到测试集上，计算在测试集上的各项指标。

2.如权利要求1所述的基于线性递减权重粒子群算法优化Xgboost模型方法，其特征在于：所述步骤二具体为：
在4维搜索空间中，某时刻t，第i个粒子的位置为
Xi(t)＝[Xi1,Xi2,Xi3,Xi4]，
将Xi1到Xi4分别赋值给eta、max_depth、min_...

【专利技术属性】
技术研发人员：王晋，刘畅，喻潇，舒欣，杜丰夷，徐江珮，周亮，王文娜，杜仙，
申请(专利权)人：国网湖北省电力有限公司电力科学研究院，国家电网有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人