一种基于XGBoost的员工晋升预测的方法技术

技术编号：38544173 阅读：7 留言：0更新日期：2023-08-22 20:54

本发明专利技术主要关于一种基于XGBoost的员工晋升预测的方法，包括：获取待预测范围内历史员工特征数据集；对历史员工特征数据集预处理后利用SMOTE算法进行过采样，得到员工数据集，划分为员工训练集和员工测试集；利用XGBoost算法对员工训练集数据构建员工晋升预测模型；将员工测试集数据输入员工晋升预测模型进行评估验证；获取待预测范围内待预测员工特征数据集，进行步骤S200获得待预测员工预测集，输入员工晋升预测模型进行预测。采用SMOTE结合XGBoost算法，构成预测模型对员工晋升进行高效预测，效果较单一模型预测更佳，具有良好的鲁棒性和稳定性，验证表明其预测准确度较高。验证表明其预测准确度较高。验证表明其预测准确度较高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于XGBoost的员工晋升预测的方法

[0001]本专利技术主要关于数据挖掘
及人工智能
，具体涉及一种员工晋升预测方法，特别是关于一种基于XGBoost的员工晋升预测的方法。

技术介绍

[0002]对于企业来说，人才的晋升、招聘与企业发展息息相关，人才晋升能够对员工有效激励，发挥更大价值，可为企业留住更多有才华的员工，创造更多的收益。人力资源部门需要提升对员工晋升分析、决策的效率，改善传统信息更新缓慢和决策单调的问题，提高人才晋升公平性，有效激励员工工作积极性。
[0003]传统员工晋升预测模型，如随机森林、SVM、多层感知机等模型的缺陷导致构建的预测模型精度不高，预测结果不准确；企业实际情况中员工数据中符合晋升条件员工的比例占少数，数据集存在不平衡问题。存在不平衡特性的员工晋升数据集也会在数据层面降低预测准确度。现有的技术方案没有对员工数据的不平衡性进行平衡，且传统员工晋升预测模型精度上也不高，导致员工晋升风险预测的准确度低。
[0004]前述
技术介绍
知识的记载旨在帮助本领域普通技术人员理解与本专利技术较为接近的现有技术，同时便于对本申请专利技术构思及技术方案的理解，应当明确的是，在没有明确的证据表明上述内容在本专利申请的申请日前已公开的情况下，上述
技术介绍
不应当用于评价本申请技术方案的新创性。

技术实现思路

[0005]为解决上述
技术介绍
中提及的至少一种技术问题，本专利技术的目的旨在提供一种基于XGBoost的员工晋升预测的方法，方法采用SMOTE结合XGBoo...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost的员工晋升预测的方法，其特征在于包括以下步骤：S100、获取待预测范围内历史员工特征数据集；S200、对历史员工特征数据集预处理后利用SMOTE算法对不平衡员工数据进行过采样，得到正负样本均衡的员工数据集，划分为员工训练集和员工测试集；S300、利用XGBoost算法对员工训练集数据构建员工晋升预测模型，不断优化调整并确定模型参数；S400、将员工测试集数据输入员工晋升预测模型进行评估验证；S500、获取待预测范围内待预测员工特征数据集，进行步骤S200获得待预测员工预测集，输入员工晋升预测模型进行预测。2.根据权利要求1所述的基于XGBoost的员工晋升预测的方法，其特征在于：所述步骤S100及步骤S500中的特征数据集属性包括：所在部门、教育程度、性别、招聘渠道、KPI、上一年获奖、工龄和去年评级。3.根据权利要求1所述的基于XGBoost的员工晋升预测的方法，其特征在于：所述步骤S200中的预处理包括：对特征数据集进行缺失值和异常值处理，填充缺失值和剔除异常值。4.根据权利要求1
‑
3任一项所述的基于XGBoost的员工晋升预测的方法，其特征在于：所述步骤S200中的预处理还包括：对特征数据集中类别型特征进行数值编码，依据类别分别进行二值化、独热编码或归一化，得到标准特征数据集。5.根据权利要求1
‑
3任一项所述的基于XGBoost的员工晋升预测的方法，其特征在于：所述步骤S200中利用SMOTE算法对不平衡员工数据进行过采样，得到正负样本均衡的员工数据集的具体步骤包括：根据向上采样倍率n，从晋升员工样本x
i
的同类别且距离相邻最近的k个近邻样本中随机选取样本作为辅助样本，用以合成新样本，重复n次；在样本x
i
和每个辅助样本之间按照式(1)进行线性插值，完成合成n个样本；x
new
＝x
i
+rand(0,1)
×
Δ
ꢀꢀꢀ
(1)其中，x
i
为一个小数量类样本；x
new
为插值新生成的样本；rand(0,1)为0到1中的随机数；Δ＝(x

【专利技术属性】
技术研发人员：章涵博，黄静，郑慧慧，
申请(专利权)人：杭州众章数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人