【技术实现步骤摘要】
一种基于聚类算法的员工离职风险预测方法及装置
本专利技术实施例涉及数据分析
,尤其涉及一种基于聚类算法的员工离职风险预测方法及装置。
技术介绍
在预测员工离职风险的方法上,传统的方法主要分为两种,一种是通过分析员工日常的行为习惯,如公司邮件内容,日常的上网内容和时间是否与工作相匹配,通过分析这些内容的变化来判断是否发生离职风险。另一种是通过利用机器学习中分类器的方法,统计员工的日常行为习惯,KPI考核信息,满意度,职位类别,薪水等,构建一种分类器(包含离职员工和正常续约的员工的训练样本)。用这个分类器对后续的员工表现进行评估。传统方案有如下方面的缺点:第一,基于员工日常的行为习惯方法,统计公司的邮件内容,员工的上网内容等多维度分析是否会出现离职风险,会出现如下问题,首先统计的内容中包含文本,数值等多种类型的数据,针对这些数据,需要加入一定的规则或者条件(如判定阈值)来判定某个维度,如日常上网的行为是否超出风险控制范围。还有就是当面对多维度时,经常会出现有些维度超出阈值,有些在合理范围内,这时也需要加入一定的判定条件来整体确定员工是否会出现离职风险。加入过多的 ...
【技术保护点】
一种基于聚类算法的员工离职风险预测方法,其特征在于,包括:获取待测员工多个维度的预测数据,所述待测员工包括在职员工和已离职员工;根据所述在职员工对应的第一员工数量和已离职员工的第二员工数量计算分组个数;根据所述预测数据和所述分组个数,利用聚类算法对所述待测员工进行聚类分析,获得每一分组对应的待测员工的信息;根据每一分组对应的待测员工的信息预测所述待测员工中具有离职风险的员工。
【技术特征摘要】
1.一种基于聚类算法的员工离职风险预测方法,其特征在于,包括:获取待测员工多个维度的预测数据,所述待测员工包括在职员工和已离职员工;根据所述在职员工对应的第一员工数量和已离职员工的第二员工数量计算分组个数;根据所述预测数据和所述分组个数,利用聚类算法对所述待测员工进行聚类分析,获得每一分组对应的待测员工的信息;根据每一分组对应的待测员工的信息预测所述待测员工中具有离职风险的员工。2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:对所述预测数据进行归一化处理。3.根据权利要求1所述的方法,其特征在于,所述根据每一分组对应的待测员工的信息预测所述待测员工中具有离职风险的员工,包括:统计每一分组中待测员工对应的已离职员工数量,并获取已离职员工数量最多的分组作为目标分组;将所述目标分组中的在职员工作为具有离职风险的员工。4.根据权利要求1所述的方法,其特征在于,所述聚类算法包括:K-means聚类算法;相应的,所述根据所述预测数据和所述分组个数,利用聚类算法对所述待测员工进行聚类分析,获得每一分组对应的待测员工的信息,包括:根据公式进行聚类分析,获得每一分组对应的待测员工的信息;其中,V为所述预测员工的均方差之和,k为所述分组个数,xj为第j个待测员工对应的预测数据,j为正整数且小于等于所述待测员工的数量,Si为第i个聚类中心,1≤i≤k,且i为整数,μi为为聚类Si的均值。5.根据权利要求1所述的方法,其特征在于,所述根据所述在职员工对应的第一员工数量和已离职员工的第二员工数量计算分组个数...
【专利技术属性】
技术研发人员:李智博,董旭,范成伟,李宝环,王凤君,
申请(专利权)人:北京德塔精要信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。