基于数据深度挖掘的人才评价方法、系统及存储介质技术方案

技术编号:37614106 阅读:13 留言:0更新日期:2023-05-18 12:05
本发明专利技术公开了一种基于数据深度挖掘的人才评价方法、系统及存储介质,方法包括下述步骤:使用爬虫软件从人力系统中按指标获取待评价对象的人力数据表;对待评价对象的人力数据表进行清洗与整理,获得标准化矩阵;利用客观权重法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵;计算相关系数矩阵的特征根和特征向量,并计算主成分贡献率及累计贡献率,得到主成分;计算各个待评价对象的综合得分,并对主成分进行分析,获得专题指标,判断专题指标的得分并进行排名,生成分析报告。本发明专利技术通过采用大数据深度挖掘的分析方法对人力数据信息进行综合评价,实现了客观性、全面性的人力评价。全面性的人力评价。全面性的人力评价。

【技术实现步骤摘要】
基于数据深度挖掘的人才评价方法、系统及存储介质


[0001]本专利技术属于人才评价的
,具体涉及一种基于数据深度挖掘的人才评价方法、系统及存储介质。

技术介绍

[0002]人才是企业的宝贵财富,企业的快速健康发展离不开人才的支持。科学有效开展人才评价,挖掘人力资源,将合适的人才应用在合适的工作上,是快速提升企业发展和效率的重要措施。有些国际化大企业成立的人才评价部门,重点分析人才的各方面信息和优势,挖掘人才,做到人尽其用。人才评价的本质是,从评价对象获取关键的信息,采用合适的算法进行分析并形成相应的分析报告。随着社会的快速发展,每个人才肩负的角色越来越多,人才的综合评价也日趋多样化。部分企业开展了形式多样的人才评价方式,但仍无法真实反映人才的真正水平,原因在于:
[0003]1、目前每位人才身上的“标签”越来越多,有的机构为了能全面评价人才能力,设置了三四十个维度,在综合分析时,不仅造成计算量庞大,而且无法突出各个指标的重要程度;2、大量的评价“标签”采用文字、字母等非数据格式记录,且可能存在数据丢失的情况,无法直接进行数据分析,需要对数据进行有效的清洗;3、现有技术中有采用将人力评价指标经过简单赋分后直接相加求合并进行排名的方法,但由于不同指标的重要程度无法体现,结果失真较大;4、有些技术为了体现不同指标的重要程度,采取加权平均数的方法进行分析,但无法避免人为主观性强的缺陷,造成不同指标之间相同隐含信息的重叠。
[0004]本质上而言,现有方法仍是将数据进行简单的预处理和简单计算,无法有效提取数据内部的隐含信息,更无法深度挖掘人才的各方面情况,颗粒度不够。

技术实现思路

[0005]本专利技术的针对现有技术的缺点与不足,提供一种基于数据深度挖掘的人才评价方法、系统及存储介质,通过对人力数据进行挖掘分析,按照指标提取人力数据并进行数据处理,再通过客观权重法对指标进行赋权,并计算指标的相关系数,构建相关系数矩阵,最后通过计算综合得分,生成分析报告,实现了客观性、全面性的人力评价。
[0006]为了达到上述目的,本专利技术采用以下技术方案:
[0007]一方面,本专利技术提供一种基于数据深度挖掘的人才评价方法,所述方法包括下述步骤:
[0008]S1、使用爬虫软件从人力系统中按指标获取待评价对象的人力数据表;
[0009]S2、对待评价对象的人力数据表进行清洗与整理,获得标准化矩阵;
[0010]S3、利用客观权重法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵;
[0011]S4、计算相关系数矩阵的特征根和特征向量,并计算各个特征根的贡献率及累计贡献率,当前h个特征根的累计贡献率大于设定贡献率阈值时,停止计算并将前h个特征根
作为主成分;
[0012]S5、计算各个待评价对象的综合得分,并对主成分进行分析,获得专题指标,判断专题指标的得分并进行排名,生成分析报告。
[0013]作为优选的技术方案,所述爬虫软件从人力系统获取m个待评价对象的人力数据,每个人力数据包括n个指标x,构成待评价对象的人力数据表,表示为:
[0014][0015]其中,a
mn
表示第m个待评价对象的第n个指标的取值。
[0016]作为优选的技术方案,所述获得规范人力数据表,具体为:
[0017]首先进行数据清洗:对数值格式数据中的无效数据进行清除、缺失数据进行填充、异常数据进行更换,对非数值格式数据进行转换,得到全数值型数据;
[0018]再对清洗后的数据进行标准化变换,得到标准化矩阵Z
m
×
n

[0019]所述转换公式为:
[0020][0021][0022][0023]所述标准化矩阵表示为:
[0024][0025]其中,a
ij
表示清洗后数据中第i个待评价对象的第j个指标的取值,表示第j个指标的平均值,s
j
表示第j个指标的样本标准差,Z
ij
表示标准化矩阵中第i个待评价对象的第j个指标的取值。
[0026]作为优选的技术方案,利用客观权重法中的熵权法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵,具体为:
[0027]首先计算标准化矩阵中各指标的熵值,公式为:
[0028][0029]其中,e
j
表示第j个指标的熵值;
[0030]接着根据熵值,计算标准化矩阵中各指标的差异性系数,公式为:
[0031][0032]其中,f
j
表示第j个指标的差异性系数;
[0033]最后计算标准化矩阵中各指标的权重,公式为:
[0034][0035]其中,w
j
表示第j个指标的客观权重;
[0036]计算得到各指标权重后,计算标准化矩阵的相关系数,得到相关系数矩阵R,表示为:
[0037][0038]其中,Z表示指标赋权后的标准化矩阵;Z
T
是Z的转置矩阵;r
ij
表示相关系数矩阵中第i个待评价对象的第j个指标的相关系数,公式为:
[0039][0040]其中,Z
ki
表示标准化矩阵Z中第k个待评价对象的第i个指标的取值,Z
kj
表示标准化矩阵Z中第k个待评价对象的第j个指标的取值。
[0041]作为优选的技术方案,所述计算相关系数矩阵的特征根和特征向量,具体为:
[0042]根据相关系数矩阵r列特征方程,并求解相关系数矩阵r的特征根,公式为:
[0043]|R

λI|=0
[0044]其中,I表示单位矩阵,λ表示特征根集;
[0045]将特征根集中的特征根按照从大到小的顺序进行排列,并满足:λ1≥λ2≥

n
≥0,再求解每一特征根对应的标准正交化特征向量η;所述标准正交化特征向量的每一个元素作为每一个指标数据的计算系数,用于计算每一主成分的评分以及确定每一主成分代表的指标数据。
[0046]作为优选的技术方案,所述特征根贡献率的计算公式为:
[0047][0048]所述累计贡献率的计算公式为:
[0049][0050]当前h个特征根的累计贡献率大于设定的贡献率阈值时,并将前h个特征根作为主成分。
[0051]作为优选的技术方案,所述计算各个待评价对象的综合得分,具体为:
[0052]得到前h个主成分后,将标准化矩阵带入到变换方程中,求得前h个主成分中每一主成分的得分,再乘以本身的贡献率,最后将前h个主成分得分及贡献率的乘积求和,得到某一待评价对象的综合得分,公式为:
[0053][0054]其中,M
i
表示第i个待评价对象的综合得分,y
k
表示第k个主成分的得分,计算式为η
kj
为第k个主成分的标准正交化特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据深度挖掘的人才评价方法,其特征在于,所述方法包括下述步骤:S1、使用爬虫软件从人力系统中按指标获取待评价对象的人力数据表;S2、对待评价对象的人力数据表进行清洗与整理,获得标准化矩阵;S3、利用客观权重法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵;S4、计算相关系数矩阵的特征根和特征向量,并计算各个特征根的贡献率及累计贡献率,当前h个特征根的累计贡献率大于设定贡献率阈值时,停止计算并将前h个特征根作为主成分;S5、计算各个待评价对象的综合得分,并对主成分进行分析,获得专题指标,判断专题指标的得分并进行排名,生成分析报告。2.根据权利要求1所述的基于数据深度挖掘的人才评价方法,其特征在于,所述爬虫软件从人力系统获取m个待评价对象的人力数据,每个人力数据包括n个指标x,构成待评价对象的人力数据表,表示为:其中,a
mn
表示第m个待评价对象的第n个指标的取值。3.根据权利要求2所述的基于数据深度挖掘的人才评价方法,其特征在于,所述获得规范人力数据表,具体为:首先进行数据清洗:对数值格式数据中的无效数据进行清除、缺失数据进行填充、异常数据进行更换,对非数值格式数据进行转换,得到全数值型数据;再对清洗后的数据进行标准化变换,得到标准化矩阵Z
m
×
n
;所述转换公式为:所述转换公式为:所述转换公式为:所述标准化矩阵表示为:其中,a
ij
表示清洗后数据中第i个待评价对象的第j个指标的取值,表示第j个指标的平均值,s
j
表示第j个指标的样本标准差,Z
ij
表示标准化矩阵中第i个待评价对象的第j个指标的取值。4.根据权利要求3所述的基于数据深度挖掘的人才评价方法,其特征在于,利用客观权重法中的熵权法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵,具
体为:首先计算标准化矩阵中各指标的熵值,公式为:其中,e
j
表示第j个指标的熵值;接着根据熵值,计算标准化矩阵中各指标的差异性系数,公式为:其中,f
j
表示第j个指标的差异性系数;最后计算标准化矩阵中各指标的权重,公式为:其中,w
j
表示第j个指标的客观权重;计算得到各指标权重后,计算标准化矩阵的相关系数,得到相关系数矩阵R,表示为:其中,Z表示指标赋权后的标准化矩阵;Z
T
是Z的转置矩阵;r
ij
表示相关系数矩阵中第i个待评价对象的第j个指标的相关系数,公式为:其中,Z
ki
表示标准化矩阵Z中第k个待评价对象的第i个指标的取值,Z
kj
表示标准化矩阵Z中第k个待评价对象的第j个指标的取值。5.根据权利要求4所述的基于数据深度挖掘的人才评价方法,其特征在于,所述计算相关系数矩阵的特征根和特征向量,具体...

【专利技术属性】
技术研发人员:焦夏男杨祺邝东海余伟凌王贺东徐阳陈沛宏石循杰邱晓明
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1