一种基于职业数据的评估方法、系统及装置制造方法及图纸

技术编号:38004368 阅读:7 留言:0更新日期:2023-06-30 10:19
本发明专利技术提供了一种基于职业数据的评估方法、系统及装置,涉及分类学习技术领域,方法包括:构造网络模型,包括节点、边及权重;定义每种职业的职业特征,并通过所述网络模型提取原始职业数据中每种职业的职业特征;基于所述网络模型及所述职业特征,通过评估模型进行预测,得到评估报告;所述评估模型包括子分类器及集成机制。本发明专利技术从多个计算维度构建出网络模型,继而提取原始职业数据的多种职业特征,在此基础上设计了评估模型,可对标签进行评估。该发明专利技术能够为原始职业数据分析提供较为准确、全面的量化评估。全面的量化评估。全面的量化评估。

【技术实现步骤摘要】
一种基于职业数据的评估方法、系统及装置


[0001]本专利技术涉及分类学习
,尤其是涉及一种基于职业数据的评估方法、系统及装置。

技术介绍

[0002]网络是节点和边的集合,其抽象地描述了事物间的关系,是一类特殊的系统。网络中节点的连接形式多种多样,主要包括无向、有向和带权重,共计三种模式。所述节点可以代表任何事物,如人际关系网络中的人类个体、交通网络中的城市等。复杂网络指的是具有自组织、自相似、吸引子、小世界以及无标度等性质中部分或全部性质的网络。
[0003]目前,原始职业数据纷繁复杂,包括职业数量、从业人员数量、流动人员数量、从业时间等等,处理起来非常繁琐,而网络模型可以将这些数据抽象化,比如将职业作为节点,以职业间的人员流动作为边,形成一个有向加权网络。利用该复杂网络,通过对网络拓扑结构、节点重要性等属性进行分析,能够挖掘出事物之间的深入关系以及更多隐藏信息,得到更有用的特征。
[0004]另一方面,集成学习本身不是单独的机器学习算法,它通过构建并结合多个机器分类器来完成学习任务。在分类问题中,集成学习训练若干弱分类器,采用一定的结合策略形成最终的强分类器,达到博采众长的目的。常用的弱分类器有决策树、支持向量机、逻辑回归及朴素贝叶斯等。常用的结合策略有平均法、投票法及学习法等。其中,平均法是对弱分类器的输出求平均值,最终得到预测输出;而投票法让每个弱分类器对分类结果进行投票,将其中票数最高的类作为最终的预测进行输出;最后,学习法的代表方法之一是堆叠法,将弱分类器的结果作为输入,重新训练一个分类器来得到最终结果。
[0005]但是,这些模型方法主要是针对单一特征样本,集成的是不同模型,如何利用集成算法博采众长的能力集成不同特征样本是一个需要研究的重要问题。

技术实现思路

[0006]本专利技术的目的在于提供一种基于职业数据的评估方法、系统及装置,以解决现有技术中存在的至少一种上述技术问题。
[0007]第一方面,为解决上述技术问题,本专利技术提供的基于职业数据的评估方法,包括:
[0008]步骤1、构造网络模型G(V,E,W);其中,V表示节点集合,E表示边集合,W表示权重集合;每个节点v∈V表示一种职业,每条边e∈E表示在t时刻有若干从业人员从职业u流动至职业v,该边的权重为w
t
(u,v)∈W所述权重包括流动量;
[0009]步骤2、定义每种职业的职业特征,并通过所述网络模型提取原始职业数据中每种职业的职业特征;所述职业特征包括一般特征和网络特征;所述原始职业数据包括职业数量、从业人数、人员受教育情况、人员流动经历、人员所在行业、人员所在地区等;
[0010]步骤3、基于所述网络模型及所述职业特征,通过评估模型进行预测,得到评估报告;所述评估模型包括子分类器及集成机制;所述评估报告包括标签分类及其预测概率。
[0011]通过上述步骤,可以对原始职业数据自动提取每种职业的职业特征,并进行智能预测,得到针对标签的评估报告。
[0012]在一种可行的实施方式中,所述步骤1中的权重包括教育水平、工作经验、社会资本、人才集中度及职业规模扩张等多个计算维度。
[0013]这样可以从多维度对各种职业数据进行细化处理,便于后序评估。
[0014]在一种可行的实施方式中,所述教育水平分为四个等级,每个等级的分数如下所示:
[0015][0016]通过sigmoid函数模拟教育水平维度的计算因子,具体公式可以为:
[0017][0018]其中,α表示曲线陡度的控制参数,其取值可以为2;
[0019]那么,所述G(V,E,W)中的权重变换为:
[0020][0021]其中,表示有关教育水平计算因子的流动量在t时刻从职业u流动至职业v;
[0022]这样可以将所述G(V,E,W)持化为教育水平维度下的网络模型G
EA
(V,E,W
EA
)从而通过针对不同学历水平设置不同分值,反映出不同教育水平的流动量。
[0023]在一种可行的实施方式中,所述工作经验包括职业长度l(p,t),所述l(p,t)表示从业人员p在t时刻的职业长度;通过sigmoid函数模拟通过工作经验获得的流动量的计算因子,具体公式可以为:
[0024][0025]其中,表示t时刻所有从业人员的平均职业长度;γ表示曲线陡度的控制参数,可以取
[0026]那么,所述G(V,E,W)中的权重变换为:
[0027][0028]其中,表示通过工作经验获得的流动量在t时刻从职业u流动至职业v;
[0029]这样可以将所述G(V,E,W)持化为工作经验维度下的网络模型G
XA
(V,E,W
XA
),
[0030]在一种可行的实施方式中,所述社会资本包括节点的度degree
SN
(p),所述degree
SN
(p)表示从业人员p在社会关系网络中可得到社会资本,将其作为通过社会资本获得的流动量的计算因子,具体公式可以为:
[0031]HC
SC
(p)=degree
SN
(p)
[0032]那么,所述G(V,E,W)中的权重变换为:
[0033][0034]这样可以将所述G(V,E,W)持化为社会资本维度下的网络模型G
SC
(V,E,W
SC
)
[0035]在一种可行的实施方式中,所述人才集中度的计算因子,其公式可以为:
[0036][0037]其中,表示在t时刻从职业u流动至职业v的流动人员数量;表示t时刻从职业u流动至职业Z的流动人员数量;Z表示在所有职业V中,除v之外的任意一种职业;
[0038]那么,所述G(V,E,W)中的权重变换为:
[0039][0040]其中,表示在t时刻职业u流动到职业v相对于流动至其他职业的比例;
[0041]这样可以将G(V,E,W)特化为人才集中度维度下的网络模型G
RC
(V,E,W
RC
),
[0042]在一种可行的实施方式中,所述职业规模扩张包括从业人员总数的增长率,则通过职业规模扩张获得的流动量的计算因子,具体公式可以为:
[0043][0044]其中,表示t时刻职业v的从业人员总数;表示t时刻从职业u流动至
职业v的流动人员数量;表示t时刻从职业v流动至职业Z的流动人员数量;
[0045]那么,通过归一化处理后,所述G(V,E,W)中的权重变换为:
[0046][0047]其中,w
t
(u,v)表示t时刻从职业u转移至职业v的人员数量;β表示控制参数;
[0048]这样可以将G(V,E,W)持化为职业规模扩张维度下的网络模型G
RE
(V,E,W
RE
)
[0049]在一种可行的实施方式中,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于职业数据的评估方法,其特征在于,包括:步骤1、构造网络模型,包括节点、边及权重:每个节点表示一种职业;每条边表示在某时刻两种职业之间存在人数有向变动;权重表示所述边的权重,所述权重包括流动量;步骤2、定义每种职业的职业特征,并通过所述网络模型提取原始职业数据中每种职业的职业特征;所述职业特征包括一般特征和网络特征;步骤3、基于所述网络模型及所述职业特征,通过评估模型进行预测,得到评估报告;所述评估模型包括子分类器及集成机制;所述评估报告包括标签分类及其预测概率。2.根据权利要求1所述的方法,其特征在于,所述步骤1中权重的计算维度包括教育水平、工作经验、社会资本、人才集中度及职业规模扩张:所述教育水平分为四个等级,每个等级的分数为:通过sigmoid函数模拟教育水平维度的计算因子,具体公式为:其中,α表示曲线陡度的控制参数;所述工作经验包括职业长度l(p,t),所述l(p,t)表示从业人员p在t时刻的职业长度;通过工作经验获得的流动量的计算因子,具体公式为:其中,表示t时刻所有从业人员的平均职业长度;γ表示曲线陡度的控制参数;所述社会资本包括节点的度degree
SN
(p),所述degree
SN
(p)表示从业人员p在社会关系网络中得到社会资本,将其作为通过社会资本获得的流动量的计算因子,具体公式为:HC
SC
(p)=degrge
SN
(p)所述人才集中度的计算因子,具体公式为:其中,表示在t时刻从职业u流动至职业v的流动人员数量;表示t时刻从职业u流动至职业Z的流动人员数量;Z表示在所有职业V中,除v之外的任意一种职业;所述职业规模扩张包括从业人员总数的增长率,则通过职业规模扩张获得的流动量的
计算因子,具体公式为:其中,表示t时刻职业v的从业人员总数;表示t时刻从职业u流动至职业v的流动人员数量;表示t时刻从职业v流动至职业Z的流动人员数量。3.根据权利要求1所述的方法,其特征在于,所述步骤2中的一般特征包括STEM类别、从业人员中属于第三产业的比例、从业人员中来自发达地区的比例、教育水平及教育要求;所述步骤2中的网络特征包括平...

【专利技术属性】
技术研发人员:张忠山刘嘉敏王涛沈大勇程力闫俊刚刘晓路陈宇宁何磊陈盈果吕济民
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1