基于招聘行为数据的自适应性的招聘决策系统及方法技术方案

技术编号:34961501 阅读:46 留言:0更新日期:2022-09-17 12:41
本发明专利技术公开了基于招聘行为数据的自适应性的招聘决策系统,以解决现有技术中未将招聘人员的画像以及用人策略的时间因素纳入考虑因素,因此决策模型很难学习到历史经验和动态变化,导致决策机制很难自适应调整,本发明专利技术采用行为序列的方式,可以选择一批招聘信息和候选人信息的典型样本,并基于专家的评价标准对这些样本作出决策。决策后的序列当作历史决策序列,跟需要招聘的岗位信息和待评价的候选人信息,一同输入模型,得出预测结果。通过这种方式得出的预测结果是跟历史决策序列保持一致的。这样,在不改变模型参数本身,通过输入不同的行为序列,就会带来评价结果上的变化,起到了动态自适应的效果。了动态自适应的效果。了动态自适应的效果。

【技术实现步骤摘要】
基于招聘行为数据的自适应性的招聘决策系统及方法


[0001]本专利技术属于数据处理
,具体涉及基于招聘行为数据的自适应性的招聘决策系统及方法。

技术介绍

[0002]随着信息技术的发展和数字化系统的应用普及,用人单位的岗位招聘信息以及候选人的简历信息逐渐以数字化的形态存储下来。数据的累积也促进了数据处理技术以及机器学习技术在招聘领域的发展,如简历文档解析、岗位招聘信息与简历信息匹配等系统的产生和应用。用人单位可以将招聘决策机制通过决策数据训练成模型而非纸面规定的方式传达给每个招聘人员,达到用人决策的一致性和专业性。目前,招聘决策模型主要局限于岗位信息与简历信息的匹配方法,基本流程是先通过对文本内容进行解析提取出结构化信息,然后针对岗位的各项需求与简历所述的各项能力、工作经历等进行语义上的相似度匹配,评定候选人是否满足岗位需求。
[0003]只基于文本内容的相似度匹配方法,忽略了招聘人员之间的差异,也忽略了用人单位的招聘决策机制随着时间会发生变化的动态因素影响。一方面,招聘人员由于对于用人政策的理解不同、自身经验差异,对于同一份岗位和同一个候选人,所做出的招聘决定也是不一样的,从平均意义上来说,资深招聘专家所做出的决策要比初中级招聘人员的决策要更优、更符合用人单位的招聘策略。当新的招聘人员加入到招聘决策组时,资深招聘专家需要将过往决策经验培训给新入,以对齐招聘目标,而培训的过程需要耗费大量时间和精力,也需要等待新人慢慢累积经验;另一方面,用人单位由于战略方向上的整体或局部调整,以及外在市场环境的影响,也会频繁调整招聘用人的决策。基于文本内容的相似度匹配,没有将招聘人员的画像以及用人策略的时间因素纳入方法,因此决策模型很难学习到历史经验和动态变化,导致决策机制很难自适应调整。

技术实现思路

[0004]为解决现有技术存在的缺陷,本专利技术提供一种基于招聘行为数据的自适应性的招聘决策系统及方法。
[0005]为了解决上述技术问题,本专利技术提供了如下的技术方案:
[0006]基于招聘行为数据的自适应性的招聘决策系统,包括数据存储模块、决策模型训练模块、所述决策模型训练模块包括决策模型和数据前处理模块,数据存储模块用于存储输入数据,数据含有岗位招聘信息,候选人信息,历史决策行为序列,候选人审核状态;采用关系型数据库或用支持嵌套结构的文档数据库;
[0007]数据前处理模块用于将原始信息中非结构化的部分转化成结构化;将基础信息原始文本转变为带有嵌套属性的树状结构,以schema结构格式来记录,是key

value形式:每个key代表树到叶子节点的路径为jsonpath,value代表叶子节点上的字段类型;所述前处理模块引入知识图谱进行数据增强以及信息纠错,按结构化格式将扩增字段补充进主体结
构;还包括向量化嵌入,将原始的transformer是采用字典查找(lookuptable)的方式对token进行向量化嵌入,并叠加位置编码;标记化处理,将transformer接受的是以token为元素的序列作为输入。原始的transformer架构是针对文本序列进行处理。
[0008]作为本专利技术的一种优选技术方案,所述向量化嵌入包括token根据其类型选用不同的向量化嵌入方式,包括离散型、数值类型、字符串类型,高级类型,所述离散型为将token取值采用映射方式映射进[0,1024)这个数值范围内,然后按字典查找的方式,扩展成向量,数值类型为根据mu

law归一化到[

1,1]区间,然后平均分配到[1024,2048)这个取值区间,然后采用字典查找的方式,扩展成向量,其中mu

law公式为
[0009][0010]本专利技术还提供了基于招聘行为数据的自适应性的招聘决策方法,自监督的预训练模型采用跟决策模型一致的模型结构,但训练数据方面只需使用简历数据,为了模拟决策行为序列,包括以下处理步骤:
[0011]S1:抽取出简历工作经历中的最近一段工作经历及在此段时间内的其他信息等,作为候选人上一份工作时的招聘信息;除去最近一段工作经历的其他履历信息,作为候选人在应聘上一份工作时的简历信息;流程阶段在除之外的流程里随机挑选进行填充;决策行为取值为“入职”,
[0012]S2:根据最近一段工作经历中职位名的相似度对所有收集到的简历进行聚类;
[0013]S3:对每一类简历,再根据最近一段工作经历的公司进行分组,每一组内按最近一段工作的开始时间进行排序,这样每一组为包含历史决策行为的决策序列;
[0014]S4:由于根据简历所模拟出的决策序列只有正样本,即只有入职信息,不存在淘汰信息,以负采样技术在每一个批量训练的决策序列中。
[0015]进一步地,基于真实行为数据的持续训练步骤:若模拟数据中的公司、职位跟用人单位差别较大,预训练的模型预测效果不能符合用人单位的招聘决策标准,在预训练模型的基础上继续使用真实的决策行为数据进行微调;数据量多样性充足并且决策效果达到预期后,可以将模型参数固定下来,之后只使用模型进行预测。
[0016]进一步地,决策模型预测过程:用人单位选用预训练模型或者根据自身决策数据微调后的模型,进行预测时,遵循以下流程:
[0017]1)数据存储:通过数据采集系统上传候选人信息、岗位招聘信息后进行存储;通过流程管理系统采集招聘人员的决策行为并进行存储;
[0018]2)数据处理:数据处理过程跟训练过程中的数据处理保持一致;
[0019]3)模型预测:将处理过的数据输入模型中,输出各种可能的决策行为概率,选择概率最高的action作为建议的决策行为进行输出。
[0020]进一步地,在步骤3中,决策模型的输出的条件概率表示为
[0021]p
θ
(action∣job,candidate,stage,history),其中,上式条件概率表达的是:在遵循某招聘行为序列history的前提下,对投递某个岗位job的候选人candidate,在流程阶段stage下所做出的下一步决策action的概率。
[0022]更近一步地,在步骤3中,决策模型的损失函数定义成:
[0023][0024]其中,y(action
(i)
)是一个掩蔽函数,即当action
(i)
等于真实输出时,y(action
(i)
)=1;反之,y(action
(i)
)=0。
[0025]本专利技术相较于现有技术,具有以下有益效果:
[0026]1)调整招聘决策策略:当用人单位需要调整招聘的评价标准,传统方式是制定各种局部要求的标准,但很难覆盖输入信息的多样性,导致失去科学上的一致性。采用行为序列的方式,可以选择一批招聘信息和候选人信息的典型样本,并基于专家的评价标准对这些样本作出决策。决策后的序列当作历史决策序列,跟需要招聘的岗位信息和待评价的候选人信息,一同输入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于招聘行为数据的自适应性的招聘决策系统,包括数据存储模块、决策模型训练模块、所述决策模型训练模块包括决策模型和数据前处理模块,其特征在于:数据存储模块用于存储输入数据,数据含有岗位招聘信息,候选人信息,历史决策行为序列,候选人审核状态;采用关系型数据库或用支持嵌套结构的文档数据库;数据前处理模块用于将原始信息中非结构化的部分转化成结构化;将基础信息原始文本转变为带有嵌套属性的树状结构,以schema结构格式来记录,是key

value形式:每个key代表树到叶子节点的路径为jsonpath,value代表叶子节点上的字段类型;所述前处理模块引入知识图谱进行数据增强以及信息纠错,按结构化格式将扩增字段补充进主体结构;还包括向量化嵌入,将原始的transformer是采用字典查找lookuptable的方式对token进行向量化嵌入,并叠加位置编码;标记化处理,将transformer接受的是以token为元素的序列作为输入;原始的transformer架构是针对文本序列进行处理。2.根据权利要求1所述的基于招聘行为数据的自适应性的招聘决策方法,其特征在于,所述向量化嵌入包括token根据其类型选用不同的向量化嵌入方式,包括离散型、数值类型、字符串类型,高级类型,所述离散型为将token取值采用映射方式映射进[0,1024)这个数值范围内,然后按字典查找的方式,扩展成向量,数值类型为根据mu

law归一化到[

1,1]区间,然后平均分配到[1024,2048)这个取值区间,然后采用字典查找的方式,扩展成向量,其中mu

law公式为3.根据权利要求1所述的基于招聘行为数据的自适应性的招聘决策方法,自监督的预训练模型采用跟决策模型一致的模型结构,但训练数据方面只需使用简历数据,模拟决策行为序列,其特征在于,包括以下处理步骤:S1:抽取出简历工作经历中的最近一段工作经历及在此段时间内的其他信息,作为候选人上一份工作时的招聘信息;除去最近一段工作经历的其他履历信息,作为候选人在应聘上一份工作时的简历信息;流程阶段在除之外的流程里随机挑选进行填充;决策行为取值为“入职”,S2:根据最近一段工作经历中职位...

【专利技术属性】
技术研发人员:尹超
申请(专利权)人:上海穰川信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1