【技术实现步骤摘要】
一种基于对称对比学习的人岗匹配方法
[0001]本专利技术涉及计算机数据处理
,更具体地说,涉及一种基于对称对比学习的人岗匹配方法。
技术介绍
[0002]大数据时代,各种招聘平台不断涌现,它们在为用户提供丰富的线上招聘服务之余也面临着“信息过载”的困境。为了能从海量简历和职位信息中挖掘出有价值的信息,协助人才与公司需求之间的精准匹配,则需要一种快速判断简历与职位信息的匹配程度的算法架构。在计算简历与职位信息之间的重合度时,最关键的是如何评价其中两个文本的语义相似度。目前基于有监督学习的方法需要大量人工标记的数据集,具有很强的人工参与属性,而对于无监督学习的方法大都是采用深度学习学习到字向量或者句子向量,然后再利用不同的策略对字向量进行组合得到句子表征;或者通过使用统计机器学习方法给出一段或者一篇文章的关键字作为整个文本的语义表达。但实践中其应用可靠性仍有较大的优化空间。
技术实现思路
[0003]1.专利技术要解决的技术问题
[0004]由于有监督学习需要大量标记文本,而且随着无监督深度学习的 ...
【技术保护点】
【技术特征摘要】
1.一种基于对称对比学习的人岗匹配方法,其特征在于:包括以下步骤:S100、将简历和招聘信息按规则型文本和无规则文本进行分类;S200、使用选出的无规则文本,训练无规则文本语义表征模型;S300、根据无规则文本语义表征模型计算出简历和招聘信息中无规则文本的语义表达向量;S400、结合规则型文本和无规则文本的语义表达向量,通过label数据训练一个两层的神经网络模型即可得到一个人岗匹配预测模型。2.根据权利要求1所述的一种基于对称对比学习的人岗匹配方法,其特征在于:S200步骤和S300步骤之间还包括简历初筛工序,将规则文本融入人岗匹配计算策略进行初筛,具体地,该人岗匹配计算策略包括:策略一、将规则文本作为硬性条件筛选简历;或:策略二、将规则文本作为软性条件加入简历中进行筛选。3.根据权利要求1所述的一种基于对称对比学习的人岗匹配方法,其特征在于:S200中所述的无规则文本语义表征模型的计算包括以下步骤:S210、将简历和招聘信息中的无规则文本按句子划成训练数据集D
t
和验证数据集D
v
;S220、使用预训练模型作为编码器,每一次输入为训练数据集D
t
中的N个不同的句子D
N
;选择预训练模型的CLS的位置编码作为编码层的输出O∈R
N
×
M
,紧接着会进入到一个全连接层FCN,经过激活函数tanh(x)后得到的向量Y
act
∈R
N
×
M
即为整个批次的句子在文本语义空间的表示向量;同理,针对真实样本D
N
的增强样本进行同样操作,得到增强样本文本语义空间的表示向量矩阵Y
aug
;S230、使用损失计算函数模型计算无规则文本语义表征模型的损失值Loss,并反向传播;S240、重复步骤S220至步骤S230,直到在验证数据集D
v
上的均匀性l
uniform
指标能达到阈值δ。4.根据权利要求3所述的一种基于对称对比学习的人岗匹配方法,其特征在于:步骤S300中具体的计算方法包括:S310、简历的无规则文本处理;简历中的无规则文本分为工作经历和...
【专利技术属性】
技术研发人员:张信明,杨启冲,李志炜,
申请(专利权)人:长三角信息智能创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。