职位名称的识别方法、装置、计算处理设备、程序及介质制造方法及图纸

技术编号:33375870 阅读:24 留言:0更新日期:2022-05-11 22:43
本申请提供的职位名称的识别方法、装置、计算处理设备、程序及介质,属于计算机技术领域。所述方法包括:接收待输出的原始职位信息;将所述原始职位信息输入至预先训练的职位信息表征模型进行预测,得到所述原始职位信息的原始职位特征,其中,所述职位信息表征模型是利用与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本,对预训练语言表征模型基于目标损失函数进行训练得到,所述目标损失函数的值与所述职位信息表征模型的稳定性和充分性相关;在所述标准职位特征中查询与所述原始职位特征相匹配的目标标准职位特征;输出所述目标标准职位特征相对应的标准职位名称。本方案可以提高进行职位特征匹配所得到标准职位名称的准确性。职位名称的准确性。职位名称的准确性。

【技术实现步骤摘要】
职位名称的识别方法、装置、计算处理设备、程序及介质


[0001]本申请属于计算机
,特别涉及一种职位名称的识别方法、装置、计算处理设备、程序及介质。

技术介绍

[0002]随着网络与人们生活的不断融合,用户可以通过招聘平台发布和查询各种招聘信息。
[0003]而随着用户的不断增加,职位种类也随着不断增加,由于用户在表述职位名称时会使用各种术语、简称、甚至错别字等,导致平台对职位名称进行识别变得越来越困难,以至于在给用户搜索和推荐相关职位信息的时候出现误差,大大降低了用户体验。

技术实现思路

[0004]本申请提供的一种职位名称的识别方法、装置、计算处理设备、程序及介质。
[0005]本申请一些实施方式提供一种职位名称的识别方法,所述方法包括:
[0006]接收待输出的原始职位信息;
[0007]将所述原始职位信息输入至预先训练的职位信息表征模型进行预测,得到所述原始职位信息的原始职位特征,其中,所述职位信息表征模型是利用与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本,对预训练语言本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种职位名称的识别方法,其特征在于,所述方法包括:接收待输出的原始职位信息;将所述原始职位信息输入至预先训练的职位信息表征模型进行预测,得到所述原始职位信息的原始职位特征,其中,所述职位信息表征模型是利用与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本,对预训练语言表征模型基于目标损失函数进行训练得到,所述目标损失函数的值与所述职位信息表征模型的稳定性和充分性相关;在所述标准职位特征中查询与所述原始职位特征相匹配的目标标准职位特征;输出所述目标标准职位特征相对应的标准职位名称。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于样本职位信息与标准职位名称之间的匹配关系对所述样本职位信息进行标注,得到与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本;分别将所述正样本和所述负样本输入至预训练语言表征模型进行预测,得到所述正样本的正样本预测特征、所述负样本的负样本预测特征;将所述正样本的正样本预测特征、所述负样本的负样本预测特征、所述标准职位名称的标准职位特征输入至目标损失函数,得到目标损失值;在所述目标损失值小于损失值阈值的情况下结束训练,将训练后的预训练语言表征模型作为所述职位信息表征模型,所述目标损失函数的损失值是与所述职位信息表征模型的稳定性和充分性呈负相关关系。3.根据权利要求2所述的方法,其特征在于,所述将所述正样本的正样本预测特征、所述负样本的负样本预测特征、所述标准职位名称的标准职位特征输入至目标损失函数,得到目标损失值,包括:计算所述正样本预测特征与所述标准职位特征之间的第一余弦相似度,所述负样本预测特征与所述标准职位特征之间的第二余弦相似度;计算所述第一余弦相似度与综合余弦相似度之间比例的相反数,得到目标损失值,所述综合余弦相似度是将所述第一余弦相似度和所述第二余弦相似度结合得到。4.根据权利要求3所述的方法,其特征在于,所述计算所述第一余弦相似度与综合余弦相似度之间比例的相反数,得到目标损失值,包括:通过下述公式计算得到目标损失值:其中,所述Loss为目标损失值,所述h
i
表示第i个标准职位名称...

【专利技术属性】
技术研发人员:陈猛
申请(专利权)人:北京五八信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1