一种基于词向量的岗位推荐方法、装置及计算机设备制造方法及图纸

技术编号:37421566 阅读:32 留言:0更新日期:2023-04-30 09:43
本发明专利技术公开一种基于词向量的岗位推荐方法、装置及计算机设备,包括:利用潜在语义分析模型获取个人简历中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;根据词向量求和因子,分别对重复求职意愿关键词的词向量和非重复求职意愿关键词的词向量、重复个人技能关键词的词向量和非重复个人技能关键词的词向量进行加权求和,得到用户的求职意愿特征向量和个人技能特征向量;根据相似值大小对岗位需求特征向量进行一次筛选、根据投影长度大小和投影难度进行二次筛选,得到多个岗位需求特征向量及对应的多个岗位。采用本发明专利技术,能够从岗位匹配用户维度、用户意愿维度两个维度准确地为用户推荐就业岗位。准确地为用户推荐就业岗位。准确地为用户推荐就业岗位。

【技术实现步骤摘要】
一种基于词向量的岗位推荐方法、装置及计算机设备


[0001]本专利技术涉及数据处理
,尤其涉及一种基于词向量的岗位推荐方法、装置及计算机设备。

技术介绍

[0002]随着互联网技术的高速发展,人们通常通过互联网的招聘网站进行求职。网络应聘招聘的主要运作模式是求职者在网络平台上发布个人简历,用人单位在网络平台上发布职位信息。网络平台在拥有了大量的个人简历和职位信息后,有针对性地向求职者推荐职位信息,向用人单位推荐个人简历,以此将求职者和用人单位联系起来,帮助求职者快速地找到适合其工作能力的工作,帮助用人单位快速找到符合工作要求的员工。
[0003]对于应聘者而言,使用通过由岗位需求、技能需求、学历要求等信息组成的关键词集合在招聘平台进行岗位搜索,获取符合条件的岗位。但是,应聘者调用的关键词集合未必能够覆盖各个相关岗位相关文字描述,由于语言表达的多样性,不同的词语可以表达同一个意思,同一个意思也可以用不同的词语来表达,招聘方在发布的招聘职位中用词不可能和求职者发布的求职简历中用词一致,因此,应聘者调用的关键词集合来搜索岗位,往往不能达到精确的匹配效果。另一方面,即使应聘者自身的专业技能满足岗位需求,但是检索到岗位的工作内容、职位晋升方向、公司文化等影响个人选择意愿的隐性内容往往不能反馈到搜索结果中,往往需要应聘者在检索结果中浏览大量无关的、不敢感兴趣的岗位,大大影响求职效率。
[0004]综上所述,招聘平台提供给应聘者的推荐岗位不准确、推荐效率低极大低影响了应聘者跟招聘者双方匹配体验。
专利
技术实现思路

[0005]本专利技术实施例提供一种基于词向量的岗位推荐方法、装置及计算机设备,利用潜在语义分析模型个人简历提取求职意愿特征向量和个人技能特征向量,从两个维度方向与岗位需要特征向量匹配进而推荐合适的岗位。
[0006]本申请实施例的第一方面提供了一种基于词向量的岗位推荐方法,包括:分别以用户简历中的每一类主观信息为整体,利用潜在语义分析模型对每一类主观信息进行词向量提取,获取每一类主观信息中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;其中,所述主观信息为内容与形式非固定的信息;以用户简历中的全部信息为整体,利用潜在语义分析模型对全部客观信息进行词向量提取,获取客观信息中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;其中,所述客观信息为内容与形式固定的信息;按照预设的权重,分别对每一类主观信息和客观信息中重复出现的重复求职意愿关键词对应的多个词向量、重复出现的重复个人技能关键词对应的多个词向量加权相加,得到所述用户简历中所述重复求职意愿关键词的词向量和所述重复个人技能关键词的词
向量;根据词向量求和因子,分别对所述重复求职意愿关键词的词向量和非重复求职意愿关键词的词向量、所述重复个人技能关键词的词向量和非重复个人技能关键词的词向量进行加权求和,得到用户的求职意愿特征向量和个人技能特征向量;根据所述个人技能特征向量,确认对应的岗位需求类簇库并比较所述个人技能特征向量与岗位需求类簇库中所有岗位需求特征向量的相似值,根据相似值大小对岗位需求特征向量进行一次筛选;分别计算所有经过一次筛选的岗位需求特征向量在所述求职意愿特征向量上的投影,根据投影长度大小和投影难度进行二次筛选,得到多个岗位需求特征向量及对应的多个岗位;所述投影难度的值等于岗位需求特征向量与求职意愿特征向量之间转换矩阵的秩。
[0007]在第一方面的一种可能的实现方式中,所述词向量求和因子的获取方式为:分别根据各个求职意愿关键词、各个个人技能关键词在所述用户简历中出现的频次,得到对应的词向量求和因子。
[0008]在第一方面的一种可能的实现方式中,所述岗位需求类簇库中每个岗位需求特征向量的获取过程为:利用潜在语义分析模型对目标岗位信息进行词向量提取,获取目标岗位信息中岗位需求关键词的词向量;按照岗位供应方的实际需求,调整各个岗位信息中岗位需求关键词对应的影响因子;根据所述影响因子和各个岗位信息中岗位需求关键词的词向量,生成一个目标岗位信息对应的岗位需求特征向量。
[0009]在第一方面的一种可能的实现方式中,所述根据所述个人技能特征向量,确认对应的岗位需求类簇库,具体包括:采用基于划分的聚类算法,对全部岗位需求特征向量进行聚类,得到多个类簇中心向量;将与每个类簇中心向量之间的余弦距离小于预设类簇值的向量空间划分为该类簇中心向量对应的岗位需求类簇库;计算所述个人技能特征向量与各个类簇中心向量之间的余弦距离,确认余弦距离最小时对应类簇中心向量;根据所述余弦距离最小时对应类簇中心向量,确认对应的岗位需求类簇库。
[0010]在第一方面的一种可能的实现方式中,所述比较所述个人技能特征向量与岗位需求类簇库中所有岗位需求特征向量的相似值,根据相似值大小对岗位需求特征向量进行一次筛选,具体包括:计算所述个人技能特征向量与岗位需求特征向量的夹角余弦、信息熵和曼哈顿距离;对所述夹角余弦、所述信息熵和所述曼哈顿距离进行归一化处理并取均值作为相似值;从所有的岗位需求特征向量中选出与所述个人技能特征向量相似值大于预设阈
值的多个岗位需求特征向量。
[0011]在第一方面的一种可能的实现方式中,所述分别计算所有经过一次筛选的岗位需求特征向量在所述求职意愿特征向量上的投影,根据投影长度大小和投影难度进行二次筛选,得到多个岗位需求特征向量及对应的多个岗位,具体包括:分别计算所有经过一次筛选的岗位需求特征向量在所述求职意愿特征向量上的投影长度;分别计算所有经过一次筛选的岗位需求特征向量与求职意愿特征向量之间转换矩阵的秩;将各个投影长度与对应转换矩阵的秩的比值作为长秩比;从所有经过一次筛选的岗位需求特征向量选出与所述求职意愿特征向量长秩比大于预设阈值的多个岗位需求特征向量,得到多个岗位需求特征向量对应的多个岗位。
[0012]在第一方面的一种可能的实现方式中,所述潜在语义分析模型的建模过程为:统计文档中各个关键词词频和逆文档频率;所述文档是用户简历中的每一类主观信息,或是用户简历中的全部信息,或是目标岗位信息;构建共现矩阵,所述共现矩阵中每个元素的值为各个关键词词频和逆文档频率的比值;对所述共现矩阵进行奇异值分解,得到词向量空间矩阵、文档向量空间矩阵和奇异值对角矩阵。
[0013]在第一方面的一种可能的实现方式中,所述潜在语义分析模型运行过程为:利用SVD方法对所述词向量空间矩阵、所述文档向量空间矩阵和所述奇异值对角矩阵进行多次降维,直至低维近似矩阵与所述共现矩阵的近似误差最小;对近似误差最小时对应的词向量空间矩阵进行转换,得到对应词向量。
[0014]本申请实施例的第二方面提供了一种基于词向量的岗位推荐装置,包括:主观信息提取模块,用于分别以用户简历中的每一类主观信息为整体,利用潜在语义分析模型对每一类主观信息进行词向量提取,获取每一类主观信息中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;其中,所述主观信息为内容与形式非固定的信息;客观信息提取模块,用于以用户简历中的全部信息为整体,利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于词向量的岗位推荐方法,其特征在于,包括:分别以用户简历中的每一类主观信息为整体,利用潜在语义分析模型对每一类主观信息进行词向量提取,获取每一类主观信息中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;其中,所述主观信息为内容与形式非固定的信息;以用户简历中的全部信息为整体,利用潜在语义分析模型对全部客观信息进行词向量提取,获取客观信息中全部求职意愿关键词的词向量和全部个人技能关键词的词向量;其中,所述客观信息为内容与形式固定的信息;按照预设的权重,分别对每一类主观信息和客观信息中重复出现的重复求职意愿关键词对应的多个词向量、重复出现的重复个人技能关键词对应的多个词向量加权相加,得到所述用户简历中所述重复求职意愿关键词的词向量和所述重复个人技能关键词的词向量;根据词向量求和因子,分别对所述重复求职意愿关键词的词向量和非重复求职意愿关键词的词向量、所述重复个人技能关键词的词向量和非重复个人技能关键词的词向量进行加权求和,得到用户的求职意愿特征向量和个人技能特征向量;根据所述个人技能特征向量,确认对应的岗位需求类簇库并比较所述个人技能特征向量与岗位需求类簇库中所有岗位需求特征向量的相似值,根据相似值大小对岗位需求特征向量进行一次筛选;分别计算所有经过一次筛选的岗位需求特征向量在所述求职意愿特征向量上的投影,根据投影长度大小和投影难度进行二次筛选,得到多个岗位需求特征向量及对应的多个岗位;所述投影难度的值等于岗位需求特征向量与求职意愿特征向量之间转换矩阵的秩。2.如权利要求1所述基于词向量的岗位推荐方法,其特征在于,所述词向量求和因子的获取方式为:分别根据各个求职意愿关键词、各个个人技能关键词在所述用户简历中出现的频次,得到对应的词向量求和因子。3.如权利要求1所述基于词向量的岗位推荐方法,其特征在于,所述岗位需求类簇库中每个岗位需求特征向量的获取过程为:利用潜在语义分析模型对目标岗位信息进行词向量提取,获取目标岗位信息中岗位需求关键词的词向量;按照岗位供应方的实际需求,调整各个岗位信息中岗位需求关键词对应的影响因子;根据所述影响因子和各个岗位信息中岗位需求关键词的词向量,生成一个目标岗位信息对应的岗位需求特征向量。4.如权利要求1所述基于词向量的岗位推荐方法,其特征在于,所述根据所述个人技能特征向量,确认对应的岗位需求类簇库,具体包括:采用基于划分的聚类算法,对全部岗位需求特征向量进行聚类,得到多个类簇中心向量;将与每个类簇中心向量之间的余弦距离小于预设类簇值的向量空间划分为该类簇中心向量对应的岗位需求类簇库;计算所述个人技能特征向量与各个类簇中心向量之间的余弦距离,确认余弦距离最小时对应类簇中心向量;根据所述余弦距离最小时对应类簇中心向量,确认对应的岗位需求类簇库。
5.如权利要求1所述基于词向量的岗位推荐方法,其特征在于,所述比较所述个人技能特征向量与岗位需求类簇库中所有岗位需求特征向量的相似值,根据相似值大小对岗位需求特征向量进行一次筛选,具体包括:计算所述个人技能特征向量与岗位需求特征向量的夹角余弦、信息熵和曼哈顿距离;对所述夹角余弦、所述信息熵和所述曼哈顿距离进行归一化处理并取均值作为相似值;从所有的岗位需求特征向量中选出与所述个人技能特征向量相似值大于预设阈值的多个岗位需求特征向量。6.如权利要求1所述基于词向量的岗位推荐方法...

【专利技术属性】
技术研发人员:苑俊英丁柳黄沛涵张鉴新陈昭鹏
申请(专利权)人:广州南方学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1