【技术实现步骤摘要】
一种简历文本相似度匹配方法和系统
本公开涉及信息
,特别涉及一种处理文本信息的方法、系统、电子设备及计算机可读存储介质。
技术介绍
在现有的提供互联网招聘服务的网站中,常规的方法是由招聘方发布需要招聘的职位,对该职位感兴趣的求职者向该职位投递简历。也有一些招聘网站,会自动匹配求职者与职位的相关性,向相关性高的求职者推送职位,提高招聘的效果。但是,常见的简历职位匹配算法通常是直接计算简历文本和职位文本之间的语义相似度,根据语义相似度对求职者简历或招聘方职位进行排序。传统的简历和职位语义相似度计算,主要通过TF-IDF等特征提取算法来提取简历和招聘文件的字词特征,然后用字词特征的语义表示计算简历和职位相似度。然而,这种方式不能很好地提取到简历和招聘职位的整体语义表示,匹配的准确度不高。此外,这种匹配也仅仅利用了简历和职位文本的字词信息,没有本体知识信息,同样导致匹配不精准。因此,急需一种简历职位匹配算法,其能够全面的,综合各种信息,实现高效精确的简历和职位匹配和推荐。
技术实现思路
有鉴 ...
【技术保护点】
1.一种处理文本信息的方法,用于向招聘职位推荐简历,所述方法包括:/n获取招聘职位的第一文本和多个简历的第二文本;/n解析所述第一文本,从所述第一文本提取数值文本、短文本和自由文本,其中,所述第一文本的数值文本至少包括工作时间、薪资范围,短文本至少包括工作地点、最低学历、职位类别、职位名称,自由文本包括职位描述和职位要求;/n解析多个所述第二文本,从每个第二文本提取数值文本、短文本和自由文本,其中,所述第二文本的数值文本包括至少工作时间、期望薪资,短文本至少包括期望工作地点、期望职位类别、期望职位、学历、学校、专业,自由文本至少包括工作经历、项目经历;/n计算所述第一文本的 ...
【技术特征摘要】
1.一种处理文本信息的方法,用于向招聘职位推荐简历,所述方法包括:
获取招聘职位的第一文本和多个简历的第二文本;
解析所述第一文本,从所述第一文本提取数值文本、短文本和自由文本,其中,所述第一文本的数值文本至少包括工作时间、薪资范围,短文本至少包括工作地点、最低学历、职位类别、职位名称,自由文本包括职位描述和职位要求;
解析多个所述第二文本,从每个第二文本提取数值文本、短文本和自由文本,其中,所述第二文本的数值文本包括至少工作时间、期望薪资,短文本至少包括期望工作地点、期望职位类别、期望职位、学历、学校、专业,自由文本至少包括工作经历、项目经历;
计算所述第一文本的数值文本与所述第二文本的数值文本之间的相似度,得到第一相似度,其中,计算所述第一相似度的方法包括,分别将所述第一文本和第二文本的数值文本中的数值映射到预设区间,如果两者属于同一区间,则相似度为1,如果两者属于相邻区间,则相似度为0.5,其他情况,相似度为0;
分别计算所述第一文本的短文本与所述第二文本的短文本之间的相似度,得到第二相似度,其中,计算所述第二相似度的方法包括,基于预先设定的知识图谱规则,为符合规则的短文本之间的相似度赋予规则设定的值;
分别计算所述第一文本的自由文本与所述第二文本的自由文本之间的相似度,得到第三相似度,其中,计算所述第三相似度的方法包括,将所述第一文本的自由文本和第二文本的自由文本通过预先训练好的基于主题的相似度模型;
计算所述第一相似度、第二相似度以及第三相似度的加权和;以及
将所述加权和按照降序排序,选取排序靠前的第二文本作为推荐简历。
2.如权利要求1所述的方法,其中,所述知识图谱规则至少包括:学历知识、中国地理知识、工作性质知识、职位名称知识、高校知识、专业体系知识。
3.如权利要求1所述的方法,所述计算加权和的公式为:
其中,R代表简历,J代表招聘职位,Sim表示相似度,∑ici*Sim(ki,li)表示计算短文本的每一项之间的相似度,并加权求和,∑jcj*Sin(mj,nj)表示计算数值文本的每一项之间的相似度,并加权求和,λ*Sim(p,q)是计算自由文本之间的相似度,ki表示简历中的短文本第i个属性,li表示职位中的短文本第i个属性,ci是短文本的加权系数,mj表示简历中的数值文本第j个属性,nj表示职位中的数值文本的第j个属性,cj是数值文本的加权系数,p是简历的自由文本,q是职位的自由文本,λ是自由文本的加权系数。
4.如权利要求2所述的方法,所述高校知识包括:判断第二文本和第一文本的学校是否是985、211、一本、二本、其他大学、非大学,分别赋值为1、0.8、0.6、0.4、0.2、0,得到学校分数,如果第二文本的学校分数与第一文本的学校分数之差的绝对值小于预设阈值,则相似度为1,否则为0。
5.如权利要求2所述的方法,所述中国地理知识包括:将中国地理知识按照省、地级市、县划分为树形结构,分为三个层级,如果第一文本与第二文本的工作地...
【专利技术属性】
技术研发人员:吴晓军,
申请(专利权)人:河北冀联人力资源服务集团有限公司,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。