【技术实现步骤摘要】
一种在大数量人才简历中提高搜索匹配度的方法
本专利技术涉及大数据分析
,尤其是一种在大数量人才简历中提高搜索匹配度的方法。
技术介绍
随着人才市场的发展,招人的企业可以在各种人才网站上获取用户的信息;但人才的查找受限于网上人才市场提供的功能。对于特殊的需要进行大范围的人才简历的查找,可通过网络爬虫等方式进行获取。但对于存在的大数量人才简历,其中简历的关联性、搜索的匹配度,对于文本类的人才简历,是一个问题。
技术实现思路
本专利技术解决的技术问题在于提供一种在大数量人才简历中提高搜索匹配度的方法;提高在大数量人才简历中进行搜索的匹配度,提高搜索效率。本专利技术解决上述技术问题的技术方案是:所述的方法是基于LAS算法及Apriori算法,利用LAS算法的语义分析,获取大数量人才简历的代表词语,基于Apriori算法对简历特征进行关联匹配,通过关联分析获取所有人才简历的关联度高的各关联项及关联度。所述的方法包括以下具体步骤:所述的方法是基于LAS算法及Apriori算法,利用LAS算法的语义分析,获取大数量人才简历的代表词语,基于Apriori算法对简历特征进行关联匹 ...
【技术保护点】
1.一种在大数量人才简历中提高搜索匹配度的方法,其特征在于:所述的方法是基于LAS算法及Apriori算法,利用LAS算法的语义分析,获取大数量人才简历的代表词语,基于Apriori算法对简历特征进行关联匹配,通过关联分析获取所有人才简历的关联度高的各关联项及关联度。
【技术特征摘要】
1.一种在大数量人才简历中提高搜索匹配度的方法,其特征在于:所述的方法是基于LAS算法及Apriori算法,利用LAS算法的语义分析,获取大数量人才简历的代表词语,基于Apriori算法对简历特征进行关联匹配,通过关联分析获取所有人才简历的关联度高的各关联项及关联度。2.根据权利要求1所述的方法,其特征在于:所述的方法包括以下具体步骤:步骤1、获取大数量人才简历的内容,分别按标点符号进行删除处理,形成可用于LAS算法输入的简历内容;步骤2、输入每个处理后的简历信息,构建形成基于每个人才简历的词-文档矩阵,每个人才简历分析得出多个代表词语,及各词语的出现次数,按出现的次数进行统计;步骤3、对统计后的每个简历的词频进行处理,去除在所有的简历中共同存在的机率小于10%的代表词语;把处理后的各个简历的代表词语按简历特征进行一对多的保存,形成各个简历的特征;步骤4:把获取后的各简历的词频作为特征,同时输入到构建的Apriori算法上进行关联分析,全部输入完成后,获取所有的关联度的信息;步骤5:人才简历关联分析后,获取分析出来的关联度;对于出现搜索词的其他相关语汇的资料,综合两者按关联系数从大到小进行排列,保存各关联系数及关联的项;步骤6:在进行人才简历搜索时,输入关键字后,从分析出来的...
【专利技术属性】
技术研发人员:郑锐韬,涂旭平,李勇波,季统凯,
申请(专利权)人:国云科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。