【技术实现步骤摘要】
数据匹配方法及装置
本申请涉及计算机数据处理
,尤其涉及一种数据匹配方法及装置。
技术介绍
无论是通过企业官网或外部招聘网站的渠道,还是通过员工内推或猎头推荐等渠道,企业每天都会收到海量的求职应聘申请,且每个应聘申请中通常均包含求职者简历及具体应聘职位等,通过他人推荐的应聘申请还会包含推荐入评语等信息。在应聘申请信息到达企业后,需要企业自行对应聘申请进行审核,以决定是否将该应聘申请信息提交给用人部门进行面试评估。现有技术中,企业对应聘申请进行审核评估的方式一般为由招聘专员进行人工审核或由评估系统判断应聘申请的审核通过率。其中,人工审核的方式存在人员与岗位匹配度高的优势,但同时也存在审核效率低的问题。为了提高审核效率,部分企业采用由评估系统判断应聘申请的审核通过率的方式,具体为从给定职类(例如数据库维护岗位)的历史求职简历(包含通过和不通过)抽取特征训练模型,对于该职类新收到的简历进行自动评估。然而,无论是人工审核还是系统审核,均存在由于人为漏选或系统审核不够细化而造成的针对人岗匹配度的评估准确性低的问题。因此,业内亟需一种能够提高人岗匹配度的解决方案。
技术实现思路
针对现有技术中的问题,本申请提供一种数据匹配方法及装置,可以使得针对人岗匹配度的评估更加细化和准确。为解决上述技术问题,本申请提供以下技术方案:第一方面,本申请提供一种数据匹配方法,包括:获取求职者的求职者特征信息和职位的职位特征信息,所述职位特征信息包括职位类型、所属部门和职位层 ...
【技术保护点】
1.一种数据匹配方法,包括:/n获取求职者的求职者特征信息和职位的职位特征信息,所述职位特征信息包括职位类型、所属部门和职位层级中的至少一项;/n根据所述求职者特征信息和所述职位特征信息生成预测样本;/n将所述预测样本输入预设的分类模型,将所述分类模型的输出作为所述求职者与所述职位之间的匹配度。/n
【技术特征摘要】
1.一种数据匹配方法,包括:
获取求职者的求职者特征信息和职位的职位特征信息,所述职位特征信息包括职位类型、所属部门和职位层级中的至少一项;
根据所述求职者特征信息和所述职位特征信息生成预测样本;
将所述预测样本输入预设的分类模型,将所述分类模型的输出作为所述求职者与所述职位之间的匹配度。
2.根据权利要求1所述的数据匹配方法,所述求职者特征信息包括从事行业、拟应聘职位、曾工作内容、现居城市、当前及过去工作的公司、学校、性别、年龄、学历、工作年限、项目经历和职业技能,所述职位特征信息还包括所属行业、职位名称、工作地点和职位要求。
3.根据权利要求1所述的数据匹配方法,所述预测样本还包括交叉信息,该交叉信息为根据匹配规则获取的各项职位特征信息与求职者特征信息之间的匹配结果,其中,所述匹配规则根据各项所述职位特征信息预先设置。
4.根据权利要求1所述的数据匹配方法,还包括:
根据应聘历史审核日志生成训练样本集,所述训练样本集包括多个训练样本,所述训练样本包括相关联的求职者特征信息、职位特征信息和所述相关联的求职者特征信息、职位特征信息所对应的审核标签;
应用所述训练样本集对所述分类模型进行训练。
5.根据权利要求4所述的数据匹配方法,
所述根据应聘历史审核日志生成训练样本集,包括:
获取应聘历史审核日志,所述应聘历史审核日志包括多条应聘历史审核记录,所述应聘历史审核记录包括求职者标识、职位标识、以及审核通过状态;
针对所述应聘历史审核记录,根据所述职位标识确定职位特征信息,根据所述求职者标识确定求职者特征信息,根据所述审核通过状态确定审核标签,所述审核标签包括审核通过和审核未通过;
根据所述职位特征信息、求职者特征信息和对应的审核标签生成训练样本。
6.根据权利要求5所述的数据匹配方法,所述根据所述职位特征信息、求职者特征信息和对应的审核标签生成训练样本,包括:
在所述求职者特征信息中提取求职者特征向量,以及,在所述职位特征信息中提取职位特征向量;
根据所述求职者特征向量、职位特征向量和对应的审核标签生成训练样本。
7.根据权利要求5所述的数据匹配方法,所述训练样本还包括交叉信息;
所述交叉信息为根据匹配规则获取的各项职位特征信息与求职者特征信息之间的匹配结果,其中,所述匹配规则根据各项所述职位特征信息预先设置。
8.根据权利要求1所述的数据匹配方法,所述根据所述求职者特征信息和所述职位特征信息生成预测样本,包括:
在所述求职者特征信息中提取求职者特征向量,以及,在所述职位特征信息中提取职位特征向量;
根据所述求职者特征向量和所述职位特征向量生成预测样本。
9.根据权利要求6或8所述的数据匹配方法,所述求职者特征向量和职位特征向量的提取方式包括:
若所述求职者特征信息和/或所述职位特征信息中包含有枚举类信息,则对所述枚举类信息进行独热处理,得到对应的特征向量;
若所述求职者特征信息和/或所述职位特征信息中包含有数值信息,则对所述数值信息进行归一化处理,得到对应的特征向量。
10.根据权利要求1所述的数据匹配方法,所述获取求职者的求职者特征信息和职位的职位特征信息,包括:
获取求职者针对职位的应聘申请信息,并从所述应聘申请信息中提取求职者特征信息和职位特征信息。
11.根据权利要求10所述的数据匹配方法,还包括:
根据所述求职者与所述职位的匹配度预测该求职者成功应聘该职位的概率。
12.根据权利要求10或11所述的数据匹配方法,还包括:
预先设置多个应聘优先级所对应的匹配度范围或概率范围,根据所述求职者与所述职位的匹配度或求职者成功应聘该职位的概率来确定所述求职者所属的应聘优先级。
13.根据权利要求1所述的数据匹配方法,还包括:
获取目标求职者对应的求职者特征信息与至少一个候选职位的职位特征信息,其中,所述候选职位为所述目标求职者未曾应聘过的职位;
应用所述分类模型依次确定所述目标求职者与各个所述候选职位之间的匹配度;
根据所述目标求职者与各个所述候选职位之间的匹配度,从所述候选职位中确定针对目标求职者的推荐职位。
14.根据权利要求13所述的数据匹配方法,所述应用所述分类模型依次确定所述目标求职者与各个所述候选职位之间的匹配度,包括:
根据所述目标求职者的求职者特征信息和各个所述候选职位的职位特征信息分别生成各条用于职位推荐的预测样本;
将各条用于职位推荐的预测样本分别输入所述分类模型,将所述分类模型的各个输出分别作为所述目标求职者与各个所述候选职位的匹配度。
15.根据权利要求13所述的数据匹配方法,所述获取目标求职者对应的求职者特征信息与至少一个候选职位的职位特征信息,包括:
选取一求职者作为目标求职者,从数据库中获取所述目标求职者的求职者特征信息,所述数据库中存储有多个求职者的求职者特征信息、多个职位的职位特征信息以及求职者与职位之间的应聘关系;
根据所述求职者与职位之间的应聘关系,选取与所述目标求职者不存在应聘关系的至少一个职位作为候选职位,获取候选职位的职位特征信息。
16.根据权利要求1所述的数据匹配方法,还包括:
获取目标职位对应的职位特征信息与至少一个候选求职者的求职者特征信息,其中,所述候选求职者为未曾应聘过所述目标职位的求职者;
应用所述分类模型依次确定所述目标职位与各个所述候选求职者之间的匹配度;
根据所述目标职位与各个所述候选求职者之间的匹配度,从所述候选求职者中确定针对目标职位的推荐求职者。
17.根据权利要求16所述的数据匹配方法,所述应用所述分类模型依次确定所述目标职位与各个所述候选求职者之间的匹配度,包括:
根据所述目标职位的职位特征信息和各个所述候选求职者的求职者特征信息生成各条用于求职者推荐的预测样本;
将各条用于求职者推荐的预测样本分别输入所述分类模型,将所述分类模型的各个输出分别作为所述目标职位与各个所述候选求职者的匹配度。
18.根据权利要求16所述的数据匹配方法,
所述获取目标职位对应的职位特征信息与至少一个候选求职者的求职者特征信息,包括:
选取一职位作为目标职位,从数据库中获取所述目标职位的职位特征信息,所述数据库中存储有多个求职者的求职者特征信息、多个职位的职位特征信息以及求职者与职位之间的应聘关系;
根据所述求职者与职位之间的应聘关系,选取与所述目标职位不存在应聘关系的至少一个求职者作为候选求职者,获取候选求职者的求职者特征信息。
19.一种数据匹配系统,包括:
信息获取模块,用于获取求职者的求职者特征信息和职位的职位特征信息,所述职位特征信息包括职位类型、所属部门和职位层级中的至少一项;
预测样本生成模块,用于根据所述求职者特征信息和所述职位特征信息生成预测样本;
匹配度预测模块,用于将所述预测样本输入预设的分类模型,将所述分类模型的输出作为所述求职者与所述职位之间的匹配度。
20.根据权利要求19所述...
【专利技术属性】
技术研发人员:林方全,杨超,钊魁,杨程,朱胜火,蒋澄宇,吴超,周涛明,周恒,李越川,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。