【技术实现步骤摘要】
一种简历筛选方法及装置
本说明书实施例涉及信息处理
,尤其涉及一种简历筛选方法及装置。
技术介绍
在招聘过程中,招聘方将针对招聘的职位给出职位要求,而应聘者则针对该职位投递个人简历,招聘方需要筛选出符合职位要求的简历。为了节省人力,可以采用自动筛选的方式,现有的自动筛选简历的方案,可以通过逗号与句号等标点符号,将职位要求与待筛选简历的文本划分为语句,以划分后的语句分别形成2个集合,并计算2个集合的Jaccard相似性系数,根据计算结果决定是否选择该简历。一般情况下,应聘者投递的简历中的字数,均远大于招聘方给出的职位需求,因而划分后将得到较多的用于计算Jaccard相似性系数的语句,且如果收到大量简历,则划分得到的语句数量也将成倍增长,使上述自动筛选的方式需要消耗大量的计算资源,筛选效率较低。
技术实现思路
针对上述技术问题,本说明书实施例提供一种简历筛选方法及装置,技术方案如下:一种简历筛选方法,该方法包括:获得预先存储的需求特征集合,所述需求特征集合为:根据预设划分规则,对给定的职位需求信息的文本进行划分得到的文本片段的集合;根据所述预设划分规则,对任一备选简历的文本进行划分,得到划分的文本片段构成的简历特征集合;确定需求特征子集,所述需求特征子集中包括:所述需求特征集合中的k1个具有最小哈希值的需求特征,k1为预设值且不大于所述需求特征集合中特征个数;确定简历特征子集,所述简历特征子集中包括:所述简历特征集合中的k2个具有最小哈希值的简历特征,k2为预设值且小于所述简历特征集合中特征个数;计算所述需求特征子集与简历特征子集的Jaccard相似性系数, ...
【技术保护点】
1.一种简历筛选方法,该方法包括:获得预先存储的需求特征集合,所述需求特征集合为:根据预设划分规则,对给定的职位需求信息的文本进行划分得到的文本片段的集合;根据所述预设划分规则,对任一备选简历的文本进行划分,得到划分的文本片段构成的简历特征集合;确定需求特征子集,所述需求特征子集中包括:所述需求特征集合中的k1个具有最小哈希值的需求特征,k1为预设值且不大于所述需求特征集合中特征个数;确定简历特征子集,所述简历特征子集中包括:所述简历特征集合中的k2个具有最小哈希值的简历特征,k2为预设值且小于所述简历特征集合中特征个数;计算所述需求特征子集与简历特征子集的Jaccard相似性系数,并在计算结果大于预设阈值的情况下,确定所述备选简历为符合所述给定的职位需求信息的简历。
【技术特征摘要】
1.一种简历筛选方法,该方法包括:获得预先存储的需求特征集合,所述需求特征集合为:根据预设划分规则,对给定的职位需求信息的文本进行划分得到的文本片段的集合;根据所述预设划分规则,对任一备选简历的文本进行划分,得到划分的文本片段构成的简历特征集合;确定需求特征子集,所述需求特征子集中包括:所述需求特征集合中的k1个具有最小哈希值的需求特征,k1为预设值且不大于所述需求特征集合中特征个数;确定简历特征子集,所述简历特征子集中包括:所述简历特征集合中的k2个具有最小哈希值的简历特征,k2为预设值且小于所述简历特征集合中特征个数;计算所述需求特征子集与简历特征子集的Jaccard相似性系数,并在计算结果大于预设阈值的情况下,确定所述备选简历为符合所述给定的职位需求信息的简历。2.根据权利要求1所述的方法,所述预设划分规则包括:基于预设词库对文本进行分词,得到文本中的词条的规则。3.根据权利要求2所述的方法,所述计算所述需求特征子集与简历特征子集的Jaccard相似性系数,包括:确定所述需求特征集合中的任一词条是否包含于所述简历特征集合中;根据确定的结果,得到所述需求特征子集的词条中,包含于所述简历特征子集的词条的个数l;计算所述需求特征子集与简历特征子集的Jaccard相似性系数:4.根据权利要求3所述的方法,所述确定所述需求特征集合中的任一词条是否包含于所述简历特征集合中,包括:基于预设语料库,对所述需求特征集合及所述简历特征集合中的词条进行语义识别;针对所述需求特征集合中的任一词条,查找所述简历特征集合中是否存在与该词条具有相同语义的词条;若是,则确定该词条包含于所述简历特征集合中;若否,则确定该词条不包含于所述简历特征集合中。5.根据权利要求3所述的方法,所述确定所述需求特征集合中的任一词条是否包含于所述简历特征集合中后,该方法还包括:获得预先构建的词条矩阵,所述词条矩阵的任一行对应所述需求特征集合中的1个词条,任一列对应1个备选简历;在确定该词条包含于所述简历特征集合中的情况下,将所述词条矩阵中该词条与该简历对应的元素置为1;在确定该词条不包含于所述简历特征集合中的情况下,将该词条与该简历对应的元素置为0。6.根据权利要求1所述的方法,所述确定需求特征子集,包括:基于预设的n个哈希函数,获得所述需求特征集合的k1个具有最小哈希值的需求特征,构成需求特征子集,1≤n≤k1;其中,第i个函数对应k1i个具有最小哈希值的需求特征,k1i为预设值且7.根据权利要求1所述的方法,所述确定简历特征子集,包括:基于预设的m个哈希函数,获得所述简历特征集合的k2个具有最小哈希值的简历特征,构成简历特征子集,1≤m≤k2;其中,第j个函数对应k2j个具有最小哈希值的简历特征,k2j为预设值且8.一种简历筛选装置,该装置包括:需求特征集合获得模块,用于获得预先存储的需求特征集合,所述需求特征集合为:根据预设划分规则,对给定的职位需求信息...
【专利技术属性】
技术研发人员:王胜,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。