一种电子简历的筛选方法技术

技术编号:16327146 阅读:43 留言:0更新日期:2017-09-29 19:02
本发明专利技术提供了一种电子简历的筛选方法,获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;分别对第一词语和第二词语进行概念拆分后,根据拆分后得到的概念集合计算两者之间的词语相似度,根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。则本发明专利技术中,在进行信息匹配时要对词语进行拆分,形成概念集合,而概念集合中的概念可以最大程度的涵盖词语的本质含义,所以从概念的层面对词语进行匹配,可以有效的提高简历筛选的精确度。

【技术实现步骤摘要】
一种电子简历的筛选方法
本专利技术信息处理领域,尤其涉及一种电子简历的筛选方法。
技术介绍
随着网络的发展,大多求职者都通过网络投递简历,一份简历可以轻松投递到多家招聘方,因此无论是招聘网站还是招聘方,往往会收到大量简历。在面对大量简历时,人工筛选无疑是效率极低的,因此,出现了智能匹配简历和招聘信息(包括招聘职位以及其他招聘要求,例如工作地点要求、学历要求等)的方法。目前,简历和招聘信息的匹配方法多为将简历中的关键词与招聘信息中的关键字进行关键字匹配。但是,现有匹配的精准度并不高,仅仅通过简单的关键词匹配,尤其对于工作经历的分析而言,很难获得精确的匹配度。因此,现有技术有待进一步的提高。
技术实现思路
本专利技术提供了一种电子简历的筛选方法,为人力资源工作者提供一种简历初步筛选的方法,解决现有技术中电子简历处理量大的,效率低的问题。本专利技术提供了一种电子简历的筛选方法,所述方法包括:获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。可选的,所述计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度包括:计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度;计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度,所述第二独立义原为语义表达式中除所述第一独立义原以外的所有其他独立义原;计算所述第一概念的关系义原与第二概念的关系义原之间的第三相似度;计算所述第一概念的符号义原与第二概念的符号义原之间的第四相似度;根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度。可选的,所述计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度包括:按照如下公式计算所述第一相似度Sim1(V1,V2):其中,所述(d+α)表示两个义原,d是和在义原层次体系中的路径长度,α为常数参数。可选的,计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度包括:1)将第一概念与第二概念的语义表达式的所有独立义原任意配对,计算两两独立义原相似度;2)将相似度取值最大的一对归为一组;3)对剩余的独立义原两两执行步骤2),直至所有独立义原都完成分组;4)对各组的相似度计算平均值作为所述第二相似度。可选的,所述根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度包括:按照如下公式计算所述概念相似度Sim(Si,Tj):可选的,所述预标注项包括:专业选项、工作经历选项和工作地点选项。可选的,在计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度步骤还包括:判断排列在前预定个数的预标注项中第一词语与第二词语之间的词语相似度是否低于预设相似度阈值,若低于,则放弃本份简历其他相对应预标注项中对应第一词语与第二词语之间词语相似度的计算。可选的,在计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度步骤之后还包括:按照预设每个预标注项所占的权重,对计算出的各个词语相似度进行加权处理,得到最终的匹配值,并根据所述匹配值判断待筛选简历是否符合要求。本专利技术提供了一种电子简历的筛选方法,获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;分别对第一词语和第二词语进行概念拆分后,根据拆分后得到的概念集合计算两者之间的词语相似度,根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。则本专利技术中,在进行信息匹配时要对词语进行拆分,形成概念集合,而概念集合中的概念可以最大程度的涵盖词语的本质含义,所以从概念的层面对词语进行匹配,可以有效的提高简历筛选的精确度。附图说明图1为本专利技术所提供的一种电子简历的筛选方法步骤流程示意图。具体实施方式为了使本领域的技术人员更好的理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。在Hownet中,对实词的概念描述由以下三种形式的描述式组成:(1)独立义原描述式:由“基本义原”或“(具体词)”表示;(2)关系义原描述式:由“关系义原=基本义原”或“关系义原=(具体词)”或者“(关系义原=具体词)”来表示,其中关系义原是指包含“EventRole|动态角色”和“EventFeatures|动态属性”这两类的义原;(3)符号义原描述式:由“关系符号基本义原”或者“关系符号(具体词)”表示,其中关系符号包括“#、%、$、*、+、&、@、?、!”,其各自代表的关系不再赘述。在实际应用中,每一个概念由多个义原组成,义原是最基本的、不易于再分割的意义的最小单位。例如:“人”虽然是一个非常复杂的概念,它可以是多种属性的集合体,但也可以把它看作为一个义原。所有的概念都可以分解成各种各样的义原。同时也应该有一个有限的义原集合,其中的义原组合成一个无限的概念集合。中文中的字(包括单纯词)是有限的,并且它可以被用来表达各种各样的单纯的或复杂的概念,以及表达概念与概念之间、概念的属性与属性之间的关系。通过对义原和概念的定义,就可以对两个词语的相似度进行计算,基于上述原理,本专利技术提了一种电子简历的筛选方法,如图1所示,包括:101、获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;102、对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;103、计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;104、将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;105、根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。本专利技术的上述步骤中,需要预先设置一个简历模板,在简历模块中设置好预标注项,所述简历模板为应聘者通过网站可以本文档来自技高网...
一种电子简历的筛选方法

【技术保护点】
一种电子简历的筛选方法,其特征在于,所述方法包括:获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。

【技术特征摘要】
1.一种电子简历的筛选方法,其特征在于,所述方法包括:获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。2.根据权利要求1所述的电子简历的筛选方法,其特征在于,所述计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度包括:计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度;计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度,所述第二独立义原为语义表达式中除所述第一独立义原以外的所有其他独立义原;计算所述第一概念的关系义原与第二概念的关系义原之间的第三相似度;计算所述第一概念的符号义原与第二概念的符号义原之间的第四相似度;根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度。3.根据权利要求2所述的电子简历的筛选方法,其特征在于,所述计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度包括:按照如下公式计算所述第一相似度Sim1(V1,V2):

【专利技术属性】
技术研发人员:向敏明
申请(专利权)人:东莞市华睿电子科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1