【技术实现步骤摘要】
本专利技术涉及计算机信息检索领域,尤其涉及一种简历搜索方法和装置。
技术介绍
通常在对简历进行搜索匹配过程中,一般是通过关键词+相关词检进行检索的,但是专利技术人在实施过程中发现该方案存在以下问题:在进行简历搜索时搜索引擎会将关键词和相关词取相同的权重值进行搜索,那么命中的频次决定了搜索出来的简历的排序,则搜索结果极有可能偏向某个频次较高的相关词,另一方面,当相关词的数量大大多于关键词时,则在检索过程中关键词可能会被相关词淹没,难以突出关键词相对于相关词在搜索出简历过程中作为主要作检索关键词的作用。
技术实现思路
本专利技术实施例提出一种简历搜索方法,平衡关键词和相关词在简历搜索过程中所占的权重,提高简历搜索的效率。本专利技术实施例提出一种简历搜索方法,包括:接收用于从简历数据库中进行简历搜索的关键词和相关词集;其中,所述相关词集记载有多个相关词,以及每一个相关词与所述关键词的相关度;根据所述相关词集中的相关词的数量选择权重计算方式,并基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所述关键词所占的权重值;将所述关键词、所述关键词所占的权重值、每一个相关词和所述每一个相关词的权重值提交给搜索引擎,以从所述简历数据库中搜索出简历。进一步地,当所述相关词集中的相关词的数量处于上限词量和下限词量之
间时,选择第一方式作为权重计算方式,则基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所述关键词所占的权重值,具体为: ...
【技术保护点】
一种简历搜索方法,其特征在于,包括:接收用于从简历数据库中进行简历搜索的关键词和相关词集;其中,所述相关词集记载有多个相关词,以及每一个相关词与所述关键词的相关度;根据所述相关词集中的相关词的数量选择权重计算方式,并基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所述关键词所占的权重值;将所述关键词、所述关键词所占的权重值、每一个相关词和所述每一个相关词的权重值提交给搜索引擎,以从所述简历数据库中搜索出简历。
【技术特征摘要】
1.一种简历搜索方法,其特征在于,包括:接收用于从简历数据库中进行简历搜索的关键词和相关词集;其中,所述相关词集记载有多个相关词,以及每一个相关词与所述关键词的相关度;根据所述相关词集中的相关词的数量选择权重计算方式,并基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所述关键词所占的权重值;将所述关键词、所述关键词所占的权重值、每一个相关词和所述每一个相关词的权重值提交给搜索引擎,以从所述简历数据库中搜索出简历。2.如权利要求1所述的简历搜索方法,其特征在于,当所述相关词集中的相关词的数量处于上限词量和下限词量之间时,选择第一方式作为权重计算方式,则基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所述关键词所占的权重值,具体为:根据第一权重公式计算出所述相关词集中第i个相关词在进行简历搜索时所占的权重值Wi;其中,rmax为在所述相关词集中所记载的所有相关词的相关度的最大值;根据第二权重公式WA=m×sumW,计算出所述关键词在进行简历搜索时所占的权重值WA;其中,A为所述关键词,m为第一权重系数,sumW为所述相关词集中所有相关词的权重值的总和。3.如权利要求1或2所述简历搜索方法,其特征在于,当所述相关词集中的相关词的数量不处于所述上限词量和所述下限词量之间时,选择第二方式作为权重计算方式,则基于所选择的权重计算方式,根据所述每一个相关词与所述关键词的相关度,计算出在进行简历搜索时每一个相关词所占的权重值及所
\t述关键词所占的权重值,具体为:根据基准分值公式计算出所述相关词集中第i个相关词的基准分值Si;其中,ri为所述相关词集中的第i个相关词的相关度;rmin为在所述相关词集中所记载的所有相关词的相关度的最小值;rmax为在所述相关词集中所记载的所有相关词的相关度的最大值;对所述所有相关词的基准分值进行求和,获得基准分值总值sum;根据第三权重公式WA=5+log1.5(sum+1),计算出所述关键词在进行简历搜索时所占的权重值WA;其中,A为所述关键词;判断所述第i个相关词的基准分值是否大于WA/n若是,则根据第四权重公式计算出所述第i个相关词在进行简历搜索时所占的权重值Wi;若否,则根据第五权重公式计算出所述第i个相关词在进行简历搜索时所占的权重值Wi;其中,n为第二权重系数;k为所述相关词集中的相关词的数量。4.如权利要求3所述的简历搜索方法,其特征在于,在所述判断所述第i个相关词的基准分值是否大于WA/n之前,还包括:根据均值公式计算基准分值均值其中,为所述所有相关词的相关度的平均值;对于所述相关词集中的第i个相关词,判断所述第i个相关词的基准分值Si是否大于所述基准分值均值若是,通过更新公式更新所述第i个相关词的基准分值Si。5.如权利要求1所述的简历搜索的方法,其特征在于,所述将所述关键词、
\t所述关键词所占的权重值、每一个相关词和所述每一个相关词所占的权重值提交给搜索引擎,以从所述简历数据库中搜索出简历,具体为:根据搜索引擎的权重关联格式,将所述关键词所占的权重值和所述关键词相关联作为第一组合,以及将所述每一个相关词所占的权重值与其对应的相关词相关联作为第二组合;将所述第一组合和所述第二组合提交给搜索引擎,以供所述搜索引擎从所述简历数据库中搜索出简历,并根据所述搜索引擎内置的排序算法显示搜索出的简历;其中,所述简历中包含的所述关...
【专利技术属性】
技术研发人员:李贤,
申请(专利权)人:广州视源电子科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。