一种处理招聘数据的方法及装置制造方法及图纸

技术编号:17655002 阅读:27 留言:0更新日期:2018-04-08 08:21
本发明专利技术提供了一种处理招聘数据的方法及装置,该方法包括:基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;针对该至少一个第一关键词进行词库训练,以获得至少一个第二关键词;针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;根据确定出的每一个第三关键词,计算各第二关键词的权重。首先基于部分招聘数据以训练出若干关键词,然后基于海量招聘数据以计算训练出的各关键词的权重,这一计算结果可以反映企业技术需求。可以看出,本方案可以处理海量的招聘数据,故能够提高数据处理效率。

【技术实现步骤摘要】
一种处理招聘数据的方法及装置
本专利技术涉及计算机
,特别涉及一种处理招聘数据的方法及装置。
技术介绍
随着现代社会的不断发展,就业人群的规模逐渐壮大,网络招聘已成为职员求职的首选方式。比如,可以通过公司专用网站、第三方招聘网站等机构,发布各公司的网络招聘信息。通常情况下,各公司的招聘信息可以反映其企业技术需求。目前,为了解企业技术需求,专业工作人员可以人为查看该公司发布的网络招聘信息,以进行分析处理。但是,当公司数量、网络招聘信息数量较多时,现有实现方式的数据处理效率较低。
技术实现思路
本专利技术提供了一种处理招聘数据的方法及装置,能够提高数据处理效率。为了达到上述目的,本专利技术是通过如下技术方案实现的:一方面,本专利技术提供了一种处理招聘数据的方法,基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;针对所述至少一个第一关键词进行词库训练,以获得至少一个第二关键词;还包括:针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;根据确定出的每一个所述第三关键词,计算每一个所述第二关键词的权重。进一步地,所述计算每一个所述第二关键词的权重,包括:利用公式一,计算每一个所述第二关键词的权重;所述公式一包括:其中,Wi为所述至少一个第二关键词中的第i个第二关键词的权重,n为所述至少一个第二招聘数据的个数,Pij为所述第i个第二关键词在所述至少一个第二招聘数据中的第j个第二招聘数据中的出现概率。进一步地,在所述确定当前第二招聘数据包括的至少一个第三关键词之后,进一步包括:利用公式二,计算所述至少一个第三关键词中的每一个第三关键词在所述当前第二招聘数据中的出现概率;所述公式二包括:其中,Pi为所述至少一个第三关键词中的第i个第三关键词在所述当前第二招聘数据中的出现概率,fi为所述第i个第三关键词在所述当前第二招聘数据中的出现次数,m为所述至少一个第三关键词的个数。进一步地,在所述确定当前第二招聘数据包括的至少一个第三关键词之后,进一步包括:判断所述至少一个第三关键词中是否存在目标第三关键词,若是,将所述目标第三关键词加入预设的备用关键词列表中;其中,所述至少一个第二关键词不包括所述目标第三关键词,所述至少一个第二关键词中存在一目标第二关键词,所述至少一个第三关键词包括所述目标第二关键词,且所述目标第二关键词在所述当前第二招聘数据中的出现次数不大于所述目标第三关键词在所述当前第二招聘数据中的出现次数。进一步地,该方法还包括:创建必需关键词列表,其中,所述必需关键词列表中包括所述至少一个第二关键词,所述必需关键词列表中包括的各关键词按照权重从大至小的排列顺序依次排列;在所述将所述目标第三关键词加入预设的备用关键词列表中之后,进一步包括:计算所述目标第三关键词的权重;判断所述目标第三关键词的权重是否不小于所述必需关键词列表中末位排序的关键词的权重,若是,将所述目标第三关键词从所述备用关键词列表转移至所述必需关键词列表中。另一方面,本专利技术提供了一种处理招聘数据的装置,包括:第一获取单元,用于基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;第二获取单元,用于针对所述至少一个第一关键词进行词库训练,以获得至少一个第二关键词;处理单元,用于针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;计算单元,用于根据确定出的每一个所述第三关键词,计算每一个所述第二关键词的权重。进一步地,所述计算单元,具体用于利用公式一,计算每一个所述第二关键词的权重;所述公式一包括:其中,Wi为所述至少一个第二关键词中的第i个第二关键词的权重,n为所述至少一个第二招聘数据的个数,Pij为所述第i个第二关键词在所述至少一个第二招聘数据中的第j个第二招聘数据中的出现概率。进一步地,所述处理单元,还用于利用公式二,计算所述至少一个第三关键词中的每一个第三关键词在所述当前第二招聘数据中的出现概率;所述公式二包括:其中,Pi为所述至少一个第三关键词中的第i个第三关键词在所述当前第二招聘数据中的出现概率,fi为所述第i个第三关键词在所述当前第二招聘数据中的出现次数,m为所述至少一个第三关键词的个数。进一步地,所述处理单元,还用于判断所述至少一个第三关键词中是否存在目标第三关键词,若是,将所述目标第三关键词加入预设的备用关键词列表中;其中,所述至少一个第二关键词不包括所述目标第三关键词,所述至少一个第二关键词中存在一目标第二关键词,所述至少一个第三关键词包括所述目标第二关键词,且所述目标第二关键词在所述当前第二招聘数据中的出现次数不大于所述目标第三关键词在所述当前第二招聘数据中的出现次数。进一步地,该处理招聘数据的装置还包括:维护单元,用于创建必需关键词列表,其中,所述必需关键词列表中包括所述至少一个第二关键词,所述必需关键词列表中包括的各关键词按照权重从大至小的排列顺序依次排列;计算所述目标第三关键词的权重;判断所述目标第三关键词的权重是否不小于所述必需关键词列表中末位排序的关键词的权重,若是,将所述目标第三关键词从所述备用关键词列表转移至所述必需关键词列表中。本专利技术提供了一种处理招聘数据的方法及装置,该方法包括:基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;针对该至少一个第一关键词进行词库训练,以获得至少一个第二关键词;针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;根据确定出的每一个第三关键词,计算各第二关键词的权重。首先基于部分招聘数据以训练出若干关键词,然后基于海量招聘数据以计算训练出的各关键词的权重,这一计算结果可以反映企业技术需求。可以看出,本专利技术可以处理海量的招聘数据,故能够提高数据处理效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的一种处理招聘数据的方法的流程图;图2是本专利技术一实施例提供的另一种处理招聘数据的方法的流程图;图3是本专利技术一实施例提供的一种处理招聘数据的装置的示意图;图4是本专利技术一实施例提供的另一种处理招聘数据的装置的示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例提供了一种处理招聘数据的方法,可以包括以下步骤:步骤101:基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词。步骤102:针对所述至少一本文档来自技高网...
一种处理招聘数据的方法及装置

【技术保护点】
一种处理招聘数据的方法,其特征在于,基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;针对所述至少一个第一关键词进行词库训练,以获得至少一个第二关键词;还包括:针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;根据确定出的每一个所述第三关键词,计算每一个所述第二关键词的权重。

【技术特征摘要】
1.一种处理招聘数据的方法,其特征在于,基于预先确定好的至少一个第一招聘数据,根据外部输入的分词标注信息,获得至少一个第一关键词;针对所述至少一个第一关键词进行词库训练,以获得至少一个第二关键词;还包括:针对预先确定好的至少一个第二招聘数据中的每一个第二招聘数据均执行:利用分词标注工具,确定当前第二招聘数据包括的至少一个第三关键词;根据确定出的每一个所述第三关键词,计算每一个所述第二关键词的权重。2.根据权利要求1所述的方法,其特征在于,所述计算每一个所述第二关键词的权重,包括:利用公式一,计算每一个所述第二关键词的权重;所述公式一包括:其中,Wi为所述至少一个第二关键词中的第i个第二关键词的权重,n为所述至少一个第二招聘数据的个数,Pij为所述第i个第二关键词在所述至少一个第二招聘数据中的第j个第二招聘数据中的出现概率。3.根据权利要求2所述的方法,其特征在于,在所述确定当前第二招聘数据包括的至少一个第三关键词之后,进一步包括:利用公式二,计算所述至少一个第三关键词中的每一个第三关键词在所述当前第二招聘数据中的出现概率;所述公式二包括:其中,Pi为所述至少一个第三关键词中的第i个第三关键词在所述当前第二招聘数据中的出现概率,fi为所述第i个第三关键词在所述当前第二招聘数据中的出现次数,m为所述至少一个第三关键词的个数。4.根据权利要求1至3中任一所述的方法,其特征在于,在所述确定当前第二招聘数据包括的至少一个第三关键词之后,进一步包括:判断所述至少一个第三关键词中是否存在目标第三关键词,若是,将所述目标第三关键词加入预设的备用关键词列表中;其中,所述至少一个第二关键词不包括所述目标第三关键词,所述至少一个第二关键词中存在一目标第二关键词,所述至少一个第三关键词包括所述目标第二关键词,且所述目标第二关键词在所述当前第二招聘数据中的出现次数不大于所述目标第三关键词在所述当前第二招聘数据中的出现次数。5.根据权利要求4所述的方法,其特征在于,进一步包括:创建必需关键词列表,其中,所述必需关键词列表中包括所述至少一个第二关键词,所述必需关键词列表中包括的各关键词按照权重从大至小的排列顺序依次排列;在所述将所述目标第三关键词加入预设的备用关键词列表中之后,进一步包括:计算所述目标第三关键词的权重;判断所述目标第三关键词的权重是否不小于所述必需关键词列表中末位排序的关键词的权重,若是,将所述目标第三关键词从所述备用关键词列表...

【专利技术属性】
技术研发人员:李树友
申请(专利权)人:山东浪潮云服务信息科技有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1