当前位置: 首页 > 专利查询>北京大学专利>正文

一种启发式的工作岗位分级方法及装置制造方法及图纸

技术编号:14762840 阅读:34 留言:0更新日期:2017-03-03 16:50
本发明专利技术公开了一种启发式的工作岗位分级方法。本方法为:确定岗位分级层数;获取每一级工作岗位的特征属性;通过训练集工作岗位特征生成分级规则;利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。本发明专利技术还公开了一种启发式的工作岗位分级装置。本发明专利技术中启发式的工作岗位分级方法及装置通过将工作岗位进行关键词提取并与分级规则匹配,采取关键词的经验规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。

【技术实现步骤摘要】

本专利技术属于电子人力资源管理和数据挖掘领域,通过构造工作岗位分级规则,自动对工作岗位进行分级。本专利技术可直接应用在工作岗位管理、分析和推荐中。该专利技术涉及一种启发式的工作岗位分级方法及装置
技术介绍
目前的工作岗位分级,主要是针对专业技术岗位和管理岗位进行分类和分级,包含的领域有政府机构、事业单位、咨询公司等传统领域。由于这些领域的岗位名称相对固定,在相当长的时间内岗位名称不会发生变化,因此针对这些领域有固定的岗位分级依据,每一个岗位都有固定的归类和分级。现有的岗位分级和分类主要依靠领域专家人工完成。以互联网为代表的新兴行业的岗位具有周期短、变化快等特点,往往会在短时间内出现较多新的岗位名称,传统的基于人工的和固定式的岗位分级方式不适用于互联网这类的新兴行业。
技术实现思路
对于以互联网为代表的新兴行业,由于其工作岗位更新周期短、变化快,使用传统的基于人工的和固定内容的分级方法来判断岗位的级别高低,不但效率低,而且无法满足市场快速发展的需求。本专利技术设计了一种启发式工作岗位分级方法,利用岗位关键词构造分级规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。本专利技术解决其技术问题所采用的技术方案是:首先根据所选行业确定岗位层级,然后结合使用通用词典和行业专用词典对训练集中的工作岗位进行关键词提取,最后通过对提取的关键词进行迭代统计分析生成分级规则。对于新的需要分级的工作岗位,首先同样进行分词处理后提取关键词列表,然后把提取的工作岗位关键词列表按照分级规则进行逐条匹配,满足哪一条分级规则就判断其为该级工作岗位。本专利技术的出发点是通过工作岗位的关键词列表与分级规则进行匹配来进行岗位分级,关键在于工作岗位的关键词提取和分级规则的制定与匹配。主要包含三个子过程,分别是工作岗位的关键词提取过程、启发式分级规则的制定和分级规则匹配过程。本专利技术的技术方案为:1)对训练集中的工作岗位进行分词处理,生成每一个工作岗位的关键词列表;2)对岗位关键词进行统计分析,生成工作岗位分级规则;3)对测试集的工作岗位同样进行分词处理,生成每一个工作岗位的关键词列表;4)将待分级的工作岗位的关键词列表与分级规则逐级进行匹配,符合某一条分级规则就将这个工作岗位归类为此级别。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,步骤1)中工作岗位的分词处理,具体过程为:(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;(2)将训练集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。进一步,步骤2)中生成工作岗位规则,具体过程为:(1)对工作岗位的关键词列表进行统计分析,使用频率较高的关键词生成分级的基础规则;(2)依据分级的基础规则对训练集的工作岗位进行分级匹配;(3)对分级得到的每一级中的工作岗位的关键词重新进行统计分析,根据相关领域专家的判断,如果高频率关键词列表中出现不合理的关键词,则通过添加新的约束条件对分级结果进行调整以避免出现的不合理现象;(4)依据附有约束条件的基础规则对训练集的工作岗位重新进行分级匹配;(5)迭代执行步骤(3)和(4),直至分级匹配后的工作岗位正确率符合要求,即在每一级的分级结果中,对于设定频率阈值的高频词列表中未出现不合理的关键词;(6)根据基础规则和迭代添加的约束条件生成分级规则。进一步,步骤3)中工作岗位的分词处理,具体过程为:(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;(2)将测试集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。进一步,步骤4)中关键词列表与分级规则逐级匹配,具体过程为:(1)将匹配规则按照其判断准确率的顺序排列,准确率越高的规则匹配时优先权越高;(2)对于每一个工作岗位的关键词列表,按照规则的优先级与分级规则逐条进行匹配;(3)若符合某一条规则,匹配结束并将该工作岗位归类为相应的级别。此外,为解决传统的固定式工作岗位分级方法对于互联网这类新兴行业的不适用性问题,本专利技术提出了一种启发式的工作岗位分级装置。一种启发式的工作岗位分级装置,包括:工作岗位的关键词提取模块,用于对工作岗位进行自然语言处理并提取关键词列表;启发式分级规则制定模块,用于根据训练集中工作岗位关键词的统计分析结果,迭代生成分级规则;分级规则匹配模块,用于将工作岗位的关键词列表与分级规则逐条进行匹配,若满足某一条规则,则匹配结束,并将该工作岗位归类为此工作岗位级别。本方法的有益效果是:该启发式方法及装置在对互联网这类新兴行业的工作岗位进行分级处理时,在保证准确性的前提下,可以大大提高数据处理的效率,并减少人工操作的成本。以互联网为例,数据涵盖了互联网行业所有主流的公司和工作岗位,具有高度的普遍性和代表性。下面结合数据实例进行分析。数据集信息如表1所示。表1数据集详细参数序号参数数量1用户数1290552工作记录2564913公司数358921根据互联网行业的工作岗位特征,具体分级如表2所示。表2工作岗位分级说明级别序列级别岗位1实习生2工程师3高级工程师、经理4公司高层利用在上述训练数据集上得到的分级规则,对测试的300个互联网工作岗位进行分级,通过领域专家人工对分级结果进行检查,结果显示300个被测岗位中有290个岗位分级正确,10个工作岗位分级结果不合理,正确率为96.7%。实验结果表明所设计的方法不仅正确率较高,且效率远远高于人工手动分级。该方法及装置能够很好的对互联网行业工作岗位进行分级处理,解决了人工分类成本高昂以及固定式分类不适用于互联网这类新兴行业的问题。附图说明下面结合附图和实施例对本方法进一步说明。图1是工作岗位关键词提取过程的流程图。图2是启发式分级规则制定过程的流程图。图3是工作岗位关键词列表与分级规则匹配的流程图。图4是一种启发式的工作岗位分级方法及装置的示意图。具体实施方式以下结合附图对本专利技术的原理和性质进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供一种启发式的工作岗位分级方法,包括三个过程:工作岗位关键词提取过程、启发式分级规则制定过程和工作岗位关键词列表与分级规则匹配过程,以下步骤:工作岗位关键词提取过程,如图1所示,详细过程如下:1)如图步骤S101,对于训练数据上的每一个工作岗位,综合使用通用分词词典和行业专用词典,进行自然语言处理,得到分词的结果;2)如图步骤S102,对于每一个工作岗位的分词结果,去除与判断工作岗位级别不相关或不明显的词语;3)如图步骤S103,将处理后的关键词构造为该工作岗位的关键词列表;启发式分级规则制定过程,如图2所示,详细过程如下:1)如图步骤S201,对分词后的工作岗位关键词列表进行统计分析,按照频率从高到低进行排序;2)如图步骤S202,根据频率较高的关键词生成分级的基础规则;3)如图步骤S203,依据分级的基本文档来自技高网...
一种启发式的工作岗位分级方法及装置

【技术保护点】
一种启发式的工作岗位分级方法,其特征在于,所述方法包括:确定岗位分级层数;获取每一级工作岗位的特征属性;通过训练集工作岗位特征生成分级规则;利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。

【技术特征摘要】
1.一种启发式的工作岗位分级方法,其特征在于,所述方法包括:确定岗位分级层数;获取每一级工作岗位的特征属性;通过训练集工作岗位特征生成分级规则;利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。2.根据权利要求1所述的方法,其特征在于,确定岗位分级层数,包括:确定目标行业领域;确定目标行业领域的工作岗位分级层数。3.根据权利要求1所述的方法,其特征在于,获取每级工作岗位的特征属性,包括:获取每级工作岗位的职位名称集合;提取每级工作岗位的关键词列表。4.根据权利要求3所述的方法,其特征在于,提取岗位关键词,包括:对工作岗位进行分词处理;提取可用于判断属于该级工作岗位的关键词;将提取的关键词构成该工作岗位的关键词列表。5.根据权利要求4所述的方法,其特征在于,分词处理,包括:综合使用通用分词词典和行业专用词典对工作岗位进行分词处理。6.根据权利要求1所述的方法,其特征在于,生成分级规则,包括:根据关键词统计分析的结果生成基础规则;使用基础规则对训练集进行分级处理;使用分级统计结果中出现的高频的不合理的关键词构造分级的约束条件;结合分级的基础规则和所有的约束条件生成最终的分级规则。7.根据权利要求6所述的方法,其特征在于,构造分级的约束条件,包括:结合分级的基础规则和分级的约束条件对训练集重新进行分级处理;使用分级统计结果中出现的高频的不合理的关键词构造新的分级的约束条件,并添加到约束条件集合中;重复上述操作,直至分级统计结果中未出现不合理的高频关键词。8.根据权利要求1所述的...

【专利技术属性】
技术研发人员:刘宏志付彬易晖吴波赵鹏吴中海
申请(专利权)人:北京大学北京华品博睿网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1