基于招聘信息的岗位词条构建方法技术

技术编号:38162521 阅读:12 留言:0更新日期:2023-07-13 09:36
本申请提供基于招聘信息的岗位词条构建方法,属于招聘信息挖掘分析技术领域,方法采集招聘信息进行分割清洗,并构建招聘信息表;依据预设关键词表中的关键词为词首,对招聘信息表中的所有招聘信息进行短句分割,获取关键词句并构建关键词句列表;分别以岗位职责动名词表和岗位要求动名词表为约束,从关键词句列表中分离出岗位职责短句和岗位要求短句,并依据短句的句型对岗位职责短句和岗位要求短句进行词组分割与组合,构建岗位职责词条和岗位要求词条;最后依据词条修复逻辑对两个词条进行修复,确定招聘信息对应的岗位词条。本申请可以有效提取招聘信息中的关键词,提高了关键词提取准确度,能满足实际招聘的业务需求。能满足实际招聘的业务需求。能满足实际招聘的业务需求。

【技术实现步骤摘要】
基于招聘信息的岗位词条构建方法


[0001]本申请属于招聘信息挖掘分析
,具体涉及一种从招聘信息中挖掘任务词和技能词来构建岗位词条的方法。

技术介绍

[0002]随着互联网的蓬勃发展,网络中的信息量开始爆炸式增长,如何从海量信息中快速准确地获取知识,成为人们最核心和迫切的需求。传统的招聘流程中,需要大量的招聘官人工地负责多次面试与筛选的流程,这会耗费大量的人力与时间。而招聘文本是一种特殊的信息文体,其记载的文本信息较为零散,且文本中的词汇受现有行业技术发展和调整的影响,容易出现新的招聘词汇,这对于招聘信息挖掘分析的准确性和适应性提出了较高的要求。
[0003]目前也有通过关键词模型来对招聘信息中的工作职责和技能要求关键词进行提取的技术方案,通常做法是先爬取智联上关于数据挖掘的岗位的招聘要求及其职责信息,根据分词技术对爬取的信息进行分词处理,如结巴分词等,从招聘信息提取出关键字,获得出现频率比较高的词汇,进而获取招聘信息中的关键词。但是现有分词技术如jieba,是针对通用词和常用词,或者自定义字典方式来实现分词的。而通用词和常用词模式分词的结果,往往会对工作职责和岗位要求的关键词从中截断,不能满足业务要求。同时,通过自定义字典方式进行关键词提取虽然能保障关键词提取质量,但工作量大,且部分职业招聘信息中的词汇连贯性强,自定义词典无法实现对各岗位招聘信息分词信息的穷举,关键词提取的准确度不高。

技术实现思路

[0004]为此,本申请提供一种基于招聘信息的岗位词条构建方法,有助于解决现有关键词提取方法难以有效提取招聘信息中的关键词,导致关键词提取准确度较低,不能满足实际招聘业务需求的问题。
[0005]为实现以上目的,本申请采用如下技术方案:本申请提供一种基于招聘信息的岗位词条构建方法,包括:采集招聘信息并依据第一预设序号列表规则对所述招聘信息进行分割清洗,构建招聘信息表;依据预设关键词表中的关键词为词首,对所述招聘信息表中的所有招聘信息进行短句分割,获取关键词句并构建关键词句列表;所述预设关键词表具体包括岗位描述主题词表、岗位职责动名词表和岗位要求动名词表;以所述岗位职责动名词表为约束,从所述关键词句列表中分离出岗位职责短句,并依据所述岗位职责短句的句型对所述岗位职责短句进行词组分割与组合,构建岗位职责词条;以所述岗位要求动名词表为约束,从所述关键词句列表中分离出岗位要求短句,
并依据所述岗位要求短句的句型对所述岗位要求短句进行词组分割与组合,构建岗位要求词条;依据词条修复逻辑对所述岗位职责词条和岗位要求词条进行修复,确定所述招聘信息对应的岗位词条。
[0006]进一步地,所述采集招聘信息并依据第一预设序号列表规则对所述招聘信息进行分割清洗,构建招聘信息表,具体包括:预先设置多个序号列表规则,并将每条序号列表规则依次链接,构成完整的正则表达式,获得第一预设序号列表规则;采集招聘信息,依据第一预设序号列表规则对所述招聘信息中序号格式进行识别,并依据识别出的序号先后顺序对招聘信息文本进行数据分割,将每个序号对应的招聘信息的文本模式逐句转换为正则表达式,构成招聘信息表。
[0007]进一步地,所述依据预设关键词表中的关键词为词首,对所述招聘信息表中的所有招聘信息进行短句分割,获取关键词句并构建关键词句列表,具体包括:预先定义设置岗位描述主题词表、岗位职责动名词表和岗位要求动名词表,以岗位描述主题词表中的岗位描述主题词、岗位职责动名词表中的岗位职责动名词和岗位要求动名词表中的岗位要求动名词作为短句的词首,对所述招聘信息表中的所有招聘信息进行短句分割,分别获取岗位描述短句、岗位职责短句和岗位要求短句;分别对岗位职责短句和岗位要求短句进行主题化处理,以使岗位职责短句或岗位要求短句中只包含一个岗位职责动名词或岗位要求动名词;分别遍历岗位职责短句,确定岗位职责动名词在岗位职责短句中开始和结束序号,构建岗位职责短句中前后两个关键词的开始序号组,以及遍历岗位要求短句,确定岗位要求动名词在岗位职责短句中开始和结束序号,构建岗位要求短句中前后两个关键词的开始序号和结束序号;按照预设的关键词过滤逻辑分别对岗位描述短句、岗位职责短句和岗位要求短句进行关键词过滤处理,获得招聘信息的关键语句;基于关键语句,以关键词为键,关键语句为值,通过键值对的方式构成关键语句列表。
[0008]进一步地,所述以所述岗位职责动名词表为约束,从所述关键词句列表中分离出岗位职责短句,并依据所述岗位职责短句的句型对所述岗位职责短句进行词组分割与组合,构建岗位职责词条,具体包括:依据岗位职责动名词表中的岗位职责动名词,从关键词句列表分离出岗位职责短句;遍历分离出的岗位职责短句,对岗位职责短句的句型进行判断,若岗位职责短句为标点符号句型语句,则以岗位职责短句中的岗位职责动名词为首词组,将原岗位职责短句作为一级任务词,构建出岗位职责词条;若岗位职责短句为括号句型语句,则依据括号句型语句处理逻辑构建出岗位职责词条。
[0009]进一步地,所述括号句型语句处理逻辑具体为:若岗位职责短句的句型是标准括号句型,则将首词组设置为岗位职责动名词,将
标准括号前后的词组和标准括号内的文本信息进行分离,并将标准括号前后的词组组合成一级任务词,获得一级岗位职责词组,同时将标准括号中的文本信息按照标点符号分割为二级任务词,获得二级岗位职责词组,结合一级岗位职责词组和将二级岗位职责词组构建出岗位职责词条;若岗位职责短句的句型是非标准括号句型,匹配首词组为岗位职责动名词,以第一预设关键字前面的词组为一级任务词,将第一预设关键字后面的词组按照标点符号分割为二级任务词,结合一级任务词和二级任务词。
[0010]进一步地,所述以所述岗位要求动名词表为约束,从所述关键词句列表中分离出岗位要求短句,并依据所述岗位要求短句的句型对所述岗位要求短句进行词组分割与组合,构建岗位要求词条,具体包括:依据岗位要求动名词表中的岗位要求动名词,从关键词句列表分离出岗位要求短句;遍历分离出的岗位要求短句,对岗位要求短句的句型进行判断,若岗位要求短句为标点符号句型语句,则按照岗位职责短句的标点符号句型语句处理逻辑构建出岗位要求词条;若岗位要求短句为括号句型语句,则按照岗位职责短句的括号句型语句处理逻辑构建出岗位要求词条;若岗位要求短句为双具句型语句,则依据双具句型处理逻辑构建出岗位要求词条。
[0011]进一步地,所述双具句型处理逻辑具体为:若岗位要求短句包含三个词组,则依据预设的三段词规则构建岗位要求词条;若岗位要求短句包含两个词组,则依据预设的两段词规则构建岗位要求词条。
[0012]进一步地,所述依据词条修复逻辑对所述岗位职责词条和岗位要求词条进行修复,确定所述招聘信息对应的岗位词条,具体包括:分别对所述岗位职责词条和岗位要求词条进行标点符号分析,去除所述岗位职责词条和岗位要求词条前后的无效标点符号;删除所述岗位职责词条和岗位要求词条前后的无效字符串;分别对所述岗位职责词条和岗位要求词条进行词函数补充,确定所述招聘信息对应的岗位词条。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于招聘信息的岗位词条构建方法,其特征在于,包括:采集招聘信息并依据第一预设序号列表规则对所述招聘信息进行分割清洗,构建招聘信息表;依据预设关键词表中的关键词为词首,对所述招聘信息表中的所有招聘信息进行短句分割,获取关键词句并构建关键词句列表;所述预设关键词表具体包括岗位描述主题词表、岗位职责动名词表和岗位要求动名词表;以所述岗位职责动名词表为约束,从所述关键词句列表中分离出岗位职责短句,并依据所述岗位职责短句的句型对所述岗位职责短句进行词组分割与组合,构建岗位职责词条;以所述岗位要求动名词表为约束,从所述关键词句列表中分离出岗位要求短句,并依据所述岗位要求短句的句型对所述岗位要求短句进行词组分割与组合,构建岗位要求词条;依据词条修复逻辑对所述岗位职责词条和岗位要求词条进行修复,确定所述招聘信息对应的岗位词条。2.根据权利要求1所述的基于招聘信息的岗位词条构建方法,其特征在于,所述采集招聘信息并依据第一预设序号列表规则对所述招聘信息进行分割清洗,构建招聘信息表,具体包括:预先设置多个序号列表规则,并将每条序号列表规则依次链接,构成完整的正则表达式,获得第一预设序号列表规则;采集招聘信息,依据第一预设序号列表规则对所述招聘信息中序号格式进行识别,并依据识别出的序号先后顺序对招聘信息文本进行数据分割,将每个序号对应的招聘信息的文本模式逐句转换为正则表达式,构成招聘信息表。3.根据权利要求1所述的基于招聘信息的岗位词条构建方法,其特征在于,所述依据预设关键词表中的关键词为词首,对所述招聘信息表中的所有招聘信息进行短句分割,获取关键词句并构建关键词句列表,具体包括:预先定义设置岗位描述主题词表、岗位职责动名词表和岗位要求动名词表,以岗位描述主题词表中的岗位描述主题词、岗位职责动名词表中的岗位职责动名词和岗位要求动名词表中的岗位要求动名词作为短句的词首,对所述招聘信息表中的所有招聘信息进行短句分割,分别获取岗位描述短句、岗位职责短句和岗位要求短句;分别对岗位职责短句和岗位要求短句进行主题化处理,以使岗位职责短句或岗位要求短句中只包含一个岗位职责动名词或岗位要求动名词;分别遍历岗位职责短句,确定岗位职责动名词在岗位职责短句中开始和结束序号,构建岗位职责短句中前后两个关键词的开始序号组,以及遍历岗位要求短句,确定岗位要求动名词在岗位职责短句中开始和结束序号,构建岗位要求短句中前后两个关键词的开始序号和结束序号;按照预设的关键词过滤逻辑分别对岗位描述短句、岗位职责短句和岗位要求短句进行关键词过滤处理,获得招聘信息的关键语句;基于关键语句,以关键词为键,关键语句为值,通过键值对的方式构成关键语句列表。4.根据权利要求1所述的基于招聘信息的岗位词条构建方法,其特征在于,所述以所述
岗位职责动名词表为约束,从所述关键词句列表中分离出岗位职责短句...

【专利技术属性】
技术研发人员:彭光辉陶磊
申请(专利权)人:成都国腾实业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1