【技术实现步骤摘要】
一种基于技能感知多注意力机制的招聘启事生成方法
本专利技术涉及计算机应用技术。
技术介绍
人力资源管理是通过对组织内外相关人力资源进行有效运用,满足组织当前及未来发展的需要,保证组织目标实现与成员发展的最大化的一系列活动的总称。其重要性对于个人发展,企业发展乃至社会的发展都不言而喻。随着互联网线上招聘的发展和招聘数据的累积,智能化的人力资源管理越来越被重视和关注。智能化人力资源管理通过对大数据的分析和建模来辅助人力资源管理并提高其效率和质量。近年来,国内外已有很多工作针对智能化人力资源管理开展了相关研究,并且取得了一定的研究成果。LeeandBrusilovsky[1]基于招聘者和候选者的偏好设计了一个工作推荐系统。Qin等人[2]提出了一个个性化的问题推荐系统服务于工作面试环节。Sun等人[3]研究了任何组织的相容性。Xu等人[4]提出了一个数据驱动的方法来建模技能的流行度。同时,一些公司也开发了增强写作的工具:Textio,TapRecruit等等来辅助写作润色草稿。本专利技术专利也从辅助招聘广告的写作角度出发,创新性的提出智能化的段落生成。在机器学习中,生成任务的发展日渐成熟。生成任务大多被建模成序列到序列的学习问题。Lopyrev[5]通过训练一个具有注意力机制的序列到序列的模型解决了标题生成任务。Xing等人[6]在序列到序列模型中引入了话题信息解决了连天机器人对话生成任务。Meng等人[7]在序列到序列模型应用了复制机制解决了关键字抽取问题。近年来,随着实际任务的复杂化,层级的序列到序列模 ...
【技术保护点】
1.一种基于技能感知多注意力机制的招聘启事生成方法,其特征是包括以下步骤:/n步骤1,获得工作任务详情、基本信息数据,基本信息包括发布公司规模信息和工作职位信息和技能需求段落,其中,工作任务和技能需求首先分别被分词工具拆分为词序列,并将每个词初始化为词向量的形式作为词的浅层语义表示;利用全局的招聘启事数据构建知识图谱;输入经过分词处理后的工作任务详情(局部信息),使用词向量的方法初始化每个词的浅层语义表示;同时输入知识图谱(全局信息)和对应基本信息;/n步骤2,基于步骤1中局部信息的输出,学习工作任务详情中每个词的高层语义表示:/n根据步骤1中输出的局部信息的每个词的词向量,利用双向的长短时记忆网络以序列的方式对工作任务的词进行高层语义编码;/n步骤3,基于步骤2中的输出,生成技能词序列;/n步骤4,基于步骤3的输出,初步生成文本词序列;/n步骤5,基于步骤1中全局信息部分和步骤4中的输出,进一步优化文本词序列中的技能词。/n
【技术特征摘要】
1.一种基于技能感知多注意力机制的招聘启事生成方法,其特征是包括以下步骤:
步骤1,获得工作任务详情、基本信息数据,基本信息包括发布公司规模信息和工作职位信息和技能需求段落,其中,工作任务和技能需求首先分别被分词工具拆分为词序列,并将每个词初始化为词向量的形式作为词的浅层语义表示;利用全局的招聘启事数据构建知识图谱;输入经过分词处理后的工作任务详情(局部信息),使用词向量的方法初始化每个词的浅层语义表示;同时输入知识图谱(全局信息)和对应基本信息;
步骤2,基于步骤1中局部信息的输出,学习工作任务详情中每个词的高层语义表示:
根据步骤1中输出的局部信息的每个词的词向量,利用双向的长短时记忆网络以序列的方式对工作任务的词进行高层语义编码;
步骤3,基于步骤2中的输出,生成技能词序列;
步骤4,基于步骤3的输出,初步生成文本词序列;
步骤5,基于步骤1中全局信息部分和步骤4中的输出,进一步优化文本词序列中的技能词。
2.根据权利要求1所述的基于技能感知多注意力机制的招聘启事生成方法,其特征是:步骤1中,利用全局的招聘启事数据构建知识图谱包括以下步骤:首先,利用命名实体识别工具将技能需求段落中的技能抽取出来得到对应的技能序列,然后根据招聘启事中的语义信息构成知识图谱。
3.根据权利要求1所述的基于技能感知多注意力机制的招聘启事生成方法,其特征是:步骤3中,包含三个步骤:(1)根据步骤2中输出的工作任务的语义表示,基于工作任务与技能词的映射关系利用注意力机制计算工作任务中每个词的注意力权重,并基于该权重对工作任务中词语的语义表示进行加权求和;(2)利用长短时记忆网络基于加权的工作任务语义表示解码出第一个技能词隐层语义表示,并根据语义表示在技能词表中得到技能词概率分布,概率最大的为预测的技能词并初始化为技能词向量;(3)继续利用长短时记忆网络基于加权的工作任务语义表示和前一个解码出的技能词向量,解码出下一个技能词隐层语义表示;最终,得到技能词向量序列作为预测技能的语义表示。
4.根据权利要求1所述的基于技能感知多注意力机制的招聘启事生成方法,其特征是:步骤4中,包含四个步骤:(1)根据步骤2中输出的工作任务的语义表示,基于工作任务与技能需求文本词的映射关系利用注意力机制计算工作任务中每个词的注意力权重,并基于该权重对工作任务中词语的语义表示进行加权求和;(2)根据步骤3中输出的技能词的语义表示,基于预测的技能词与技能需求文本词的映射关系再次利用注意力机制联合训练,计算预测技能词中每个词的注意力权重,并基于该权重对预测技能中词语的语义表示进行加权求和;(3)对工作任务的注意力语义表示和预测技能的注意力语义表示进行拼接得到整体语义表示,基于整体语义表示在文本词表中得到词概率分布,概率最大的预测为第一个技能需求文本词并初始化为文本词向量;(4)继续利用长短时记忆网络基于拼接后的整体语义表示和前一个预测的文本词向量,逐步解码出下一个文本词的隐层语义表示。基于此,在文本词表中得到词概率分布。
5.根据权利要求1所述的基于技能感知多注意力机制的招聘启事生成方法,其特征是:步骤5中,包含四个步骤:(1)基于知识图谱和对应的基本信息,在知识图谱中根据先验知识查找得到推荐的技能词,并对知识图谱技能词初始化为向量形式;(2)基于知识图谱技能词与技能需求文本词的映射关系,再次利用注意力机制联合步骤4中的注意力机制共同训练,计算知识图谱技能词中每个词的注意力权重,并基于该权重对知识图谱技能词的语义表示进行加权选择;(3)基于知识图谱技能词的注意力语义表示,逐一地在技能词表中得到词概率分布;(4)将基于知识图谱先验知识得到的技能词概率分布对应的与步骤4中得到的词概率分布进行加权和,加权和概率最大的预测为文本词;最终,生成技能需求文本。
6.根据权利要求1所述的基于技能感知多注意力机制的招聘启事生成方法,其特征是:步骤2中,基于工作任务的词向量,使用双向的长短时记忆网络对词的高层语义表示进行编码:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。