当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种类双塔模型的多特征交互网络招聘文本分类方法技术

技术编号:29930143 阅读:26 留言:0更新日期:2021-09-04 18:56
本发明专利技术涉及一种类双塔模型的多特征交互网络招聘文本分类方法,将招聘样本文本进行预处理,并处理成具有映射关系的稀疏特征文本和稠密特征文本;再通过预训练语言模型和one

【技术实现步骤摘要】
一种类双塔模型的多特征交互网络招聘文本分类方法


[0001]本专利技术涉及一种类双塔模型的多特征交互网络招聘文本分类方法,属于自然语言文本处理


技术介绍

[0002]网上在线招聘和投递简历逐渐成为企业招聘人才和年轻人求职就业的主要途径。透过网络招聘文本可以了解某个行业对当下乃至未来该领域人才技能的需求,从而更好地为高校制定符合企业需求的专项人才培养计划,缓解毕业生就业难的压力,同时也可以为该领域企业一定程度上提供未来招聘人才的方向,推动企业发展。
[0003]各行各业让人目不暇接的职业种类,以及网络招聘文本数据量大,更新快的特点使得人工分类显得极其不方便,对网络招聘文本实现自动分类从而方便后续分析的需求与日俱增。而传统的文本分类模型过分依赖于模型内分类器性能的好坏,而分类器性能又很大程度上取决于设计该分类器的专家所拥有的知识丰富程度。因此,模型表现出来的性能往往受人为因素影响较大。

技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种类双塔模型的多特征交互网络招聘文本分类方法,基于招聘文本对应稀疏特本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于:执行如下步骤I至步骤VI,获得招聘文本分类概率模型,以及执行如下步骤A至步骤B,实现对目标招聘文本的分类;步骤I. 收集各条招聘样本文本,并确定各招聘样本文本分别对应预设各招聘分类类别中的真实分类类别,并分别针对各条招聘样本文本,按预设各稠密属性与预设各稀疏属性,将招聘样本文本划分为稀疏特征文本和稠密特征文本,进而获得各条招聘样本文本分别所对应的稀疏特征文本和稠密特征文本,然后进入步骤II;步骤II. 分别针对各条招聘样本文本,获得其稀疏特征文本所对应的字向量序列,以及获得其稠密特征文本所对应的one

hot向量序列,进而获得各条招聘样本文本分别所对应的字向量序列与one

hot向量序列,然后进入步骤III;步骤III. 基于对应字向量序列的预设第一特征提取模型、对应one

hot向量序列的预设第二特征提取模型、各特征提取模型分别对应的特征自交互模型、以及两特征提取模型之间的全局特征交互模型,以预设第一特征提取模型输入端、预设第二特征提取模型输入端为输入,预设第一特征提取模型输出端、预设第二特征提取模型输出端、以及各特征自交互模型输出端对接特征融合层的输入端,特征融合层的输出端依次串联注意力层、softmax层,构建文本分类初始概率模型,然后进入步骤VI;步骤VI. 以各招聘样本文本分别所对应的字向量序列与one

hot向量序列为输入,各招聘样本文本分别对应预设各招聘分类类别的概率为输出,结合各招聘样本文本分别对应预设各招聘分类类别中的真实分类类别,针对文本分类初始概率模型进行训练,获得招聘文本分类概率模型;步骤A. 按步骤I至步骤II,获得目标招聘文本所对应的字向量序列与one

hot向量序列,然后进入步骤B;步骤B. 应用招聘文本分类概率模型,针对目标招聘文本所对应的字向量序列与one

hot向量序列进行处理,获得目标文本对象分别对应预设各招聘分类类别的概率,并选择其中最大概率所对应的分类类别,作为目标文本对象所对应的分类类别,实现对目标招聘文本的分类。2.根据权利要求1所述一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于:所述步骤I包括如下步骤I1至步骤I3;步骤I1. 收集各个招聘样本文本,并确定各文本样本对象分别对应预设各招聘分类类别中的真实分类类别,然后进入步骤I2;步骤I2. 删除各招聘样本文本中各预设无意义类型的词,更新各个招聘样本文本,然后进入步骤I3;步骤I3. 分别针对各条招聘样本文本,按预设各稠密属性与预设各稀疏属性,将招聘样本文本划分为稀疏特征文本和稠密特征文本,进而获得各条招聘样本文本分别所对应的稀疏特征文本和稠密特征文本,然后进入步骤II。3.根据权利要求1所述一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于:所述步骤II中,分别针对各条招聘样本文本,按如下步骤II

I

I1至步骤II

I

I2,获得其稀疏特征文本所对应的字向量序列;步骤II

I

I1.针对招聘样本文本的稀疏特征文本,应用预训练语言模型,获得该稀疏
特征文本中各个字分别所对应的字向量,然后进入步骤II

I

I2;步骤II

I

I2.由该稀疏特征文本中各个字分别所对应的字向量,组成该稀疏特征文本所对应的字向量序列。4.根据权利要求1所述一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于: 所述步骤II中,分别针对各条招聘样本文本,按如下步骤II

I

II1至步骤II

I

II3,获得其稀疏特征文本所对应的字向量序列;步骤II

I

II1. 针对招聘样本文本的稀疏特征文本执行分词处理,并按预设连词库删除其中的连词,获得该稀疏特征文本中的各个稀疏特征分词,然后进入步骤II

I

II2;步骤II

I

II2. 分别针对该稀疏特征文本中的各个稀疏特征分词,应用word2vec算法,获得稀疏特征分词所对应的字向量,然后进入步骤II

I

II3;步骤II

I

II3. 由该稀疏特征文本中各稀疏特征分词分别所对应的字向量,组成该稀疏特征文本所对应的字向量序列。5.根据权利要求1所述一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于:所述步骤II中,分别针对各条招聘样本文本,按如下步骤II

II

1至步骤II

II

3,获得其稠密特征文本所对应的one

hot向量序列;步骤II

II

1. 针对招聘样本文本的稠密特征文本执行分词处理,并按预设词表删除其中的相应字符,获得该稠密特征文本中的各个稠密特征分词,然后进入步骤II

II

2;步骤II

II

2. 选择该稠密特征文本中的各个非重复稠密特征分词,并按各非重复稠密特征分词分别在该稠密特征文本中第一次出现的位置,针对该各个非重复稠密特征分词进行排序,然后进入步骤II

II

3;步骤II

II

3. 获得各个非重复稠密特征分词分别所对应的向量,并结合各非重复稠密特征分词的排序,构成该稠密特征文本所对应的one

hot向量序列。6.根据权利要求1所述一种类双塔模型的多特征交互网络招聘文本分类方法,其特征在于:所述步骤...

【专利技术属性】
技术研发人员:高尚兵张骏强李文婷相林陈浩霖于永涛周君朱全银张正伟汪长春蔡创新郝明阳胡序洋李少凡
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1