System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能的薪酬查询模型构建方法及装置制造方法及图纸_技高网

一种基于人工智能的薪酬查询模型构建方法及装置制造方法及图纸

技术编号:40172771 阅读:5 留言:0更新日期:2024-01-26 23:42
本发明专利技术涉及语言模型领域,揭露了一种基于人工智能的薪酬查询模型构建方法、装置、电子设备及存储介质,其中,所述方法包括:获取待识别文本,基于待识别文本获取特征词集,从所述特征词集中依次提取目标特征词,基于目标特征词构建特征词网络,利用特征词网络、权重整合公式及注意力加权算法获取目标特征词的优化特征值,筛选目标特征词,得到特征词矩阵,获取多个单位薪酬集的描述特征词,计算特征词矩阵及描述特征词的文本相似度,基于文本相似度获取薪酬查询结果,并完成基于人工智能的薪酬查询模型构建及薪酬查询。本发明专利技术主要目的为通过提高待识别文本中的特征词识别精确度和优化薪酬数据集来优化的薪酬查询方法并提高查询薪酬时的响应速度。

【技术实现步骤摘要】

本专利技术涉及一种基于人工智能的薪酬查询模型构建方法、装置、设备及介质,属于语言模型领域。


技术介绍

1、为了对不同城市、不同学历及不同工作经验的薪酬进行查询,常使用利用选项卡进行数据筛选,并将筛选后查询结果用表格及文字呈现出来,且构建薪酬数据库时需要将大量的样本数据输入至薪酬数据库,在进行薪酬查询时挨个输出薪酬数据时响应速度较慢,故构建能够简化查询方法的薪酬查询模型并优化薪酬数据库中的数据存储方式以提高响应速度尤为重要。

2、目前进行薪酬查询时,将会在查询窗口设置多个选项卡,当查询者需要查询薪酬时,从选项卡中选出目标工种、目标工龄、目标学历及目标城市后,薪酬数据库中数据将会根据所述目标工种、目标工龄、目标学历及目标城市被调用,并将目标工种、目标工龄、目标学历及目标城市所包括的薪酬数据以图标形式输出至查询窗口。

3、虽然上述方法能够实现薪酬查询,但是在进行薪酬查询时,选项卡有很多,查询者从多个选项卡中进行选择十分麻烦,同时,随着语言模型的发展,需要构建基于语言模型的人工智能薪酬查询方法以优化查询流程,而使用现有的非专用薪资查询的语言模型在进行薪资查询时,常出现查询不准确的情况,在传统的薪酬查询过程中,薪酬数据库将会根据所述目标工种、目标工龄、目标学历及目标城市一项一项调用薪酬数据,并最终汇成图标形式发送至查询窗口,这种逐项调用的方式使得薪酬查询的响应速度有待提升。


技术实现思路

1、本专利技术提供一种基于人工智能的薪酬查询模型构建方法、装置、电子设备及存储介质,其主要目的在于通过提高待识别文本中的特征词识别精确度和优化薪酬数据集来优化的薪酬查询方法并提高查询薪酬时的响应速度。

2、为实现上述目的,本专利技术提供的一种基于人工智能的薪酬查询模型构建方法,包括:

3、获取待识别文本,利用预构建的文本划分方法将所述待识别文本划分成多个待识别句,从所述多个待识别句中依次提取待识别句,并对所提取的待识别句均执行如下操作:

4、利用预构建的句法筛选器筛选所提取的待识别句,得到特征词集,从所述特征词集中依次提取目标特征词,并对所提取的每一个目标特征词均执行如下操作:

5、基于所提取的目标特征词及特征词集构建特征词网络,利用特征词网络及预构建的特征词权重计算公式计算所提取的目标特征词的语义权重,利用预构建的逆文档频率权重值计算公式计算所提取的目标特征词在待识别文本中的逆文本权重,利用预构建的权重整合公式、逆文本权重及语义权重获取目标特征词的次优特征值,利用预构建的注意力加权算法及预构建的薪酬模型词典调整目标特征词的次优特征值,得到优化特征值;

6、利用目标特征词的优化特征值对特征词集中的每一个目标特征词进行降序排列,得到降序特征词集,剔除降序特征词集中优化特征值小于预设优化特征值阈值的目标特征词,得到目标降序词集,其中,所述目标降序词集中包括多个降序特征词,利用预构建的特征检验方法确认所述目标降序词集中的目标特征词满足预构建的薪酬查询模版后,基于目标降序词集构建待识别文本对应的特征词矩阵;

7、利用预构建的薪酬数据库及薪酬模型词典构建薪酬集,基于所述薪酬集获取多个单位薪酬集,基于所述多个单位薪酬集获取所述多个单位薪酬集中每一个单位薪酬集的描述特征词,基于多个描述特征词获取描述特征词集;

8、从描述特征词集中依次提取描述特征词,利用预构建的文本相似度计算公式、特征词矩阵及描述特征词计算待识别文本与描述特征词的文本相似度,得到多个文本相似度;

9、从所述多个文本相似度中提取最大的文本相似度对应的一个或多个单位薪酬集,将所述一个或多个单位薪酬集转化为预设的输出形式,得到薪酬查询结果,将所述薪酬查询结果发送至预构建的对话窗口后,完成基于人工智能的薪酬查询模型构建及薪酬查询。

10、可选地,所述基于所提取的目标特征词及特征词集构建特征词网络,包括:

11、基于特征词集及目标特征词获取第一特征词集;

12、利用目标特征词及第一特征词集获取一个或多个特征词组,其中,一个或多个特征词组的数量与第一特征词集中特征词的数量相同;

13、从所述一个或多个特征词组中依次提取特征词组,其中,所述特征词组包括目标特征词及待定特征词,并利用预构建的语义联系方法评估特征词组后,得到特征词组的简单依存关系,剔除特征词集中的目标特征词,得到第二特征词集,并以第二特征词集为特征词集并返回所述从所述特征词集中依次提取目标特征词的步骤;

14、基于一个或多个特征词组及特征词组对应的简单依存关系构建特征词网络。

15、可选地,所述基于一个或多个特征词组及特征词组对应的简单依存关系构建特征词网络,包括:

16、基于一个或多个特征词组及特征词组对应的简单依存关系获取目标特征词的有向边,得到目标特征词的单位有向网络,其中,所述目标特征词的有向边为0个、1个或多个;

17、汇总多个单位有向网络,得到单位有向网络集,基于单位有向网络集构建特征词网络。

18、可选地,所述利用特征词网络及预构建的特征词权重计算公式计算所提取的目标特征词的语义权重,包括:

19、利用特征词网络及特征词权重计算公式计算所提取的目标特征词的迭代语义权重,其中,所述特征词权重计算公式为:

20、

21、其中,p(pi)表示目标特征词的迭代语义权重,pi表示特征词集中的目标特征词,d表示阻尼系数,n表示特征词集中的目标特征词的个数,m(pi)表示特征词集,ωji表示目标特征词及待定特征词之间的有向边基于目标特征词的权重,q(pj)表示在单位有向网络中目标特征词通过有向边能够到达的其他目标特征词的集合,ωjh表示目标特征词通过有向边能够到达的其他目标特征词与目标特征词之间的权重;

22、基于所述迭代语义权重及特征词权重计算公式获取目标特征词的语义权重。

23、可选地,所述利用预构建的特征检验方法确认所述目标降序词集中的目标特征词满足预构建的薪酬查询模版后,包括:

24、从所述薪酬查询模版中获取多个待填关键词,从所述多个待填关键词中依次提取待填关键词,并基于所提取的待填关键词构建待填集,得到多个待填集,其中,所述多个待填集分别为:城市集、学历集、工龄集及工种集,且所述多个待填集中的每一个待填集的初始状态均为空集;

25、从所述目标降序词集中依次提取目标特征词,利用预构建的文本分类器及多个待填集对所提取的目标特征词进行分类,若所述多个待填集中存在所提取的目标特征词所属类别,则将所提取的目标特征词输入至所提取的目标特征词所属类别对应的待填集,否则,则跳过所提取的目标特征词;

26、从所述多个待填集中依次提取待填集,并判断所提取的待填集是否为空集,若所提取的待填集为空集,则提示待填关键词缺失,否则,确认所提取的待填集已填写;

27、确认所述多个待填集中的每一个待填集均已填写后,确认所述目标降序词集中本文档来自技高网...

【技术保护点】

1.一种基于人工智能的薪酬查询模型构建方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述基于所提取的目标特征词及特征词集构建特征词网络,包括:

3.如权利要求2所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述基于一个或多个特征词组及特征词组对应的简单依存关系构建特征词网络,包括:

4.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述利用特征词网络及预构建的特征词权重计算公式计算所提取的目标特征词的语义权重,包括:

5.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述利用预构建的特征检验方法确认所述目标降序词集中的目标特征词满足预构建的薪酬查询模版后,包括:

6.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述利用预构建的薪酬数据库及薪酬模型词典构建薪酬集,基于所述薪酬集获取多个单位薪酬集,包括:

7.如权利要求1至6中任意一项所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述文本相似度计算公式为:

8.一种基于人工智能的薪酬查询模型构建装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于人工智能的薪酬查询模型构建方法。

...

【技术特征摘要】

1.一种基于人工智能的薪酬查询模型构建方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述基于所提取的目标特征词及特征词集构建特征词网络,包括:

3.如权利要求2所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述基于一个或多个特征词组及特征词组对应的简单依存关系构建特征词网络,包括:

4.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述利用特征词网络及预构建的特征词权重计算公式计算所提取的目标特征词的语义权重,包括:

5.如权利要求1所述的基于人工智能的薪酬查询模型构建方法,其特征在于,所述利用预构建的特征检验方法确认所述目标降序...

【专利技术属性】
技术研发人员:张海东童昌泰曾辉
申请(专利权)人:深圳市一览网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1