一种基于统计推理的薪资预测方法及设备技术

技术编号:38564020 阅读:36 留言:0更新日期:2023-08-22 21:03
本申请的目的是提供一种基于统计推理的薪资预测方法及设备,本申请通过从招聘网站获取与职位相关的信息,以构建第一数据集;对第一数据集中的各职位信息中的加权薪资进行修正,得到第二数据集;对第二数据集中的各职位信息的字段依序分别进行字段映射和字段分组,得到第三数据集;基于第三数据集对所在城市、工作年限、教育程序、行业分类及职位类型的字段的组合,统计对应薪资区间内的薪资分布,以构建薪资统计表;根据输入的目标字段的取值和薪资统计表,采用降维递归推理的方式进行薪资预测,得到与目标字段对应的预测薪资,实现通过统计推理的方式,达到准确的薪资预测效果。达到准确的薪资预测效果。达到准确的薪资预测效果。

【技术实现步骤摘要】
一种基于统计推理的薪资预测方法及设备


[0001]本申请涉及计算机
,尤其涉及一种基于统计推理的薪资预测方法及设备。

技术介绍

[0002]在信贷领域,申请人的薪资是很重要的一个信息。它会影响是否通过授信,通过以后的评级,初始额度,以及未来的额度提升。因此需要找一个合理的方法来确定申请人的薪资范围。
[0003]自填法、社保公积金法以及招聘数据统计法是常用的薪资预估方法,但,自填法会高估薪资,申请人有一定的动机去填写一个比较高的数字以提高通过率,导致高估的薪资增加金融机构的信用风险;社保公积金法覆盖范围有限,不是所有申请人都能提供社保和公积金信息,且容易低估,缴纳的费用有一个上限,低估的薪资使得金融机构拒绝掉优质客户,从而增加营销成本,也减少利润;招聘数据统计法采用简单平均把薪资范围变成薪资时,容易高估,并且人工对字段分组没有充分利用数据的特点,难以有效处理真实数据里的缺失情况。

技术实现思路

[0004]本申请的一个目的是提供一种基于统计推理的薪资预测方法及设备,实现对获取的数据集采用统计修正的方式得到对应的合理本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于统计推理的薪资预测方法,其中,所述方法包括:从招聘网站获取与职位相关的信息,以构建第一数据集,所述第一数据集包括至少两个职位信息,其中,所述职位信息包括六个字段和加权薪资,所述六个字段分别为所在城市、工作年限、教育程序、行业分类、职位类型和薪资区间;对所述第一数据集中的各所述职位信息中的加权薪资进行修正,得到第二数据集;对所述第二数据集中的各所述职位信息的字段依序分别进行字段映射和字段分组,得到第三数据集;基于所述第三数据集对所述所在城市、所述工作年限、所述教育程序、所述行业分类及所述职位类型的字段的组合,统计对应薪资区间内的薪资分布,以构建薪资统计表;根据输入的目标字段的取值和所述薪资统计表,采用降维递归推理的方式进行薪资预测,得到与所述目标字段对应的预测薪资。2.根据权利要求1所述的方法,其中,所述对所述第一数据集中的各所述职位信息中的加权薪资进行修正,得到第二数据集,包括:对所述第一数据集中的各所述职位信息中的加权薪资在所述薪资区间中的不同分位数进行统计;基于各所述职位信息中不同分位数在薪资区间对应的分位数薪资,计算每个所述职位信息对应的修正权重;基于各所述职位信息的薪资区间中的最低薪资、最高薪资和对应的所述修正权重,对各所述职位信息中的加权薪资进行修正替换,得到各所述职位信息中的修正薪资,以得到第二数据集。3.根据权利要求2所述的方法,其中,所述对所述第二数据集中的各所述职位信息的字段依序分别进行字段映射和字段分组,得到第三数据集,包括:对所述第二数据集中各所述职位信息的字段进行实际业务与所述招聘网站之间的取值映射,得到与所述实际业务对应的映射数据集;根据所述映射数据集中各职位信息的字段对应的映射后的取值,对各所述职位信息的字段进行字段分组,得到第三数据集。4.根据权利要求3所述的方法,其中,所述根据所述映射数据集中各职位信息的字段对应的映射后的取值,对各所述职位信息的字段进行字段分组,得到第三数据集,包括:对所述映射数据集中的各所述职位信息中的每个字段分别进行如下操作,以得到字段分组后对应的第三数据集:针对字段的每个映射后的取值v,计算修正薪资在所述薪资区间中的不同分位数对应的值,以构成每个映射后的取值v对应的一个多维特征的行向量V

;将字段的每个映射后的取值v对应的行向量V

合并...

【专利技术属性】
技术研发人员:向桥梁张俊龙
申请(专利权)人:连通杭州技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1