一种养老保险数据挖掘方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37169386 阅读:17 留言:0更新日期:2023-04-20 22:41
本发明专利技术公开了一种养老保险数据挖掘方法、装置、存储介质及电子设备,获取预设养老保险数据集、预设参保人员信息数据集和参保单位信息数据集;基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集;基于所述预设养老保险数据集,经过数据分析与校验,得到养老保险疑点数据集;基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型;基于每个所述养老保险参保模型确定每个参保人员的养老保险参保状态。通过实施本发明专利技术,能快速准确分析并获取人员养老保险的参保缴费情况,为提出合理化建议,完善养老保险制度提供数据支持和科学依据。据。据。

【技术实现步骤摘要】
一种养老保险数据挖掘方法、装置、存储介质及电子设备


[0001]本专利技术涉及计算机
,具体涉及一种养老保险数据挖掘方法、装置、存储介质及电子设备。

技术介绍

[0002]社会保险制度包括基本养老保险、失业保险、基本医疗保险、工伤保险及生育保险五个保障项目,其中基本养老保险是社会保障体系中的一项基本保障项目。目前,养老保险仍然存问题。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了涉及一种养老保险数据挖掘方法、装置、存储介质及电子设备,以解决现有技术中参保覆盖率低、养老政策落实率低、养老保险参保缴费监管力度不够、异常参保缴费人员较多等技术问题。
[0004]本专利技术提出的技术方案如下:
[0005]第一方面,本专利技术实施例提供一种养老保险数据挖掘方法,该养老保险数据挖掘方法包括:获取预设养老保险数据集、预设参保人员信息数据集和参保单位信息数据集;基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集;基于所述预设养老保险数据集,经过数据分析与校验,得到养老保险疑点数据集;基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型;基于每个所述养老保险参保模型确定每个参保人员的养老保险参保状态。
[0006]结合第一方面,在第一方面的一种可能的实现方式中,获取预设养老保险数据集,包括:确定养老保险数据源;基于所述养老保险数据源获取第一养老保险数据集;基于所述第一养老保险数据集,经过预设数据处理方法,得到所述预设养老保险数据集。
[0007]结合第一方面,在第一方面的另一种可能的实现方式中,基于所述第一养老保险数据集,经过预设数据处理方法,得到所述预设养老保险数据集,包括:基于所述第一养老保险数据集,经过数据基础治理和数据内容治理,得到第二养老保险数据集;基于所述第二养老保险数据集,经过数据探索方法处理,得到所述预设养老保险数据集。
[0008]结合第一方面,在第一方面的又一种可能的实现方式中,基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集,包括:基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程处理,得到第一特征数据集;对所述第一特征数据集中包含的定类变量进行哑变量处理,得到第二特征数据集;基于所述第二特征数据集,经过基于相关系数的特征选择方法处理,得到所述目标特征数据集。
[0009]结合第一方面,在第一方面的又一种可能的实现方式中,基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型之后,所述方法还包括:基
于每个所述养老保险参保模型,经过随机森林算法处理,得到模型特征重要性;基于所述模型特征重要性,经过差异性分析,得到参保人员对应的参保地的参保情况。
[0010]结合第一方面,在第一方面的又一种可能的实现方式中,基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型之后,所述方法还包括:基于每个所述养老保险参保模型,预测参保人员的未来参保情况。
[0011]第二方面,本专利技术实施例提供一种养老保险数据挖掘装置,该养老保险数据挖掘装置包括:获取模块,用于获取预设养老保险数据集、预设参保人员信息数据集和参保单位信息数据集;处理模块,用于基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集;分析与校验模块,用于基于所述预设养老保险数据集,经过数据分析与校验,得到养老保险疑点数据集;建立模块,用于基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型;确定模块,用于基于每个所述养老保险参保模型确定每个参保人员的养老保险参保状态。
[0012]结合第二方面,在第二方面的一种可能的实现方式中,所述获取模块,包括:确定子模块,用于确定养老保险数据源;获取子模块,用于基于所述养老保险数据源获取第一养老保险数据集;第一处理子模块,用于基于所述第一养老保险数据集,经过预设数据处理方法,得到所述预设养老保险数据集。
[0013]第三方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本专利技术实施例第一方面及第一方面任一项所述的养老保险数据挖掘方法。
[0014]第四方面,本专利技术实施例提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本专利技术实施例第一方面及第一方面任一项所述的养老保险数据挖掘方法。
[0015]本专利技术提供的技术方案,具有如下效果:
[0016]本专利技术实施例提供的养老保险数据挖掘方法,基于数据分析与校验对养老保险的疑点人群进行了探查,得到养老保险疑点数据集;使用特征工程和特征选择技术进行特征处理,得到目标特征数据集,并结合养老保险疑点数据集,建立对应的养老保险参保模型来获取每个参保人员的养老保险参保情况,同时确定了影响参保人员参保情况的众多因素。因此,通过实施本专利技术,能快速准确分析并获取人员参保缴费情况,提出合理化建议,完善养老保险制度提供数据支持和科学依据。
附图说明
[0017]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是根据本专利技术实施例提供的一种养老保险数据挖掘方法的一流程图;
[0019]图2是根据本专利技术实施例提供的基于相关系数的特征选择结果示意图;
[0020]图3是根据本专利技术实施例提供的基于随机森林算法的特征选择结果示意图;
[0021]图4是根据本专利技术实施例提供的一种养老保险数据挖掘方法的另一流程图;
[0022]图5是根据本专利技术实施例提供的养老保险参保模型建立流程图;
[0023]图6是根据本专利技术实施例提供的一种养老保险数据挖掘装置的结构框图;
[0024]图7是根据本专利技术实施例提供的计算机可读存储介质的结构示意图;
[0025]图8是根据本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0026]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]本专利技术实施例提供一种养老保险数据挖掘方法,如图1所示,该方法包括如下步骤:
[0028]步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种养老保险数据挖掘方法,其特征在于,所述方法包括:获取预设养老保险数据集、预设参保人员信息数据集和参保单位信息数据集;基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集;基于所述预设养老保险数据集,经过数据分析与校验,得到养老保险疑点数据集;基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型;基于每个所述养老保险参保模型确定每个参保人员的养老保险参保状态。2.根据权利要求1所述的方法,其特征在于,获取预设养老保险数据集,包括:确定养老保险数据源;基于所述养老保险数据源获取第一养老保险数据集;基于所述第一养老保险数据集,经过预设数据处理方法,得到所述预设养老保险数据集。3.根据权利要求2所述的方法,其特征在于,基于所述第一养老保险数据集,经过预设数据处理方法,得到所述预设养老保险数据集,包括:基于所述第一养老保险数据集,经过数据基础治理和数据内容治理,得到第二养老保险数据集;基于所述第二养老保险数据集,经过数据探索方法处理,得到所述预设养老保险数据集。4.根据权利要求1所述的方法,其特征在于,基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程和特征选择技术进行特征处理,得到目标特征数据集,包括:基于所述预设参保人员信息数据集和所述参保单位信息数据集,经过特征工程处理,得到第一特征数据集;对所述第一特征数据集中包含的定类变量进行哑变量处理,得到第二特征数据集;基于所述第二特征数据集,经过基于相关系数的特征选择方法处理,得到所述目标特征数据集。5.根据权利要求1所述的方法,其特征在于,基于所述目标特征数据集和所述养老保险疑点数据集,建立至少一个养老保险参保模型之后,所述方法还包括:基于每个所述养老保险参保...

【专利技术属性】
技术研发人员:秦祉霈路兴郭曼刘杰
申请(专利权)人:北京易华录信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1