一种可认证状态的分类预测模型构建方法和系统技术方案

技术编号:33462472 阅读:17 留言:0更新日期:2022-05-19 00:42
本发明专利技术提出了一种可认证状态的分类预测模型构建方法和系统,该方法包括获取弱行为数据,并对获取的所述弱行为数据进行异常值处理和缺失值处理;弱行为数据为无法明确行为发生人是否为本人,无法判断人生存状态的与养老保险待遇资格认证相关的数据;选取分类预测模型的标签,使用距离当前时间最近一段时间的弱行为数据提取行为特征,通过分析数据特征与标签的关联系数以及数据特征分布统计完成特征提取;在特征提取后,对分类预测模型进行训练。基于该方法,还提出了一种可认证状态的分类预测模型构建系统。本发明专利技术适用于关键行为无法覆盖,且存在多种弱生存判定行为依据的情况,通过采用弱行为数据作为关键行为分析认证的补充,扩大可认证比例。扩大可认证比例。扩大可认证比例。

【技术实现步骤摘要】
一种可认证状态的分类预测模型构建方法和系统


[0001]本专利技术属于分类预测模型构建
,特别涉及一种可认证状态的分类预测模型构建方法和系统。

技术介绍

[0002]在离退休人员主要通过社会化方式进行管理后,社保部门很难管理到离退休人员的健康以及生存状况,离退休人员死亡后,也很难及时对其进行终止处理。为了防止冒领养老金,确保基金运行安全,进而保障全体参保缴费人员的根本利益,全国各地逐步建立起离退休人员养老金资格定期认证制度,领取社保待遇人员需及时参加资格认证,在规定时间内未参加认证人员,其社保待遇将暂停发放,待认证通过后恢复发放并补发。根据年龄的不同,一般每年认证1

2次。
[0003]在根据关键行为数据进行认证时,可以采用大数据认证的方法,其中关键行为数据是指有明确生存死亡判定依据的行为数据。但是在认证时,会出现大量的弱行为数据;其中弱行为数据是指无法明确行为发生人是否为本人,无法通过该数据判断人的生存状态的数据。由于关键行为数据发生较少,无法覆盖全部人员,单单依靠关键行为模型无法对系统中全部人员的进行认证。同时,系统中存在海量的弱行为数据,比如社保卡消费、大病结算、公交卡出行等行为,这些行为覆盖人群范围广,数据量大。基于弱行为数据如何进行社保认证是亟待解决的技术问题。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提出了一种可认证状态的分类预测模型构建方法和系统。适用于关键行为无法覆盖,且存在多种弱生存判定行为依据的情况,通过采用弱行为数据作为关键行为分析认证的补充,扩大可认证比例。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]一种可认证状态的分类预测模型构建方法,包括以下步骤:
[0007]获取弱行为数据,并对获取的所述弱行为数据进行异常值处理和缺失值处理;所述弱行为数据为无法明确行为发生人是否为本人,无法判断人生存状态的与养老保险待遇资格认证相关的数据;
[0008]选取所述分类预测模型的标签,所述标签包括人员生存认证标签和人员死亡认证标签;
[0009]使用距离当前时间最近一段时间的弱行为数据提取行为特征,在所述分类预测模型迭代的过程中加入人员的基础属性作为数据特征;通过分析数据特征与所述标签的关联系数以及数据特征分布统计完成特征提取;
[0010]在特征提取完成之后,对分类预测模型进行训练,并将所述模型训练的结果进行对比分析。
[0011]进一步的,所述异常值处理的方式包括可视化、统计分析和正态分布。
[0012]进一步的,所述缺失值处理的方式包括:统计每个字段的空值个数,如果空值个数小于阈值,则把所述空值删掉;对获取的弱行为数据进行填补;和利用模型预测缺失属性的值。
[0013]进一步的,所述人员生存认证标签采用人员刷脸认证信息;所述人员死亡认证标签采用上报的死亡人员名单。
[0014]进一步的,所述数据特征包括行为数据和属性数据。
[0015]进一步的,所述通过分析数据特征与所述标签的关联系数以及数据特征分布统计完成特征提取具体包括:
[0016]通过Pearson关联系数进行数据特征与标签的关联分析;
[0017]构建特征与标签的关联系数的对应表格。
[0018]进一步的,所述在特征提取完成之后,对分类预测模型进行训练的过程包括:
[0019]选取所述分类预测模型的算法,并对所述算法中的参数按步长进行调整,使验证集内找出精度最高的参数;
[0020]通过调整特征、样本、算法、算法参数的变化,获取最优解,同时针对出现的结论进行分析和调整,防止训练过程中的欠拟合和过拟合。
[0021]进一步的,在所述分类预测模型进行训练完成之后,通过验证集数据进行验证,选取当前时间段认证的信息和死亡信息做验证集,得到预测的结果。
[0022]本专利技术还提出了一种可认证状态的分类预测模型构建系统,包括获取模块、选取模块、特征提取模块和训练分析模块;
[0023]所述获取模块用于获取弱行为数据,并对获取的所述弱行为数据进行异常值处理和缺失值处理;所述弱行为数据为无法明确行为发生人是否为本人,无法判断人生存状态的与养老保险待遇资格认证相关的数据;
[0024]所述选取模块用于选取所述分类预测模型的标签,所述标签包括人员生存认证标签和人员死亡认证标签;
[0025]所述特征分析模块用于使用距离当前时间最近一段时间的弱行为数据提取行为特征,在所述分类预测模型迭代的过程中加入人员的基础属性作为数据特征;通过分析数据特征与所述标签的关联系数以及数据特征分布统计完成特征提取;
[0026]所述训练分析模块用于在特征提取完成之后,对分类预测模型进行训练,并将所述模型训练的结果进行对比分析。
[0027]进一步的,所述获取模块中,异常值处理的方式包括可视化、统计分析和正态分布;缺失值处理的方式包括:统计每个字段的空值个数,如果空值个数小于阈值,则把所述空值删掉;对获取的弱行为数据进行填补;和利用模型预测缺失属性的值。
[0028]
技术实现思路
中提供的效果仅仅是实施例的效果,而不是专利技术所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
[0029]本专利技术提出了一种可认证状态的分类预测模型构建方法和系统,该方法包括获取弱行为数据,并对获取的所述弱行为数据进行异常值处理和缺失值处理;弱行为数据为无法明确行为发生人是否为本人,无法判断人生存状态的与养老保险待遇资格认证相关的数据;选取所述分类预测模型的标签,标签包括人员生存认证标签和人员死亡认证标签;使用距离当前时间最近一段时间的弱行为数据提取行为特征,在所述分类预测模型迭代的过程
中加入人员的基础属性作为数据特征;通过分析数据特征与标签的关联系数以及数据特征分布统计完成特征提取;在特征提取完成之后,对分类预测模型进行训练,并将模型训练的结果进行对比分析。基于一种可认证状态的分类预测模型构建方法,还提出了一种可认证状态的分类预测模型构建系统。本专利技术适用于关键行为无法覆盖,且存在多种弱生存判定行为依据的情况,通过采用弱行为数据作为关键行为分析认证的补充,扩大可认证比例。在分类预测模型构建完成之后,使用分类预测模型提高了预测的精度。
[0030]本专利技术利用大数据及AI技术对数据进行处理分析,利用自研聚合深度学习模型,基于用户行为判断生存状态。使用多个机器学习模型训练选择最优模型,保证生存状态判断准确度。从改进民生服务、提升行政效率的需求出发,通过对历史数据生存样本库进行建模和训练,结合人员健康状况进行评估,识别出待遇领取人员的重点关注人群,可以从大数据中分析、发掘出每个个体的业务及行为特征,用于辅助社保待遇资格认证工作,实现社会保险待遇资格认证的“数据认证”和“静默认证”。
附图说明
[0031]如图1为本专利技术实施例1一种可认证状态的分类预测模型构建方法流程图;
[0032]如图2为本专利技术实施例1模型训练的流程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可认证状态的分类预测模型构建方法,其特征在于,包括以下步骤:获取弱行为数据,并对获取的所述弱行为数据进行异常值处理和缺失值处理;所述弱行为数据为无法明确行为发生人是否为本人,无法判断人生存状态的与养老保险待遇资格认证相关的数据;选取所述分类预测模型的标签,所述标签包括人员生存认证标签和人员死亡认证标签;使用距离当前时间最近一段时间的弱行为数据提取行为特征,在所述分类预测模型迭代的过程中加入人员的基础属性作为数据特征;通过分析数据特征与所述标签的关联系数以及数据特征分布统计完成特征提取;在特征提取完成之后,对分类预测模型进行训练,并将所述模型训练的结果进行对比分析。2.根据权利要求1所述的一种可认证状态的分类预测模型构建方法,其特征在于,所述异常值处理的方式包括可视化、统计分析和正态分布。3.根据权利要求1所述的一种可认证状态的分类预测模型构建方法,其特征在于,所述缺失值处理的方式包括:统计每个字段的空值个数,如果空值个数小于阈值,则把所述空值删掉;对获取的弱行为数据进行填补;和利用模型预测缺失属性的值。4.根据权利要求1所述的一种可认证状态的分类预测模型构建方法,其特征在于,所述人员生存认证标签采用人员刷脸认证信息;所述人员死亡认证标签采用上报的死亡人员名单。5.根据权利要求1所述的一种可认证状态的分类预测模型构建方法,其特征在于,所述数据特征包括行为数据和属性数据。6.根据权利要求1所述的一种可认证状态的分类预测模型构建方法,其特征在于,所述通过分析数据特征与所述标签的关联系数以及数据特征分布统计完成特征提取具体包括:通过Pearson关联系数进行数据特征与标签的关联分析;构建特征与标签的关联系数的对应表格。7.根据权利要求1所述的一种可认证状态的分类预测...

【专利技术属性】
技术研发人员:朱晓琳迟有深王汉肖秦超
申请(专利权)人:青岛视图信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1