一种基于胶囊网络的信用评估模型方法及其存储介质技术

技术编号:30234678 阅读:59 留言:0更新日期:2021-09-29 10:14
一种基于胶囊网络的信用评估模型方法及其存储介质,该方法包括处理用户数据,将用户数据各指标进行成像,构建胶囊网络体系结构,训练胶囊网络对用户信用特征成像图分类,利用训练后的胶囊网络计算用户违约概率值。本发明专利技术将用户信息利用图像的形式进行呈现,将所对应的特征转换形成相应的灰度图,利用构建的胶囊网络能够更好地提取图片特征从而优化模型评估,提高模型可靠性和准确性;把注意力机制层引入胶囊网络,构建后的胶囊网络能够更深层次的提取成像图的全局和局部特征,提高模型可靠性和准确性,还可以提取更多有效的特征信息从而实现更高的准确率。而实现更高的准确率。而实现更高的准确率。

【技术实现步骤摘要】
一种基于胶囊网络的信用评估模型方法及其存储介质


[0001]本专利技术涉及信用评估
,具体的,涉及一种风险用户的信用评估模型方法及存储介质。

技术介绍

[0002]随着人类社会的不断进步,征信业信用评估发展的重要性越来越被人们所认识。依法设立的个人征信机构是对个人信用信息进行采集和加工,根据用户要求提供个人信用信息查询和凭借服务。征信体系是由与征信活动有关的法律规章、组织机构、市场管理、文化建设、宣传教育等共同构成的一个体系。基于征信业的信用风险评估也是金融机构正确制定政策和商业战略的关键。
[0003]信用评估是评估机构利用专家判断或数学模型,结合用户所提供的财务状况、经营状况、诸如电话费、水费等各种公共类事务的完成情况,以及各类涉及个人信用的信息,对用户还款、参与各类公共事务的完成能力和意愿进行评价,并按照其违约概率的大小通过等级或分数的形式给出评估结论的行为。
[0004]随着社会大数据的深入,在单位用人、个人求职、职务晋升、志愿者招募等各方面都对于个人的诚信提出更高的要求,因此,如何能够针对个人在社会各项事务中留下的数据痕迹,对个人信用进行评估,准确评判相应用户参与公共事务并圆满完成的可能性,成为现有技术亟需解决的技术问题。

技术实现思路

[0005]本专利技术的目的在于提出一种基于胶囊网络的信用评估模型的方法,利用胶囊网络构建客户信用模型,提高对于用户参与社会各类事务诚信因素的预测。
[0006]为达此目的,本专利技术采用以下技术方案:一种基于胶囊网络的信用评估模型方法,其特征在于,包括如下步骤:用户数据处理步骤S110:获取用户信用数据,包括好用户数据和坏用户数据,其中坏客户表示在两年内存在违约记录的用户,反之则为好客户,对所述用户信息数据进行预处理,过滤掉缺失,异常的信息,对数据做清洗和预处理,并利用数字的方式进行赋值,以用于后续的步骤;指标成像处理步骤S120:按照数据中每个指标变量的数值对应图像中一个像素点的原则,将步骤S110处理过的指标变量根据反映客户特征信息的不同方面重组聚合成一定的用户信用指标特征矩阵,并且在不足的像素区域使用零代替,并将用户信用指标特征矩阵转换为用户的信用特征成像图;构建胶囊网络体系结构步骤S130:构建胶囊网络体系结构,依次包括:输入层、注意力机制层、主胶囊层、数字胶囊层和输出层,
其中,所述输入层用于输入所述用户信息经过成像处理得到的用户的信用特征成像图;注意力机制层,用于强调和选择目标处理对象的重要信息,并且抑制无关的细节信息,选择聚焦位置,产生更具分辨性的特征表示;主胶囊层,用于对成像图特征进一步提炼并整合,主胶囊层通过一定数量的卷积核进行特征提取,单个卷积核进行普通卷积操作后进行封装,得到一定数量的主胶囊;数字胶囊层,用于通过每个胶囊活动向量的长度即胶囊向量的模预测其属于某个用户类别的概率,其中每个胶囊表示一种预测用户的类型,在数字胶囊层的每层中含有2个胶囊,其中每个胶囊表示一种用户类型,两种用户类型包括好客户类型与坏客户类型;输出层,用于计算数字胶囊层的预测概率,输出客户好坏类别结果,将特征空间的数据映射到相应客户类别,并输出用户类别的预测概率,即为用户的违约概率值;训练胶囊网络对用户信用特征成像图分类步骤S140:将步骤S120的用户信用特征成像图作为胶囊网络的输入,利用构建的胶囊网络进行图像分类处理,所述胶囊网络用户信用特征成像图分为两类,包括好用户信用特征成像图与坏用户信用特征成像图,所述胶囊网络对输入的用户信用特征成像图进行以好用户信用特征成像图与坏用户信用特征成像图的类别进行预测分类,将用户信用特征成像图数据分为80%训练集和20%测试集,通过训练集对胶囊网络进行训练,得到分类器,测试集数据对分类器的准确性进行验证;计算用户违约概率值S150:对于训练后的胶囊网络,将用户信息经过成像处理后得到的用户信用特征成像图经输入层进入胶囊网络,利用胶囊网络进行计算,最终通过输出层,输出客户好坏类别结果,将特征空间的数据映射到相应客户类别,并输出用户类别的预测概率,即为用户的违约概率值。
[0007]可选的,所述数据清洗处理步骤S110中,要进行缺失值的处理,处理方法包括直接删除含有缺失值的样本数据、根据样本数据之间的相似性,使用能代表变量中心趋势的值进行填补和根据变量之间的相关关系填补缺失值。
[0008]可选的,所述数据清洗处理步骤S110中,所述数据预处理步骤中还包括异常值检测,找出对于明显偏离大多数抽样数据的数值,异常值检测采用离群值检测的方法,包括单变量离群值检测、局部离群值因子检测和基于聚类方法的离群值检测等或者利用箱型图的方式查看异常值并进行相应剔除处理。
[0009]可选的,在指标成像处理步骤S120中,在所述用户信用指标特征矩阵的取值时,将用户信用指标特征的取值对应乘以255以得到对应像素点的亮度,然后对数据表中的数据形式进行转换,对于x个单列指标变量,需要转化为d﹡d的用户信用特征指标变量矩阵:,第一列为1~d第二列为d+1~2d第三列为2d+1~3d
⋯⋯
其中表示向上取整。
[0010]可选的,在指标成像处理步骤S120中,使用转化的用户信用特征指标变量矩阵来形成d﹡d像素的灰度图,即为用户的信用特征成像图。
[0011]可选的,在构建胶囊网络体系结构步骤S130中,所述注意力机制层由多个注意力模块堆叠而成,每个注意力模块又分为掩膜分支(mask brunch)和主干分支(trunk branch),主干分支通过多次卷积提取所述用户信用特征成像图的张量特征,掩膜分支是注意力模块的核心部件,包括buttom

up和top

down的结构;其中buttom

up部分执行下采样,多次进行最大池化操作扩大接受域,直到达到最低分辨率,其作用效果是产生低分辨率、强语义信息的特征图,从而收集整个用户信用特征成像图的全局信息,top

down部分执行上采样线性插值,直到特征图尺寸与输入时相等,其作用效果是扩展bottom

up所产生的特征图,使其尺寸与输入bottom

up前的特征图大小相同,从而对输入的用户信用特征成像图的每个像素进行推理选择。
[0012]可选的,在构建胶囊网络体系结构步骤S130中,所述主胶囊层和数字胶囊层均为多层的结构,所述主胶囊层和数字胶囊层的多层彼此互相堆叠,在互相堆叠的主胶囊层和数字胶囊层之间采用动态路由算法对其进一步编码或者更新,动态路由算法用于计算深浅两层隐藏层中每个胶囊之间的关系,其预测向量由胶囊网络的输出向量与权重矩阵相乘获得,比较预测向量与父节点输出,若为较小的量值,则升高其他父节点的耦合系数,降低该父节点的耦合系数;若为较大的量值,则降低其他父节点的耦合系数,升高该父节点的耦合系数,即胶囊增加了对该父节点的贡献。
[0013]可选的,所述动态路由算法规则具体为:下层胶囊由上层胶囊计算得出,每个上层胶囊i连接到相邻的下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于胶囊网络的信用评估模型方法,其特征在于,包括如下步骤:用户数据处理步骤S110:获取用户信用数据,包括好用户数据和坏用户数据,其中坏客户表示在两年内存在违约记录的用户,反之则为好客户,对所述用户信息数据进行预处理,过滤掉缺失,异常的信息,对数据做清洗和预处理,并利用数字的方式进行赋值,以用于后续的步骤;指标成像处理步骤S120:按照数据中每个指标变量的数值对应图像中一个像素点的原则,将步骤S110处理过的指标变量根据反映客户特征信息的不同方面重组聚合成一定的用户信用指标特征矩阵,并且在不足的像素区域使用零代替,并将用户信用指标特征矩阵转换为用户的信用特征成像图;构建胶囊网络体系结构步骤S130:构建胶囊网络体系结构,依次包括:输入层、注意力机制层、主胶囊层、数字胶囊层和输出层,其中,所述输入层用于输入所述用户信息经过成像处理得到的用户的信用特征成像图;注意力机制层,用于强调和选择目标处理对象的重要信息,并且抑制无关的细节信息,选择聚焦位置,产生更具分辨性的特征表示;主胶囊层,用于对成像图特征进一步提炼并整合,主胶囊层通过一定数量的卷积核进行特征提取,单个卷积核进行普通卷积操作后进行封装,得到一定数量的主胶囊;数字胶囊层,用于通过每个胶囊活动向量的长度即胶囊向量的模预测其属于某个用户类别的概率,其中每个胶囊表示一种预测用户的类型,在数字胶囊层的每层中含有2个胶囊,其中每个胶囊表示一种用户类型,两种用户类型包括好客户类型与坏客户类型;输出层,用于计算数字胶囊层的预测概率,输出客户好坏类别结果,将特征空间的数据映射到相应客户类别,并输出用户类别的预测概率,即为用户的违约概率值;训练胶囊网络对用户信用特征成像图分类步骤S140:将步骤S120的用户信用特征成像图作为胶囊网络的输入,利用构建的胶囊网络进行图像分类处理,所述胶囊网络用户信用特征成像图分为两类,包括好用户信用特征成像图与坏用户信用特征成像图,所述胶囊网络对输入的用户信用特征成像图进行以好用户信用特征成像图与坏用户信用特征成像图的类别进行预测分类,将用户信用特征成像图数据分为80%训练集和20%测试集,通过训练集对胶囊网络进行训练,得到分类器,测试集数据对分类器的准确性进行验证;计算用户违约概率值S150:对于训练后的胶囊网络,将用户信息经过成像处理后得到的用户信用特征成像图经输入层进入胶囊网络,利用胶囊网络进行计算,最终通过输出层,输出客户好坏类别结果,将特征空间的数据映射到相应客户类别,并输出用户类别的预测概率,即为用户的违约概率值。2.根据权利要求1所述的基于胶囊网络的信用评估模型方法,其特征在于,所述数据清洗处理步骤S110中,要进行缺失值的处理,处理方法包括直接删除含有缺失值的样本数据、根据样本数据之间的相似性,使用能代表变量中心趋势的值进行填补和
根据变量之间的相关关系填补缺失值。3.根据权利要求2所述的基于胶囊网络的信用评估模型方法,其特征在于,所述数据清洗处理步骤S110中,所述数据预处理步骤中还包括异常值检测,找出对于明显偏离大多数抽样数据的数值,异常值检测采用离群值检测的方法,包括单变量离群值检测、局部离群值因子检测和基于聚类方法的离群值检测等或者利用箱型图的方式查看异常值并进行相应剔除处理。4.根据权利要求1所述的基于胶囊网络的信用评估模型方法,其特征在于,在指标成像处理步骤S120中,在所述用户信用指标特征矩阵的取值时,将用户信用指标特征的取值对应乘以255以得到对应像素点的亮度...

【专利技术属性】
技术研发人员:刘晓东张福浩孙浩石丽红陶坤旺
申请(专利权)人:中国测绘科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1