一种基于多实例学习的信用风险评估模型生成方法技术

技术编号:23767908 阅读:176 留言:0更新日期:2020-04-11 20:50
一种基于多实例学习的信用风险评估模型生成方法,包括以下步骤:S1:收集用户的相关数据源信息S2:对获取到的数据源信息利用最小Hausdorff距离聚类特征提取用户历史行为特征向量;S3:将所述用户历史行为特征向量和个人信息数据进行结合,构建新向量数据集;S4:采用基于径向基函数的多实例学习方法对上述结合的新向量数据集进行训练,基于评价模型指标函数来构建信用风险评估模型;S5:对所述信用风险评估模型的效果进行预测,通过适应度函数来检验模型的正确性。本发明专利技术解决了用户数据高维度、无标签问题,实现了最小化风险、最小化复杂性和最大化准确性的目标,不仅提高了信用风险评估模型的运行效率也提高了模型准确性和可解释性。

A credit risk assessment model generation method based on multi instance learning

【技术实现步骤摘要】
一种基于多实例学习的信用风险评估模型生成方法
本专利技术涉及信用评估领域,具体涉及一种基于多实例学习的信用风险评估模型生成方法。
技术介绍
随着信息时代的快速发展,信用风险评估成为金融机构研究的重要课题之一。它是将不确定性转化为风险控制过程。高质量的风险管理使银行能够建立健全的决策体系,减少损失。根据巴塞尔银行监管委员会巴塞尔协议II将银行风险分为三类:(1)信用风险,(2)市场风险,(3)经营风险。因此,从银行安全的角度来看,信用风险已成为银行业研究的一个重要课题,信用风险评估被认为是一个复杂的多维问题,它主要是基于大量的历史数据,如监护人,工作状态,以前的信用历史,个人帐户状态等,目的是了解申请人的行为和预测风险。因此,信用风险度量和管理体系的制定主要着眼于申请人的分类或信用评分。且在专利名称为:“一种基于文本分析的信用风险评估方法及装置”(申请号:2015106953161,申请公布日:2017.05.03)中公开了一种基于文本分析的信用风险评估方法及装置,其中,所述方法还包括:获取借款人的文本;对所述文本进行分析,得到基本语言特本文档来自技高网...

【技术保护点】
1.一种基于多实例学习的信用风险评估模型生成方法,其特征在于,包括以下步骤:/nS1:收集用户的相关数据源信息,所述数据源信息具体包括个人信息数据和历史动态行为数据;/nS2:对获取到的数据源信息利用最小Hausdorff距离聚类特征提取用户的历史行为特征向量;/nS3:将所述历史行为特征向量和个人信息数据进行结合,构建新向量数据集;/nS4:采用基于径向基函数的多实例学习方法对上述结合的新向量数据集进行训练,基于评价模型指标函数来构建信用风险评估模型;/nS5:对所述信用风险评估模型的效果进行预测,通过适应度函数来检验模型的正确性。/n

【技术特征摘要】
1.一种基于多实例学习的信用风险评估模型生成方法,其特征在于,包括以下步骤:
S1:收集用户的相关数据源信息,所述数据源信息具体包括个人信息数据和历史动态行为数据;
S2:对获取到的数据源信息利用最小Hausdorff距离聚类特征提取用户的历史行为特征向量;
S3:将所述历史行为特征向量和个人信息数据进行结合,构建新向量数据集;
S4:采用基于径向基函数的多实例学习方法对上述结合的新向量数据集进行训练,基于评价模型指标函数来构建信用风险评估模型;
S5:对所述信用风险评估模型的效果进行预测,通过适应度函数来检验模型的正确性。


2.根据权利要求1中所述的一种基于多实例学习的信用风险评估模型生成方法,其特征在于,步骤S2中所述的历史行为特征向量的提取过程具体为:
S2.1:将S1的历史动态行为数据聚集成K个集群;
S2.2:通过每个集群中心的距离映射到历史行为特征向量中,采用距离函数D为最小Hausdorff距离度量,具体定义为:,其中是和之间的欧式距离;
S2.3:将历史行为特征向量记为,将第i个变量的特征分量记为,的计算公式为:,通过该公式计算得到历史行为特征向量的具体值;其中表示第n个用户;表示第n个用户与集群之间的距离;表示标准差,用来描述两两集群中心点之...

【专利技术属性】
技术研发人员:吴基成程宏峰陈杰
申请(专利权)人:杭州信雅达数码科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1