基于多视图学习的借贷违约风险检测方法及相关设备技术

技术编号:28058265 阅读:25 留言:0更新日期:2021-04-14 13:32
本申请实施例属于大数据领域,涉及一种基于多视图学习的借贷违约风险检测方法,包括将违约检测数据特征划分为借款标的特征视图和借款者特征视图;基于有标签样本和拒绝样本训练第一检测分类器和第二检测分类器,得到训练好的第一检测分类器和第二检测分类器;根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型;将待检测标的数据输入到所述多视图违约风险检测模型中,得到借贷违约风险检测结果。采用本方法提高了借贷违约风险检测准确度。度。度。

【技术实现步骤摘要】
基于多视图学习的借贷违约风险检测方法及相关设备


[0001]本申请涉及数据处理领域,特别是涉及一种基于多视图学习的借贷违约风险检测方法、装置、计算机设备和存储介质。

技术介绍

[0002]在P2P平台上,借款者发布借款标的的申请,投资者可以根据自己的风险偏好选择满意的标的进行投资,若能在标的的筹备期内筹齐所需的借款总额,则该标的中标,即借款成功,这部分样本也被称为接收样本。P2P平台可以记录这些借款成功客户的后续还款信息。若在标的筹集期内未能筹齐借款总额,则该标的流标,即借款失败,这部分样本也被称为拒绝样本。
[0003]基于样本的还款信息,可以标注样本的标签是“违约”还是“非违约”。由于拒绝样本在申请时被拒绝了,没有后续还款信息,因此无法标注拒绝样本的标签是“违约”还是“非违约”,所以在传统的违约风险检测中,通常只使用接受样本(有标签样本)建模。但是由于模型的应用对象是包括接受和拒绝的全部客户,导致模型构建存在着样本选择偏差问题,即训练模型的样本和模型检测的样本分布不一致。利用有偏样本训练违约风险检测模型,将会伤害模型的泛化能力,从而本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多视图学习的借贷违约风险检测方法,应用于借贷平台上,其特征在于,所述方法包括:将违约检测数据特征划分为借款标的特征视图和借款者特征视图,其中,所述违约检测数据特征为历史标的数据的数据特征;基于所述借款标的特征视图的有标签样本训练第一检测分类器,基于所述借款者特征视图的有标签样本训练第二检测分类器,并基于训练后的第一检测分类器和第二检测分类器检测拒绝样本的检测标签,以及与所述检测标签对应的标签概率;将检测标签一致的拒绝样本,作为高置信样本加入候选集,其中,所述候选集中包括有标签样本;将标签概率作为显式置信度,并根据从所述候选集中获取到的显式置信度高于第一预设值的高置信样本,对所述第一检测分类器和所述第二检测分类器继续训练,直到训练次数达到第二预设值,或者加入到所述候选集中的拒绝样本的比例占所有有标签样本的第三设定值时,训练结束,得到训练好的第一检测分类器和第二检测分类器;根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型;将待检测标的数据输入到所述多视图违约风险检测模型中,得到借贷违约风险检测结果。2.根据权利要求1所述的方法,其特征在于,所述将违约检测数据特征划分为借款标的特征视图和借款者特征视图,包括:遍历所述历史标的数据的违约检测数据特征,确定各所述违约检测数据特征之间的关联关系,其中,所述关联关系为所述检测数据特征之间的属性相似度;根据所述属性相似度将所述违约检测数据特征划分为借款标的特征视图和借款者特征视图。3.根据权利要求1所述的方法,其特征在于,所述将检测标签一致的拒绝样本,作为高置信样本加入候选集,包括:获取各所述拒绝样本的所有检测标签;若所述拒绝样本的所有检测标签都为违约或者非违约,则所述拒绝样本的检测标签一致;若所述拒绝样本的检测标签中既有违约,又有非违约,则所述拒绝样本的检测标签不一致;将所述检测标签一致的拒绝样本作为高置信样本加入所述候选集。4.根据权利要求1所述的方法,其特征在于,所述将标签概率作为显式置信度,并根据从所述候选集中获取到的显式置信度高于第一预设值的高置信样本,对所述第一检测分类器和所述第二检测分类器继续训练,包括:从所述候选集中获取所述显式置信度大于0.5,且小于1的高置信样本;将获取到的高置信样本从所述候选集中的拒绝样本中剔除,并将剔除的高置信样本加入到有标签样本中对所述第一检测分类器和所述第二检测分类器继续进行训练。5.根...

【专利技术属性】
技术研发人员:许天歌
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1