System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,更具体地,涉及一种数据增强方法、装置、电子设备以及存储介质。
技术介绍
1、在目前的信贷领域中,通常会采取风控模型来判断用户的资质情况,找出可能会逾期的用户,然后再通过风控策略规则,做出是否放贷或者拒绝的决定。现有的风控模型几乎都是选取真实贷款逾期的用户作为负样本,选取一定比例的正常还款用户作为正样本。然而,信贷的样本数据往往是不平衡数据,即真实逾期的用户,要远远小于正常还款的用户,这样容易导致风控模型过分关注负样本,而对正样本的敏感度降低,从而影响风控模型在实际业务中的表现。
技术实现思路
1、鉴于上述问题,本申请提出了一种数据增强方法、装置、电子设备以及存储介质,以改善上述问题。
2、第一方面,本申请实施例提供了一种数据增强方法,应用于电子设备,所述方法包括:基于逾期用户的逾期原因的种类生成噪声类别;基于所述噪声类别生成所述逾期用户的生成特征;将所述噪声类别与所述生成特征进行拼接,得到第一隐含向量;基于所述第一隐含向量对条件生成对抗网络模型进行更新,直至损失函数收敛;将所述损失函数收敛时所述条件生成对抗网络模型输出的正样本特征作为目标正样本。
3、第二方面,本申请实施例提供了一种数据增强装置,运行于电子设备,所述装置包括:噪声类别获取模块,用于基于逾期用户的逾期原因的种类生成噪声类别;生成特征获取模块,用于基于所述噪声类别生成所述逾期用户的生成特征;特征拼接模块,用于将所述噪声类别与所述生成特征进行拼接,得到第一隐含向量;模型更新模块
4、第三方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面的方法。
5、第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述第一方面的方法。
6、本申请提供的一种数据增强方法、装置、电子设备以及存储介质,通过基于逾期用户的逾期原因的种类生成噪声类别;基于所述噪声类别生成所述逾期用户的生成特征;将所述噪声类别与所述生成特征进行拼接,得到第一隐含向量;基于所述第一隐含向量对条件生成对抗网络模型进行更新,直至损失函数收敛;将所述损失函数收敛时所述条件生成对抗网络模型输出的正样本特征作为目标正样本。从而通过上述方式实现了可以在逾期原因的条件下,生成与逾期用户对应的生成特征,从而可以扩大正样本的数量,进而提升正负样本的平衡性。
本文档来自技高网...【技术保护点】
1.一种数据增强方法,其特征在于,应用于电子设备,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述噪声类别生成所述逾期用户的生成特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述条件生成对抗网络模型包括生成器模型与判别器模型,所述基于所述第一隐含向量对条件生成对抗网络模型进行更新,直至损失函数收敛,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一隐含向量对条件生成对抗网络模型进行更新,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于逾期用户的逾期原因的种类生成噪声类别之前,还包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种数据增强装置,其特征在于,运行于电子设备,所述装置包括:
9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,
...【技术特征摘要】
1.一种数据增强方法,其特征在于,应用于电子设备,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述噪声类别生成所述逾期用户的生成特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述条件生成对抗网络模型包括生成器模型与判别器模型,所述基于所述第一隐含向量对条件生成对抗网络模型进行更新,直至损失函数收敛,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一隐含向量对条件生成对抗网络模型进行更新,包括:
5.根据权利要求1所述的方法,其特...
【专利技术属性】
技术研发人员:乐灵山,孔涛涛,
申请(专利权)人:深圳市与飞科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。