System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的反欺诈人群放大方法、装置和介质制造方法及图纸_技高网
当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于深度学习的反欺诈人群放大方法、装置和介质制造方法及图纸

技术编号:41241585 阅读:2 留言:0更新日期:2024-05-09 23:53
本申请涉及一种基于深度学习的反欺诈人群放大方法、装置和介质,其中,基于深度学习的反欺诈人群放大方法包括:基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型;基于训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量;将目标理赔事件或待预测用户信息输入至训练好的深度学习模型中,获得各待预测用户的中间层用户特征向量;基于各所述用户的中间层用户特征向量以及各所述待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群。解决了在金融保险人群反欺诈场景难以及时发现欺诈群体的问题,提高了反欺诈效果。

【技术实现步骤摘要】

本申请涉及深度学习,特别是涉及一种基于深度学习的反欺诈人群放大方法、装置和介质


技术介绍

1、高欺诈风险人群的用户画像和人群放大,欺诈规则的发现,对金融保险反欺诈业务至关重要。一般而言工作人员(包括风控、运营、产品等)基于不同场景和业务目标,融合业务理解和经验,定义反欺诈的人群画像标签库。随后由数据和算法工作人员,进行数据挖掘和算法建模。每个用户基于个人的人口统计学和业务规则定义,得到各种专属的标签。

2、当前的用户画像标签挖掘技术方案,存在多种缺点:1)强烈依赖于工作人员的业务经验;2)难以挖掘高维度组合特征信息;3)用户的时间序列行为特征中蕴藏的信息,难以得到有效利用。由于上述缺点,使得在金融保险人群反欺诈的业务场景难以及时发现欺诈群体。

3、目前,深度学习模型的理论和架构获得的快速的发展,涌现出deep&wide、esmm、mmoe、deepfm等各类具备不同属性、面向不同问题的深度学习模型,并且在语音图像识别、文本挖掘、搜索推荐、反欺诈等各个领域获得了广泛应用,出现了一系列基于深度学习的向量化表征方法,这些方法有效利用了深度学习模型结构的表达拟合能力。

4、针对相关技术中,结合深度学习的向量化表征方法在金融保险人群反欺诈的业务场景的应用较少,针对在金融保险人群反欺诈的业务场景难以及时发现欺诈群体的问题,目前尚未提出有效的解决方案。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种基于深度学习的反欺诈人群放大方法、装置和介质。

2、第一方面,本申请实施例提供了一种基于深度学习的反欺诈人群放大方法,所述方法包括:

3、基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型;其中,所述样本包括历史理赔事件或用户信息,所述历史理赔事件包括用户信息;

4、基于所述训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量;

5、将目标理赔事件或待预测用户信息输入至所述训练好的深度学习模型中,获得各待预测用户的中间层用户特征向量;

6、基于各所述用户的中间层用户特征向量以及各所述待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群,得到欺诈群体和非欺诈群体。

7、在其中一个实施例中,所述基于所述训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量包括:

8、抽取所述训练好的深度学习模型的中间层向量;

9、若所述深度学习模型输入的样本为历史理赔事件,则分别对同一用户对应的所有历史理赔事件的中间层向量取平均值,得到各用户的中间层用户特征向量;

10、若所述深度学习模型输入的样本为用户,则直接根据所述深度学习模型的中间层向量得到各用户的中间层用户特征向量。

11、在其中一个实施例中,所述基于各所述用户的中间层用户特征向量以及各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群包括:

12、基于业务知识、历史数据或业务规则,确定所述历史理赔事件中的欺诈代表性用户群体;

13、对所述欺诈代表性用户群体对应的中间层用户特征向量取平均值,得到各欺诈代表性向量;

14、基于所述欺诈代表性向量与各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述欺诈代表性用户群体的相似人群。

15、在其中一个实施例中,所述基于所述欺诈代表性向量与各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述欺诈代表性用户群体的相似人群包括:

16、基于所述欺诈代表性向量与各待预测用户的中间层用户特征向量,分别计算各所述预测用户与所述欺诈代表性用户群体的相似性,得到对应的相似度;

17、若所述相似度大于设定的相似度阈值,则确定对应的预测用户为所述欺诈代表性用户群体的相似人群。

18、在其中一个实施例中,所述方法还包括:

19、将所述欺诈代表性用户群体聚类为多个类别,分别确定与各类别的欺诈代表性用户群体的相似人群,得到各类别的欺诈群体。

20、在其中一个实施例中,所述方法还包括:

21、对各类别的欺诈群体的属性和行为数据进行统计分析,得到对应的业务规则。

22、在其中一个实施例中,所述基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型包括:

23、将所述样本分为训练样本和测试样本;

24、使用所述训练样本对深度学习模型进行训练,使用所述测试样本所述深度学习模型进行指标评估,直至达到预设精度,获得训练好的深度学习模型。

25、第二方面,本申请实施例还提供了一种基于深度学习的反欺诈人群放大装置,所述装置包括:

26、训练模块,用于基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型;其中,所述样本包括历史理赔事件或用户信息,所述历史理赔事件包括用户信息;

27、第一获得模块,用于基于所述训练好的深度学习模型的中间层向量,获得各所述用户的中间层用户特征向量;

28、第二获得模块,用于将目标理赔事件或待预测用户信息输入至所述训练好的深度学习模型中,获得各待预测用户的中间层用户特征向量;

29、确定模块,用于基于各所述用户的中间层用户特征向量以及各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群。

30、第三方面,本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如上述第一方面所述的方法。

31、第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。

32、上述基于深度学习的反欺诈人群放大方法、装置和介质,通过基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型;其中,所述样本包括历史理赔事件或历史用户信息,所述历史理赔事件包括所述历史用户信息;基于所述训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量;将目标理赔事件或待预测用户信息输入至所述训练好的深度学习模型中,获得各待预测用户的中间层用户特征向量;基于各所述用户的中间层用户特征向量以及各所述待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群,得到欺诈群体和非欺诈群体。解决了针对在金融保险人群反欺诈的业务场景难以及时发现欺诈群体的问题,提高了反欺诈效果。

33、本申请的本文档来自技高网...

【技术保护点】

1.一种基于深度学习的反欺诈人群放大方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量包括:

3.根据权利要求1所述的方法,其特征在于,所述基于各所述用户的中间层用户特征向量以及各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述欺诈代表性向量与各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述欺诈代表性用户群体的相似人群包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述基于样本和对应的标签对深度学习模型进行训练,获得训练好的深度学习模型包括:

8.一种基于深度学习的反欺诈人群放大装置,其特征在于,所述装置包括:

<p>9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至权利要求7中任一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至权利要求7中任一项所述的方法。

...

【技术特征摘要】

1.一种基于深度学习的反欺诈人群放大方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述训练好的深度学习模型的中间层向量,获得各用户的中间层用户特征向量包括:

3.根据权利要求1所述的方法,其特征在于,所述基于各所述用户的中间层用户特征向量以及各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述历史理赔事件中欺诈人群的相似人群以及确定与所述历史理赔事件中非欺诈人群的相似人群包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述欺诈代表性向量与各待预测用户的中间层用户特征向量,采用聚类算法,确定与所述欺诈代表性用户群体的相似人群包括:

5.根据权利要求...

【专利技术属性】
技术研发人员:黄勇杨耀翟毅腾
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1