一种基于图片背景相似性的欺诈检测识别方法及设备技术

技术编号:32328942 阅读:31 留言:0更新日期:2022-02-16 18:36
本发明专利技术公开了一种基于图片背景相似性的欺诈检测识别方法及设备。该方法包括获取各用户贷款申请上传的图片数据,基于场景分类模型过滤所述图片数据中的正常背景图片,以获得疑似欺诈场景图片;基于特征提取模型提取所述疑似欺诈场景图片中的背景特征信息;根据所述背景特征信息对疑似欺诈场景图片进行聚类,以获得身份证场景聚类结果和大头照场景聚类结果;对身份证场景聚类结果和大头照场景聚类结果进行整合输出。本发明专利技术利用场景分类,提高聚类效果,利用特征提取模型,可有效提取图片背景特征,利用HDBSCAN对于提取的疑似欺诈场景的图片特征做聚类,确保聚类后的效果,便于进行欺诈检测及欺诈团伙识别。欺诈检测及欺诈团伙识别。欺诈检测及欺诈团伙识别。

【技术实现步骤摘要】
一种基于图片背景相似性的欺诈检测识别方法及设备


[0001]本专利技术涉及欺诈检测及欺诈团伙识别
,具体涉及一种基于图片背景相似性的欺诈检测识别方法及设备。

技术介绍

[0002]近年来,随着互联网的出现,互联网金融得到了迅速的发展。虽然互联网金融的蓬勃发展为金融业注入了新的活力,但其发展过程也暴露了一些问题和风险隐患,并对金融管理带来了巨大挑战。目前,由互联网金融而导致的互联网欺诈已经变得非常专业化和产业化。
[0003]在实际业务当中,申请贷款需要上传身份证照片及个人大头照,而通过中介上传的图片的背景非常类似,比如都在某办公室,某大楼的外面,某酒店等。对于此类欺诈团伙的识别,如果所有客户上传的照片都通过人工审核,那么实现难度极大。由于图片样本本身的多样性及不规则性,图片的审核难度随着审核图片的数量的增加急剧上升,为了辅助人工审核,通过图片背景相似度进行聚类的算法被提出。场景分类作为图片分类的一个应用,发展已经比较成熟,场景分类不仅包括室内、室外场景的粗粒度分类,也包括指教室、医院、篮球场等细粒度分类。由于实际场景中,通过欺诈团伙申请的用户图片非常少,正常图片数量远远高于欺诈团伙场景图片,这样就会对于聚类对象带来非常多的噪音,造成聚类准确率低。

技术实现思路

[0004]本专利技术的目的是针对现有技术存在的不足,提供一种基于图片背景相似性的欺诈检测识别方法及设备。
[0005]为实现上述目的,在第一方面,本专利技术提供了一种基于图片背景相似性的欺诈检测识别方法,包括:
[0006]获取各用户贷款申请上传的图片数据,所述图片数据包括身份证图片和大头照图片;
[0007]基于场景分类模型过滤所述图片数据中的正常背景图片,以获得疑似欺诈场景图片,所述疑似欺诈场景图片包括疑似欺诈身份证图片和疑似欺诈大头照图片;
[0008]基于特征提取模型提取所述疑似欺诈场景图片中的背景特征信息;
[0009]根据所述背景特征信息对疑似欺诈场景图片进行聚类,以获得身份证场景聚类结果和大头照场景聚类结果,所述身份证场景聚类结果和大头照场景聚类结果依次包括若干类簇的疑似欺诈身份证图片和疑似欺诈大头照图片;
[0010]根据所述身份证场景聚类结果和大头照场景聚类结果分别对应的户头号,两两组合对比计算户头号的重合度IOU:
[0011][0012]其中,为身份证场景聚类结果中的第e个类簇的户头号集合,为大头照场景聚类结果中的第f个类簇的户头号集合,e、f均为大于零的自然数;
[0013]将所述重合度IOU大于设定的重合度阈值的户头号集合组合判定为同一类簇,并取所述户头号集合组合中的集合与集合的并集得到户头号集合且以户头号集合作为户头号聚类结果,m为取值为 1至e的自然数,n为取值为1至f的自然数;
[0014]向户头号为和的类簇中依次添加与户头号集合分别对应且缺少的疑似欺诈身份证图片和疑似欺诈大头照图片,并作为聚类结果输出。
[0015]进一步的,将所述身份证场景聚类结果和大头照场景聚类结果作为正常类类簇,将未能聚类到所述身份证场景聚类结果和大头照场景聚类结果中的疑似欺诈场景图片作为噪音类类簇,利用噪音类类簇及正常类类簇的类内最大距离对聚类结果进行重新过滤整合,具体包括:对所述噪音类类簇和正常类类簇分别计算噪音类的类内最大距离l
nmax
和正常类的类内最大距离将正常类类簇中类内距离大于设定距离阈值th
l
的类簇剔除,其中,设定距离阈值 th
l
=B*l
nmax
,B为阈值系数。
[0016]进一步的,所述B的取值为0.8。
[0017]进一步的,所述重合度阈值为0.5。
[0018]在第二方面,本专利技术提供了一种基于图片背景相似性的欺诈检测识别设备,包括:
[0019]获取模块,用以获取各用户贷款申请上传的图片数据,所述图片数据包括身份证图片和大头照图片;
[0020]过滤模块,用以基于场景分类模型过滤所述图片数据中的正常背景图片,以获得疑似欺诈场景图片,所述疑似欺诈场景图片包括疑似欺诈身份证图片和疑似欺诈大头照图片;
[0021]特征提取模块,用以基于特征提取模型提取所述疑似欺诈场景图片中的背景特征信息;
[0022]聚类模块,用以根据所述背景特征信息对疑似欺诈场景图片进行聚类,以获得身份证场景聚类结果和大头照场景聚类结果,所述身份证场景聚类结果和大头照场景聚类结果依次包括若干类簇的疑似欺诈身份证图片和疑似欺诈大头照图片;
[0023]聚类结果整合输出模块,用以根据所述身份证场景聚类结果和大头照场景聚类结果分别对应的户头号,两两组合对比计算户头号的重合度IOU:
[0024][0025]其中,为身份证场景聚类结果中的第e个类簇的户头号集合,为大头照场景聚类结果中的第f个类簇的户头号集合,e、f均为大于零的自然数;将所述重合度IOU大于设定的重合度阈值的户头号集合组合判定为同一类簇,并取所述户头号集合组合中的集合与集合的并集得到户头号集合且以户头号集合作为户头号聚类结果,m为取值为1至 e的自然数,n为取值为1至f的自然数;向户头号为和的类簇中依次添加与户头号集合分别对应且缺少的疑似欺诈身份证图片和疑似欺诈大头照图片,并作为聚类结果输出。
[0026]进一步的,所述聚类结果整合输出模块将所述身份证场景聚类结果和大头照场景聚类结果作为正常类类簇,将未能聚类到所述身份证场景聚类结果和大头照场景聚类结果中的疑似欺诈场景图片作为噪音类类簇,利用噪音类类簇及正常类类簇的类内最大距离对聚类结果进行重新过滤整合,具体包括:对所述噪音类类簇和正常类类簇分别计算噪音类的类内最大距离l
nmax
和正常类的类内最大距离将正常类类簇中类内距离大于设定距离阈值th
l
的类簇剔除,其中,设定距离阈值th
l
=B*l
nmax
,B为阈值系数。
[0027]进一步的,所述B的取值为0.8。
[0028]进一步的,所述重合度阈值为0.5。
[0029]有益效果:1、本专利技术利用场景分类,过滤正常背景图片,获得疑似欺诈背景图片,避免大量的噪音图片导致聚类结果非常差。
[0030]2、本专利技术利用深度神经网络(MobileNetV2)训练获得场景分类模型,将场景分为疑似欺诈场景和正常场景,疑似欺诈场景可以通过观察逾期账户上传的具有相似背景图片而定义。
[0031]3、本专利技术利用深度神经网络(ResNet50)和欺诈场景的图片训练获得特征提取模型,训练集为有相似背景的图片集,每一组有相似背景的图片簇都被打上相同的标签,然后通过训练整个网络得到整个网络的模型的参数,可有效提取图片背景特征。
[0032]4、本专利技术利用HDBSCAN对于提取的疑似欺诈场景的图片特征做聚类, HDBSCAN对于噪声点不敏感,确保聚类后的效果。
[0033]5、本专利技术利用噪音类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图片背景相似性的欺诈检测识别方法,其特征在于,包括:获取各用户贷款申请上传的图片数据,所述图片数据包括身份证图片和大头照图片;基于场景分类模型过滤所述图片数据中的正常背景图片,以获得疑似欺诈场景图片,所述疑似欺诈场景图片包括疑似欺诈身份证图片和疑似欺诈大头照图片;基于特征提取模型提取所述疑似欺诈场景图片中的背景特征信息;根据所述背景特征信息对疑似欺诈场景图片进行聚类,以获得身份证场景聚类结果和大头照场景聚类结果,所述身份证场景聚类结果和大头照场景聚类结果依次包括若干类簇的疑似欺诈身份证图片和疑似欺诈大头照图片;根据所述身份证场景聚类结果和大头照场景聚类结果分别对应的户头号,两两组合对比计算户头号的重合度IOU:其中,为身份证场景聚类结果中的第e个类簇的户头号集合,为大头照场景聚类结果中的第f个类簇的户头号集合,e、f均为大于零的自然数;将所述重合度IOU大于设定的重合度阈值的户头号集合组合判定为同一类簇,并取所述户头号集合组合中的集合与集合的并集得到户头号集合且以户头号集合作为户头号聚类结果,m为取值为1至e的自然数,n为取值为1至f的自然数;向户头号为和的类簇中依次添加与户头号集合分别对应且缺少的疑似欺诈身份证图片和疑似欺诈大头照图片,并作为聚类结果输出。2.根据权利要求1所述的基于图片背景相似性的欺诈检测识别方法,其特征在于,将所述身份证场景聚类结果和大头照场景聚类结果作为正常类类簇,将未能聚类到所述身份证场景聚类结果和大头照场景聚类结果中的疑似欺诈场景图片作为噪音类类簇,利用噪音类类簇及正常类类簇的类内最大距离对聚类结果进行重新过滤整合,具体包括:对所述噪音类类簇和正常类类簇分别计算噪音类的类内最大距离l
nmax
和正常类的类内最大距离l
imax
,将正常类类簇中类内距离l
imax
大于设定距离阈值th
l
的类簇剔除,其中,设定距离阈值th
l
=B*l
nmax
,B为阈值系数。3.根据权利要求2所述的基于图片背景相似性的欺诈检测识别方法,其特征在于,所述B的取值为0.8。4.根据权利要求1所述的基于图片背景相似性的欺诈检测识别方法,其特征在于,所述重合度阈值为0.5。5.一种基于图片背景相似性的欺诈检测识别设备,其特征在于,包括:获取...

【专利技术属性】
技术研发人员:王止观顾扬郑清正
申请(专利权)人:江苏苏宁银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1