对反欺诈模型进行训练的方法、识别金融欺诈行为的方法及其相关产品技术

技术编号:31747554 阅读:22 留言:0更新日期:2022-01-05 16:27
本发明专利技术涉及一种用于对识别金融欺诈行为的反欺诈模型进行训练的方法及电子设备、用于识别金融欺诈行为的方法、电子设备和系统。其中,对反欺诈模型进行训练的方法由处理器执行,并且包括:获取关于金融欺诈行为的样本特征作为训练数据;将训练数据输入至反欺诈模型,以对反欺诈模型进行聚类训练;以及响应于反欺诈模型输出目标类簇,完成对反欺诈模型的聚类训练,其中目标类簇中的簇中心点表征正常金融交易行为并且目标类簇中的各个类簇的类簇间距离和每个类簇内元素间的类簇内距离满足预定评价指标。通过本发明专利技术的技术方案,不依赖于样本标签,即可实现对反欺诈模型的无监督训练,从而为利用该反欺诈模型进行精准的金融欺诈行为识别提供有力保障。欺诈行为识别提供有力保障。欺诈行为识别提供有力保障。

【技术实现步骤摘要】
对反欺诈模型进行训练的方法、识别金融欺诈行为的方法及其相关产品


[0001]本专利技术一般地涉及金融风控
更具体地,本专利技术涉及一种用于对识别金融欺诈行为的反欺诈模型进行训练的方法及电子设备、用于识别金融欺诈行为的方法、电子设备和系统。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。
[0003]随着互联网技术的普及,基于互联网技术的电子银行得到了进一步发展,其已成为银行业务中的重要板块之一。然而,电子银行在为广大用户提供丰富金融服务的同时,也带来了新的风险。例如,近年来关于利用电子银行业务漏洞或者采取违规手段进行欺诈洗钱交易等金融欺诈案件越来越多,已严重损害了银行和国家的财产安全。随着不法分子作案流程的专业化与技术手段的升级,采用人为规则的传统风控模型已经很难满足当前的风控需求。
[0004]为此,相关技术提出了立足于监督算法的机器学习模型。然而现有的机器学习模型对样本数据的质量要求比较高,其依赖具有标签的样本数据。而在实际模型训练过程中,特别是针对欺诈行为的模型训练,有效的样本数据比例较小且标签时效性较差,使得训练出的模型的实际效果较差,无法满足实际需求。

技术实现思路

[0005]为了至少解决上述
技术介绍
部分所描述的技术问题,本专利技术提出了一种用于对识别金融欺诈行为的反欺诈模型进行训练的方案。利用本专利技术的方案,不依赖于样本标签,即可实现对反欺诈模型的无监督训练。由此,本专利技术的方案不仅能够克服人为规则的干预,并且有效降低了对样本数据的需求门槛,从而为利用该反欺诈模型进行精准的金融欺诈行为识别提供有力保障。鉴于此,本专利技术在如下的多个方面提供解决方案。
[0006]本专利技术的第一方面提供了一种用于对识别金融欺诈行为的反欺诈模型进行训练的方法,所述方法由处理器执行,并且包括:获取关于金融欺诈行为的样本特征作为训练数据;将所述训练数据输入至所述反欺诈模型,以对所述反欺诈模型进行聚类训练;以及响应于所述反欺诈模型输出目标类簇,完成对所述反欺诈模型的聚类训练,其中所述目标类簇中的簇中心点表征正常金融交易行为并且所述目标类簇中的各个类簇的类簇间距离和每个类簇内元素间的类簇内距离满足预定评价指标。
[0007]在一个实施例中,其中获取关于金融欺诈行为的样本特征作为训练数据包括:获取关于金融交易行为的原始数据样本集;从所述原始数据样本集中提取关于金融欺诈行为
的初始样本特征;以及对所述初始样本特征进行归一化处理,并将其作为所述训练数据。
[0008]在一个实施例中,其中对所述反欺诈模型进行聚类训练包括:利用K均值聚类算法对所述训练数据进行聚类训练,并在聚类过程中循环执行以下操作:
[0009]计算所训练的各个类簇的类簇间距离以及每个类簇内元素间的类簇内距离,以得到聚类结果;以及根据所述聚类结果调整所训练的类簇数量,直至输出所述目标类簇。
[0010]在一个实施例中,其中所述方法还包括:根据以下公式确定所述预定评价指标:F
max
=2DVI
×
CP/(DVI+CP);其中,F
max
表示取公式的最大值为所述预定评价指标,DVI表示用于表征各个类簇的类簇间距离的邓恩指数,CP表示用于表征每个类簇内元素间的类簇内距离的紧密度指数。
[0011]本专利技术的第二方面提供了一种用于对识别金融欺诈行为的反欺诈模型进行训练的电子设备,包括:处理器,其配置用于执行程序指令;以及存储器,其配置用于存储所述程序指令,当所述程序指令由所述处理器加载并执行时,使得所述电子设备执行本专利技术的第一方面以及在下文多个实施例中所述的方法。
[0012]本专利技术的第三方面提供了一种用于识别金融欺诈行为的方法,所述方法是基于本专利技术的第二方面所提供的电子设备所训练的反欺诈模型进行金融欺诈行为识别的方法,其包括:获取待识别的金融交易数据;计算所述待识别的金融交易数据与所述反欺诈模型中目标类簇的簇中心点的距离;以及基于所述距离确定是否存在金融欺诈行为。
[0013]在一个实施例中,其中基于所述距离确定是否存在金融欺诈行为包括:判断所述距离是否大于阈值;响应于所述距离大于或者等于阈值,确定存在金融欺诈行为;或者响应于所述距离小于阈值,确定不存在金融欺诈行为。
[0014]在一个实施例中,其中计算所述待识别的金融交易数据与所述反欺诈模型中目标类簇的簇中心点的距离包括:计算所述待识别的金融交易数据与所述目标类簇的簇中心点之间的欧式距离。
[0015]本专利技术的第四方面提供了一种用于识别金融欺诈行为的电子设备,包括:处理器;以及存储器,其配置用于存储所述程序指令,当所述程序指令由所述处理器加载并执行时,使得所述电子设备执行本专利技术的第三方面以及在下文多个实施例中所述的方法。
[0016]本专利技术的第五方面提供了一种用于识别金融欺诈行为的系统,包括:如本专利技术的第二方面所述的电子设备,其配置成执行根据本专利技术的第一方面以及在下文多个实施例中所述的方法,以对用于识别金融欺诈行为的反欺诈模型进行训练;以及如本专利技术的第四方面所述的电子设备,其配置成执行根据本专利技术的第三方面以及在下文多个实施例中所述的方法,以基于所述反欺诈模型识别金融欺诈行为。
[0017]本专利技术的第六方面提供了一种计算机程序产品,包括用于对识别金融欺诈行为的反欺诈模型进行训练的程序指令或用于识别金融欺诈行为的程序指令,当所述程序指令由处理器执行时,使得实现本专利技术的第一方面或者第三方面以及在下文多个实施例中所述的方法。
[0018]利用本专利技术所提供的方案,可以基于无标签的训练数据实现对反欺诈模型的聚类训练。可以看出,本专利技术的方案在对反欺诈模型的训练过程中不依赖于样本标签,不仅能够克服人为规则的干预,并且有效降低了对样本数据的需求门槛。基于此,有效的样本数据训练使得训练所得的反欺诈模型更加实用及精准,从而为利用该反欺诈模型进行精准的金融
欺诈行为识别提供有力保障。
附图说明
[0019]通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
[0020]图1是示出根据本专利技术实施例的用于识别金融欺诈行为的系统的架构图;
[0021]图2是示出根据本专利技术实施例的用于对识别金融欺诈行为的反欺诈模型进行训练的方法的流程图;
[0022]图3是示出根据本专利技术实施例的用于识别金融欺诈行为的方法的流程图;
[0023]图4是示出根据本专利技术实施例的用于识别金融欺诈行为的另一方法的流程图;以及
[0024]图5是示出根据本专利技术实施例的用于识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对识别金融欺诈行为的反欺诈模型进行训练的方法,其特征在于,所述方法由处理器执行,并且包括:获取关于金融欺诈行为的样本特征作为训练数据;将所述训练数据输入至所述反欺诈模型,以对所述反欺诈模型进行聚类训练;以及响应于所述反欺诈模型输出目标类簇,完成对所述反欺诈模型的聚类训练,其中所述目标类簇中的簇中心点表征正常金融交易行为并且所述目标类簇中的各个类簇的类簇间距离和每个类簇内元素间的类簇内距离满足预定评价指标。2.根据权利要求1所述的方法,其特征在于,其中获取关于金融欺诈行为的样本特征作为训练数据包括:获取关于金融交易行为的原始数据样本集;从所述原始数据样本集中提取关于金融欺诈行为的初始样本特征;以及对所述初始样本特征进行归一化处理,并将其作为所述训练数据。3.根据权利要求1所述的方法,其特征在于,其中对所述反欺诈模型进行聚类训练包括:利用K均值聚类算法对所述训练数据进行聚类训练,并在聚类过程中循环执行以下操作:计算所训练的各个类簇的类簇间距离以及每个类簇内元素间的类簇内距离,以得到聚类结果;以及根据所述聚类结果调整所训练的类簇数量,直至输出所述目标类簇。4.根据权利要求3所述的方法,其特征在于,其中所述方法还包括:根据以下公式确定所述预定评价指标:F
max
=2DVI
×
CP/(DVI+CP);其中,F
max
表示取公式的最大值为所述预定评价指标,DVI表示用于表征各个类簇的类簇间距离的邓恩指数,CP表示用于表征每个类簇内元素间的类簇内距离的紧密度指数。5.一种用于对识别金融欺诈行为的反欺诈模型进行训练的电子设备,其特征在于,包括:处理器,其配...

【专利技术属性】
技术研发人员:犹然苏才礼王云鹏王泰
申请(专利权)人:中金金融认证中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1