一种老带新活动反欺诈识别方法及系统技术方案

技术编号:35841217 阅读:59 留言:0更新日期:2022-12-03 14:13
本发明专利技术涉及一种老带新活动反欺诈识别方法及系统,包括:S1:进行黑白灰样本的定义并对样本数量进行判定,当黑白样本比为第一预设值时,则按照白样本进行执行;白样本为:(1)确定贷款且无逾期、白名单;(2)复贷率为第二预设值;(3)审核通过;S2:将裂变拉新活动的行为数据进行清洗,为每用户建立四维张量,并进行重编码操作;S3:基于动态时间规整模型将用户产生的张量进行时间序列的相似度计算;S4:建立图数据,将用户ID作为节点,并建立用户之间和节点之间的边;S5:修改GraphSage模型的采样策略,并进行模型的训练,当召回率为第三预设值时则进行上线迭代,并推送至案调岗,同时为贷前案调岗提供话术设计。前案调岗提供话术设计。前案调岗提供话术设计。

【技术实现步骤摘要】
一种老带新活动反欺诈识别方法及系统


[0001]本专利技术涉及计算机
,具体涉及一种老带新活动反欺诈识别方法及系统。

技术介绍

[0002]FinTech 在金融生态中不断扩张,金融机构正将大量业务快速迁移到互联网上,但在提供网上便利业务的同时,其亦面临着严峻的新兴交易欺诈与安全威胁的挑战;“MGM裂变拉新”是互联网金融客户运营的重要环节之一,其操作门槛简单,吸引了薅羊毛的普通客户,也吸引了黑产危害严重,会导致运营成本失控,数据失真,也影响了后期的运营策略。
[0003]而传统反欺诈技术有以下几个局限性:(1)传统反欺诈手段屡屡因为欺诈行为发生在贷前,其可防范的手段都不能像贷中的反欺诈般,使用过于严苛的规则,否则影响普通客户体验和拉新效果;(2)单个获利成本并不高,采用传统技术手段,需要处理的客户行为数据巨大,传统特征工程方式很难提取到人与行为的关系模式特征(技术层面);(3)裂变是以拉新为目的的业务特性,不允许增加太多的身份认证和设置过多的活动门槛(活动层面)。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种老带新活动反欺诈识别方法及系统,解决了传统的欺诈方法大多只能分析单个样本的风险信息的痛点,图神经网络(GraphSage)能将样本之间的关联信息作为先验知识体现在模型的训练中,即可以将深层的社会关系、节点关系、操作习惯等组合形态挖掘出来,以图结构特征、点特征、边特征的方式呈现出来,且本专利技术基于图神经网络模型是半监督模型,适合于薅羊毛个体黑样本极少且灰样本(目前没有违约的用户很难确定是否有风险)太多的场景下,即只需要少量有标签的样本就可以训练出精度高的模型。
[0005]为了实现本专利技术的目的,本专利技术提供一种老带新活动反欺诈识别方法,包括如下步骤:S1:进行黑白灰样本的定义并对样本数量进行判定,当黑白样本比为第一预设值时,则按照白样本规则进行执行;白样本规则为:(1)、确定贷款且无逾期、白名单;(2)、复贷率为第二预设值;(3)、审核通过;S2:将裂变拉新活动的行为数据进行清洗,为每一个用户建立一个四维张量,并进行重编码操作;S3:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算;
S4:建立图数据,将用户ID作为节点,并分别建立用户之间和节点之间的边;S5:修改GraphSage模型的采样策略,并进行模型的训练,当召回率为第三预设值时则进行上线迭代,并推送至案调岗,同时为贷前案调岗提供话术设计。
[0006]优选的,所述步骤S1中进行黑白灰样本的定义并进行判定的具体步骤包括:当黑样本和总样本的比例为第四预设值时,则通过滑动时间窗口的转换率来对黑样本的数量进行补充,当灰样本数量需要进行增加或减少时,则通过线上模型灰度迭代返回的硬标签比例来控制灰样本的比例。
[0007]优选的,所述步骤S2中为每一个用户建立一个四维张量,并进行重编码操作的具体步骤包括:为每一个用户建立一个四维张量,其中每个维度分别代表停留时间、event_title向量、次数向量和时间戳,并执行重编码操作。
[0008]优选的,所述步骤S3的具体步骤包括:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算,根据每个用户和其他用户之间的行为相似性计算出相似度数值,其计算方法为:从(0,0)开始匹配序列Q和C,每到一个点,就将之前所有的点计算的距离进行累加,到达终点(n,m)后,其累加距离即为总距离,即序列Q和C的相似度。
[0009]优选的,所述步骤S4中分别建立用户之间和节点之间的边的具体步骤为:通过用户之间的受邀与否的关系建立边,通过相似度作为节点之间联系的边,且两个边均带权重,再进行归一化处理。
[0010]优选的,所述步骤S5中修改GraphSage模型的采样策略的具体步骤包括:按照边的加权平均最大的TOPK作为采样计算的规则,对GraphSage模型的每一层的采样方法进行修改。
[0011]优选的,所述步骤S5中提供的话术设计具体包括:所述话术设计包括询问贷款需求和对活动的评价。
[0012]优选的,本专利技术还提供了一种老带新活动反欺诈识别系统,包括:配置和判定模块:用于进行黑白灰样本的定义并对样本数量进行判定,当黑白样本比为第一预设值时,则按照白样本规则进行执行;白样本规则为:(1)、确定贷款且无逾期、白名单;(2)、复贷率为第二预设值;(3)、审核通过;数据模块:用于对裂变拉新活动的行为数据进行清洗,为每一个用户建立一个四维张量,并进行重编码操作;计算模块:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算;编辑和控制模块:用于建立图数据,将用户ID作为节点,并分别建立用户之间和节点之间的边;修改GraphSage模型的采样策略,并进行模型的训练,当召回率为第三预设值时则进行上线迭代,并推送至案调岗,同时为贷前案调岗提供话术设计。
[0013]优选的,所述配置和判定模块具体包括:
当黑样本和总样本的比例为第四预设值时,则通过滑动时间窗口的转换率来对黑样本的数量进行补充,当灰样本数量需要进行增加或减少时,则通过线上模型灰度迭代返回的硬标签比例来控制灰样本的比例。
[0014]优选的,所述计算模块具体包括:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算,根据每个用户和其他用户之间的行为相似性计算出相似度数值,其计算方法为:从(0,0)开始匹配序列Q和C,每到一个点,就将之前所有的点计算的距离进行累加,到达终点(n,m)后,其累加距离即为总距离,即序列Q和C的相似度。
[0015]本专利技术的有益效果为:本专利技术提供的老带新活动反欺诈识别方法及系统,解决了传统的欺诈方法大多只能分析单个样本的风险信息的痛点,图神经网络(GraphSage)能将样本之间的关联信息作为先验知识体现在模型的训练中,即可以将深层的社会关系、节点关系、操作习惯等组合形态挖掘出来,以图结构特征、点特征、边特征的方式呈现出来,同时适用于黑产或者薅羊毛个体黑样本极少且灰样本(目前没有违约的用户很难确定是否有风险)太多的场景下,即只需要少量有标签的样本就可以训练出精度高的模型。
附图说明
[0016]通过附图中所示的本专利技术优选实施例更具体说明,本专利技术上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分,且并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本的主旨。
[0017]图1为本专利技术实施例提供的老带新活动反欺诈识别方法及系统的总体步骤示意图;图2为本专利技术实施例提供的老带新活动反欺诈识别方法及系统的流程设计示意图;图3为本专利技术提供的裂变活动的业务流程图。
具体实施方式
[0018]下面结合附图和具体实施例对本专利技术技术方案作进一步的详细描述,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0019]请参考图1

3,本专利技术实施例提供一种老带新活动反欺本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种老带新活动反欺诈识别方法,其特征在于,包括如下步骤:S1:进行黑白灰样本的定义并对样本数量进行判定,当黑白样本比为第一预设值时,则按照白样本规则进行执行;白样本规则为:(1)、确定贷款且无逾期、白名单;(2)、复贷率为第二预设值;(3)、审核通过;S2:将裂变拉新活动的行为数据进行清洗,为每一个用户建立一个四维张量,并进行重编码操作;S3:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算;S4:建立图数据,将用户ID作为节点,并分别建立用户之间和节点之间的边;S5:修改GraphSage模型的采样策略,并进行模型的训练,当召回率为第三预设值时则进行上线迭代,并推送至案调岗,同时为贷前案调岗提供话术设计。2.如权利要求1所述的老带新活动反欺诈识别方法,其特征在于,所述步骤S1中进行黑白灰样本的定义并进行判定的具体步骤包括:当黑样本和总样本的比例为第四预设值时,则通过滑动时间窗口的转换率来对黑样本的数量进行补充,当灰样本数量需要进行增加或减少时,则通过线上模型灰度迭代返回的硬标签比例来控制灰样本的比例。3.如权利要求1所述的老带新活动反欺诈识别方法,其特征在于,所述步骤S2中为每一个用户建立一个四维张量,并进行重编码操作的具体步骤包括:为每一个用户建立一个四维张量,其中每个维度分别代表停留时间、event_title向量、次数向量和时间戳,并执行重编码操作。4.如权利要求1所述的老带新活动反欺诈识别方法,其特征在于,所述步骤S3的具体步骤包括:基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算,根据每个用户和其他用户之间的行为相似性计算出相似度数值,其计算方法为:从(0,0)开始匹配序列Q和C,每到一个点,就将之前所有的点计算的距离进行累加,到达终点(n,m)后,其累加距离即为总距离,即序列Q和C的相似度。5.如权利要求1所述的老带新活动反欺诈识别方法,其特征在于,所述步骤S4中分别建立用户之间和节点之间的边的具体步骤为:通过用户之间的受邀与否的关系建立边,通过相似度作为节点之...

【专利技术属性】
技术研发人员:韩柳李远鑫郑宇晟黄文辉钟佳邹健娣
申请(专利权)人:中邮消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1