System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及欺诈用户识别领域,尤其涉及一种基于全局图重构和图联邦学习的欺诈用户识别方法。
技术介绍
1、近年来,基于图神经网络(gnn)的欺诈用户检测模型,成为了金融机构、企业等主体机构识别其潜在欺诈用户的强力工具。通过使用大量的用户数据以及反应用户之间关系的图结构进行训练,基于图神经网络的用户欺诈模型可以充分利用用户之间的关系信息,对欺诈用户进行高准确率地识别。
2、然而,在业界实际应用场景中,受限于数据缺失与昂贵的标注成本,训练数据不充足的问题常常阻碍着基于图神经网络欺诈识别模型的应用。一种自然而然的想法是在不同主体之间共享数据来协作地训练模型。可是,由于各主体之间牵涉广泛(包括金融机构、运营商、服务提供商等),并且主体间信息相互独立,基于保护隐私和信息安全的要求,直接共享数据来协作训练模型的想法并不可行。
3、近年来,联邦学习逐渐成为了解决上述数据孤岛问题主流方案。联邦学习可以使参与联邦训练的客户(client)能够在不共享原始数据的前提下协作训练机器学习模型。然而,现有的基于图神经网络的联邦欺诈用户识别方案存在着一个亟待解决的技术问题:他们忽略了的跨主体节点连接缺失的问题。具体来说,在已有方法中,每个联邦学习的客户(即金融机构、企业等主体)都拥有一个根据用户数据构造的用户关系图,图中每个节点代表一个用户,并且每个节点拥有一个包含了该用户信息的特征向量(例如:姓名,账户编号,出生年月,开户地点等),图中的边代表用户之间的联系(例如:交易记录、亲属关系等)。然而,受限于各主体之间信息独立,每个主体只
4、需要注意的是,这样的跨主体连接信息的缺失并非微不足道,因为其可能会显著地影响联邦学习框架下学到的欺诈用户检测模型性能。究其原因,是因为大多数图神经网络模型(例如gcn、graphsage和gin)均遵循消息传递机制,即每个图中的节点通过聚合邻居节点的信息来更新自身的表征,由于上述跨主体边的缺失,每个节点只能聚合其所在图中的邻居信息,而无法聚合位于其他图中的邻居节点的信息,导致每个节点可能无法学习到理想的表征。同时,相比其他图数据挖掘任务,欺诈用户检测的模型对于输入的图结构的质量更加敏感。因此,上述的跨主体连接缺失问题,最终往往导致令人失望的欺诈用户识别准确率。
技术实现思路
1、针对现有技术不足,本专利技术提供了一种基于全局图重构和图联邦学习的欺诈用户识别方法。
2、第一方面,本专利技术实施例提供了一种基于全局图重构和图联邦学习的欺诈用户识别方法,应用于客户端,所述方法包括:
3、客户端根据本地拥有的用户数据组成本地图数据,所述本地图数据包括特征矩阵和用于表示用户关系的邻接矩阵;通过预先训练好的本地模型对本地图数据中的特征矩阵进行压缩得到节点表征矩阵,并上传至服务器;
4、客户端接收服务器下发预先训练好的全局模型、全局子表征矩阵;使用全局模型替换本地模型,利用替换后的本地模型提取本地表征矩阵;将全局子表征矩阵与本地表征矩阵进行拼接,得到增强表征矩阵;将增强表征矩阵经全连接神经网络、softmax函数处理后得到欺诈用户识别概率;
5、其中,全局子表征矩阵为全局表征矩阵的子矩阵,全局表征矩阵由服务器对每一客户端上传的节点表征矩阵进行拼接得到。
6、第二方面,本专利技术实施例提供了一种基于全局图重构和图联邦学习的欺诈用户识别方法,应用于服务端,所述方法包括:
7、服务器接收每一客户端上传的节点表征矩阵并进行拼接,得到全局表征矩阵;其中,节点表征矩阵由预先训练好的本地模型对本地图数据中的特征矩阵进行压缩得到,所述本地图数据由客户端根据本地拥有的用户数据组成,所述本地图数据包括特征矩阵和用于表示用户关系的邻接矩阵;
8、将全局表征矩阵的子矩阵记为全局子表征矩阵,服务器将全局子表征矩阵下发至对应的客户端,将预先训练好的全局模型传播至每一客户端;
9、利用预先训练好的全局模型执行欺诈用户识别任务。
10、与现有技术相比,本专利技术的有益效果为:本专利技术提供了一种基于全局图重构和图联邦学习的欺诈用户识别方法,通过在服务器上重构包含所有节点关系的全局表征矩阵,以恢复不同客户节点(用户)之间缺失的关系。随后,根据重构后的全局表征矩阵来生成每个用户的全局子表征矩阵,并将每个节点的全局子表征矩阵返回给对应客户(主体)从而为每个节点提供其跨客户端邻居的知识,提高联邦框架下欺诈用户识别模型的准确率。
本文档来自技高网...【技术保护点】
1.一种基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,应用于客户端,所述方法包括:
2.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,客户端根据本地拥有的用户数据组成本地图数据包括:
3.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,通过预先训练好的本地模型对本地图数据中的特征矩阵进行压缩得到节点表征矩阵包括:
4.根据权利要求3所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,图自编码器模型的前向推理过程的表达式如下:
5.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,将全局子表征矩阵与本地表征矩阵进行拼接,得到增强表征矩阵;将增强表征矩阵经全连接神经网络、SoftMax函数处理后得到欺诈用户识别概率包括:
6.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,全局表征矩阵由服务器对每一客户端上传的节点表征矩阵进行拼接得到包括:
7.根据权利要求1所述的基于全
8.一种基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,应用于服务端,所述方法包括:
...【技术特征摘要】
1.一种基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,应用于客户端,所述方法包括:
2.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,客户端根据本地拥有的用户数据组成本地图数据包括:
3.根据权利要求1所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,通过预先训练好的本地模型对本地图数据中的特征矩阵进行压缩得到节点表征矩阵包括:
4.根据权利要求3所述的基于全局图重构和图联邦学习的欺诈用户识别方法,其特征在于,图自编码器模型的前向推理过程的表达式如下:
5.根据权利要求1所述的基...
【专利技术属性】
技术研发人员:刘志,周涵林,张德举,崔成勇,卞纪新,朱李楠,孔祥杰,沈国江,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。