The invention relates to an online transaction fraud detection method based on entity relationship, the key of which is to extract entity relationship according to transaction data, build a bipartite graph of relationship network, propose a heterogeneous network homogenization method based on node contraction and a neighborhood information aggregation promotion tree classification model mechanism based on integrated learning and graph learning. The method provided by the invention, from the perspective of practicability, by transforming the attention from the transaction node itself to several levels of neighborhood information of transactions in the relational network, fully considering the potential association relationship between transactions, provides the possibility for mining Gang fraud. Gradient promotion model improves the effect of fraud identification by continuously fitting the residual of the model, which has a good performance effect. At the same time, this method extends integrated learning from the application of grid data to the application of graph data. Based on the above aspects, the framework of fraud detection method for loan transaction is established, which provides technical support for solving fraud detection.
【技术实现步骤摘要】
一种基于实体关系的在线交易欺诈检测方法
本专利技术涉及一种网络交易检测方法,属于信息
技术介绍
近年来,随着互联网技术的发展,在金融领域催生了一大批新兴业务。网络交易为用户带来便利的同时,也为网络黑产提供了可乘之机。当前网络黑产呈现产业化、精准化、移动化、技术化等特征,尤其是线上信贷金融业务领域,这不仅要求对借款人的信用资质进行评估,还需要格外关注潜在的欺诈行为。对抗网络黑产已经成为互联网金融企业的一项核心研究课题。类比传统的线下贷款流程需要收集申请人的关系信息,相关联系人在贷款业务中扮演着担保人的角色。目前的研究方法,主要是利用逻辑回归、决策树、随机森林等机器学习模型对金融交易特征进行分析,对于交易记录中的诸如联系人这样具有实体特征的属性,由于其离散化数量多方差大等特点,在建模过程中基本不予考虑,这些实体属性未能很好地表征和利用。尤其是在互联网信贷领域,借款申请人的社交关系在一定程度上能够反映该申请人较为准确的社会特征,对欺诈检测具有一定的作用。不同于传统的社交关系网络,金融交易网络是异质的非连通稀疏图,且带有属性。这就使得传统的社交网络分析方法无法运用,非连通性导致衡量网络传递性的指标失效,例如,标签染色算法、pagerank算法和聚类系数指标等;稀疏图的属性使得中心性指标意义不大;而节点的同质性是社会网络分析的前提,不同物理意义、不同属性特征的节点在图域中属于不同的维度空间。同时,社会网络分析仅仅根据图的图的拓扑结构进行分析,然而线上业务间的弱关系性,无法作为交易欺诈检测的唯一且可信的 ...
【技术保护点】
1.一种基于实体关系的在线交易欺诈检测方法,包括基于关系网络的同质化节点收缩算法和基于图表征与集成学习的邻域聚合提升树算法,其特征在于,包括以下步骤:/n(1)构建交易实体与属性实体之间的金融交易二分图关系网络,本质上是异质的带有属性的非连通稀疏图,构建过程包括如下步骤:/nS101、划分数据集/n将交易数据根据属性是否具有实体意义,划分为纯交易属性集合和用于构建网络的实体关系集合;/nS102、特征工程/n对于纯交易属性集合做特征工程,衍生变量;/nS103、原始网络构建/n对于实体关系集合,进行交易实体和属性实体之间的连接,得到代表不同物理意义节点的交易网络,该交易网络的本质上异质的带有属性的非连通稀疏二分图,一部分是交易实体节点集合,另一部分是抽象化掉实际物理意义的实体属性节点集合;/nS104、返回数据集;/n(2)金融交易二分图关系网络为异质网络,针对异质网络无法统一表征问题,利用节点收缩算法对金融交易二分图关系网络进行同质化处理得到同质化网络H,包括以下步骤:/nS201、计算准备/n金融交易二分图关系网络包括交易节点集合T和属性节点集合A,各集合内部没有边,集合之间有边相 ...
【技术特征摘要】
1.一种基于实体关系的在线交易欺诈检测方法,包括基于关系网络的同质化节点收缩算法和基于图表征与集成学习的邻域聚合提升树算法,其特征在于,包括以下步骤:
(1)构建交易实体与属性实体之间的金融交易二分图关系网络,本质上是异质的带有属性的非连通稀疏图,构建过程包括如下步骤:
S101、划分数据集
将交易数据根据属性是否具有实体意义,划分为纯交易属性集合和用于构建网络的实体关系集合;
S102、特征工程
对于纯交易属性集合做特征工程,衍生变量;
S103、原始网络构建
对于实体关系集合,进行交易实体和属性实体之间的连接,得到代表不同物理意义节点的交易网络,该交易网络的本质上异质的带有属性的非连通稀疏二分图,一部分是交易实体节点集合,另一部分是抽象化掉实际物理意义的实体属性节点集合;
S104、返回数据集;
(2)金融交易二分图关系网络为异质网络,针对异质网络无法统一表征问题,利用节点收缩算法对金融交易二分图关系网络进行同质化处理得到同质化网络H,包括以下步骤:
S201、计算准备
金融交易二分图关系网络包括交易节点集合T和属性节点集合A,各集合内部没有边,集合之间有边相连表示交易实体和其属性之间的表征关系,以属性节点集合A为中心,计算属性节点集合A中的每个属性节点的邻居节点个数;
S203、节点收缩过程
对于属性节点集合A中,邻居节点个数大于1的属性节点,将与其相连的交易节点直接相连,同时将该属性节点删除,构成同质网络H;
S204、在同质网络H中删除重复出现的边;
S205、同质化过程结束;
(3)基于图的邻域信息聚合提升树方法,将交易特征通过关系网络进行信息融合,关注交易自身属性的同时,关注其邻域节点的属性,邻域信息聚合提升树算法以cart回归树作为基分类器,采用boosting串行基分类器的思想,每一棵新树的建立是为了拟合残差,包括以下步骤:
S301、节点分裂依据
加入防止过拟合的正则化操作...
【专利技术属性】
技术研发人员:章昭辉,蒋昌俊,王鹏伟,孟盈,
申请(专利权)人:东华大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。