一种基于邻域拓扑结构的异常金融组织层次划分系统及其工作方法技术方案

技术编号:26892241 阅读:72 留言:0更新日期:2020-12-29 16:12
本发明专利技术涉及一种基于邻域拓扑结构的异常金融组织层次划分系统及其工作方法,包括依次连接的数据预处理模块、邻域拓扑结构特征提取模块和异常金融组织层次划分模块;数据预处理模块对输入的异常金融组织交易流水数据进行数据清洗,构建异常金融组织的交易网络;邻域拓扑结构特征提取模块为每个账号生成对应的低维稠密向量;异常金融组织层次划分模块对每个账号生成的低维稠密向量进行降维处理,并进行聚类操作,获取异常金融组织层次划分结果。本发明专利技术只需要异常金融组织的交易记录的转账双方信息,在一定程度上减少了人工参与,降低了人力成本,能够取得很好的层次划分结果,实现了异常金融组织层次划分的自动化处理。

【技术实现步骤摘要】
一种基于邻域拓扑结构的异常金融组织层次划分系统及其工作方法
本专利技术涉及一种异常金融组织层次划分系统及其工作方法,尤其涉及一种基于邻域拓扑结构的异常金融组织层次划分系统及其工作方法。
技术介绍
异常金融组织是金融交易行为存在异常情形的金融组织,种类繁多。常见的有传销组织、非法集资组织、洗钱组织等。其中,传销组织是典型的异常金融组织。传销是一种扰乱经济秩序的犯罪行为,本质上属于“庞氏骗局”,即利用新加入人员的钱来向先前加入人员支付利息和短期回报,以制造赚钱的假象进而骗取更多的投资。传销组织具有典型的金字塔架构,传销组织成员之间相互转账构成的交易网络也具有典型的层次性。根据传销组织交易网络准确判断传销组织成员在传销组织中的级别层次具有充分的现实意义。目前,根据传销组织转账交易分析传销组织成员级别的方法在很大程度上依赖人工判断,需要大量人力参与。而面对繁复众多的传销组织数据,传统的利用人工判断的方法无法有效满足大规模数据分析处理的需要。目前,基于网络表示学习的方法在提取网络信息方面取得了很大进展。这类方法可以将网络中的节点映射成低维本文档来自技高网...

【技术保护点】
1.一种基于邻域拓扑结构的异常金融组织层次划分系统,其特征在于,包括依次连接的数据预处理模块、邻域拓扑结构特征提取模块和异常金融组织层次划分模块;/n所述数据预处理模块用于:对输入的异常金融组织交易流水数据依次进行去重、去噪和去不完整数据操作,并提取异常金融组织交易流水数据中的交易账号信息和交易对手账号信息,构建异常金融组织的交易网络;所述异常金融组织交易流水数据包括交易账号、对手账号、交易金额、交易时间、摘要、交易余额、交易地点;/n所述邻域拓扑结构特征提取模块用于:使用自定义的基于邻域拓扑结构的网络表示学习方法处理异常金融组织的交易网络的数据,提取交易/n网络账号节点的邻域拓扑结构信息,为...

【技术特征摘要】
1.一种基于邻域拓扑结构的异常金融组织层次划分系统,其特征在于,包括依次连接的数据预处理模块、邻域拓扑结构特征提取模块和异常金融组织层次划分模块;
所述数据预处理模块用于:对输入的异常金融组织交易流水数据依次进行去重、去噪和去不完整数据操作,并提取异常金融组织交易流水数据中的交易账号信息和交易对手账号信息,构建异常金融组织的交易网络;所述异常金融组织交易流水数据包括交易账号、对手账号、交易金额、交易时间、摘要、交易余额、交易地点;
所述邻域拓扑结构特征提取模块用于:使用自定义的基于邻域拓扑结构的网络表示学习方法处理异常金融组织的交易网络的数据,提取交易
网络账号节点的邻域拓扑结构信息,为每个账号生成对应的低维稠密向量;
所述异常金融组织层次划分模块用于:首先,使用PCA方法对每个账号生成的低维稠密向量进行降维处理,然后,使用k-means算法对降维处理后的低维稠密向量进行聚类操作,获取异常金融组织层次划分结果。


2.权利要求1所述的异常金融组织层次划分系统的工作方法,其特征在于,运行于计算机中,包括步骤如下:
(1)所述数据预处理模块对输入的异常金融组织交易流水数据依次进行去重、去噪和去不完整数据操作,并提取异常金融组织交易流水数据中的每一条交易记录的交易账号和交易对手账号,构建异常金融组织的交易网络;
(2)所述邻域拓扑结构特征提取模块使用自定义的基于邻域拓扑结构的网络表示学习方法处理异常金融组织的交易网络的数据,提取交易网络账号节点的邻域拓扑结构信息,为每个账号生成对应的低维稠密向量;
(3)所述异常金融组织层次划分模块先使用PCA方法对每个账号生成的低维稠密向量进行降维处理,然后使用k-means算法对降维处理后的低维稠密向量进行聚类操作,获取异常金融组织层次划分结果。


3.根据权利要求2所述的异常金融组织层次划分系统的工作方法,其特征在于,步骤(1)中,数据清洗,包括:
A、去不完整数据:即清洗格式不规范数据,格式不规范数据是指交易账号和交易对手账号位数与标准银行卡账号位数不一致的数据;
B、去噪:即清洗交易金额小于50元的数据;
C、去重:即清洗冗余数据,冗余数据是指异常金融组织交易流水数据中存在的同一笔交易记录以不同方式被记录两次的情况。


4.根据权利要求2所述的异常金融组织层次划分系统的工作方法,其特征在于,步骤(1)中,提取异常金融组织交易流水数据中的交易账号信息和交易对手账号信息,构建异常金融组织的交易网络,包括:
D、统计异常金融组织交易流水数据所涉及的账号集合C={c1,c2,…,ci,…,cn},表示一共有n个账号,C表示所有账号的集合,ci表示集合中的第i个账号;
E、根据f(ci)=vi构建交易网络的点集V={v1,v2,…,vi,…vn},将每个账号ci映射为一个正整数,范围为[1,n],vi=i,i=1,2,…,n,
F、根据交易网络的点集V、账号集合C和交易流水数据,构建交易网络的边集ei,j=(vi,vj),对于有wi,j与其对应,wi,j表示账号ci,cj之间的交易次数,且有wi,j=wj,i,
G、最终构建交易网络:G={V,E}。


5.根据权利要求4所述的异常金融组织层次划分系统的工作方法,其特征在于,步骤(2)中,包括步骤如下:
给定一个图G=(V,E),V={v1,v2,…,vi,…vn},表示有n个节点的集合;表示图G的边集;对于任意一条边ei,j,存在权重wi,j与其相对,wi,j≥0;如果两节点vi,vj之间没有边相连,那么wi,j=0,否则wi,j>0;若图G是无向图,那么ei,j≡ej,i,wi,j=wj,i;如果图G是无权图,那么wi,j=1,否则wi,j≥0;
节点v相对于节点u的能级为elu(v),设定初始能量Qu(u)=1,共有k*级能级,第k级能级能量范围为从点u出发到达点v的剩余能量为Qu(v),若则elu(v)=k;所有相对点u的能级为k的节点构成的集合为Nk(u),Nk(u)={vi|el(vi)=k};
最大采样深度d*表示以某节点为中心,按距离逐层向外扩展采样,所能采样得到的节点到中心节点距离的最大值;
二次图G′={V,E′,S},G′是在原始图基础上生成的无向有权的完全图,为边的集合,对于任意一条边ei,j都有权重si,j与其对应,si,j≥0,反映节点vi和节点vj的邻域结构相似度;
H、通过NTF算法为每个节点生成各自的影响力子网络;从交易网络G中取出一节点作为中心节点,NTF模型从交易网络G中筛选出对中心节点邻域结构重要程度较大的邻居节点,连同边一起构成中心节点的影响力子图即影响力子网络;是指:设中心节点为u,初始能量Qu(u)=1,从点u出发,能量沿边进行传播,直到能量处于最低能级或剩余能量不足以到达下一节点为止;设定存在一路径P={u,v1,…,vi,vj},vj到中心节点u的距离为k,从点u出发,能量沿该路径传播,经vi到达vj时的剩余能量Qu(vj)如公式(I)所示:



式(I)中,Qu(vi)表示从节点u出发沿路径P到达点vi时的剩余能量,k表示vj到u的距离,wi,j代表边ei,j的权重,α是能量衰减率,l(P)表示路径P的长度,d(vj)表示节点vj的度;
从点u出发,所能抵达的节点的集合记为V(u),...

【专利技术属性】
技术研发人员:马东阳王巍王佰玲辛国栋刘扬黄俊恒
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1