【技术实现步骤摘要】
一种面向流网络的角色划分系统及其工作方法、介质
本专利技术涉及一种角色划分系统及其工作方法、介质,尤其涉及一种面向流网络的角色划分系统及其工作方法。
技术介绍
网络中,每个节点都有自己的角色。同样的角色有相似的行为、功能、作用。例如企业网络,角色可以是经理,组长,普通员工。角色有助于研究一个组织或系统的关键节点,分析层级结构,也能为多个网络间的比较提供参考信息。对一个经济组织进行银行卡号的角色划分有利于了解其组织结构,有利于快速找到高级成员,核心成员,而且由于只需要银行数据,不会引起被调查组织的注意。这在调查疑似非法经济组织比如传销组织时十分有用。目前没有公开的对银行卡号进行角色划分的方法,然而,由于转账数据可以表示为流网络,角色划分也可以表示为对流网络的节点角色划分。流网络是一种特殊的有向加权网络,其边表示能量,物质,货币,信息等的流动,边的权重表示流量。我们关注的流网络是非平衡的流网络,指节点的入流量未必等于出流量。这在现实世界中很常见,例如企业内的资金流网络。在相近的问题上国内外提出了一些方法。但是由于这些方法只能划分出预定义的三、四类典型角色,或者忽略网络的方向和权重,它们在有向加权的转账网络上效果不好。处理近似问题的方法具体如下:唐诗琦等人提出了一种角色发现算法,实质上也就是节点嵌入算法,利用节点的度中心性,特征向量,特征值去构建特征矩阵,然后使用非负矩阵分解,处理的对象是一般的网络。李婉钰提出了一种角色发现算法,受物理学场和势的概念的启发,在网络中提出了拓扑势的概念 ...
【技术保护点】
1.一种面向流网络的角色划分系统,其特征在于,包括依次连接的数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;/n所述数据采集模块用于:获取转账数据;所述有向加权网络获取模块用于:将转账数据表示成有向加权网络;所述嵌入模块用于:首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;所述聚类模块用于:用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。/n
【技术特征摘要】
1.一种面向流网络的角色划分系统,其特征在于,包括依次连接的数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;
所述数据采集模块用于:获取转账数据;所述有向加权网络获取模块用于:将转账数据表示成有向加权网络;所述嵌入模块用于:首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;所述聚类模块用于:用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。
2.权利要求1所述的面向流网络的角色划分系统的工作方法,其特征在于,包括步骤如下:
(1)所述数据采集模块获取转账数据;转账数据是指银行卡之间的转账的数据,每一条银行卡之间的转账的数据包括转出方的卡号、转入方的卡号、金额、时间;
(2)所述有向加权网络获取模块将转账数据表示成有向加权网络;
(3)通过所述嵌入模块获取节点嵌入;首先为每一个节点抽取两张无向子图,然后用GraphWave算法获取结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;
(4)通过所述聚类模块实现角色划分:使用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。
3.根据权利要求2所述的面向流网络的角色划分系统的工作方法,其特征在于,步骤(2)中,将转账数据表示成有向加权网络,是指:将所有转出方的卡号及所有转入方的卡号表示成有向加权网络里的点,转出方的卡号、转入方的卡号之间的累计转账金额表示成两个点之间的有向边,从转出方指向转入方,权重为金额,即得有向加权网络。
4.根据权利要求2所述的面向流网络的角色划分系统的工作方法,其特征在于,步骤(3)中,为每一个节点抽取两张无向子图,无向子图包括聚敛子图和扩散子图,包括步骤如下:
G=(V,E),表示原图,即步骤(2)得到的有向加权网络;V是点集,包括有向加权网络中的每个点;E是边集,包括有向加权网络中的每条边;
聚敛子图的获取过程如下:
Ggat(a)=(V,Egat(a)),表示关于点a的聚敛子图;点a是点集V中的任意一点;Egat(a)是指Ggat(a)的边集;
Egat(a)的求取过程为:对于每一条指向a的边<n,a>,将其加到Egat(a)中,并称n为a的一阶上游邻居,对于每一个a的一阶上游邻居n做同样的处理,即将每一条指向n的边<m,n>加到Egat(a)中,并称m为a的二阶上游邻居,以此类推,将所有从a的k+1阶上游邻居指向k阶上游邻居的边加到Egat(a)中,直到没有新的边被添加,聚敛子图中的边保留原图的权重,丢弃方向;
扩散子图的获取过程如下:
Gdif(a)=(V,Edif(a)),表示关于点a的扩散子图;Edif(a)是指Gdif(a)的边集;
Edif(a)的求取过程为:对于每一条源点为a的边<a,n>,将其加到Edif(a)中,并称n为a的一阶下游邻居,对于每一个a的一阶下游邻居n做同样的处理,即将每一条源点为n的边<n,m>加到Edif(a)中,并称m为a的二阶下游邻居,以此类推,将所有从a的k阶下游邻居指向k+1阶上游邻居的边加到Edif(a)中,直到没有新的边被添加,扩散子图中...
【专利技术属性】
技术研发人员:杜研,王巍,王佰玲,辛国栋,刘扬,黄俊恒,
申请(专利权)人:哈尔滨工业大学威海,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。