一种面向流网络的角色划分系统及其工作方法、介质技术方案

技术编号:26924811 阅读:12 留言:0更新日期:2021-01-01 22:50
本发明专利技术涉及一种角色划分系统及其工作方法、介质,包括数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;数据采集模块用于获取转账数据;有向加权网络获取模块用于将转账数据表示成有向加权网络;嵌入模块用于首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;聚类模块用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。本发明专利技术能快速地发现一个经济组织的角色组成,结合经验找到可能是高级成员的角色。

【技术实现步骤摘要】
一种面向流网络的角色划分系统及其工作方法、介质
本专利技术涉及一种角色划分系统及其工作方法、介质,尤其涉及一种面向流网络的角色划分系统及其工作方法。
技术介绍
网络中,每个节点都有自己的角色。同样的角色有相似的行为、功能、作用。例如企业网络,角色可以是经理,组长,普通员工。角色有助于研究一个组织或系统的关键节点,分析层级结构,也能为多个网络间的比较提供参考信息。对一个经济组织进行银行卡号的角色划分有利于了解其组织结构,有利于快速找到高级成员,核心成员,而且由于只需要银行数据,不会引起被调查组织的注意。这在调查疑似非法经济组织比如传销组织时十分有用。目前没有公开的对银行卡号进行角色划分的方法,然而,由于转账数据可以表示为流网络,角色划分也可以表示为对流网络的节点角色划分。流网络是一种特殊的有向加权网络,其边表示能量,物质,货币,信息等的流动,边的权重表示流量。我们关注的流网络是非平衡的流网络,指节点的入流量未必等于出流量。这在现实世界中很常见,例如企业内的资金流网络。在相近的问题上国内外提出了一些方法。但是由于这些方法只能划分出预定义的三、四类典型角色,或者忽略网络的方向和权重,它们在有向加权的转账网络上效果不好。处理近似问题的方法具体如下:唐诗琦等人提出了一种角色发现算法,实质上也就是节点嵌入算法,利用节点的度中心性,特征向量,特征值去构建特征矩阵,然后使用非负矩阵分解,处理的对象是一般的网络。李婉钰提出了一种角色发现算法,受物理学场和势的概念的启发,在网络中提出了拓扑势的概念,并针对有向加权网络,提出了出拓扑势和入拓扑势,不过,出(入)拓扑势只是影响力求和,对网络结构不敏感,该算法只能分出四种典型角色或者介于四种角色之间的模糊角色。这样的角色和本文研究的角色字面相同而实质差异巨大。郑昆仑提出了一种角色分析算法,该算法根据节点的一些属性(度中心性、介数、PageRank排名)寻找重要节点,然后删除重要节点,再删除只受影响的节点,然后在剩下的网络中继续这一过程,总体上是通过不断地拆解网络来找到重要节点,该算法没有考虑边的权重,不适用于加权网络。钟晓宇提出了一种角色划分方法,和前述的李婉钰的方法类似,该方法只能分出三种典型角色。节点嵌入(表示学习)是角色划分的重要步骤,目前在国外已经有各种节点嵌入方法被提出。RolX,struc2vec和GraphWave是基于结构性角色的表示学习方法,结构性角色相似的点得到靠近的向量。RolX使用ReFeX算法提取特征矩阵,再使用非负矩阵分解,得到嵌入向量。struc2vec根据节点的结构相似性重构网络,用强边连接两个相似的点,在新的网络上用DeepWalk获得节点的向量表示。struc2vec仅关注拓扑结构,忽略边和点的属性。GraphWave使用扩散小波处理拉普拉斯矩阵,将小波系数作为概率分布处理,GraphWave在无向网络上有很好的表现,而且能考虑边的权重。RolX,struc2ve和GraphWave都只能处理无向图。DEG是有向图上的表示学习方法,LINE,node2vec既可以用于无向图也可以用于有向图,但它们依据的是亲密度而不是相似度。Graph2Gauss利用网络结构和节点参数嵌入节点,但其所说的网络结构仅仅指距离,这样距离近的节点更可能得到相近的嵌入向量,所以Graph2Gauss和角色无关。目前,尚没有一种方法面向流网络计算网络的节点嵌入(将节点表示成向量),进而在向量空间中对节点嵌入进行聚类划分。从而实现流网络的节点角色划分。
技术实现思路
针对现有技术的不足,本专利技术提供了一种面向流网络的角色划分系统;本专利技术还提供了角色划分系统的工作方法;本专利技术的目的是:对一组银行卡号进行角色划分,指出一共有几种角色,每种角色对应哪些银行卡号。本专利技术的角色划分并不能识别出每种角色的含义,比如是老板还是经理,只知道属于同一角色的银行卡号都有相似的转账行为,而且不同角色的卡号的转账行为不同。银行卡号的角色划分是指,把输入的所有银行卡号分到多个组,每个组里的银行卡号具有相同角色,不同组的银行卡号的角色不同,比如输入包含5个银行卡号a、b、c、d、e的数据集,经过角色划分系统处理后,得到两组,一组abc,一组是de,那么就表示这些卡号有两种角色,abc是一个角色,de是一个角色。术语解释:1、聚敛子图,对于一个点a,a点的聚敛子图是一个无向图,该图的点包括原图所有点,该图的边包含可能承载流向a点的物质的边。用数学语言描述a点的聚敛子图边集Egat(a)的生成过程:对于原图每一条指向a的边<n,a>,将其加到Egat(a)中,并称n为a的一阶上游邻居,对于每一个a的一阶上游邻居n做同样的处理,即将每一条指向n的边<m,n>加到Egat(a)中,并称m为a的二阶上游邻居,以此类推,将所有从a的k+1阶上游邻居指向k阶上游邻居的边加到Egat(a)中,直到没有新的边被添加,聚敛子图中的边保留原图的权重,丢弃方向。2、扩散子图,对于一个点a,a点的扩散子图是一个无向图,该图的点包括原图所有点,该图的边包含可能承载从a点流出的物质的边。用数学语言描述a点的扩散子图边集Edif(a)的生成过程:与Egat(a)的生成过程对称,将所有从a的k阶下游邻居指向k+1阶下游邻居的边加到Edif(a)中,直到没有新的边被添加,扩散子图中的边保留原图的权重,丢弃方向。3、PCA,PrincipalComponentsAnalysis主成分分析,一种著名的降维方法。本专利技术的技术方案为:一种面向流网络的角色划分系统,包括依次连接的数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;所述数据采集模块用于:获取转账数据;所述有向加权网络获取模块用于:将转账数据表示成有向加权网络;所述嵌入模块用于:首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;所述聚类模块用于:用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。上述面向流网络的角色划分系统的工作方法,包括步骤如下:(1)所述数据采集模块获取转账数据;转账数据是指银行卡之间的转账的数据,每一条银行卡之间的转账的数据包括转出方的卡号、转入方的卡号、金额、时间;(2)所述有向加权网络获取模块将转账数据表示成有向加权网络;(3)通过所述嵌入模块获取节点嵌入;首先为每一个节点抽取两张无向子图,然后用GraphWave算法获取结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;(4)通过所述聚类模块实现角色划分:使用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。根据本专利技术优选的,步骤(2)中,将转账数据表示成有向加权网络,是指:将所有转出方的卡号及所有转入方的卡号表示成有向加权网络里的点,转出方的卡号、转入方的卡号之间的累计转账金额表示成两个点之间的有本文档来自技高网
...

【技术保护点】
1.一种面向流网络的角色划分系统,其特征在于,包括依次连接的数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;/n所述数据采集模块用于:获取转账数据;所述有向加权网络获取模块用于:将转账数据表示成有向加权网络;所述嵌入模块用于:首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;所述聚类模块用于:用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。/n

【技术特征摘要】
1.一种面向流网络的角色划分系统,其特征在于,包括依次连接的数据采集模块、有向加权网络获取模块、嵌入模块及聚类模块;
所述数据采集模块用于:获取转账数据;所述有向加权网络获取模块用于:将转账数据表示成有向加权网络;所述嵌入模块用于:首先为每一个节点抽取两张无向子图,然后采用GraphWave算法结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;所述聚类模块用于:用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。


2.权利要求1所述的面向流网络的角色划分系统的工作方法,其特征在于,包括步骤如下:
(1)所述数据采集模块获取转账数据;转账数据是指银行卡之间的转账的数据,每一条银行卡之间的转账的数据包括转出方的卡号、转入方的卡号、金额、时间;
(2)所述有向加权网络获取模块将转账数据表示成有向加权网络;
(3)通过所述嵌入模块获取节点嵌入;首先为每一个节点抽取两张无向子图,然后用GraphWave算法获取结构性嵌入,最后整合结构性嵌入和节点的出入流量差得到节点嵌入;
(4)通过所述聚类模块实现角色划分:使用改进的自组织映射神经网络对上一步得到的节点嵌入进行聚类,得到节点的角色划分。


3.根据权利要求2所述的面向流网络的角色划分系统的工作方法,其特征在于,步骤(2)中,将转账数据表示成有向加权网络,是指:将所有转出方的卡号及所有转入方的卡号表示成有向加权网络里的点,转出方的卡号、转入方的卡号之间的累计转账金额表示成两个点之间的有向边,从转出方指向转入方,权重为金额,即得有向加权网络。


4.根据权利要求2所述的面向流网络的角色划分系统的工作方法,其特征在于,步骤(3)中,为每一个节点抽取两张无向子图,无向子图包括聚敛子图和扩散子图,包括步骤如下:
G=(V,E),表示原图,即步骤(2)得到的有向加权网络;V是点集,包括有向加权网络中的每个点;E是边集,包括有向加权网络中的每条边;
聚敛子图的获取过程如下:
Ggat(a)=(V,Egat(a)),表示关于点a的聚敛子图;点a是点集V中的任意一点;Egat(a)是指Ggat(a)的边集;
Egat(a)的求取过程为:对于每一条指向a的边<n,a>,将其加到Egat(a)中,并称n为a的一阶上游邻居,对于每一个a的一阶上游邻居n做同样的处理,即将每一条指向n的边<m,n>加到Egat(a)中,并称m为a的二阶上游邻居,以此类推,将所有从a的k+1阶上游邻居指向k阶上游邻居的边加到Egat(a)中,直到没有新的边被添加,聚敛子图中的边保留原图的权重,丢弃方向;
扩散子图的获取过程如下:
Gdif(a)=(V,Edif(a)),表示关于点a的扩散子图;Edif(a)是指Gdif(a)的边集;
Edif(a)的求取过程为:对于每一条源点为a的边<a,n>,将其加到Edif(a)中,并称n为a的一阶下游邻居,对于每一个a的一阶下游邻居n做同样的处理,即将每一条源点为n的边<n,m>加到Edif(a)中,并称m为a的二阶下游邻居,以此类推,将所有从a的k阶下游邻居指向k+1阶上游邻居的边加到Edif(a)中,直到没有新的边被添加,扩散子图中...

【专利技术属性】
技术研发人员:杜研王巍王佰玲辛国栋刘扬黄俊恒
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1