【技术实现步骤摘要】
基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质
[0001]本专利技术属于聚类领域,具体涉及基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]当前联邦学习技术对于数据不出库下的数据联合使用,挖掘多方数据价值有较高的应用潜力,但主要支持的算法为传统机器学习分类模型、回归模型等,集中于个体的价值画像评价,对于潜在的团伙行为挖掘较为欠缺,同时由于图计算涉及多方数据的多轮拓扑交互计算,基于隐私计算的图挖掘算法开发目前研究较为薄弱,业界成果较少。
[0004]因此,基于隐私图结构的联邦学习是一个亟待解决的问题。
技术实现思路
[0005]针对上述现有技术中存在的问题,提出了一种基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质,利用这种方法、装置及计算机可读存储介质,能够解决上述问题。
[0006]本专利技术提供了以下方案。 >[0007]第一方本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于分布式图嵌入的联邦图聚类方法,其特征在于,包括:基于第一方数据构建第一图,基于第二方数据构建第二图;对所述第一方数据和所述第二方数据进行加密求交,确定所述第一图和所述第二图中的公共节点,根据所述公共节点关联所述第一图和所述第二图,得到联邦图;利用基于随机游走的分布式图嵌入算法学习所述联邦图,确定从所述第一图出发的第一图嵌入向量[PiA,PiB]和从所述第二图出发的第二图嵌入向量[PiA
’
,PiB
’
],其中,所述PiA和所述PiA
’
为所述第一图的各个第一图节点的嵌入向量,所述PiB和所述PiB
’
为所述第二图的各个第二图节点的嵌入向量;基于联邦聚类方法对所述联邦图的所述第一图嵌入向量[PiA,PiB]和所述第二图嵌入向量[PiA
’
,PiB
’
]进行聚类分析,得到聚类结果。2.根据权利要求1所述的方法,其特征在于,确定所述第一图嵌入向量[PiA,PiB]和所述第二图嵌入向量[PiA
’
,PiB
’
],包括:以所述第一图节点为起始节点在所述联邦图上进行多次随机游走,第一方根据所述第一图上的游走路径确定所述PiA,第二方根据所述第二图上的匹配游走路径确定所述PiB;以所述第二图节点为起始节点在所述联邦图上进行多次随机游走,所述第二方根据所述第二图上的游走路径确定所述PiB
’
,所述第一方根据所述第一图上的匹配游走路径确定所述PiA
’
。3.根据权利要求1所述的方法,其特征在于,根据所述公共节点关联所述第一图和所述第二图得到联邦图,还包括:剔除所述第一图和所述第二图中与所述公共节点无直接或间接的关联关系的孤岛节点,得到所述联邦图。4.根据权利要求1所述的方法,其特征在于,所述第一方数据和所述第二方数据相互隔离。5.根据权利要求1所述的方法,其特征在于,所述第一图的节点为第一方用户和/或第一方商户,所述第一图的边根据所述第一图节点之间的关联关系确定;所述第二图的节点为第二方用户和/或第二方商户,所述第二图的边根据所述第二图节点之间的关联关系确定。6.根据权利要求1所述的方法,其特征在于,对所述第一方数据和所述第二方数据进行加密求交,确定所述第一图网络和所述第二图网络中的公共节点,包括:根据商户和/或用户的属性信息,对齐所述第一图网络和所述第二图网络中的公共节点。7.根据权利要求2所述的方法,其特征在于,以所述第一图节点为起始节点在所述联邦图上进行多次所述随机游走,所述第一方根据所述第一图上的游走路径确定所述PiA,包括:定义随机游走步数M,所述第一方以任意一个所述第一图节点为起始节点在所述第一图上进行随机游走,当游走至任意一个公共节点时停止游走,并记录第一图游走步数Mia、游走到的所述公共节点的标识Vab
i
和本次游走经过的各第一图节点;在随机游走X次以后,统计每次游走的所述第一图游走步数Mia以及各第一图节点被游
走到的频数,得到对应于各个所述第一图游走步数Mia的第一图节点频数矩阵;将对应于各个所述第一图游走步数Mia的所述第一图节点频数矩阵进行矩阵累加计算,并除以随机游走次数X,得到所述第一图嵌入向量的第一图部分PiA。8.根据权利要求7所述的方法,其特征在于,所述第二方根据所述第二图上的匹配游走路径确定所述PiB,包括:在所述X次随机游走过程之中或之后,所述第一方将游走到的每个公共节点的标识Vab
i
和对应的全部第一图游走步数Mia发送给第二方;所述第二方确定从每个所述公共节点Vab
i
出发在所述第二图游走对应的第二图游走步数Mib的图嵌入向量PiB_Vab
i
,其中M=Mib+Mia;将全部的所述公共节点Vab
i
对应的图嵌入向量PiB_Vab
i
进行累加,并除以子游走次数X1,得到所述第一图嵌入向量的第二图部分PiB;其中,所述子游走次数X1是指所述X次随机游走过程中游走至所述第二图的次数。9.根据权利要求7所述的方法,其特征在于,对应于各个所述第一图游走步数Mia的所述第一图节点频数矩阵包括:PA_Mia=[Pa
n1
_Mia,n1=1,2,
…
,Na];其中,所述第一图包括Na个节点Pa
n1
;所述Mia取值为所述起始节点距离所述公共节点的最小步数m与总步数M之间的整数;所述Pa
n
_Mia为从起始节点随机游走X次Mia步之后经过所述第一图的节点Pa
n
的次数。10.根据权利要求9所述的方法,其特征在于,利用以下公式计算得到所述PiA:11.根据权利要求8所述的方法,其特征在于,利用以下公式计算得到所述PiB:12.根据权利要求2所述的方法,其特征在于,以所述第二图节点为起始节点在所述联邦图上进行多次所述随机游走,所述第二方根据所述第二图上的游走路径确定所述PIB
’
,包括:定义随机游走步数M
’
,所述第二方以任意一个所述第二图节点为起始节点在所述第二图上进行随机游走,当游走至任意一个公共节点时停止游走,并记录第二图游走步数Mi...
【专利技术属性】
技术研发人员:汤韬,陈滢,高鹏飞,庞悦,郑建宾,刘红宝,潘婧,周雍恺,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。