当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于组织相似度的联邦学习方法技术

技术编号:36831785 阅读:45 留言:0更新日期:2023-03-12 01:53
本发明专利技术提供了一种基于组织相似度的联邦学习方法,包括以下步骤:获取机构的本地子图,计算本地子图中各个节点的嵌入值;根据节点的嵌入值组成该机构本地子图的嵌入列表;中央服务器获取多个客户端的嵌入列表并在区块链上进行对比,分别将每个客户端的嵌入列表与中央服务器的嵌入列表进行对齐排序处理;根据嵌入列表和度量公式分别获取各个客户端与中央服务器的相似度,筛选出相似度高于设定值的客户端为预选客户端,中央服务器与预选客户端共同参与联邦学习。本发明专利技术即不交换用户数据,又能筛选出用户数据符合训练需求的客户端,提高了联邦学习的训练效率和训练结果。联邦学习的训练效率和训练结果。联邦学习的训练效率和训练结果。

【技术实现步骤摘要】
一种基于组织相似度的联邦学习方法


[0001]本专利技术属于联邦学习
,具体涉及一种基于组织相似度的联邦学习方法。

技术介绍

[0002]联邦学习是一种分布式机器学习,联邦学习对象包括一个中央服务器和多个客户端,在学习过程中多个客户端之间不需要交换本地个体或样本数据,仅通过将本地训练的模型参数或中间结果上传至中央服务器,再通过中央服务器构建基于虚拟融合数据下的全局模型,以此实现数据隐私保护和数据共享计算。当多个机构需要进行联邦学习时,由一个机构承担中央服务器的角色,邀请其他机构承担客户端的角色进行联邦学习。
[0003]现有技术中,为了保护用户数据的私密性,客户端之间不进行数据交换,中央服务器通过随机筛选的方式邀请客户端进行联邦学习;随机筛选的方式可能会导致筛选出的客户端数据量不平衡,客户端的关联性差,客户端的用户重复度低等问题,从而影响模型的训练效率和训练效果。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题,提供一种基于组织相似度的联邦学习方法,即不交换用户数据,又能筛选出用户数据符合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于组织相似度的联邦学习方法,其特征在于,包括以下步骤:获取机构的本地子图,计算本地子图中各个节点的嵌入值;根据节点的嵌入值组成该机构本地子图的嵌入列表;中央服务器获取多个客户端的嵌入列表,分别将每个客户端的嵌入列表与中央服务器的嵌入列表进行对齐排序处理;根据嵌入列表和度量公式分别获取各个客户端与中央服务器的相似度,筛选出相似度高于设定值的客户端为预选客户端,中央服务器与预选客户端共同参与联邦学习。2.根据权利要求1所述的一种基于组织相似度的联邦学习方法,其特征在于,所述度量公式如下:其中,表示机构i的嵌入列表,表示机构j的嵌入列表,表示机构i的嵌入列表中第x个节点嵌入值;表示机构j的嵌入列表中第x个节点嵌入值。3.根据权利要求2所述的一种基于组织相似度的联邦学习方法,其特征在于,节点的嵌入值的计算过程具体为:识别本地子图中的连通分量,获取连通分量的嵌入系数,根据嵌入系数和嵌入公式计算该连通分量中每个节点的嵌入值;嵌入公式如下:其中,c表示节点,e
c
表示节点c的嵌入值,N
c
表示节点c的邻节点集合,p表示节点c的一个邻节点;W
c,p
表示节点c与节点p的边权重,coe
f
表示连通分量f的嵌入系数,W
f
表示整个连通分量f的边权重。4.根据权利要求3所述的一种基于组织相似度的联邦学习方法,其特征在于,获取连通分量的嵌入系数过程如下:根据路径公式获取连通分量的平均最短路径长度,通过转换公式将平均最短路径长度转换为该连通分量的嵌入系数;转换公式如下:coe
f
=(a
f

1)
×
(n/2)其中,coe
f
表示连通分量的嵌入系数,a
f
表示连通分量的平均最短路径长度,n表示连通分量中的节点数;路径公式如下:
其中,f表示连通分量,q表示连通分量中的任意一个节点,m表示连通分量中节点q能够到达的节点;d(q,m)表示从节点q至节点m的最短路径长度。5.根据权利要求1、2、3或4所述的一种基于组织相似度的联邦学习方法,其特征在于,分别将每个客户端的嵌入列表与中央服务器的嵌入列表进行对齐排序处理的步骤具体为:若客户端嵌入列表的嵌入值个数与中央服务器嵌入列表的嵌入值个数不相同,则对嵌入值个数较少的嵌入列表进行补全,使两个嵌入列表的嵌入值个数相同,再对客户端嵌入列表的嵌入值进行排序,对中央服务器嵌入值列表的嵌入值进行排序;补全嵌入值...

【专利技术属性】
技术研发人员:胡春强谢彪邓绍江夏晓峰蔡斌向涛桑军
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1