基于自监督对比学习的个性化联邦学习图像分类方法及系统技术方案

技术编号:38682800 阅读:15 留言:0更新日期:2023-09-02 22:55
本发明专利技术公开了一种基于自监督对比学习的个性化联邦学习图像分类方法及系统,具体为:中央服务器随机初始化全局模型,并下发给每个客户端,客户端的本地模型包括共享层与个性化层;随机选取参与本次聚合的客户端,接收全局模型参数并作为本地模型共享层的初始化参数,使用本地图像数据集基于SimCLR算法进行自监督对比学习分别训练个性化层和共享层,然后客户端将共享层参数上传至中央服务器;中央服务器针对接收到的模型参数,根据客户端数据量基于FedAvg算法进行加权平均,得到聚合后的全局模型,并下发给每个客户端;重复执行直到每个客户端得到一个收敛的个性化模型,用于完成图像分类。本发明专利技术安全性好、效率高、准确性好。准确性好。准确性好。

【技术实现步骤摘要】
基于自监督对比学习的个性化联邦学习图像分类方法及系统


[0001]本专利技术涉及深度学习和计算机
,具体涉及一种基于自监督对比学习的个性化联邦学习图像分类方法及系统。

技术介绍

[0002]随着边端设备数量的暴增,这些设备产生了海量的图像数据。例如在医疗系统中,对生物医学图片数据的研究分析是开展健康医疗与诊断的前提,不同医疗图像对应不同的疾病类型,通过分析X光片、CT等医疗影像数据可以帮助医生快速准确的识别和诊断疾病。现代医学研究工作中需要依赖多样本且多维度的样本支持,从而才能有效提高医疗数据分析的准确性和适用性,但是医疗机构中的内部数据关乎病人隐私信息,在数据存储和数据使用方面具有高度的保密性和敏感性。因此,各个国家和地区均对个人隐私数据的收集、传播和使用等过程进行了严格的法律法规制定与实施。
[0003]针对海量的图像数据,传统的集中式机器学习是将数据集中在一个中央位置,然后对齐训练,但集中式训练存在以下问题:1)数据安全性问题,因为数据必须被传输至集中服务器;2)当数据量非常庞大时,集中式学习会面临大量数据的问题,导致训练时本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自监督对比学习的个性化联邦学习图像分类方法,其特征在于,包括以下步骤:步骤1、中央服务器随机初始化全局模型,并下发给每个客户端,客户端的本地模型包括共享层与个性化层;步骤2、随机选取参与本次聚合的客户端;步骤3、被选中的各客户端,接收由步骤1下发的全局模型参数并作为本地模型共享层的初始化参数,使用本地图像数据集基于SimCLR算法进行自监督对比学习分别训练个性化层和共享层,完成本地训练后客户端将共享层参数及数据量上传至中央服务器;步骤4、中央服务器针对接收到的模型参数,根据客户端数据量基于FedAvg算法进行加权平均,得到聚合后的全局模型;步骤5、中央服务器将聚合后的全局模型下发给每个客户端;步骤6、重复执行步骤2至步骤5,直到每个客户端得到一个收敛的个性化模型,用于完成图像分类。2.根据权利要求1所述的基于自监督对比学习的个性化联邦学习图像分类方法,其特征在于,步骤1中,全局模型为一个网络结构为Resnet18的编码器。3.根据权利要求1所述的基于自监督对比学习的个性化联邦学习图像分类方法,其特征在于,步骤1中,共享层为一个Resnet18组成的编码器,用于提取公共特征;个性化层为一个双层MLP网络,用于适应本地数据,客户端在首轮训练前初始化个性化层。4.根据权利要求1所述的基于自监督对比学习的个性化联邦学习图像分类方法,其特征在于,步骤3中,基于SimCLR算法进行自监督对比学习,具体为:在没有数据标签的情况下,SimCLR通过隐藏空间的对比损失最大化相同数据在不同增广下的一致性来学习表达,损失函数为:其中,z
i
,z
j
是图像i,j经过模型的输出,sim(z
i
,z
j
)表示z
i
,z
j
之间的余弦相似度,τ是对比学习的温度系数,2N是一个小批样本N经过成对增广之后得到的数据点个数,z
k
是图像k经过模型的输出,l
i,j
是正样本对(i,j)的损失;随机抽取一个包含N个样本的小批样本,并在小批样本中得到成对增广样本,一共2N个数据点;图像i及其增强样本j构成一个正样本对(i,j),损失函数如上式所示,最后该批次样本上的损失函数为计算2N个数据点中的所有的正样本对的损失平均值。5.根据权利要...

【专利技术属性】
技术研发人员:李骏罗丹韦康
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1