【技术实现步骤摘要】
一种高能效的聚类联邦边缘学习策略生成方法和装置
[0001]本专利技术涉及数据处理
,尤其涉及一种高能效的聚类联邦边缘学习策略生成方法和装置。
技术介绍
[0002]数据安全已成为人工智能技术持续发展所面临的关键问题。传统的机器学习技术是集中式的,其收集设备的数据到处理中心,进行集中训练,然而这可能会导致用户数据隐私泄露。
[0003]联邦学习是一种有前途的分布式机器学习架构,随着设备计算能力的提升,设备可以在本地使用采集的数据训练本地模型,之后只需要把本地模型上传到处理中心进行模型聚合,避免了原始数据直接上传,极大地保护了数据隐私。
[0004]在现实生活中,设备间的数据可能呈现非独立同分布特性,这对于联邦学习训练一个统一的全局模型带来了挑战。因此研究联邦学习如何适应每一个设备上的数据是非常有意义的。目前,已经有一些个性化联邦学习的研究被提出。
[0005]个性化联邦学习包括联邦迁移学习与联邦元学习,其本质都是先获得一个所有设备共享的基础全局模型,之后再在每一个设备上根据本地数据,微调全局模型以适应个性化数据特征。不同的个性化联邦学习策略各有弊端。联邦迁移学习和联邦元学习由于首先需要得到一个涵盖绝大多数特征的全局模型,然后再进行个性化,故其只适用于异构性较弱的数据,无法处理拥有强异构数据系统的个性化问题。
[0006]多任务联邦学习也是解决联邦学习个性化的有效方法,其通过计算相关矩阵来量化不同设备模型的相似性,然后把异构的数据作为不同的学习目标,从而进行多任务学习。联邦多任务学 ...
【技术保护点】
【技术特征摘要】
1.一种高能效的聚类联邦边缘学习策略生成方法,其特征在于,包括以下步骤:S1、云中心初始化边缘接入策略;S2、边缘基站使用凸优化方法求解其接入设备的带宽资源分配策略,并将其初始化模型发送给接入设备;S3、设备计算接收到的全局模型在本地测试数据集上精度,并根据全局模型和本地训练数据采用分层联邦迁移方法训练本地模型,计算上传本地模型所花费的能量,将测试精度与能耗的差值作为本地收益,然后将本地模型和本地收益上传到所接入的边缘基站;S4、边缘基站分层聚合本地模型,同时通过平均所有接入设备的本地收益,计算边缘收益,将边缘收益上传到云中心;S5、云中心根据收到的边缘基站的反馈信息,计算系统收益,并采用深度强化学习算法调整边缘接入策略;S6、重复上述过程直至收敛。2.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方法,其特征在于,步骤S1中,设备与边缘基站的接入策略a
ij
是一个二进制变量,即若设备i与边缘基站j通信,则a
ij
=1,否则,a
ij
=0,每个设备接入一个边缘基站。3.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方法,其特征在于,步骤S2中的凸优化方法具体为:对于边缘基站j及其接入设备簇给定边缘接入策略时,资源分配子问题的最优带宽分配β
ij
计算公式如下:其中,h
ij
表示设备i和边缘服务器j之间的信道增益,p
i
表示设备i的模型上传功率,N0表示高斯噪声的功率谱密度,β
ij
B
j
为接入边缘基站j的设备i所分得的带宽资源,接入边缘基站j的设备共享用带宽为B
j
的公共频谱进行通信,a
ij
表示设备与边缘基站的接入策略,β
ij
表示分配给设备i的带宽比例。4.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方法,其特征在于,步骤S3中,设备根据收到的全局模型θ
j
,利用本地数据进行训练,设备i的损失函数公式为:设备使用梯度下降法更新本地模型ω
i
,公式如下:其中,η为学习步长,且η≥0;
步骤S3在训练一定轮次后,采用分层联邦迁移学习策略训练本地模型,将神经网络分为基础特征层和个性特征层,分层联邦迁移学习策略具体过程为:S301、根据如下公式计算每个边缘基站经过一定轮次后的平均学习精度:S302、将高于平均精度的设备基础特征层模型和个性特征层模型上传到接入的边缘基站,低于平均精度的设备上传基础特征层模型,个性特征层模型在设备本地更新,公式如下:其中,为设备i的本地个性特征层模型,为迁移设备集。S303、边缘基站聚合所有设备的基础特征层模型并且聚合非迁移设备的个性特征层模型,边缘基站将聚合后的基础层模型下发到所有接入设备,而将个性层模型下发到非迁移设备,设备根据收到的模型再进行上述更新,如此迭代直到收敛。5.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方法,其特征在于,步骤S3中,将全局模型在本地测试数据集上的学习精度g
ij
作为衡量边缘基站j上的全局模型性能的指标,系统的学习性能增益G是所有设备的平均精度,公式所示:6.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方法,其特征在于,步骤S3中设备i上传本地模型所消耗的能量E
ij
公式如下:T
ij
为设备i将本地模型上传到边缘基站的传输时延,公式如下:S表示本地模型的大小,r
ij
为设备i上传模型的传输速率,公式如下:h
ij
表示设备i和边缘服务器j之间的信道增益,p
i
表示设备i的模型上传功率,N0表示高斯噪声的功率谱密度,β
ij
B
j
为接入边缘基站j的设备i所分得的带宽资源,接入边缘基站j的设备共享用带宽为B
j
的公共频谱进行通信,a
ij
表示设备与边缘基站的接入策略,β
ij
表示分配给设备i的带宽比例。7.根据权利要求1所述的高能效的聚类联邦边缘学习策略生成方...
【专利技术属性】
技术研发人员:秦晓琦,李艺璇,韩凯峰,马楠,
申请(专利权)人:中国信息通信研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。