【技术实现步骤摘要】
一种基于联邦强化学习的边缘计算模型训练方法
[0001]本专利技术属于无线通信和信息安全领域,具体是涉及一种基于联邦强化学习的边缘计算模型训练方法。
技术介绍
[0002]联邦目标识别模型训练过程中,由于无线信道开放的特点,模型参数的传输容易受到环境噪声干扰和敌意干扰,导致移动设备无法及时获取全局网络参数进行本地训练,延长模型训练时间,降低目标识别精度。因此,为在较差通信环境下快速训练高精度的识别模型,需要选择合适的移动设备参与训练并引入低时延高精度的模型训练方法。
[0003]现有的联邦学习模型训练方案如论文[Cai Lingshuang et al.,Dynamic Sample Selection for Federated Learning with Heterogeneous Data in Fog Computing[C]//ICC 2020
‑
2020 IEEE International Conference on Communications(ICC).IEEE,2020:1 />‑
6.本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于联邦强化学习的边缘计算模型训练方法,其特征在于包括以下步骤:1)检测信号覆盖范围内的移动设备数量,构建卷积神经网络,初始化参数;2)将各移动设备的参数组成状态向量输入卷积神经网络中,得到选择的移动设备和训练数据量;3)将全局模型参数和选择的数据量发送给移动设备,接收移动设备的本地模型参数,更新全局模型参数;4)根据各移动设备的训练时间、目标识别精度和能量消耗作为奖励值,更新状态向量、存储向量;5)从内存中随机选取存储的向量更新卷积神经网络的权重参数;6)重复步骤2)~5),直至移动设备反馈的目标识别精度的平均值大于所需的目标识别精度。2.如权利要求1所述一种基于联邦强化学习的边缘计算模型训练方法,其特征在于在步骤1)中,所述检测信号覆盖范围内的移动设备数量,构建卷积神经网络,初始化参数的具体步骤为:检测信号覆盖范围内移动设备的个数,记为N;量化移动设备i(1≤i≤N)所需训练数据量y
i
为L个等级,y
i
∈{a
l
|1≤l≤L,a
l
≥0};设置每个时隙的间隔为T(T>0)秒,记T秒所需达到的目标识别精度为ρ;将移动设备的信道状态划分为G个等级,采用信道估计技术获取N台设备的信道初始状态g=[g
i
]
1≤i≤N
;利用反馈信道获取N台移动设备初始的t
×
l维本地模型参数向量[ω
i
]
1≤i≤N
,计算t
×
l维全局参数模型向量ψ;均匀量化移动设备的训练时间,能量消耗和T秒内目标识别精度为I、E和A个等级,令首个时隙N台移动设备的训练时间,能量消耗和T秒内目标识别精度为0;根据N台移动设备在L
N
种模型训练方法中接收全局模型参数信号的误码率概率分布,将接收误码率量化为B个等级,记首个时隙T秒内接收全局模型参数信号的误码率为0;构造具有U层卷积层和M层全连接层的卷积神经网络,第n(1≤n≤U)层卷积层包含f
n
个ε
n
×
ε
n
大小的卷积核;初始化d
×
b维的网络权重参数向量θ,折扣因子γ(0<γ≤1),输入神经网络的序列长度W(W≥1)和效益权重参数μ1、μ2(μ1>0,μ2>0)。3.如权利要求1所述一种基于联邦强化学习的边缘计算模型训练方法,其特征在于在步骤2)中,所述参数包括信道状态、训练时间、目标识别精度、能量消耗、接收全局模型信号的误码率。4.如权利要求1所述一种基于联邦强化学习的边缘计算模型训练方法,其特征在于在步骤2)中,所述将各移动设备的参数组成状态向量输入卷积神经网络中,得到选择的移动设备和训练数据量的具体步骤为:在第k时隙,记上一时隙移动设备i的训练时间为信道状态为T秒内接收全局模型参数信号的误码率为T秒内目标识别精度为训练模型所消耗的能量为构建5N维向量和2WN+N维向量η
(k)
=[s
(k...
【专利技术属性】
技术研发人员:肖亮,许诗雨,洪思愿,林紫涵,冯玮,
申请(专利权)人:厦门大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。