一种服务端自适应参数聚合方法技术

技术编号：45260048 阅读：3 留言：0更新日期：2025-05-13 18:53

本发明专利技术公开了一种服务端自适应参数聚合方法，为电网输电线路缺陷检测技术领域。包括对K个客户端进行联合训练，每个客户端加载本地数据集，进入等待初始化全局模型状态；向每个客户端下发全局模型，客户端进行加载并作为自身的初始训练本地模型参数；根据指定的训练轮次进行训练，若达到指定轮次，本次联合训练任务就结束，否则，每个客户端使用本地数据集进行训练，待K个客户端均训练完成；将计算得到的分层模型差异作为自适应聚合算法的伪梯度，并生成和存储二阶段全局模型。本发明专利技术对联合均值算法与自适应聚合算法进行融合，实现优势互补，更好地处理缺陷检测任务，减少误检和漏检，解决了数据不均衡、训练效率和模型泛化能力的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电网输电线路缺陷检测，尤其涉及一种服务端自适应参数聚合方法。

技术介绍

1、输电线路作为电力传输的关键环节，其安全稳定运行直接关系到电力供应的可靠性。输电线路遍布全国各地，覆盖广袤的地理区域，因此，对其缺陷进行高效准确的检测成为电力维护中的一个核心挑战。

2、传统输电线路缺陷检测主要依赖人工巡检和单一节点的计算机视觉技术，电路缺陷数据分散在不同地域的设备或系统中，导致传统输电线路缺陷检测模型训练中存在以下问题：(1)数据之间缺乏有效的共享和连接，形成一个个数据孤岛，使得不同环境下所采集的数据无法得到充分地整合与分析，从而影响了输电线路缺陷检测模型的数据多样性和泛化能力。(2)数据隐私和安全问题突出。(3)计算机硬件性能存在上限，导致单节点无法训练大规模数据。

3、虽然联合学习可以很好地解决以上问题，但现有联合学习算法仍存在一些问题：(1)不同训练节点或设备模型参数不同，单一参数聚合算法难以保证全局模型的收敛和稳定。(2)不同训练节点或设备的计算能力和数据质量不同，单一参数聚合算法难以保证所有节点或设备都能为全局模型做出贡献。(3)仅使用单一参数聚合算法进行参数聚合，难以充分利用不同算法的优势来提高模型的性能。

技术实现思路

1、为了克服现有技术的不足，本专利技术的目的是提供一种服务端自适应参数聚合方法，解决了数据不均衡、训练效率和模型泛化能力的问题，特别是在输电线路缺陷检测应用中，显著提高了检测准确率和模型的稳定性。

2、为实现上述

3、一种服务端自适应参数聚合方法，包括以下步骤：

4、s1、由服务端选择k个客户端进行联合训练，同时每个客户端加载本地数据集，并进入等待初始化全局模型状态；

5、s2、在开始阶段，由服务端初始化全局模型后，向每个客户端下发全局模型参数，由客户端加载初始化后的全局模型参数，并作为客户端的初始训练本地模型参数，在迭代阶段，随着联合学习的进行，由服务端在每次迭代后生成二阶段全局模型，并将该二阶全局模型下发至客户端进行训练；

6、s3、判断客户端是否达到预设的训练轮次，若是，则结束本次联合训练任务，结束流程，否则，每个客户端通过改进的联合均值算法，使用本地数据集对本地模型进行训练，并进入s4；

7、s4、判断k个客户端是否均训练完成，若是，则根据训练结果，由服务器使用改进的联合均值算法对客户端上传的本地模型参数进行聚合，得到一阶段全局模型，并进入s5，否则，返回s3，直至所有客户端训练完成；

8、s5、根据当前得到的一阶段全局模型与上一轮训练的全局模型，计算分层模型差异；

9、s6、将分层模型差异作为自适应聚合算法的伪梯度，计算自适应聚合算法涉及的一阶矩估计和二阶矩估计，并利用自适应聚合算法进行自适应聚合，生成二阶段全局模型，并存储本轮二阶段全局模型参数，以及通过一阶矩估计和二阶矩估计动态调整学习率，并将二阶段全局模型参数下发至客户端，并返回s2中的迭代阶段；

10、所述在开始阶段，由服务端初始化全局模型后，向每个客户端下发全局模型参数，由客户端加载初始化后的全局模型参数，并作为客户端的初始训练本地模型参数，其具体为：

11、a1、在开始阶段，由服务端初始化全局模型后，向每个客户端下发全局模型参数；

12、a2、由客户端加载初始化后的全局模型参数，将其作为初始参数，并在本地数据集上使用全局模型参数进行本地模型训练，生成本地模型参数；

13、a3、针对本次训练结束后，由客户端将更新后的本地模型参数回传至服务端；

14、a4、由服务端收集所有客户端更新后的本地模型参数，并进行聚合处理，生成新的全局模型；

15、a5、由服务端将新的全局模型参数下发至向客户端，并由客户端将新的全局模型参数作为新的初始参数，对本地模型进行训练；

16、所述本地模型参数的表达式如下：

17、

18、其中，表示第t+1训练轮次，第k个客户端的本地模型参数，表示第t训练轮次，第k个客户端的本地模型参数，η表示学习率，gk表示第k个客户端的本地模型在本地数据集上训练时计算出的梯度；

19、所述s4中一阶段全局模型的表达式如下：

20、

21、其中，wt+1表示第t+1训练轮次聚合后得到的一阶段全局模型，k表示客户端索引，k表示客户端的总数，n表示客户端样本总数，nk表示第k个客户端的样本数量；

22、所述s5中分层模型差异的表达式如下：

23、δt＝[wavg,1-wt,1,wavg，2-wt,2，...,wavg，i-wt，i]

24、

25、其中，δt表示分层模型差异，i表示全局模型的层次，wavg，i表示全局模型的第i层参数使用联合均值算法聚合的全局模型，wt，i表示上一轮全局模型的第i层参数，wavg表示第一阶段使用联合均值算法聚合的全局模型，θ表示调节客户端样本数量和损失之间的比例参数，lk表示第k个客户端在所有客户端上的损失占比，lk和li″′均表示第k个客户端在本地数据集上训练的本地模型损失值，i″′表示客户端的索引号；

26、所述一阶矩估计的表达式如下：

27、mt＝β1mt-1+(1-β1)δt

28、其中，mt表示第t训练轮次的一阶矩估计，t表示训练轮次，β1表示一阶矩估计的衰减率，mt-1表示第t-1训练轮次的一阶矩估计，δt表示伪梯度；

29、所述二阶矩估计的表达式如下：

30、

31、其中，vt表示第t训练轮次的二阶矩估计，β2表示二阶矩估计的衰减率，vt-1表示第t-1训练轮次的二阶矩估计；

32、所述全局模型参数的更新公式如下：

33、

34、其中，wt表示更新前的全局模型，σ表示学习率，ε表示常数，λ表示权重衰减项；

35、所述服务端的全局最优目标函数的表达式如下：

36、

37、其中，min表示取小值，w表示全局模型参数，f(w)表示服务端的全局最优目标函数，fk(w)表示第k个客户端的本地目标函数，nk表示第k个客户端的数据量，i"表示第i″个样本，dk表示第k个客户端的本地数据集，fi″(w)表示本地客户端缺陷检测模型ssd在样本i″上的损失值，n表示匹配到的真实框对应的默认框的数量，lconf表示分类损失，x表示匹配指标变量，c表示预测出的各类别的置信度得分，λ表示平衡分类损失和定位损失之间权重的超参数，lloc表示定位损失，l表示预测出的每个默认框相对于原始形状的偏移量，g表示真实框的参数，pos表示正类标签的集合，i′表示第i′个默认框，表示第i′个默认框是否匹配到第j个属于正类标签的集合pos的真实边界框，表示第i′个默认框属于正类标签的集合pos的概率，neg表示负类标签的集合，表示第i'个默本文档来自技高网...

【技术保护点】

1.一种服务端自适应参数聚合方法，其特征在于，包括以下步骤：

【技术特征摘要】

1.一种服务端自适应参数聚合方...

【专利技术属性】
技术研发人员：张凌浩，滕予非，向思屿，王胜，庞博，邝俊威，郗宁，
申请(专利权)人：国网四川省电力公司电力科学研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人