模型优化方法、电子设备以及计算机可读存储介质技术

技术编号：38323540 阅读：8 留言：0更新日期：2023-07-29 09:05

本发明专利技术公开了一种模型优化方法、电子设备以及计算机可读存储介质，该方法应用于第一电子设备，第一电子设备处于包括多个第二电子设备的集群网络，多个第二电子设备上至少分布两种具有不同数据结构的第一数据，第一电子设备根据每个第二电子设备上分布的第一数据的数据结构，为每个第二电子设备确定第一神经网络模型，第一神经网络模型包括第一模型参数和第一结构参数；第一电子设备根据每个第二电子设备对应的第一数据，确定多个第二电子设备之间的相关系数，以及第一电子设备根据相关系数调整每个第二电子设备对应的第一模型参数和第一结构参数，得到第二神经网络模型，第二神经网络结构为针对集群网络进行模型优化得到的神经网络模型。神经网络模型。神经网络模型。

全部详细技术资料下载

【技术实现步骤摘要】
模型优化方法、电子设备以及计算机可读存储介质

[0001]本专利技术涉及人工智能学习领域，尤其是涉及模型优化方法、装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]现有的联邦学习(Federated Learning，FL)技术中，集群网络中各客户端设备(或节点设备)通过配置相同的神经网络模型，即神经网络模型的结构相同，然后由集群网络中的服务器聚合客户端设备(或节点设备)上传的各神经网络模型的模型参数，或者说对客户端设备上传的各神经网络模型的模型参数进行加权平均，得到更新后的模型参数，进而得到优化后的全局神经网络模型，然后服务器将该全局神经网络模型发送至各客户端设备，完成共同训练。
[0003]但是上述方法无法满足各客户端设备模型优化的个性化需求。同时也加重了客户端设备的计算负担。
[0004]在另外一些方案中，研究人员开始关注个性化联邦学习(Personalized Federated Learning,PFL)。个性化联邦学习利用多任务学习、元学习等技术，将每个客户端设备的学习任务视作不同任务，以此得到每个客户端设备对应的单独的神经网络模型，进而实现模型优化的个性化(例如摩卡(MOCHA)个性化联邦学习方法)。
[0005]但是，这种个性化联邦学习方法存在过拟合或欠拟合问题。
[0006]在其他方案中，研究人员则考虑将知识蒸馏方法(Knowledge Distillation,KD)中只交换软标签(也即神经网络模型针对某数据输出的概率值)、不交换神经网络模型的模型参数的...

【技术保护点】

【技术特征摘要】
1.一种模型优化方法，其特征在于，应用于第一电子设备，第一电子设备处于集群网络，集群网络还包括多个第二电子设备，多个第二电子设备上至少分布两种具有不同数据结构的第一数据，方法包括：第一电子设备根据每个第二电子设备上分布的第一数据的数据结构，为每个第二电子设备确定第一神经网络模型，第一神经网络模型包括第一模型参数和第一结构参数；第一电子设备根据每个第二电子设备对应的第一数据，确定多个第二电子设备之间的相关系数，以及第一电子设备根据相关系数调整每个第二电子设备对应的第一模型参数和第一结构参数，得到第二神经网络模型，第二神经网络结构为针对集群网络进行模型优化得到的神经网络模型。2.根据权利要求1的方法，其特征在于，多个第二电子设备之间的相关系数是第一电子设备基于每个第二电子设备对应的第一标签数据确定的，每个第二电子设备对应的第一标签数据是每个第二电子设备利用对应的第一神经网络模型处理对应的第一数据得到的。3.根据权利要求1的方法，其特征在于，第一电子设备根据相关系数调整每个第二电子设备对应的所第一模型参数和第一结构参数，包括：第一电子设备将相关系数发送至每个第二电子设备，控制每个第二电子设备基于对应的第一数据以及相关系数确定第一权重；第一电子设备根据第一权重，调整第一模型参数和第一结构参数。4.根据权利要求1至3中任一项的方法，其特征在于，相关系数包括表示每个第二电子设备之间相关性的矩阵。5.根据权利要求1至4中任一项的方法，其特征在于，第一电子设备根据每个第二电子上分布的第一数据的数据结构，为每个第二电子设备确定第一神经网络模型结构，包括：第一电子设备根据每个第二电子设备上分布...

【专利技术属性】
技术研发人员：王晓禅，王智，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人