模型训练方法、装置、服务器及存储介质制造方法及图纸

技术编号:36109952 阅读:10 留言:0更新日期:2022-12-28 14:12
本申请实施例公开了一种模型训练方法、装置、服务器及存储介质。该方法包括:向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;基于所述多个梯度参数获取目标模型。本方法实现了能够借助客户端使用自身的图像数据对待训练模型进行训练,而不需要将图像数据收集到服务器再开始模型训练,一方面,提升了端云联动场景下扩大数据集的便利性,从而以大数据集来换取更好的深度学习模型训练效果,进而提升深度神经网络的图像质量评估效果;另一方面,在借助用户数据的同时,有效保护了用户的隐私。保护了用户的隐私。保护了用户的隐私。

【技术实现步骤摘要】
模型训练方法、装置、服务器及存储介质


[0001]本申请涉及数据处理
,更具体地,涉及一种模型训练方法、装置、服务器以及存储介质。

技术介绍

[0002]随着深度学习的提出和流行,训练深度神经网络已经成为了解决图像质量评估问题的主流方案,且效果大大优于非深度学习的方案。目前主要的发展方向是优化深度学习模型或者优化数据集。相关优化深度学习模型的方案难以有效的提取图像的相关特征,且可解释性较差;而优化数据集的方案也因制作数据集相当耗费人力物力财力而难以直接扩大数据集的规模,从而影响了深度神经网络的图像质量评估效果。

技术实现思路

[0003]鉴于上述问题,本申请提出了一种模型训练方法、装置、服务器以及存储介质,以改善上述问题。
[0004]第一方面,本申请实施例提供了一种模型训练方法,应用于服务器,所述服务器与多个客户端设备连接,所述方法包括:向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;基于所述多个梯度参数获取目标模型。
[0005]第二方面,本申请实施例提供了一种模型训练装置,运行于服务器,所述服务器与多个客户端设备连接,所述装置包括:模型分发与训练模块,用于向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;梯度参数获取模块,用于获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;模型获取模块,用于基于所述多个梯度参数获取目标模型。
[0006]第三方面,本申请提供了一种服务器,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面所述的方法。
[0007]第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述第一方面所述的方法。
[0008]本申请提供的一种模型训练方法、装置、服务器以及存储介质,应用于服务器,所述服务器与多个客户端设备连接,本方法通过向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;继而获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;然后基于所述多个梯度参数获取目标模型。从而通过上述方式实现了能够借助客户端使用自身的图像数据对待训练模型进行训练,而不需要将图像数据收集到服务器再开始模
型训练,一方面,提升了端云联动场景下扩大数据集的便利性,从而以大数据集来换取更好的深度学习模型训练效果,进而提升深度神经网络的图像质量评估效果;另一方面,在借助用户数据的同时,有效保护了用户的隐私。
附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1示出了本申请实施例提供的模型训练方法、装置所涉及的应用环境图。
[0011]图2示出了本申请一实施例提供的模型训练方法的流程图。
[0012]图3示出了图2中的步骤S130的方法流程图。
[0013]图4示出了本申请另一实施例提供的模型训练方法的流程图。
[0014]图5示出了本申请又一实施例提供的模型训练方法的流程图。
[0015]图6示出了本申请再一实施例提供的模型训练方法的流程图。
[0016]图7示出了本申请实施例提供的模型训练装置的结构框图。
[0017]图8示出了本申请实施例的用于执行根据本申请实施例的模型训练方法的服务器的结构框图。
[0018]图9是本申请实施例的用于保存或者携带实现根据本申请实施例的模型训练方法的程序代码的存储单元。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]为了方便理解,下面对本申请实施例中涉及的名词进行简要说明。
[0021](1)联邦学习(Federated Learning,FL)
[0022]联邦学习又名联邦机器学习、联合学习、联盟学习。联邦学习是一种基于云技术的分布式系统的机器学习框架,在联邦学习架构中,包含服务器和多个客户端设备,每个客户端设备在本地存储有各自的训练数据,且服务器和各客户端设备中都设置有模型架构相同的模型,通过联邦学习架构进行机器学习模型的训练,可以有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,能从技术上打破数据孤岛,实现AI协作。
[0023]随着深度学习的提出和流行,训练深度神经网络已经成为了解决图像质量评估问题的主流方案,且效果大大优于非深度学习的方案。目前主要的发展方向是优化深度学习模型或者优化数据集。相关优化深度学习模型的方案难以有效的提取图像的相关特征,且可解释性较差;而优化数据集的方案也因制作数据集相当耗费人力物力财力而难以直接扩大数据集的规模,从而影响了深度神经网络的图像质量评估效果。
[0024]因此,为了改善上述问题,专利技术人经过长时间的研究并提出了本申请实施例提供
的模型训练方法、装置、服务器以及存储介质,通过向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;继而获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;然后基于所述多个梯度参数获取目标模型。从而通过上述方式实现了能够借助客户端使用自身的图像数据对待训练模型进行训练,而不需要将图像数据收集到服务器再开始模型训练,一方面,提升了端云联动场景下扩大数据集的便利性,从而以大数据集来换取更好的深度学习模型训练效果,进而提升深度神经网络的图像质量评估效果;另一方面,在借助用户数据的同时,有效保护了用户的隐私。
[0025]下面先对本申请实施例提供的模型训练方法、装置所涉及的应用环境进行介绍。
[0026]请参阅图1,在图1涉及的应用环境10中包括服务器100以及多个客户端设备(图中仅示出两个)101。其中,在某些场景中服务器100可以被称为中心服务器(例如数据中心),可选的,服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,应用于服务器,所述服务器与多个客户端设备连接,所述方法包括:向所述多个客户端设备分发待训练模型,并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练;获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数;基于所述多个梯度参数获取目标模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个梯度参数获取目标模型,包括:对所述多个梯度参数以及每个客户端设备对应的图像数量进行加权平均,得到平均梯度;基于所述平均梯度以及所述待训练模型获取目标模型。3.根据权利要求1所述的方法,其特征在于,所述向所述多个客户端设备分发待训练模型,包括:若是第一轮训练,将初始模型作为待训练模型分发给所述多个客户端设备;若不是第一轮训练,获取上一轮训练结束后所述多个客户端设备传回的上一轮梯度参数,以得到多个上一轮梯度参数;基于所述多个上一轮梯度参数确定上一轮模型;将所述上一轮模型作为待训练模型分发给所述多个客户端设备;所述获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数,包括:获取当轮所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数,以得到多个梯度参数。4.根据权利要求3所述的方法,其特征在于,所述指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练,包括:指示所述多个客户端设备将各自的图像数据输入所述待训练模型,得到第一质量评分,以用于所述多个客户端设备获取基于所述各自的图像数据确定的第一标签评分;将所述第一质量评分与所述第一标签评分之差的绝对值作为损失函数,采用梯度下降法对所述待训练模型的参数进行更新;基于所述待训练模型以及更新后的待训练模型获取梯度参数。5.根据权利要求1所述的方法,其特征在于,所述基于所述多个梯度参数获取目标模型之前,还包括:若训练次数达到指定次数,将基于所述多个梯度参数获取的模型作...

【专利技术属性】
技术研发人员:胡松
申请(专利权)人:广东明创软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1