模型训练方法、装置、服务器及存储介质制造方法及图纸

技术编号：36109952 阅读：10 留言：0更新日期：2022-12-28 14:12

本申请实施例公开了一种模型训练方法、装置、服务器及存储介质。该方法包括：向所述多个客户端设备分发待训练模型，并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练；获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数，以得到多个梯度参数；基于所述多个梯度参数获取目标模型。本方法实现了能够借助客户端使用自身的图像数据对待训练模型进行训练，而不需要将图像数据收集到服务器再开始模型训练，一方面，提升了端云联动场景下扩大数据集的便利性，从而以大数据集来换取更好的深度学习模型训练效果，进而提升深度神经网络的图像质量评估效果；另一方面，在借助用户数据的同时，有效保护了用户的隐私。保护了用户的隐私。保护了用户的隐私。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、服务器及存储介质

[0001]本申请涉及数据处理
，更具体地，涉及一种模型训练方法、装置、服务器以及存储介质。

技术介绍

[0002]随着深度学习的提出和流行，训练深度神经网络已经成为了解决图像质量评估问题的主流方案，且效果大大优于非深度学习的方案。目前主要的发展方向是优化深度学习模型或者优化数据集。相关优化深度学习模型的方案难以有效的提取图像的相关特征，且可解释性较差；而优化数据集的方案也因制作数据集相当耗费人力物力财力而难以直接扩大数据集的规模，从而影响了深度神经网络的图像质量评估效果。

技术实现思路

[0003]鉴于上述问题，本申请提出了一种模型训练方法、装置、服务器以及存储介质，以改善上述问题。
[0004]第一方面，本申请实施例提供了一种模型训练方法，应用于服务器，所述服务器与多个客户端设备连接，所述方法包括：向所述多个客户端设备分发待训练模型，并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练；获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数，以得到多个梯度参数；基于所述多个梯度参数获取目标模型。
[0005]第二方面，本申请实施例提供了一种模型训练装置，运行于服务器，所述服务器与多个客户端设备连接，所述装置包括：模型分发与训练模块，用于向所述多个客户端设备分发待训练模型，并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练；梯度参数获取模块，用于获取所述多个客户端设备各自对所述待训练模型进行训练后传...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，应用于服务器，所述服务器与多个客户端设备连接，所述方法包括：向所述多个客户端设备分发待训练模型，并指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练；获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数，以得到多个梯度参数；基于所述多个梯度参数获取目标模型。2.根据权利要求1所述的方法，其特征在于，所述基于所述多个梯度参数获取目标模型，包括：对所述多个梯度参数以及每个客户端设备对应的图像数量进行加权平均，得到平均梯度；基于所述平均梯度以及所述待训练模型获取目标模型。3.根据权利要求1所述的方法，其特征在于，所述向所述多个客户端设备分发待训练模型，包括：若是第一轮训练，将初始模型作为待训练模型分发给所述多个客户端设备；若不是第一轮训练，获取上一轮训练结束后所述多个客户端设备传回的上一轮梯度参数，以得到多个上一轮梯度参数；基于所述多个上一轮梯度参数确定上一轮模型；将所述上一轮模型作为待训练模型分发给所述多个客户端设备；所述获取所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数，以得到多个梯度参数，包括：获取当轮所述多个客户端设备各自对所述待训练模型进行训练后传回的梯度参数，以得到多个梯度参数。4.根据权利要求3所述的方法，其特征在于，所述指示所述多个客户端设备基于各自的图像数据对所述待训练模型进行训练，包括：指示所述多个客户端设备将各自的图像数据输入所述待训练模型，得到第一质量评分，以用于所述多个客户端设备获取基于所述各自的图像数据确定的第一标签评分；将所述第一质量评分与所述第一标签评分之差的绝对值作为损失函数，采用梯度下降法对所述待训练模型的参数进行更新；基于所述待训练模型以及更新后的待训练模型获取梯度参数。5.根据权利要求1所述的方法，其特征在于，所述基于所述多个梯度参数获取目标模型之前，还包括：若训练次数达到指定次数，将基于所述多个梯度参数获取的模型作...

【专利技术属性】
技术研发人员：胡松，
申请(专利权)人：广东明创软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人