模型训练方法及相关装置、设备和存储介质制造方法及图纸

技术编号：33351375 阅读：53 留言：0更新日期：2022-05-08 09:57

本申请公开了一种模型训练方法及相关装置、设备和存储介质，方法包括：获取基于源域样本数据训练得到的目标模型和评价模型，其中，评价模型用于对目标模型输出的预测结果的准确性进行评价；利用目标模型对目标域样本数据进行预测，得到目标域预测结果；利用评价模型对目标域预测结果进行评价，得到目标域评价结果；基于目标域评价结果，调整目标模型的网络参数。通过该方法，实现了目标模型的域适应。实现了目标模型的域适应。实现了目标模型的域适应。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法及相关装置、设备和存储介质

[0001]本申请涉及深度学习
，特别是涉及一种模型训练方法及相关装置、设备和存储介质。

技术介绍

[0002]深度学习的快速发展，各行各业使用神经网络模型进行工作已经成为常态。例如，在医学领域，利用神经网络模型进行医学图像分割。又如，在交通领域，利用神经网络模型进行车辆识别。
[0003]随着神经网络模型的逐渐普及，神经网络模型的域不适应问题变得日益严重。神经网络模型的域不适应问题主要表现为利用源域数据训练的模型，在目标域数据上的效果不好。域不适应的问题极大地限制了神经网络模型的进一步普及。
[0004]因此，如何解决域不适应问题，是当下研究的重点，对于促进神经网络模型的进一步普及，具有重要的意义。

技术实现思路

[0005]本申请至少提供一种模型训练方法及相关装置、设备和存储介质。
[0006]本申请第一方面提供了一种模型训练方法，方法包括：获取基于源域样本数据训练得到的目标模型和评价模型，其中，评价模型用于对目标模型输出的预测结果的准确性进行评价；利用目标模型对目标域样本数据进行预测，得到目标域预测结果；利用评价模型对目标域预测结果进行评价，得到目标域评价结果；基于目标域评价结果，调整目标模型的网络参数。
[0007]因此，通过获得基于源域样本数据训练得到的目标模型和评价模型，并利用评价模型对目标模型基于目标域样本数据预测得到的目标域预测结果进行评价，以此实现了目标模型在目标域的训练，有助于提高目标模型在目标域样本数据...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取基于源域样本数据训练得到的目标模型和评价模型，其中，所述评价模型用于对所述目标模型输出的预测结果的准确性进行评价；利用所述目标模型对目标域样本数据进行预测，得到目标域预测结果；利用所述评价模型对所述目标域预测结果进行评价，得到目标域评价结果；基于所述目标域评价结果，调整所述目标模型的网络参数。2.根据权利要求1所述的方法，其特征在于，所述获取基于源域样本数据训练得到的目标模型和评价模型，包括：基于所述源域样本数据对所述目标模型和评价模型进行至少一次迭代训练，其中，每次训练所基于的所述源域样本数据相同或不同。3.根据权利要求1所述的方法，其特征在于，每次基于所述源域样本数据对所述目标模型和评价模型进行训练，包括：利用所述目标模型对所述源域样本数据进行预测，得到本次训练对应的第一源域预测结果；基于本次训练对应的所述第一源域预测结果，调整所述目标模型的网络参数；以及利用所述评价模型对第二源域预测结果进行评价，得到源域评价结果，其中，所述第二源域预测结果包括本次训练和/或历史训练对应的所述第一源域预测结果；基于所述第二源域预测结果以及所述源域评价结果，调整所述评价模型的网络参数。4.根据权利要求3所述的方法，其特征在于，在所述利用所述评价模型对第二源域预测结果进行评价，得到源域评价结果之前，所述方法还包括：基于所述目标模型当前预测的准确性，将本次训练和/或历史训练对应的所述第一源域预测结果作为所述第二源域预测结果；其中，所述目标模型当前预测的准确性是基于前若干次训练对应的第一源域预测结果或前若干次训练中所述评价模型输出的评价结果确定的。5.根据权利要求4所述的方法，其特征在于，所述基于所述目标模型当前预测的准确性，将本次训练和/或历史训练对应的所述第一源域预测结果作为所述第二源域预测结果，包括：响应于所述目标模型当前预测的准确性满足第一预设要求，选出至少一个历史训练对应的第一源域预测结果，并将本次训练对应的第一源域预测结果和所述选出的第一源域预测结果，作为所述第二源域预测结果；响应于所述目标模型当前预测的准确性不满足第一预设要求，将本次训练对应的所述第一源域预测结果作为所述第二源域预测结果。6.根据权利要求5所述的方法，其特征在于，在所述利用所述目标模型对所述源域样本数据进行预测，得到本次训练对应的第一源域预测结果之后，所述方法还包括：响应于当前满足第二预设要求，将本次训练对应的所述第一源域预测结果保存至预设结果集中；所述选出至少一个历史训练对应的第一源域预测结果，包括：从所述预设结果集中选出至少一个所述第一源域预测结果。7.根据权利要...

【专利技术属性】
技术研发人员：宋涛，张少霆，
申请(专利权)人：上海商汤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人