模型训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39745398 阅读:8 留言:0更新日期:2023-12-17 23:44
本申请公开了一种模型训练方法、装置、计算机设备及存储介质。该模型训练方法包括:获取样本图像集,所述样本图像集包括不同领域的样本图像,以及对应的分类类别标签;构建特征编码网络和分类网络,所述分类网络包括全连接层和分类函数层;以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件;将满足预设停止条件的特征编码网络和分类网络组合成图像分类模型。本申请可以防止训练得到的图像分类模型被他人迁移学习。人迁移学习。人迁移学习。

【技术实现步骤摘要】
模型训练方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,具体涉及一种模型训练方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]迁移学习是一种机器学习方法,就是把为任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中。比如,在图像分类业务中,通常可以基于用于源领域的图像分类模型进行迁移学习,从而更快地获得高性能的图像分类模型用于目标领域的图像分类模型。在人工智能技术高速发展的今天,神经网络模型本身作为优秀的基准模型会在不远的未来作为商品被出售,其知识产权的保护将会变得尤为重要。为此,基于知识产权保护的角度,需要防止模型,如图像分类模型被他人迁移学习。

技术实现思路

[0003]本申请实施例提供一种模型训练方法、装置、计算机设备及存储介质,可以防止训练得到的图像分类模型被他人迁移学习。
[0004]本申请实施例提供一种模型训练方法,包括:
[0005]获取样本图像集,所述样本图像集包括不同领域的样本图像,以及对应的分类类别标签;
[0006]构建特征编码网络和分类网络,所述分类网络包括全连接层和分类函数层;
[0007]以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件;
[0008]将满足预设停止条件的特征编码网络和分类网络组合成图像分类模型。
[0009]相应的,本申请实施例还提供一种模型训练装置,包括:
[0010]图像获取模块,用于获取样本图像集,所述样本图像集包括不同领域的样本图像,以及对应的分类类别标签;
[0011]网络构建模块,用于构建特征编码网络和分类网络,所述分类网络包括全连接层和分类函数层;
[0012]网络训练模块,用于以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件;
[0013]网络组合模块,用于将满足预设停止条件的特征编码网络和分类网络组合成图像分类模型。
[0014]可选地,网络训练模块具体用于执行:
[0015]以最大化所述特征编码网络对同一类别的不同领域的样本图像的编码结果的差异,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件。
[0016]可选地,网络训练模块具体用于执行:
[0017]将同一类别的不同领域的第一样本图像和第二样本图像输入所述特征提取网络进行特征提取,得到所述第一样本图像的第一图像特征和所述第二样本图像的第二图像特征;
[0018]获取所述第一图像特征和所述第二图像特征的互相关矩阵,所述互相关矩阵中对角线上的元素用于表征所述第一样本图像和所述第二样本图像中共有特征的相似度,所述互相关矩阵中非对角线上的元素用于表征所述第一样本图像和所述第二样本图像中独有特征的相似度;
[0019]以最小化互相关矩阵中对角线上的元素值,最大化互相关矩阵中非对角线上的元素值,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,对所述特征编码网络和分类网络的网络参数进行更新,直至满足预设停止条件。
[0020]可选地,网络训练模块具体用于执行:
[0021]将所述第一图像特征和所述第二图像特征输入所述全连接层进行全连接处理,得到所述第一样本图像的第一全连接结果和所述第二样本图像的第二全连接结果;
[0022]以最小化互相关矩阵中对角线上的元素值,最大化互相关矩阵中非对角线上的元素值,最大化所述第一全连接结果和所述第二全连接结果的差异为目标,对所述特征编码网络和分类网络的网络参数进行更新,直至满足预设停止条件。
[0023]可选地,所述特征编码网络包括依次连接的N个卷积层和M个残差块,网络训练模块具体用于执行:
[0024]将同一类别的不同领域的第一样本图像和第二样本图像输入第一个卷积层,将所述M个残差块中任一个残差块的输出结果作为第一样本图像的第一图像特征和第二样本图像的第二图像特征。
[0025]可选地,网络训练模块具体用于执行:
[0026]以最大化所述特征编码网络对同一类别的不同领域的样本图像的编码结果的差异,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异,最小化同一领域的样本图像的分类损失为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件。
[0027]可选地,模型训练装置还包括图像分类模块,图像分类模块具体用于执行:
[0028]获取待分类图像;
[0029]将所述待分类图像输入所述图像分类模型进行图像分类,得到所述待分类图像的类别。
[0030]相应的,本申请实施例还提供的一种计算机设备,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行本申请实施例提供的任一种模型训练方法。
[0031]相应的,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器加载以执行本申请实施例提供的任一种模型训练方法。
[0032]本申请实施例中,通过获取样本图像集,所述样本图像集包括不同领域的样本图像,以及对应的分类类别标签;构建特征编码网络和分类网络,所述分类网络包括全连接层和分类函数层;以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的
差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件;将满足预设停止条件的特征编码网络和分类网络组合成图像分类模型,可以在全连接层层面拉远不同领域的图像特征,以保证模型能够在独有特征上尽可能学习到不同领域的图像特征,以防止训练得到的图像分类模型被他人迁移学习。
附图说明
[0033]下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。
[0034]图1a是本申请实施例提供的模型训练系统示意图。
[0035]图1b是本申请实施例提供的模型训练方法的第一种流程示意图。
[0036]图1c是本申请实施例提供的分类网络的结构示意图。
[0037]图1d是本申请实施例提供的特征编码网络的结构示意图。
[0038]图1e是本申请实施例提供的图像分类模型的结构示意图。
[0039]图2是本申请实施例提供的模型训练方法的第二种流程示意图。
[0040]图3a是本申请实施例提供的模型训练装置的第一种结构示意图。
[0041]图3b是本申请实施例提供的模型训练装置的第二种结构示意图。
[0042]图4是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
[0043]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取样本图像集,所述样本图像集包括不同领域的样本图像,以及对应的分类类别标签;构建特征编码网络和分类网络,所述分类网络包括全连接层和分类函数层;以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件;将满足预设停止条件的特征编码网络和分类网络组合成图像分类模型。2.根据权利要求1所述的模型训练方法,其特征在于,所述以最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件,包括:以最大化所述特征编码网络对同一类别的不同领域的样本图像的编码结果的差异,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件。3.根据权利要求2所述的模型训练方法,其特征在于,所述以最大化所述特征编码网络对同一类别的不同领域的样本图像的编码结果的差异,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,训练所述特征编码网络和分类网络,直至满足预设停止条件,包括:将同一类别的不同领域的第一样本图像和第二样本图像输入所述特征提取网络进行特征提取,得到所述第一样本图像的第一图像特征和所述第二样本图像的第二图像特征;获取所述第一图像特征和所述第二图像特征的互相关矩阵,所述互相关矩阵中对角线上的元素用于表征所述第一样本图像和所述第二样本图像中共有特征的相似度,所述互相关矩阵中非对角线上的元素用于表征所述第一样本图像和所述第二样本图像中独有特征的相似度;以最小化互相关矩阵中对角线上的元素值,最大化互相关矩阵中非对角线上的元素值,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,对所述特征编码网络和分类网络的网络参数进行更新,直至满足预设停止条件。4.根据权利要求3所述的模型训练方法,其特征在于,所述以最小化互相关矩阵中对角线上的元素值,最大化互相关矩阵中非对角线上的元素值,最大化所述全连接层对同一类别的不同领域的样本图像的全连接结果的差异为目标,对所述特征编码网络和分类网络的网络参数进行更新,直至满足预设停止条件,包括:将所述第一图像特征和所述第二图像特征输入所述全连接层进行全连接处理,得到所述第一样本图像的第一全连接结果和所述第二样本图像的第二全连接结果;以最小化互相关矩阵中对角线上的元素值,最大化互相关矩阵中非对角...

【专利技术属性】
技术研发人员:朱城
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1