模型训练方法技术

技术编号:39652296 阅读:6 留言:0更新日期:2023-12-09 11:20
本申请涉及一种模型训练方法

【技术实现步骤摘要】
模型训练方法、装置、计算机设备及计算机可读存储介质


[0001]本申请涉及人工智能
,特别是涉及一种模型训练方法

装置

计算机设备及计算机可读存储介质


技术介绍

[0002]随着计算机技术的发展,神经网络模型被广泛的应用于对图像进行语义分割,语义分割是指对图像中的像素点进行图像类别上的分类,为了使神经网络模型的输出结果更加准确,使用之前需要对神经网络模型进行训练

[0003]传统技术中,对大量的图像进行人工标注,得到训练图像,然后使用训练图像对神经网络模型进行训练,以得到准确度较高的神经网络模型,由于人工标注需要花费大量的时间,导致神经网络模型的训练效率低下


技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种模型训练方法

装置

计算机设备

计算机可读存储介质及计算机程序产品,能够实现提高模型训练效率

[0005]第一方面,本申请提供了一种模型训练方法,包括:
[0006]获取多张训练图像和多张候选图像;
[0007]将训练图像输入至初始语义分割模型,得到第一预测矩阵;将候选图像输入至初始语义分割模型,得到第二预测矩阵;
[0008]基于候选图像对应的第二预测矩阵,确定候选图像的预测差异度;
[0009]基于候选图像对应的第二预测矩阵与训练图像对应的第一预测矩阵;确定候选图像与多张训练图像的特征相似度;
[0010]基于各张候选图像的预测差异度和特征相似度,确定目标图像;
[0011]基于目标图像,对初始语义分割模型进行训练,得到目标语义分割模型

[0012]第二方面,本申请还提供了一种模型训练装置,包括:
[0013]获取模块,用于获取多张训练图像和多张候选图像;
[0014]输入模块,用于将训练图像输入至初始语义分割模型,得到第一预测矩阵;将候选图像输入至初始语义分割模型,得到第二预测矩阵;
[0015]第一确定模块,用于基于候选图像对应的第二预测矩阵,确定候选图像的预测差异度;
[0016]第二确定模块,用于基于候选图像对应的第二预测矩阵与训练图像对应的第一预测矩阵,确定候选图像与多张训练图像的特征相似度;
[0017]选择模块,用于基于各张候选图像的预测差异度和特征相似度,确定目标图像;
[0018]训练模块,用于基于目标图像,对初始语义分割模型进行训练,得到目标语义分割模型

[0019]第三方面,本申请还提供了一种计算机设备,计算机设备包括存储器和处理器,存
储器存储有计算机程序,处理器执行计算机程序时实现上述模型训练方法的步骤

[0020]第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述模型训练方法的步骤

[0021]第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述模型训练方法的步骤

[0022]上述模型训练方法

装置

计算机设备及计算机可读存储介质,获取多张训练图像和多张候选图像,将已标注的训练图像输入至初始语义分割模型,得到第一预测矩阵,将未标注的候选图像输入至初始语义分割模型,得到第二预测矩阵,根据候选图像对应的第二预测矩阵,确定初始语义分割模型对候选图像的预测差异度,即确定初始语义分割模型对候选图像预测的准确程度,预测差异度越大,表征初始语义分割模型对候选图像预测的准确度越低,该候选图像对于初始语义分割模型的不确定性越强,基于候选图像对应的第二预测矩阵与训练图像对应的第一预测矩阵,确定候选图像与多张训练图像的特征相似度,特征相似度越低,表征候选图像与多张训练的差异性越大,基于各张候选图像的预测差异度和特征相似度,确定目标图像,可以理解为,选择出初始语义分割模型预测准确程度低,且与多张训练图像差异性大的目标图像,使用少量的目标图像对初始语义分割模型进行训练,即可达到使用所有的候选图像对初始语义分割模型进行训练的效果,从而提高了模型的训练效率

附图说明
[0023]图1为本申请实施例提供的一种模型训练方法的应用环境图;
[0024]图2为本申请实施例提供的一种模型训练方法的流程示意图;
[0025]图3为本申请实施例提供的一种特征相似度确定步骤的流程示意图;
[0026]图4为本申请实施例提供的一种特征矩阵确定步骤的流程示意图;
[0027]图5为本申请实施例提供的一种确定特征矩阵的框架示意图;
[0028]图6为本申请实施例提供的一种目标图像确定步骤的流程示意图;
[0029]图7为本申请实施例提供的一种模型训练装置的结构框图;
[0030]图8为本申请实施例提供的一种计算机设备的内部结构图;
[0031]图9为本申请实施例提供的一种计算机可读存储介质的内部结构图

具体实施方式
[0032]为了使本申请的目的

技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明

应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请

[0033]本申请实施例提供的模型训练方法,可以应用于如图1所示的应用环境中

其中,终端
102
通过网络与服务器
104
进行通信

数据存储系统可以存储服务器
104
需要处理的数据

数据存储系统可以集成在服务器
104
上,也可以放在云上或其他网络服务器上

终端和服务器均可单独用于执行本申请实施例中提供的模型训练方法

终端和服务器也可协同用于执行本申请实施例中提供的模型训练方法

其中,终端
102
可以但不限于是各种个人计算机

笔记本电脑

智能手机

平板电脑

物联网设备及便携式可穿戴设备,物联网设备可为智
能音箱

智能电视

智能空调

智能车载设备等

便携式可穿戴设备可为智能手表

智能手环

头戴设备等

服务器
104
可以用独立的服务器或者是多个服务器组成的服务器集群来实现

[0034]在一些实施例中,如图2所示,提供了一种模型训练方法,该方法可应用于计算机设备,计算机设备可以是终端或服务器...

【技术保护点】

【技术特征摘要】
1.
一种模型训练方法,其特征在于,包括:获取多张训练图像和多张候选图像;将所述训练图像输入至初始语义分割模型,得到第一预测矩阵;将所述候选图像输入至所述初始语义分割模型,得到第二预测矩阵;基于所述候选图像对应的第二预测矩阵,确定所述候选图像的预测差异度;基于所述候选图像对应的第二预测矩阵与所述训练图像对应的第一预测矩阵,确定所述候选图像与多张所述训练图像的特征相似度;基于各张所述候选图像的预测差异度和特征相似度,确定目标图像;基于所述目标图像,对所述初始语义分割模型进行训练,得到目标语义分割模型
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述候选图像对应的第二预测矩阵,确定所述候选图像的预测差异度,包括:基于所述候选图像对应的第二预测矩阵,确定各个图像类别对应的平均概率;所述第二预测矩阵为三维矩阵,所述第二预测矩阵中的元素值表征所述候选图像中的像素点所对应的图像类别的概率;从各个所述图像类别对应的平均概率中筛选出第一平均概率和第二平均概率;将所述第一平均概率与所述第二平均概率之间的差异,确定为所述候选图像的预测差异度
。3.
根据权利要求1所述的方法,其特征在于,所述基于所述候选图像对应的第二预测矩阵与所述训练图像对应的第一预测矩阵,确定所述候选图像与多张所述训练图像的特征相似度,包括:基于预测矩阵,对图像进行特征提取,得到所述图像对应的特征矩阵;所述预测矩阵包括所述训练图像对应的第一预测矩阵和所述候选图像对应的第二预测矩阵;当所述预测矩阵为所述第一预测矩阵时,得到所述训练图像对应的第一特征矩阵;当所述预测矩阵为所述第二预测矩阵时,得到所述候选图像对应的第二特征矩阵;基于所述第二特征矩阵与所述第一特征矩阵,确定所述候选图像与所述训练图像之间的相似度;将多个相似度中最小的相似度确定为所述候选图像与多张所述训练图像的特征相似度,多个所述相似度与多张所述训练图像一一对应
。4.
根据权利要求3所述的方法,其特征在于,所述基于预测矩阵,对图像进行特征提取,得到所述图像对应的特征矩阵,包括:基于预测矩阵,确定图像对应的标签矩阵;对所述预测矩阵进行降维转换,得到预测降维矩阵;对所述标签矩阵进行降维转换,得到标签降维矩阵;对所述标签降维矩阵进行转置处理,得到标签转置矩阵;对所述预测降维矩阵和所述标签转置矩阵进行融合处理,得到所述图像对应的特征矩阵
。5.
根据权利要求4所述的方法,其特征在于,所述基于预测矩阵,确定图像...

【专利技术属性】
技术研发人员:颜泽鑫刘枢吕江波沈小勇田倬韬
申请(专利权)人:北京思谋智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1