模型训练方法技术

技术编号:39813640 阅读:10 留言:0更新日期:2023-12-22 19:31
本申请涉及一种模型训练方法

【技术实现步骤摘要】
模型训练方法、缺陷类型确定方法及装置、设备


[0001]本申请涉及互联网通信
,尤其涉及一种模型训练方法

缺陷类型确定方法及装置

设备


技术介绍

[0002]随着互联网通信技术的发展,可以利用目标模型来对输入图像进行缺陷预测,这提高了缺陷类型确定的便捷性

目标模型的获得依赖预训练模型

相关技术中,对于预训练模型的训练关注其具备针对通用分类数据集的分类能力

这样的预训练模型会局限对应的目标模型的特征提取能力,进而影响目标模型对于包含展示特定对象的区域的图像的缺陷预测能力,比如工业领域的特定对象


技术实现思路

[0003]为了解决上述提出的至少一个技术问题,本申请提供了一种模型训练方法

缺陷类型确定方法及装置

设备:
[0004]根据本申请的第一方面,提供了一种模型训练方法,所述方法包括:
[0005]利用第一样本集训练获得基准模型,所述基准模型用于输出针对输入图像的缺陷类型,所述基准模型包括特征提取网络,所述第一样本集指示第一类对象,所述第一样本集中每一第一样本图像携带有至少一个第一类对象缺陷标签;
[0006]针对第二样本集中每一第二样本图像,利用所述基准模型得到所述第二样本图像对应的缺陷预测结果,以及以所述缺陷预测结果扩充所述第二样本图像携带的至少一个第二类对象缺陷标签,得到缺陷标签扩充结果,所述第二样本集指示第二类对象,所述第二类对象与所述第一类对象具有关联关系;
[0007]基于每一所述第二样本图像对应的所述缺陷标签扩充结果更新所述第二样本集,得到第三样本集;
[0008]利用所述第三样本集训练所述特征提取网络,得到预训练模型

[0009]根据本申请的第二方面,提供了一种缺陷类型确定方法,其特征在于,所述方法包括:
[0010]获取待处理图像,所述待处理图像包含展示第一类对象的区域;
[0011]利用目标缺陷类型确定模型对所述待处理图像进行缺陷预测,所述目标缺陷类型确定模型基于如第一方面所述的预训练模型得到

[0012]根据本申请的第三方面,提供了一种模型训练装置,所述装置包括:
[0013]第一训练模块:用于利用第一样本集训练获得基准模型,所述基准模型用于输出针对输入图像的缺陷类型,所述基准模型包括特征提取网络,所述第一样本集指示第一类对象,所述第一样本集中每一第一样本图像携带有至少一个第一类对象缺陷标签;
[0014]标签扩充模块:用于针对第二样本集中每一第二样本图像,利用所述基准模型得到所述第二样本图像对应的缺陷预测结果,以及以所述缺陷预测结果扩充所述第二样本图
像携带的至少一个第二类对象缺陷标签,得到缺陷标签扩充结果,所述第二样本集指示第二类对象,所述第二类对象与所述第一类对象具有关联关系;
[0015]样本集更新模块:用于基于每一所述第二样本图像对应的所述缺陷标签扩充结果更新所述第二样本集,得到第三样本集;
[0016]第二训练模块:用于利用所述第三样本集训练所述特征提取网络,得到预训练模型

[0017]根据本申请的第四方面,提供了一种缺陷类型确定装置,所述装置包括:
[0018]获取模块:用于获取待处理图像,所述待处理图像包含展示第一类对象的区域;
[0019]预测模块:用于利用目标缺陷类型确定模型对所述待处理图像进行缺陷预测,所述目标缺陷类型确定模型基于如第一方面所述的预训练模型得到

[0020]根据本申请的第五方面,提供了一种电子设备,所述电子设备包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由所述至少一个处理器加载并执行以实现如第一方面所述的模型训练方法

或者如第二方面所述的缺陷类型确定方法

[0021]根据本申请的第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的模型训练方法

或者如第二方面所述的缺陷类型确定方法

[0022]根据本申请的第七方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的模型训练方法

或者如第二方面所述的缺陷类型确定方法

[0023]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请

[0024]实施本申请,具有以下有益效果:
[0025]本申请提供了一种预训练模型的训练方案,有利于提高训练获得的预训练模型的适应性

在训练获得预训练模型的过程中,先利用第一样本集训练获得基准模型;然后利用基准模型对第二样本集进行缺陷预测,并扩充第二样本集原本携带的缺陷标签,以获得第三样本集;再者,利用第三样本集训练基准模型中的特征提取网络,得到预训练模型

预训练模型基于第一类对象的缺陷类型开始训练,并利用有关第二类对象的样本提高基准模型的特征提取能力

这样有利于提高预训练模型对于包含展示第一类对象的区域的图像的特征提取能力,更具针对性

相应的,基于该预训练模型获得的目标缺陷类型确定模型,在对包含展示第一类对象的区域的图像进行缺陷预测时,更具准确度

[0026]根据下面参考附图对示例性实施例的详细说明,本申请的其它特征及方面将变得清楚

附图说明
[0027]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,
还可以根据这些附图获得其它附图

[0028]图1示出根据本申请实施例的一种应用环境示意图;
[0029]图2示出根据本申请实施例的一种模型训练方法的流程示意图;
[0030]图3示出根据本申请实施例的获得缺陷标签扩充结果的流程示意图;
[0031]图4示出根据本申请实施例的确定第二类对象的流程示意图;
[0032]图5示出根据本申请实施例的利用第三样本集训练所述特征提取网络以得到预训练模型的流程示意图;
[0033]图6示出根据本申请实施例的一种缺陷类型确定方法的流程示意图;
[0034]图7示出根据本申请实施例的获得第三样本集的流程示意图;
[0035]图8示出根据本申请实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种模型训练方法,其特征在于,所述方法包括:利用第一样本集训练获得基准模型,所述基准模型用于输出针对输入图像的缺陷类型,所述基准模型包括特征提取网络,所述第一样本集指示第一类对象,所述第一样本集中每一第一样本图像携带有至少一个第一类对象缺陷标签;针对第二样本集中每一第二样本图像,利用所述基准模型得到所述第二样本图像对应的缺陷预测结果,以及以所述缺陷预测结果扩充所述第二样本图像携带的至少一个第二类对象缺陷标签,得到缺陷标签扩充结果,所述第二样本集指示第二类对象,所述第二类对象与所述第一类对象具有关联关系;基于每一所述第二样本图像对应的所述缺陷标签扩充结果更新所述第二样本集,得到第三样本集;利用所述第三样本集训练所述特征提取网络,得到预训练模型
。2.
根据权利要求1所述的方法,其特征在于,所述缺陷预测结果包括所述第二样本图像对应每一所述第一类对象缺陷标签的预测概率,所述以所述缺陷预测结果扩充所述第二样本图像携带的至少一个第二类对象缺陷标签,得到缺陷标签扩充结果,包括:获取概率阈值;对于对应每一所述第一类对象缺陷标签的预测概率,在所述预测概率大于所述概率阈值的情况下,确定所述第一类对象缺陷标签是扩充标签,以得到至少一个所述扩充标签;基于所述至少一个所述扩充标签和所述至少一个第二类对象缺陷标签,得到所述缺陷标签扩充结果
。3.
根据权利要求1或2所述的方法,其特征在于,所述方法还包括确定所述第二类对象:确定所述第一类对象的对象信息,所述对象信息包括多个维度的描述信息;从所述多个维度中确定出第一类维度和第二类维度;基于所述第一类维度的描述信息匹配结果和所述第二类维度的描述信息匹配结果,从多个候选对象中确定出所述第二类对象,所述第二类对象与所述第一类对象在所述第一类维度的描述信息匹配度大于第一阈值,所述第二类对象与所述第一类对象在所述第二类维度的描述信息匹配度小于第二阈值
。4.
根据权利要求3所述的方法,其特征在于,所述第一类对象是由至少一个工业制件构成的产品,所述多个维度包括产品名称维度

产品材质维度

产品版本维度和产品产地维度,所述从所述多个维度中确定出第一类维度和第二类维度,包括:确定所述产品名称维度和产品材质维度是所述第一类维度,以及确定所述产品版本维度是所述第二类维度;或者,确定所述产品名称维度和产品材质维度是所述第一类维度,以及确定所述产品产地维度是所述第二类维度
。5.
根据权利要求4所述的方法,其特征在于,所述第一类对象和所述第二类对象分别指示同一产品的当前版本和历史版本,所述方法还包括获取所述第二样本集:获取训练历史缺陷类型确定模型所用到的多个历史样本图像,所述历史样本图像包含展示所述第二类对象的区域,所述多个历史样本图像基于针对所述历史版本的产品允收规则进行缺陷标签标...

【专利技术属性】
技术研发人员:林愉欢汪铖杰刘永李嘉麟吴凯聂强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1