一种模型训练方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:35978202 阅读:55 留言:0更新日期:2022-12-17 22:47
本发明专利技术提供了一种模型训练方法、装置、计算机可读存储介质及电子设备,该方法包括:将未标注图像输入初始训练模型,获取末层预测掩码图像和隐层预测掩码图像;基于末层预测掩码图像、隐层预测掩码图像和预设不确定度函数,确定未标注图像分别对应的不确定度值;基于未标注图像分别对应的不确定度值和第一预设条件,在未标注图像中选取出目标未标注图像;利用掩码生成器确定目标未标注图像对应的目标掩码图像;基于目标未标注图像分别对应的目标掩码图像和末层预测掩码图像,更新初始训练模型。本发明专利技术提供的技术方案可以有效利用未标注数据,即使在标注数据较少的情况下也可以获取到精度较高的初始训练模型。到精度较高的初始训练模型。到精度较高的初始训练模型。

【技术实现步骤摘要】
一种模型训练方法、装置、可读存储介质及电子设备


[0001]本专利技术涉及机器学习
,且更具体地,涉及一种模型训练方法、装置、可读存储介质及电子设备。

技术介绍

[0002]随着科技的发展,机器学习技术被广泛的应用于各个领域,然而在利用该技术时,通常需要大量的标注数据,而在某些特定领域,标注数据往往难以获取,如在半导体制造领域和医疗领域等,在获取标注图像时需要多名专家同时进行人工标注,耗时耗力,因此想要获取到大量的标注数据较为困难,而在标注数据较少时,往往难以获取到精度较高的数学模型。

技术实现思路

[0003]本专利技术提供了一种模型训练方法、装置、计算机可读存储介质及电子设备,以解决在标注数据较少时,往往难以获取到精度较高的数学模型的技术问题。
[0004]根据本专利技术的第一方面,提供了一种模型训练方法,包括:
[0005]将未标注数据集中的未标注图像输入初始训练模型,获取末层预测掩码图像和隐层预测掩码图像,其中所述初始训练模型由数量小于设定值的标注图像获取;
[0006]基于所述末层预测掩码图像、所述隐层预测掩码图像和预设不确定度函数,确定所述未标注图像分别对应的不确定度值;
[0007]基于所述未标注图像分别对应的不确定度值和第一预设条件,在所述未标注图像中选取出目标未标注图像;
[0008]利用掩码生成器确定所述目标未标注图像对应的目标掩码图像;
[0009]基于所述目标未标注图像分别对应的目标掩码图像和末层预测掩码图像,更新所述初始训练模型。
[0010]根据本专利技术的第二方面,提供了一种模型训练装置,包括:
[0011]掩码图像确定模块,用于将未标注数据集中的未标注图像输入初始训练模型,获取末层预测掩码图像和隐层预测掩码图像,其中所述初始训练模型由数量小于设定值的标注图像获取;
[0012]不确定度确定模块,用于基于所述末层预测掩码图像、所述隐层预测掩码图像和预设不确定度函数,确定所述未标注图像分别对应的不确定度值;
[0013]目标数据选取模块,用于基于所述未标注图像分别对应的不确定度值和第一预设条件,在所述未标注图像中选取出目标未标注图像;
[0014]目标图像生成模块,用于利用掩码生成器确定所述目标未标注图像对应的目标掩码图像;
[0015]检测模型更新模块,用于基于所述目标未标注图像分别对应的目标掩码图像和末层预测掩码图像,更新所述初始训练模型。
[0016]根据本专利技术的第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的模型训练方法。
[0017]根据本专利技术的第四方面,提供了一种电子设备,所述电子设备包括:
[0018]处理器;
[0019]用于存储所述处理器可执行指令的存储器;
[0020]所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述的模型训练方法。
[0021]与现有技术相比,本专利技术提供的模型训练方法、装置、计算机可读存储介质及电子设备,至少包括以下有益效果:
[0022]本专利技术的技术方案通过数量较少的标注图像获取到初始训练模型,因标注数据的数量较少,因此获取的初始训练模型通常难以满足用户的实际需求,因此将未标注图像输入初始训练模型,获取到末层预测掩码图像和隐层预测掩码图像,其中隐层预测掩码图像和末层预测掩码图像是分别基于初始训练模型不同层级的隐藏层获取到的,即末层预测掩码图像和隐层预测掩码图像是基于相同未标注图像获取到的,则末层预测掩码图像和隐层预测掩码图像具有一致性,进而根据末层预测掩码图像、隐层预测掩码图像和预设不确定度函数,确定出的未标注图像分别对应的不确定度值,可以用于评估未标注图像的样本质量,并根据第一预设条件和未标注图像分别对应的不确定度值,在未标注图像中选取样本质量较高的目标未标注图像,然后利用掩码生成器确定目标未标注图像对应的目标掩码图像,并根据目标未标注图像分别对应的目标掩码图像和末层预测掩码图像,更新初始训练模型,从而可以有效利用目标未标注图像提升初始训练模型的精度。
附图说明
[0023]为了更清楚地说明本的技术方案,下面将对本专利技术的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本专利技术一示例性实施例提供的模型训练方法的流程示意图一;
[0025]图2是本专利技术一示例性实施例提供的模型训练方法的流程示意图二;
[0026]图3是本专利技术一示例性实施例提供的模型训练方法中初始训练模型的结构示意图;
[0027]图4是本专利技术一示例性实施例提供的模型训练方法的流程示意图三;
[0028]图5是本专利技术一示例性实施例提供的模型训练方法中步骤1081

步骤1083的流程示意图;
[0029]图6是本专利技术一示例性实施例提供的模型训练方法中第一动态置信阈值确定时对应的直方图;
[0030]图7是本专利技术一示例性实施例提供的模型训练方法不确定度值和第一置信度值的分布示意图;
[0031]图8是本专利技术一示例性实施例提供的模型训练方法的流程示意图四;
[0032]图9是本专利技术一示例性实施例提供的模型训练方法的整体示意图;
[0033]图10是本专利技术一示例性实施例提供的模型训练装置的结构示意图;
[0034]图11是本专利技术一示例性实施例提供的电子设备的结构图。
具体实施方式
[0035]下面将结合本中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有创造性劳动前提下所获得的所有其他实施例,都属于本实施例保护的范围。
[0036]示例性方法
[0037]图1是本专利技术一示例性实施例提供的模型训练方法的流程示意图,至少包括如下步骤:
[0038]步骤101,将未标注数据集中的未标注图像输入初始训练模型,获取末层预测掩码图像和隐层预测掩码图像,其中所述初始训练模型由数量小于设定值的标注图像获取。
[0039]在一实施例中,先获取标注图像,其中标注图像为带有真实标注值的图像,利用数量小于设定值来表征获取到的标注图像的数量较少,因此设定值可以根据实际应用场景进行确定。在获取到标注图像后,利用该标注图像进行模型训练,确定出初始训练模型,因为该初始训练模型仅是由少量的标注图像获取,因此常常难以满足用户的实际需求。未标注图像即为获取到的没有标注的样本图像,因此往往会存在数量较多的未标注图像,在本实施例中,在获取到初始训练模型后,将未标注图像输入初始训练模型,获取到末层预测掩码图像和隐层预测掩码图像,其中隐层预测掩码图像和末层预测掩码图像是分别基于初始训练模型不同层级的隐藏层获取到的,即末本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:将未标注数据集中的未标注图像输入初始训练模型,获取末层预测掩码图像和隐层预测掩码图像,其中所述初始训练模型由数量小于设定值的标注图像获取;基于所述末层预测掩码图像、所述隐层预测掩码图像和预设不确定度函数,确定所述未标注图像分别对应的不确定度值;基于所述未标注图像分别对应的不确定度值和第一预设条件,在所述未标注图像中选取出目标未标注图像;利用掩码生成器确定所述目标未标注图像对应的目标掩码图像;基于所述目标未标注图像分别对应的目标掩码图像和末层预测掩码图像,更新所述初始训练模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述未标注数据集中删除所述目标未标注图像,更新所述未标注数据集。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述末层预测掩码图像和预设置信度函数,确定所述未标注图像分别对应的第一置信度值;则,所述基于所述未标注图像分别对应的不确定度值和第一预设条件,在所述未标注图像中选取出目标未标注图像,包括:基于所述未标注图像分别对应的不确定度值、所述第一置信度值和第二预设条件,在所述未标注图像中选取出目标未标注图像。4.根据权利要求3所述的方法,其特征在于,所述基于所述未标注图像分别对应的不确定度值、所述第一置信度值和第二预设条件,在所述未标注图像中选取出目标未标注图像,包括:基于所述未标注图像分别对应的第一置信度值,确定第一动态置信阈值;对所述未标注图像分别对应的不确定度值进行排序,确定第一排序结果;基于所述第一动态置信阈值、所述第一排序结果和第二预设条件,在所述未标注图像中选取出目标未标注图像。5.根据权利要求4所述的方法,其特征在于,目标未标注图像包括第一目标确定图像和第一目标不确定图像,则所述基于所述第一动态置信阈值、所述第一排序结果和第二预设条件,在所述未标注图像中选取出目标未标注图像,包括:若所述第一排序结果为由小至大的顺序;则利用所述第二预设条件在所述第一排序结果中筛选出前预设个数的不确定度值对应的未标注图像为第一目标不确定图像,利用所述第二预设条件筛选出不确定度值排在所述第一排序结果中后预设位置处且第一置信度值大于第一动态置信阈值的未标注图像为第一目标确定图像;或,若第一排序结果为由大至小的顺序;则利用所述第二预设条件在所述第一排序结果中筛选出后预设个数的不确定度值对应的未标注图像为第一目标不确定图像,利用所述第二预设条件筛选出不确定度值排在所述第一排序结果中前预设位置处且第一置信度值大于第一动态置信阈值的未标注图像为第一目标确定图像。6.根据权利要求5所述的方法,其特征在于,所述掩码生成器包括弱掩码生成器和强掩码生成器;则所述利用掩码生成器确定所述目标未标注图像对应的目标掩码图像包括:
将所述第一目标不确定图像输入强掩码生成器,确定所述第一目标不确定图像对应的目标掩码图像;将所述第一目标确定图像输入弱掩码生成器,确定所述第一...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:上海联麓半导体技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1