一种半监督模型的训练方法、装置及相关设备制造方法及图纸

技术编号:37771789 阅读:19 留言:0更新日期:2023-06-06 13:37
本发明专利技术提供了一种半监督模型的训练方法、装置及相关设备,该方法包括:获取开集数据集,其中,开集数据集包括无标注样本和标注样本;筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本,所述第一无标注样本和第二无标注样本不同;利用初始半监督模型的卷积网络基于所述第一无标注样本,生成无标注样本对应的伪标签,利用初始半监督模型的卷积网络基于所述第二无标注样本,生成无标注样本对应的负标签;确定待训练样本;基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型。本发明专利技术实施例能够提升标注数据集下的半监督模型的泛化能力。注数据集下的半监督模型的泛化能力。注数据集下的半监督模型的泛化能力。

【技术实现步骤摘要】
一种半监督模型的训练方法、装置及相关设备


[0001]本专利技术涉及图像处理
,尤其涉及一种半监督模型的训练方法、装置及相关设备。

技术介绍

[0002]半监督模型学习允许训练集中含有无标注的数据,降低了深度学习对训练数据的要求,使深度学习能够在更广泛的领域得到应用。
[0003]但是传统半监督研究假定标注数据与无标注数据属于同一分布,即无标注数据归属于某一已知类别。然而当无标注数据与标注数据分布不匹配,出现已知类别外的样本时,传统半监督的打标器只能对此类样本猜测错误标签,并且错误标签在后续的一致性正则化误差计算中扰乱样本分布形态,影响半监督模型的训练过程,且训练出来的半监督模型的泛化能力较低。

技术实现思路

[0004]本专利技术的目的在于提供一种半监督模型的训练方法、装置及相关设备,能够提升半监督模型的泛化能力。
[0005]为实现上述目的,第一方面,本专利技术提供了一种半监督模型的训练方法,包括:
[0006]获取开集数据集,其中,开集数据集包括无标注样本和标注样本;
[0007]筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本,所述第一无标注样本和第二无标注样本不同;
[0008]利用初始半监督模型的卷积网络基于所述第一无标注样本,生成无标注样本对应的伪标签,利用初始半监督模型的卷积网络基于所述第二无标注样本,生成无标注样本对应的负标签;
[0009]确定待训练样本,其中,所述待训练样本中至少包括标注样本、已知类别样本以及失配样本,所述已知类别样本为所述伪标签和第一无标注样本的集合,所述失配样本为所述负标签和第二无标注样本的集合;
[0010]基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型。
[0011]可选的,所述筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本包括:
[0012]利用相似度指数识别第一无标注样本和第二无标注样本。
[0013]可选的,所述利用相似度指数识别出第一无标注样本和第二无标注样本,包括:
[0014]确定所述标注样本对应的特征中心;
[0015]计算所述特征中心与无标注样本的相似度指数,所述相似度指数包括方向指数或者距离指数中的至少一种;
[0016]根据相似度指数识别出第一无标注样本和第二无标注样本。
[0017]可选的,所述确定所述标注样本对应的特征中心,包括:
[0018][0019]其中,c为标注样本中的已知类别,x为标注数据,g(x)为标注数据x在特征空间中的坐标,I[
·
]为指示函数,i表示样本的序号,y为样本标签,N表示标注样本总量,N
c
表示类别为c的标注样本量,Center
c
为标注样本对应的特征中心。
[0020]可选的,若所述待训练样本为失配样本,所述失配样本还包括正标签样本,所述正标签样本中包括正标签和复制的第二无标注样本,基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型,包括:
[0021]获取所述失配样本中的负标签对应的正标签;
[0022]复制所述失配样本中的第二无标注样本,与正标签组成正标签样本;
[0023]利用所述正标签样本与所述失配样本对初始半监督模型进行训练,得到半监督模型。
[0024]第二方面,本专利技术提供了一种半监督模型的训练装置,包括:
[0025]样本获取模块,用于获取开集数据集,其中,开集数据集包括无标注样本和标注样本;
[0026]筛选样本模块,用于筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本,所述第一无标注样本和第二无标注样本不同;
[0027]伪标签生成模块,用于利用初始半监督模型的卷积网络基于所述第一无标注样本,生成无标注样本对应的伪标签,利用初始半监督模型的卷积网络基于所述第二无标注样本,生成无标注样本对应的负标签;
[0028]待训练样本确定模块,用于确定待训练样本,其中,所述待训练样本中至少包括标注样本、已知类别样本以及失配样本,所述已知类别样本为所述伪标签和第一无标注样本的集合,所述失配样本为所述负标签和第二无标注样本的集合;
[0029]训练模块,用于基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型。
[0030]第三方面,本专利技术提供了一种电子设备,包括至少一个存储器和至少一个处理器,所述存储器存储一条或多条计算机可执行指令,所述处理器调用所述一条或多条计算机可执行指令,以执行如第一方面所述的训练方法。
[0031]第四方面,本专利技术提供了一种存储介质,所述存储介质存储一条或多条计算机可执行指令,所述一条或多条计算机可执行指令用于执行如第一方面所述的训练方法。
[0032]基于以上,本专利技术实施例提供了一种半监督模型的训练方法,包括:获取开集数据集,其中,开集数据集包括无标注样本和标注样本;筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本,所述第一无标注样本和第二无标注样本不同;利用初始半监督模型的卷积网络基于所述第一无标注样本,生成无标注样本对应的伪标签,利用初始半监督模型的卷积网络基于所述第二无标注样本,生成无标注样本对应的负标签;确定待训练样本,其中,所述待训练样本中至少包括标注样本、已知类别样本以及失配样本,所述已知类别样本为所述伪标签和第一无标注样本的集合,所述失配样本为所述负标签和第二无标注样本的集合;基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型。可见,本专利技术实施例中在开集数据集的基础上,通过为无标注样本生
成对应的负标签,使半监督模型能够根据标注样本、已知类别样本以及失配样本进行训练,从而学习已知类别样本以及失配样本的特征差异,在所有类别下降低对失配样本的预测置信度,能够实现半监督模型的反向约束,从特征空间中分离失配样本,提升半监督模型的泛化能力。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1为本专利技术实施例中一种半监督模型的训练方法的步骤示意图;
[0035]图2为本专利技术实施例中利用相似度指数识别出第一无标注样本和第二无标注样本的步骤示意图;
[0036]图3为本专利技术实施例中半监督模型的训练过程的流程示意图;
[0037]图4为本专利技术实施例中半监督深度模型与传统半监督模型的对比图;
[0038]图5为本专利技术实施例中提供的基于半监督模型的训练装置的可选框图;
[0039]图6为本专利技术实施例中提供的电子设备的框图。
具体实施方式
[0040]下面详细描述本专利技术的实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种半监督模型的训练方法,其特征在于,包括:获取开集数据集,其中,开集数据集包括无标注样本和标注样本;筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本,所述第一无标注样本和第二无标注样本不同;利用初始半监督模型的卷积网络基于所述第一无标注样本,生成无标注样本对应的伪标签,利用初始半监督模型的卷积网络基于所述第二无标注样本,生成无标注样本对应的负标签;确定待训练样本,其中,所述待训练样本中至少包括标注样本、已知类别样本以及失配样本,所述已知类别样本为所述伪标签和第一无标注样本的集合,所述失配样本为所述负标签和第二无标注样本的集合;基于所述待训练样本对所述初始半监督模型进行训练,得到半监督模型。2.根据权利要求1所述的训练方法,其特征在于,所述筛选所述无标注样本,得到所述无标注样本中的第一无标注样本和第二无标注样本包括:利用相似度指数识别第一无标注样本和第二无标注样本。3.根据权利要求2所述的训练方法,其特征在于,所述利用相似度指数识别出第一无标注样本和第二无标注样本,包括:确定所述标注样本对应的特征中心;计算所述特征中心与无标注样本的相似度指数,所述相似度指数包括方向指数或者距离指数中的至少一种;根据相似度指数识别出第一无标注样本和第二无标注样本。4.根据权利要求2所述的训练方法,其特征在于,所述确定所述标注样本对应的特征中心,包括:其中,c为标注样本中的已知类别,x为标注数据,g(x)为标注数据x在特征空间中的坐标,I[
·
]为指示函数,i表示样本的序号,y为样本标签,|N|表示标注样本总量,|N
c
|表示类别为c的标注样本量,Center
c
为标注样本对应的特征中心。5.根据权利...

【专利技术属性】
技术研发人员:文成林孙洁晓
申请(专利权)人:广东石油化工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1