一种半监督模型的训练方法、装置及相关设备制造方法及图纸

技术编号：37771789 阅读：19 留言：0更新日期：2023-06-06 13:37

本发明专利技术提供了一种半监督模型的训练方法、装置及相关设备，该方法包括：获取开集数据集，其中，开集数据集包括无标注样本和标注样本；筛选所述无标注样本，得到所述无标注样本中的第一无标注样本和第二无标注样本，所述第一无标注样本和第二无标注样本不同；利用初始半监督模型的卷积网络基于所述第一无标注样本，生成无标注样本对应的伪标签，利用初始半监督模型的卷积网络基于所述第二无标注样本，生成无标注样本对应的负标签；确定待训练样本；基于所述待训练样本对所述初始半监督模型进行训练，得到半监督模型。本发明专利技术实施例能够提升标注数据集下的半监督模型的泛化能力。注数据集下的半监督模型的泛化能力。注数据集下的半监督模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督模型的训练方法、装置及相关设备

[0001]本专利技术涉及图像处理
，尤其涉及一种半监督模型的训练方法、装置及相关设备。

技术介绍

[0002]半监督模型学习允许训练集中含有无标注的数据，降低了深度学习对训练数据的要求，使深度学习能够在更广泛的领域得到应用。
[0003]但是传统半监督研究假定标注数据与无标注数据属于同一分布，即无标注数据归属于某一已知类别。然而当无标注数据与标注数据分布不匹配，出现已知类别外的样本时，传统半监督的打标器只能对此类样本猜测错误标签，并且错误标签在后续的一致性正则化误差计算中扰乱样本分布形态，影响半监督模型的训练过程，且训练出来的半监督模型的泛化能力较低。

技术实现思路

[0004]本专利技术的目的在于提供一种半监督模型的训练方法、装置及相关设备，能够提升半监督模型的泛化能力。
[0005]为实现上述目的，第一方面，本专利技术提供了一种半监督模型的训练方法，包括：
[0006]获取开集数据集，其中，开集数据集包括无标注样本和标注样本；
[0007]筛选所述无标注样本，得到所述无标注样本中的第一无标注样本和第二无标注样本，所述第一无标注样本和第二无标注样本不同；
[0008]利用初始半监督模型的卷积网络基于所述第一无标注样本，生成无标注样本对应的伪标签，利用初始半监督模型的卷积网络基于所述第二无标注样本，生成无标注样本对应的负标签；
[0009]确定待训练样本，其中，所述待训练样本中至少包括标注样本、已知类别样...

【技术保护点】

【技术特征摘要】
1.一种半监督模型的训练方法，其特征在于，包括：获取开集数据集，其中，开集数据集包括无标注样本和标注样本；筛选所述无标注样本，得到所述无标注样本中的第一无标注样本和第二无标注样本，所述第一无标注样本和第二无标注样本不同；利用初始半监督模型的卷积网络基于所述第一无标注样本，生成无标注样本对应的伪标签，利用初始半监督模型的卷积网络基于所述第二无标注样本，生成无标注样本对应的负标签；确定待训练样本，其中，所述待训练样本中至少包括标注样本、已知类别样本以及失配样本，所述已知类别样本为所述伪标签和第一无标注样本的集合，所述失配样本为所述负标签和第二无标注样本的集合；基于所述待训练样本对所述初始半监督模型进行训练，得到半监督模型。2.根据权利要求1所述的训练方法，其特征在于，所述筛选所述无标注样本，得到所述无标注样本中的第一无标注样本和第二无标注样本包括：利用相似度指数识别第一无标注样本和第二无标注样本。3.根据权利要求2所述的训练方法，其特征在于，所述利用相似度指数识别出第一无标注样本和第二无标注样本，包括：确定所述标注样本对应的特征中心；计算所述特征中心与无标注样本的相似度指数，所述相似度指数包括方向指数或者距离指数中的至少一种；根据相似度指数识别出第一无标注样本和第二无标注样本。4.根据权利要求2所述的训练方法，其特征在于，所述确定所述标注样本对应的特征中心，包括：其中，c为标注样本中的已知类别，x为标注数据，g(x)为标注数据x在特征空间中的坐标，I[
·
]为指示函数，i表示样本的序号，y为样本标签，|N|表示标注样本总量，|N
c
|表示类别为c的标注样本量，Center
c
为标注样本对应的特征中心。5.根据权利...

【专利技术属性】
技术研发人员：文成林，孙洁晓，
申请(专利权)人：广东石油化工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人