基于信息混合的半监督学习方法及半监督学习装置制造方法及图纸

技术编号:37712208 阅读:12 留言:0更新日期:2023-06-02 00:05
本发明专利技术实施例公开一种基于信息混合的半监督学习方法及半监督学习装置,涉及深度学习技术领域,包括:基于标记数据集对预设深度学习模型进行训练,获得初始分类模型;基于标记数据集和未标记数据集训练生成自编码网络;基于初始分类模型对未标记数据集进行分析,生成第一标签信息,基于自编码网络对未标记数据集进行分析,生成第二标签信息;基于第一标签信息和第二标签信息生成未标记数据集的混合标签信息;基于未标记数据集、混合标签信息及标记数据集对初始分类模型进行训练,生成的半监督学习模型。通过基于采用多种学习模型生成针对未标记数据集的混合标签的方式进行半监督学习模型的训练,从而有效提高半监督学习模型的训练效果。的训练效果。的训练效果。

【技术实现步骤摘要】
基于信息混合的半监督学习方法及半监督学习装置


[0001]本专利技术涉及深度学习
,具体地涉及一种基于信息混合的半监督学习方法及一种基于信息混合的半监督学习装置。

技术介绍

[0002]随着图像采集设备在人们生活中的应用越来越广泛,针对图像识别技术的需求越来越高,传统的图像识别技术包括基于深度学习的图像识别技术,根据其是否利用标签进行学习,分为有监督学习、半监督学习和无监督学习三种。
[0003]传统的监督型学习模型根据样本及对应标签挖掘图像本质和内在规律,以实现对新样本类别的判断,然而该模型需要大量有标签样本的支撑,否则会出现“过拟合”的现象;传统的无监督型学习模型从图像之间的关系入手,通过某种度量准则探究图像之间的内在联系,实现对图像的归类和划分,然而该模型缺乏图像标签的指导,导致训练出来的模型判别性不足、泛化能力较弱。
[0004]为了解决上述技术问题,技术人员提出了半监督学习模型,该模型通过少量的标记标签以及大量的未标记标签对模型进行训练以实现更好的学习效果。然而在实际应用过程中,一方面,在将未标记数据作为伪标签进行训练的过程中,存在将错误的伪标签输入训练模型的问题;另一方面,现有的半监督学习模型依然存在一定的一致性损失,因此识别精确性依然有待提高。

技术实现思路

[0005]为了克服现有技术中存在的上述技术问题,本专利技术实施例提供一种基于信息混合的半监督学习方法及半监督学习装置,通过基于采用多种学习模型生成针对未标记数据集的混合标签的方式进行半监督学习模型的训练,从而有效提高半监督学习模型的训练效果。
[0006]为了实现上述目的,本专利技术实施例提供一种基于信息混合的半监督学习方法,所述方法包括:基于标记数据集对预设深度学习模型进行训练,获得初始分类模型;基于所述标记数据集和未标记数据集训练生成对应的自编码网络;基于所述初始分类模型对所述未标记数据集进行分析,生成第一标签信息,以及基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息;基于所述第一标签信息和所述第二标签信息生成所述未标记数据集的混合标签信息;基于所述未标记数据集、所述混合标签信息以及所述标记数据集对所述初始分类模型进行训练,生成对应的半监督学习模型。
[0007]优选地,所述自编码网络包括编码器和解码器,所述基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息,包括:基于所述编码器对所述标记数据集进行处理,获得所述标记数据集中每张图像的第一低维特征信息,所述第一低维特征信息与不同类别相对应;基于预设聚类算法确定不同类别的中心点;基于所述编码器对所述未标记数据集进行处理,获得所述未标记数据集中每张图像的第二低维特征信息;计算确定所述
第二低维特征信息与不同中心点之间的距离;基于所述距离确定所述未标记数据集中每张图像属于不同类别的第二概率信息;基于所述第二概率信息生成所述第二标签信息。
[0008]优选地,所述基于所述第一标签信息和所述第二标签信息生成所述未标记数据集的混合标签信息,包括:基于所述初始分类模型对预设验证数据集进行分析,生成第一分析结果,基于所述自编码网络对所述预设验证数据集进行分析,生成第二分析结果;基于所述预设验证数据集的数据标签确定所述第一分析结果的第一分析准确率,以及确定所述第二分析结果的第二分析准确率;基于所述第一分析准确率和所述第二分析准确率生成所述第一标签信息的第一权重值以及所述第二标签信息的第二权重值;基于所述第一权重值、所述第一标签信息、所述第二权重值以及所述第二标签信息执行混合处理,生成混合后信息;基于所述预设归一化规则对所述混合后信息进行处理,生成所述未标记数据集的混合标签信息。
[0009]优选地,所述方法还包括:在生成所述半监督学习模型之后,获取所述半监督学习模型的损失函数;基于所述损失函数对所述半监督学习模型执行周期性识别效果验证,生成验证结果;在所述验证结果为识别效果不满足预设效果的情况下,基于第一时间周期生成单位时间窗口,获取与至少一个单位时间窗口对应的至少一个窗口数据集;基于所述至少一个窗口数据集生成至少一个新的混合标签信息;基于所述至少一个新的混合标签信息对所述半监督学习模型进行迭代训练,生成迭代后模型,将所述迭代后模型作为新的半监督学习模型。
[0010]优选地,所述基于所述损失函数对所述半监督学习模型执行周期性识别效果验证,生成验证结果,包括:判断当前时刻与生成所述半监督学习模型的时刻之间是否达到第二时间周期;若是,获取在前一单位时间窗口内输入所述半监督学习模型的在先窗口数据集;对所述在先数据集进行标记,生成在先标记数据集;基于所述损失函数和所述在先标记数据集判断所述半监督学习模型的学习效果是否满足预设效果;基于判断结果生成针对半监督学习模型的识别效果的验证结果。
[0011]相应的,本专利技术还提供一种基于信息混合的半监督学习装置,所述装置包括:模型训练单元,用于基于标记数据集对预设深度学习模型进行训练,获得初始分类模型;编码网络创建单元,用于基于所述标记数据集和未标记数据集训练生成对应的自编码网络;分析单元,用于基于所述初始分类模型对所述未标记数据集进行分析,生成第一标签信息,以及基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息;混合单元,用于基于所述第一标签信息和所述第二标签信息生成所述未标记数据集的混合标签信息;训练单元,用于基于所述未标记数据集、所述混合标签信息以及所述标记数据集对所述初始分类模型进行训练,生成对应的半监督学习模型。
[0012]优选地,所述自编码网络包括编码器和解码器,所述基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息,包括:基于所述编码器对所述标记数据集进行处理,获得所述标记数据集中每张图像的第一低维特征信息,所述第一低维特征信息与不同类别相对应;基于预设聚类算法确定不同类别的中心点;基于所述编码器对所述未标记数据集进行处理,获得所述未标记数据集中每张图像的第二低维特征信息;计算确定所述第二低维特征信息与不同中心点之间的距离;基于所述距离确定所述未标记数据集中每张图像属于不同类别的第二概率信息;基于所述第二概率信息生成所述第二标签信息。
[0013]优选地,所述混合单元包括:验证分析模块,用于基于所述初始分类模型对预设验证数据集进行分析,生成第一分析结果,基于所述自编码网络对所述预设验证数据集进行分析,生成第二分析结果;准确率确定模块,用于基于所述预设验证数据集的数据标签确定所述第一分析结果的第一分析准确率,以及确定所述第二分析结果的第二分析准确率;权重确定模块,用于基于所述第一分析准确率和所述第二分析准确率生成所述第一标签信息的第一权重值以及所述第二标签信息的第二权重值;混合模块,用于基于所述第一权重值、所述第一标签信息、所述第二权重值以及所述第二标签信息执行混合处理,生成混合后信息;归一化模块,用于基于所述预设归一化规则对所述混合后信息进行处理,生成所述未标记数据集的混合标签信息。
[0014]优选地,所述装置还包括迭代单元,所述迭代单元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于信息混合的半监督学习方法,其特征在于,所述方法包括:基于标记数据集对预设深度学习模型进行训练,获得初始分类模型;基于所述标记数据集和未标记数据集训练生成对应的自编码网络;基于所述初始分类模型对所述未标记数据集进行分析,生成第一标签信息,以及基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息;基于所述第一标签信息和所述第二标签信息生成所述未标记数据集的混合标签信息;基于所述未标记数据集、所述混合标签信息以及所述标记数据集对所述初始分类模型进行训练,生成对应的半监督学习模型。2.根据权利要求1所述的方法,其特征在于,所述自编码网络包括编码器和解码器,所述基于所述自编码网络对所述未标记数据集进行分析,生成第二标签信息,包括:基于所述编码器对所述标记数据集进行处理,获得所述标记数据集中每张图像的第一低维特征信息,所述第一低维特征信息与不同类别相对应;基于预设聚类算法确定不同类别的中心点;基于所述编码器对所述未标记数据集进行处理,获得所述未标记数据集中每张图像的第二低维特征信息;计算确定所述第二低维特征信息与不同中心点之间的距离;基于所述距离确定所述未标记数据集中每张图像属于不同类别的第二概率信息;基于所述第二概率信息生成所述第二标签信息。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一标签信息和所述第二标签信息生成所述未标记数据集的混合标签信息,包括:基于所述初始分类模型对预设验证数据集进行分析,生成第一分析结果,基于所述自编码网络对所述预设验证数据集进行分析,生成第二分析结果;基于所述预设验证数据集的数据标签确定所述第一分析结果的第一分析准确率,以及确定所述第二分析结果的第二分析准确率;基于所述第一分析准确率和所述第二分析准确率生成所述第一标签信息的第一权重值以及所述第二标签信息的第二权重值;基于所述第一权重值、所述第一标签信息、所述第二权重值以及所述第二标签信息执行混合处理,生成混合后信息;基于所述预设归一化规则对所述混合后信息进行处理,生成所述未标记数据集的混合标签信息。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在生成所述半监督学习模型之后,获取所述半监督学习模型的损失函数;基于所述损失函数对所述半监督学习模型执行周期性识别效果验证,生成验证结果;在所述验证结果为识别效果不满足预设效果的情况下,基于第一时间周期生成单位时间窗口,获取与至少一个单位时间窗口对应的至少一个窗口数据集;基于所述至少一个窗口数据集生成至少一个新的混合标签信息;基于所述至少一个新的混合标签信息对所述半监督学习模型进行迭代训练,生成迭代后模型,将所述迭代后模型作为新的半监督学习模型。5.根据权利要求4所述的方法,其特征在于,所述基于所述损失函数对所述半监督学习
模型执行周期性识别效果验证,生成验证结果,包括:判断当前时刻与生成所述半监督学习模型的时刻之间是否达到第二时间周期;若是,获取在前一单位时间窗口内输入所述半监督学习模型的在先窗口数据集;对所述在先数据集进行标记,生成在先标记数据集;基于所述损失函数和所述在先标记数据集判断所述半监督学习模型的学习效果是否满足预设效果;基于判断结果生成针对半监督学习模型的识别效果的验证结果。6.一种基于信息混合的半监督学习装置,其特征在于,所述装置包括:模型训练...

【专利技术属性】
技术研发人员:刘利非杨吉利朱剑
申请(专利权)人:上海锡鼎智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1