当前位置: 首页 > 专利查询>苏州大学专利>正文

基于半监督学习的图片分类算法制造技术

技术编号:28225719 阅读:23 留言:0更新日期:2021-04-28 09:59
本发明专利技术提供基于半监督学习的图片分类算法,涉及模式识别与机器学习技术领域。该基于半监督学习的图片分类算法,包括以下步骤:S1、针对数据集进行原数据的获取;S2、将原始部分数据标签化,构建数据标签矩阵,利用特征提取算法提取矩阵中每一个数据的特征值;S3、对上述提取的特征值矩阵进行降维处理;S4、利用框架构建监督学习模型。本发明专利技术,通过利用机器学习监督的方法,将图片分类固定化、流程化以及简易化,图片分类时,只需要导入原始数据到训练模型中即可快速进行分类,在一定程度上简化了图片集中分类的难度,提升了图片分类的效率;同时利用大数据技术,减轻了图片集中分类工作量,大大提高图片集中分类的准确度。大大提高图片集中分类的准确度。大大提高图片集中分类的准确度。

【技术实现步骤摘要】
基于半监督学习的图片分类算法


[0001]本专利技术涉及模式识别与机器学习
,具体为基于半监督学习的图片分类算法。

技术介绍

[0002]半监督学习是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法,它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题,主要算法有五类:基于概率的算法;在现有监督算法基础上作修改的方法;直接依赖于聚类假设的方法;基于多视图的方法;基于图的方法。
[0003]图片是指由图形、图像等构成的平面媒体,图片的格式很多,但总体上可以分为点阵图和矢量图两大类,我们常用BMP、JPG等格式都是点阵图形,而SWF、CDR、AI等格式的图形属于矢量图形,目前,深度学习对标签和数据十分依赖,然而实际问题中无标签数据要远多于有标签数据,从而实现图片的分类需要较多的数据去实现,分类过程较为繁琐,存在着一定的局限性。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了基于半监督学习的图片分类算法,解决了现有技术中存在的缺陷与不足。
[0006](二)技术方案
[0007]为实现以上目的,本专利技术通过以下技术方案予以实现:基于半监督学习的图片分类算法,包括以下步骤:
[0008]S1、针对数据集进行原数据的获取;
[0009]S2、将原始部分数据标签化,构建数据标签矩阵,利用特征提取算法提取矩阵中每一个数据的特征值;
[0010]S3、对上述提取的特征值矩阵进行降维处理;
[0011]S4、利用框架构建监督学习模型;
[0012]S5、利用监督学习模型对标签化数据数据进行训练;
[0013]S6、利用分类器对数据集进行分类。
[0014]优选的,所述步骤1中原数据的获取利用方差选择法与递归特征消除法对原始数据特征S1、S2、S3...S
n
进行特征选择,确保原始数据特征的多样化。
[0015]优选的,所述步骤2中数据标签矩阵形式设定为mxn的矩阵B,其矩阵中行数据标签标注为b1、b2、b3......b
m
,其矩阵中列数据标签标注为b1、b2、b3......b
n
,然后再将每一个标注与其特征值一一对应,建立关于数据的特征值矩阵,其矩阵设定为mxn的矩阵C,其矩阵中行数据标签标注为c1、c2、c3......c
m
,其矩阵中列数据标签标注为c1、c2、c3......c
n

[0016]优选的,所述步骤3中特征矩阵降维处理采用主成分分析法和线性判别分析结合,
降低特征矩阵维度。
[0017]优选的,所述步骤4中利用TensorFlow、keras、mxnet框架实现对监督学习模型的构建。
[0018]优选的,所述步骤5中监督学习模型可为Co

training,Tri

training或mean teacher,优选为Tri

training,其中Tri

training模型训练包括以下步骤:
[0019]1)、对特征值矩阵进行重采样,以获得三个有标记特征值矩阵;
[0020]2)、从每个特征值矩阵中产生一个分类器;
[0021]3)、利用三个分类器以“少数服从多数”的形式来产生伪标记样本,若两个分类器将某个特征值矩阵预测为正类,而第三个分类器预测为反类,则该特征值矩阵被作为伪标记正样本提供给第三个分类器进行学习;
[0022]4)、最终三个分类器通过投票机制作为一个分类器集成进行使用。
[0023]优选的,所述步骤6中分类器对数据集原始数据进行分类具体为:调节所有降维特征值矩阵,降降维特征值矩阵导入到分类器中,分类器首先对降维特征值矩阵进行分类,然后将分类之后的降维特征值矩阵进行还原处理,即可完全原始数据中图片分类。
[0024](三)有益效果
[0025]本专利技术提供了基于半监督学习的图片分类算法。具备以下有益效果:
[0026]1、本专利技术,通过利用机器学习监督的方法,将图片分类固定化、流程化以及简易化,图片分类时,只需要导入原始数据到训练模型中即可快速进行分类,在一定程度上简化了图片集中分类的难度,提升了图片分类的效率;同时利用大数据技术,减轻了图片集中分类工作量,大大提高图片集中分类的准确度。
[0027]2、本专利技术,通过对特征值矩阵进行降维处理,解决了提取的特征矩阵过大,导致计算量大,训练时间长的问题,进一步提高了图片分类的效率,缩短了图片分类的周期。
附图说明
[0028]图1为本专利技术流程图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]实施例:
[0031]如图1所示,本专利技术实施例提供基于半监督学习的图片分类算法,包括以下步骤:
[0032]S1、针对数据集进行原数据的获取,其中原数据的获取利用方差选择法与递归特征消除法对原始数据特征S1、S2、S3...Sn进行特征选择,确保原始数据特征的多样化;
[0033]S2、将原始部分数据标签化,构建数据标签矩阵,利用特征提取算法提取矩阵中每一个数据的特征值,其中数据标签矩阵形式设定为mxn的矩阵B,其矩阵中行数据标签标注为b1、b2、b3......b
m
,其矩阵中列数据标签标注为b1、b2、b3......b
n
,然后再将每一个标注与其特征值一一对应,建立关于数据的特征值矩阵,其矩阵设定为mxn的矩阵C,其矩阵中行数
据标签标注为c1、c2、c3......c
m
,其矩阵中列数据标签标注为c1、c2、c3......c
n

[0034]S3、对上述提取的特征值矩阵进行降维处理,由于提取的特征矩阵过大,导致计算量大,训练时间长的问题,所以需要对矩阵进行降维处理,其中特征矩阵降维处理采用主成分分析法(PCA)和线性判别分析(LDA)结合,降低特征矩阵维度;
[0035]主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分,依次类推,I个变量就有I个主成分;其中Li为p维正交化向量(Li*Li=1),Zi之间互不相关且按照方差由大到小排列,则称Zi为X的第I个主成分,设X的协方差矩阵为Σ,则Σ必为半正定对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于半监督学习的图片分类算法,其特征在于:包括以下步骤:S1、针对数据集进行原数据的获取;S2、将原始部分数据标签化,构建数据标签矩阵,利用特征提取算法提取矩阵中每一个数据的特征值;S3、对上述提取的特征值矩阵进行降维处理;S4、利用框架构建监督学习模型;S5、利用监督学习模型对标签化数据数据进行训练;S6、利用分类器对数据集进行分类。2.根据权利要求1所述的基于半监督学习的图片分类算法,其特征在于:所述步骤1中原数据的获取利用方差选择法与递归特征消除法对原始数据特征S1、S2、S3...S
n
进行特征选择,确保原始数据特征的多样化。3.根据权利要求1所述的基于半监督学习的图片分类算法,其特征在于:所述步骤2中数据标签矩阵形式设定为mxn的矩阵B,其矩阵中行数据标签标注为b1、b2、b3......b
m
,其矩阵中列数据标签标注为b1、b2、b3......b
n
,然后再将每一个标注与其特征值一一对应,建立关于数据的特征值矩阵,其矩阵设定为mxn的矩阵C,其矩阵中行数据标签标注为c1、c2、c3......c
m
,其矩阵中列数据标签标注为c1、c2、c3......c
n
。4.根据权利要求1所述的基于半监督学习的图片分类算法,其特征在于:所述步骤3中特征矩阵降维处...

【专利技术属性】
技术研发人员:杨新艳
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1