基于改进高斯网络的小样本学习垃圾分类方法技术

技术编号:26172911 阅读:25 留言:0更新日期:2020-10-31 13:53
本发明专利技术公开了一种基于改进高斯网络的小样本学习垃圾分类方法,包括:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;计算编码器中的协方差矩阵以及父类集合的边缘权重;根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。本发明专利技术的方法相对于其它方法都有显著的提高,分类准确率最多提高20%左右,训练消耗时间有明显的区分,对于多噪声,分布广泛的数据集有很好的适用性,提出并建立了垃圾数据集可供读者下载使用。

【技术实现步骤摘要】
基于改进高斯网络的小样本学习垃圾分类方法
本专利技术属于垃圾分类的
,尤其涉及一种基于改进高斯网络的小样本学习垃圾分类方法。
技术介绍
我们能够从一个或几个示例中来学习认识新的对象,从手写字符识别和电机控制到高级概念的广泛活动,都已经证实了这一点。将人类的这种行为复制到机器中去是小样本学习的最初动机。尽管现代深度学习方法通过非常深的神经网络实现了前所未有的性能,但这种技术仍然需要大量的数据进行训练,通常是数以百万计。而最近提出的小样本学习方法解决了深度学习与人类学习在计算机视觉和强化学习等领域之间的样本效率差距。其中简单高效的如原型网络通过学习一个度量空间,计算和每个类别的原型表达的距离来进行分类。但对于两个或多个样本的相似度,用距离较近来度量区分度不是非常明显。以及将深度神经网络特征的度量学习和外部存储的记忆增强网络相结合的匹配网络,该模型使用加权平均的方法去做小样本分类,速度快,需要训练量小,但当原有数据分别差异过大时会出现分类问题。小样本学习分类是一项任务,在训练过程中必须调整分类器以适应训练中未见的新类。这样就会面临着过度配置问题,而数据增强和正则化技术可以减轻这种有限数据体系中的过度配置,但它们无法根本解决这一问题。
技术实现思路
基于以上现有技术的不足,本专利技术所解决的技术问题在于提供一种基于改进高斯网络的小样本学习垃圾分类方法,分类准确率高,提出并建立了垃圾数据集可供读者下载使用。为了解决上述技术问题,本专利技术提供一种基于改进高斯网络的小样本学习垃圾分类方法,包括以下步骤:步骤1:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;步骤2:计算编码器中的协方差矩阵以及父类集合的边缘权重;步骤3:根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;步骤4:根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。进一步的,所述步骤1中的编码器为能够将图像X转换为矢量的函数:其中的H是图像的高度,W是图像的宽度,C是图像的通道数,D是向量空间的嵌入维数。由上,本专利技术针对于垃圾分类问题,提出了基于小样本学习的高斯原型网络,对生活中经常出现的四大类,几十小类做分类任务,分类效果较为理想。本专利技术有以下优点:1)提出引入注意力机制的高斯原型网络。2)对于多噪声,分布广泛的数据集有很好的适用性。3)提出并建立了垃圾数据集可供读者下载使用。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例的附图作简单地介绍。图1为本专利技术的基于改进高斯网络的小样本学习垃圾分类方法的流程图。图2为本专利技术与Prototypicalnetwork,Matchingnetworks以及GaussianPrototypical分类准确率比较图,其中(a)代表1-样本,(b)代表5-样本。具体实施方式下面结合附图详细说明本专利技术的具体实施方式,其作为本说明书的一部分,通过实施例来说明本专利技术的原理,本专利技术的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。本专利技术提出一种将弱监督机制的原型传播网络中的注意力机制加入到高斯原型网络的新型网络模型,更改后的模型通过把图像嵌入到向量中,并且可以评估数据集的质量情况。随后将这种质量情况与嵌入的图像向量一起,就可以用来预测样本周围的一个收敛的区域,样本的特征是由高斯协方差矩阵来决定,与此同时,它能够将一类的原型传播到数据集中的另一种上,以便在传播过程中定义K近邻分类器。本专利技术称之为引入注意力机制的高斯原型网络,这种模型可以在不同的少量任务中实现高精度。训练任务是通过子图采样生成的,并且训练目标是通过在子图上累积逐级分类损失来获得的。生成的原型图可以不断地重复使用和更新,以用于新的任务和类。针对于小样本学习下的垃圾分类任务,本专利技术学习分类的基本流程分为:1)将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;2)计算编码器中的协方差矩阵以及父类集合的边缘权重;3)根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;4)根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。传统的原型网络相比较于高斯原型网络的编码器的结构没有什么不同之处,关键是针对于编码器的使用方式、如果去构建空间的度量以及编码器的输出内容的解释。由于将编码器的一部分输出作为构建有关支持集的协方差矩阵,模型的预测能力以及单个数据点的质量问题就可以被清晰的反映出来。此时的编码器是一种能够将图像X转换为矢量的函数:其中的H是图像的高度,W是图像的宽度,C是图像的通道数,D是向量空间的嵌入维数。对于高斯原型网络来说,编码器的输出则是嵌入矢量和协方差矩阵Σ∈RD*D的相关分量的串联。此时:此时的DS为协方差矩阵的预测成分的维数,为了能够使的网络能够表达出关于支持集数据点的方向相关的置信度,选择DS=D的情况,即此时的协方差估计的维数与嵌入空间的维数是相等的,此时每一个图像都会生成用来表示嵌入矢量周围的置信区间的大小。此时协方差矩阵的表示形式选择为:其中是从原始编码器输出的计算得到的。在高斯原型网络中,原型(即类的质心)被定义为:此时的为类x的嵌入矢量,为对角线,○表示为分量形式乘法,除法也为分量形式。在引入注意力机制的高斯原型网络中,原型传播在每个子类Zi上定义,也就说每一个总的垃圾分类Ri情况下包含着许多小的子分类Zi,如在可回收垃圾中包括废塑料、金属等;在有害垃圾中包括废电池、废药品等;在湿垃圾中包括瓜果皮核、蛋壳等。在给定类别Z∈Ri的相关训练数据Xr,类别Z的原型将初始化为样本Z∈Xr的平均值f(x),即针对于数据集S中Zi所代表的某一子类的父类Ri来说,将通过一种边权重将传播到Z类,用来测量Z类和R类之间的相似性,并对这种传播过程做出一个汇总的工作,即:其中的边缘权重是可学习的相似性度量,通过点积注意来定义,即:其中的g(·)和h(·)是适用于具有参数θa的原型,传播后的原型网络将是具有权重的和的加权平均值,α,β∈[0,1/2]即:引入注意力机制后的高斯原型网络训练过程在下面的算法给出,主要包括为两个阶段:编码器计算阶段,该阶段主要是将输入的图片信息转换为矢量信息,并把协方差矩阵和嵌入矢量作为输出信息;原型传播阶段,主要是本文档来自技高网...

【技术保护点】
1.基于改进高斯网络的小样本学习垃圾分类方法,其特征在于,包括以下步骤:/n步骤1:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;/n步骤2:计算编码器中的协方差矩阵以及父类集合的边缘权重;/n步骤3:根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;/n步骤4:根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。/n

【技术特征摘要】
1.基于改进高斯网络的小样本学习垃圾分类方法,其特征在于,包括以下步骤:
步骤1:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;
步骤2:计算编码器中的协方差矩阵以及父类集合的边缘权重;
步骤3:根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性...

【专利技术属性】
技术研发人员:张海涛陈真
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1