【技术实现步骤摘要】
一种小样本下复杂环境的目标识别方法
本专利技术属于图像处理
,涉及一种小样本下复杂环境的目标识别方法。
技术介绍
在实际工程中,采集获得的数据样本通常不充足,导致模型学习不足,出现过拟合状态。复杂场景下,会出现曝光过度、正样本数量大于负样本的情况,在这种情况下,亟需一种能解决小样本在复杂环境下的目标识别方法。近几年,基于深度学习的识别技术得到很快发展,尤其以GoogleNet、VGG、ResNet、SENet为代表的深度卷积分类网络在工业界和学术界都取得了巨大的成功。相比于传统的图像分类识别技术,深度卷积分类网络使得特征提取和特征分类统一成一个整体框架联合训练,从而避免了手动提取特征和传统识别方法存在的语义鸿沟问题。然而,这些分类模型为端到端的监督模型,其较高的准确率依赖于大量的有标签数据,在数据稀少的情况下,模型很容易过拟合,得到很差的泛化结果和较低的准确率,数据增强和正则化技术只能缓解而无法从根本上解决小样本的目标识别问题。为了解决采集样本数量少的问题,目前容易想到采用生成式对抗网络(GenerativeAdversarialNetworks,GAN)来扩充样本数据,GAN网络是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中两个模块:生成模型(GenerativeModel)和判别模型(DiscriminativeModel)的互相博弈学习产生相当好的输出,从而得到扩充后的样本。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种小样本 ...
【技术保护点】
1.一种小样本下复杂环境的目标识别方法,其特征在于,该方法包括以下步骤:/nS1:数据扩充,具体包括:/nS11:构建并训练生成式对抗网络(Generative Adversarial Networks,GAN);/nS12:GAN网络训练完成后,将GAN生成的数据集进行筛选,把结果和真实数据集混合形成新的数据集,得到扩充小样本数据集;标注新数据集,并把标注之后的新数据集作为YOLOV3的输入;/nS2:目标识别,具体包括:/nS21:构建并训练YOLOV3网络;/nS22:在对YOLOV3网络的坐标、置信度和分类训练完成后,将新数据集输入到YOLOV3网络中,对图片中最终剩下的检测框进行NMS处理,删去多余的框,输出带有检测框的图片。/n
【技术特征摘要】
1.一种小样本下复杂环境的目标识别方法,其特征在于,该方法包括以下步骤:
S1:数据扩充,具体包括:
S11:构建并训练生成式对抗网络(GenerativeAdversarialNetworks,GAN);
S12:GAN网络训练完成后,将GAN生成的数据集进行筛选,把结果和真实数据集混合形成新的数据集,得到扩充小样本数据集;标注新数据集,并把标注之后的新数据集作为YOLOV3的输入;
S2:目标识别,具体包括:
S21:构建并训练YOLOV3网络;
S22:在对YOLOV3网络的坐标、置信度和分类训练完成后,将新数据集输入到YOLOV3网络中,对图片中最终剩下的检测框进行NMS处理,删去多余的框,输出带有检测框的图片。
2.根据权利要求1所述的一种小样本下复杂环境的目标识别方法,其特征在于,步骤S11中,构建的GAN网络包含生成器C和判别器T;生成器C有一个输入,即符合某种概率分布的噪声数据,C的作用是根据输入的噪声数据来生成新的图片;判别器T有两个输入,一个是真实数据集,真实数据集的标签自动设为1,另一个输入是生成器C生成的数据,标签自动设为0,T的作用是识别出真实数据与生成器生成的数据;
GAN网络的损失函数为:
其中,t~Atrue(t)表示数据t来自于真实数据的数据集T(t);n~Anoise(n)表示数据n来自于生成器C所生成的数据集C(n)。
3.根据权利要求2所述的一种小样本下复杂环境的目标识别方法,其特征在于,步骤S11中,训练GAN网络是:采用单独交替迭代训练的模式训练生成器C和判别器T;训练开始前,随机初始化生成器C,并对判别器T进行预训练,使其在开始训练时就具有一定的分类能力;
GAN网络训练的具体步骤为:
1)固定生成器C,训练判别器T,循环执行下列步骤K次;
①从噪声数据Anoise中采样n个对象,产生集合n~Anoise(n);
②从真实数据集Atrue(t)中采样t个对象,产生集合t~Atrue(t);
③将n~Anoise(n)输入GAN中,生成新的数据集合C(n);
④将C(n)和t~Atrue(t)输入T,以下列公式为损失函数进行训练,损失函数类似二分类网络,使T判别时,倾向于使Atrue(t)中数据的得分接近1,C(n)中数据的得分接近0;
采用交叉熵损失来作为损失函数,梯度下降的方式更新网络参数,循环K次,来找到在当前GAN的情况下的最优判别器T;
2)固定判别器T,训练生成器C,执行下列步骤一次;
①从噪声数据Anoise中采样n个对象,产生集合n~Anoise(n);
②将n~Anoise(n)输入C中,输出的数据记为C(n);
③从C(n)和Atrue(t)中抽样出n个数据,构成集合输入到T中;
④根据下列公式的损失函数和T的输出结果来对C进行训练,采用梯度下降更新网络参数;
3)单次训练过程结束,返回开始,再次进行训练。
4.根据权利要求1所述的一种小样本下复杂环境的目标识别方法,其特征在于,步骤S21中,构建的YOLOV3网络是:主干网络为53层的...
【专利技术属性】
技术研发人员:姚远,郑志浩,张学睿,张帆,尚明生,
申请(专利权)人:中国科学院重庆绿色智能技术研究院,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。