本发明专利技术属于自动目标识别技术领域,具体涉及一种基于小样本数目集的动态渐进式自动目标识别方法。本发明专利技术在使用GANs生成样本进行数据集扩充的基础之上,提出了一种通用的在小规模样本集条件下进行识别的自动目标识别方法,并应用于自动目标识别领域。作为一种具备在小样本条件下能够进行自动目标识别的方法,该方法能够保有自主生成、自主迭代以及自主成长的能力,在训练样本数目不足原始样本集15%的条件下,使ATR模型的识别准确率达到了94%。同时,本发明专利技术所提出的筛选方法,较之于SVM等传统筛选方法,其筛选样本的结果更具显著性。
A dynamic progressive automatic target recognition method based on small sample set
【技术实现步骤摘要】
一种基于小样本数目集的动态渐进式自动目标识别方法
本专利技术属于自动目标识别
,具体涉及一种基于小样本数目集的动态渐进式自动目标识别方法。
技术介绍
在自动目标识别任务中,得益于机器学习的发展,基于数据驱动的自动目标识别(AutomaticTargetRecognition,ATR)算法取得了广泛的成功。在众多数据驱动算法中,以特征提取以及分类器算法取得的贡献最为突出。在特征提取方法中,主成分分析(PrincipleComponentAnalysis,PCA)、线性判别分析(LinearDiscriminantAnalysis,LDA)、非负矩阵分解(NonnegativeMatrixFactorization,NMF)早已被广泛运用到各种ATR模型。在分类器算法中,支持向量机(SupportVectorMachine,SVM)通过选取支持向量来最大化目标分类边界的方式,也曾在ATR上取得了成功。近些年,随着深度学习算法的崛起,各类深度识别网络也被应用到ATR中,并取得了明显突破。虽然上述算法均在ATR任务中取得了不俗表现,但是基于数据驱动的算法都十分依赖于数据集容量。因此,基于数据驱动的算法往往会在面对小样本目标数据集时失效。小样本数据集对ATR任务的挑战其实就是数据驱动为基础的算法与数据不足的样本集之间的矛盾。因此,本专利技术所提出的方法正是应对于缓解此矛盾提出的。解决这一问题的途径通常可以从以下两个思路展开:第一,考虑使用能够在极端少量数据集下进行有效自动目标识别的方法,迁移学习(TransferLearning)提供了一种可供替代的思路。但是,迁移学习所需预训练的大型神经网络往往以大规模同质数据集为前提,这个前提并不适用于ATR任务的现状。第二,考虑通过样本集扩充的方式来缓解数据需求不一致的矛盾,生成对抗网络(GenerativeAdversarialNets,GANs)能够生成与真实目标图像极为相似的图像,为解决上述矛盾提供了另一种切实的思路。近年来,在行人重识别,人脸识别等其他领域,许多使用GANs生成样本进行数据集扩充并解决小样本目标识别的方法被提出。虽然上述方法使得为小样本目标识别方法提供了一种切实有效的思路,但仍然不得不囿于自动目标识别领域本身的缺陷——自动目标识别领域所使用的目标图像可解译度通常不高。因此,若将GANs生成样本进行数据集扩充的方式应用于ATR,在充分考虑目标图像可解译度低的前提下,这无疑将是一种更加适用于的小样本数据集下的自动目标识别方法。
技术实现思路
本专利技术的目的,就是针对上述存在的问题及不足,为了解决数据驱动为基础的算法与数据不足的样本集之间的矛盾,使自动目标识别模型能够在小样本数据集下通过数据集扩充来缓解数据需求不一致的矛盾,提供了一种基于小样本数目集的动态渐进式自动目标识别方法。本专利技术的技术方案为:一种基于小样本数目集的动态渐进式自动目标识别方法,如图1所示,包括:步骤1、对现有的小规模图像样本集进行真实样本数据分布拟合,采用Wasserstein距离测度进行生成样本数据分布Pg(y)和真实样本数据分布Pr(x)之间的距离衡量,即:其中,∏(Pr(x),Pg(y))是所有联合分布γ(x,y)的集合,它们各自的边界分布则分别是真实样本数据分布Pr(x)和生成样本数据分布Pg(y)。同时,将1-lipschitz约束施加到Wasserstein距离测度上,则生成模型的损失函数转化为以下形式:其中,x=εxr+(1-ε)xg。ε是一个采样于均匀分布ε~U[0,1]的随机数。λ是用于梯度惩罚的常数系数。通过最小化上述损失函数,可以达到用生成样本数据分布Pg(y)拟合真实样本数据Pr(x)的目的;步骤2、在达到用生成样本数据分布Pg(y)拟合真实样本数据Pr(x)的目的后,生成模型仅仅能够得到未标记的高质量生成目标样本。这些生成样本并不完全适用于当前流行的监督学习框架。因此,向生成模型的生成过程中添加标签信息y来控制其生成样本的类别,则生成模型的损失函数转化为以下形式:通过最小化上述损失函数,生成模型可以按目标类型生成高质量的目标样本。步骤3、生成模型凭借分布拟合以及标签信息控制生成高质量的目标样本后,需要对生成样本进行筛选才能够用于后续识别流程。其筛选流程(以下称动态渐进式过程)所选用的迭代分类器选用为SVM。在一次动态渐进式过程的循环中,SVM1由现阶段已收集到的样本进行训练,随后,使用SVM1对新的生成样本进行筛选。通过筛选的生成样本将与现阶段已收集到的样本组成一个新的训练样本集。训练样本集的更新将会重新训练一个新的SVM2,再使用新的SVM2对已经通过筛选的生成样本进行再筛选;最后,通过再筛选的样本将作为下次动态渐进式过程循环的输入。循环过程终止的条件是:随着生成样本将不再能够被SVMi有效筛选出时,动态渐进式过程停止循环。步骤4、生成样本筛选之后进行目标识别。首先,对现有真实样本集使用传统数据增强方法,如旋转、翻折等方法进行数据集扩充。随后,将增强后的样本集与筛选后的生成样本集组合后形成一个新的训练样本集。使用该训练样本集对三值神经网络进行训练,并使用训练出的ATR模型进行自动目标识别。本专利技术在生成对抗网络扩充数据集的基础上提出了一种小样本自动目标识别方法:基于小样本数目集的动态渐进式自动目标识别方法,并应用于自动目标识别中。该方法作为一种有效的小样本目标识别方法,在保证模型能够自主生成样本的前提下,不仅可以自主筛选生成样本,更能够缓解数据驱动为基础的算法与数据不足的样本集数据需求不一致的矛盾,让现有自动目标识别模型能够在小样本条件下进行识别。本专利技术的有益效果为,较现有的ATR方法,本专利技术具有了在小样本条件下进行有效自动目标识别的能力;能够自主生成高质量样本的前提下,也能够自主筛选可靠的生成样本;在提高识别能力的基础上,比传统方法适用的场景更加广泛,能够应用于更加严苛的环境条件。附图说明图1为本专利技术特征提取方法流程;图2为MSTAR目标切片部分读取图像展示;(a)是BMP2装甲车,(b)是BTR70装甲车,(c)是T72坦克;图3三种方法针对小样本SAR十类目标识别任务的识别率统计;图4两种方法针对小样本SAR十类目标筛选结果对比。具体实施方式下面以MSTAR十类目标图像识别任务为例,模拟实际增量学习应用对本专利技术做进一步说明。表1实验所用样本为MSTAR三类目标切片,切片为64×64的RAW格式数据,训练样本为俯仰角为17度的目标,测试样本为俯仰角为15度的目标。表1为MSTAR十类目标分布。目标切片读取图像例参见附图2。本专利技术是为了ATR模型具备在小样本条件下的自动目标识别能力,因此,将只从现有训练样本集中选取每类目标样本40个,将训练样本集的样本数目降低至现有训练集的15%以下,从而模拟实际应用中小样本条件的情况。测试样本为未知标签样本,不参与训练。在每次ATR本文档来自技高网...
【技术保护点】
1.一种基于小样本数目集的动态渐进式自动目标识别方法,其特征在于,包括以下步骤:/n步骤1、对小规模图像样本集进行真实样本数据分布拟合,采用Wasserstein距离测度进行生成样本数据分布P
【技术特征摘要】
1.一种基于小样本数目集的动态渐进式自动目标识别方法,其特征在于,包括以下步骤:
步骤1、对小规模图像样本集进行真实样本数据分布拟合,采用Wasserstein距离测度进行生成样本数据分布Pg(y)和真实样本数据分布Pr(x)之间的距离衡量,即:
其中,∏(Pr(x),Pg(y))是所有联合分布γ(x,y)的集合,它们各自的边界分布则分别是真实样本数据分布Pr(x)和生成样本数据分布Pg(y),E表示两种分布之间Wasserstein距离的数学期望,inf表示该数学期望的下确界;同时,将1-lipschitz约束施加到Wasserstein距离测度上,则生成模型的损失函数转化为以下形式:
其中,x=εxr+(1-ε)xg,ε是一个采样于均匀分布ε~U[0,1]的随机数,λ是用于梯度惩罚的常数系数,D表示用于判定样本是否属于生成样本数据分布Pg(y)的判决函数,表示为函数D的一阶求导形式,通过最小化上述损失函数,达到用生成样本数据分布Pg(y)拟合真...
【专利技术属性】
技术研发人员:曹宗杰,曹昌杰,崔宗勇,皮亦鸣,杨建宇,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。