【技术实现步骤摘要】
基于核心样本自适应扩充的小样本高光谱图像分类方法
本专利技术涉及高光谱图像处理领域,特别是涉及一种基于核心样本自适应扩充的小样本高光谱图像分类方法。
技术介绍
近年来,由于高光谱图像的独特性质以及所包含的海量信息,对于高光谱图像的分析与处理已经成为遥感影像研究领域的热点之一,而其中的高光谱图像分类又对地质勘探、农作物检测、国防军事等领域起着实质性的重要作用。然而,高光谱图像标注困难,费时费力,往往只存在少量标注数据作为先验,因此,高光谱图像分类问题往往是小样本问题。目前存在的小样本高光谱图像像素级分类方法主要有两类:一类是基于样本扩充的方法;另一类是基于迁移学习的方法。而在现有的高光谱图像样本生成方法,通常使用GAN生成与原始训练样本分布大致相同的高光谱图像样本加入训练样本,进而得到更多的训练样本,以提高神经网络模型的泛化能力,提高测试精度,得到有效的分类结果。然而,这种方法中,GAN生成的高光谱图像训练样本往往只是与原始少量的训练样本相关,而这些少量样本并非一定是核心样本,因此,其生成的样本一般也不是核心样本,只是 ...
【技术保护点】
1.一种基于核心样本自适应扩充的小样本高光谱图像分类方法,其特征在于,包括:/n对高光谱图像进行数据预处理,得到训练样本和测试样本;/n采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本;/n将所述核心样本加入至所述训练样本中,扩充得到训练样本集;/n将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集;/n将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;/n将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果。/n
【技术特征摘要】
1.一种基于核心样本自适应扩充的小样本高光谱图像分类方法,其特征在于,包括:
对高光谱图像进行数据预处理,得到训练样本和测试样本;
采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本;
将所述核心样本加入至所述训练样本中,扩充得到训练样本集;
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集;
将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;
将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果。
2.如权利要求1所述的小样本高光谱图像分类方法,其特征在于,所述对高光谱图像进行数据预处理,得到训练样本和测试样本,具体包括:
随机从高光谱图像R的每一个类别中选取5%的光谱像素点作为训练样本所述训练样本的数量表示为M,所述训练样本的尺寸为h×1,h为光谱数;
将剩余95%的光谱像素点作为测试样本所述测试样本的数量表示为N。
3.如权利要求1所述的小样本高光谱图像分类方法,其特征在于,所述采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本,具体包括:
将所述测试样本作为聚类数据集,j表示所述聚类数据集中的数据点,且j的取值范围为[1,N];
计算每一个数据点j的局部密度ρj:
其中,ρj表示数据点j的局部密度,k表示数据点j之外的另一个数据点,djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离,dc表示截断距离;当djk-dc<0时,则χ(djk-dc)=1,否则χ(djk-dc)=0,χ(·)表示判断函数;
δj表示数据点j与比所述数据点j的局部密度高的所有数据点之间的最近距离,如公式(2)所示:
其中,ρk表示数据点k的局部密度;djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离;
对于拥有最大局部密度的数据点,其距离为所有数据点与数据点之间的距离的最大值δj=maxk(dkj);dkj为数据点k与数据点j之间的欧氏距离;
对于每个数据点j,都有与其对应的密度值ρj和距离值δj;距离阈值δ为选择数据点为聚类结果的唯一标准,则有:
numv=f(δv)(3)
其中,δv表示所有数据点的距离值,numv为δj≥δv的数据点j的个数;
对公式(3)求微分得到:
conv=[f(δv+1)-f(δv)]/(δv+1-δv)(4)
其中,conv为数据点个数与距离值的微分;δv和δv+1表示拥有数据点的距离阈值的相邻值,且δv+1>δv;
对公式(4)中的距离阈值的相邻值δv和δv+1上的conv与conv+1做商,再对结果求绝对值,即有:
quov=|conv/conv+1|(5)
quov表示两个相邻距离阈值上微分的商的绝对值;
当在某距离阈值区间δr(δv-1,δv,δv+1)上的数据点数numv趋近稳定时,在这个距离阈值区间的距离阈值δv上存在quov的局部极大值,则将当前的距离阈值δv确定为自适应距离阈值δA;
当数据点j的距离δj>δA时,所述数据点j被选择为聚类中心点,所述聚类中心点即为所述核心样本,并对所述核心样本的类别进行人为标注,得到自适应确定的核心样本。
4.如权利要求2所述的小样本高光谱图像分类方法,其特征在于,所述将所述核心样本加入至所述训练样本中,扩充得到训练样本集,具体包括:
将所述核心样本的数量定义为T;
将所述核心样本加入到所述训练样本中进行扩充,得到训练样本集;
由于所述训练样本的数量为M,所述核心样本的数量为T,则扩充后得到的训练样本...
【专利技术属性】
技术研发人员:丁晨,陈非熊,庄旭思,陈家祯,王旭珂,李润泽,苏舸夫,石武军,吴昊,
申请(专利权)人:西安邮电大学,陕西山河明泽生态环境技术咨询有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。