基于多示例深度卷积记忆网络的高光谱目标检测方法技术

技术编号:23099792 阅读:71 留言:0更新日期:2020-01-14 20:43
本发明专利技术公开了一种基于多示例深度卷积记忆网络的高光谱目标检测方法,主要解决现有技术对复杂场景下不精确标记的高光谱目标检测效果差的问题。其实现步骤为:1.对输入图像进行划分,得到训练集和测试集;2.搭建依次包括一个输入层,中间三个重复的结构单元和一个输出层共11层结构的多示例深度卷积记忆网络N;3.设置训练参数,用训练集对多示例深度卷积记忆网络N进行迭代训练,当网络性能不再提升或达到最大训练次数时,停止训练,得到最终训练好的网络N′;4.将测试样本集输入到最终训练好的网络N′进行检测,得到检测结果。本发明专利技术提高了不精确标记的高光谱目标的检测结果,减小了过拟合现象,可用于爆炸物检测、农作物精细分类。

【技术实现步骤摘要】
基于多示例深度卷积记忆网络的高光谱目标检测方法
本专利技术属于图像处理
,更进一步涉及一种高光谱目标检测方法,可用于爆炸物检测、农作物精细分类。
技术介绍
高光谱图像由于具有丰富的时空信息,近年来在爆炸物检测、农作物精细分类等各个领域得到了广泛的应用。然而,由于传感器的精度问题,高光谱图像中标记为目标的像素,在地面真值中不一定存在目标,而是表明目标存在于包括该像素在内的一定范围的空间中。此外,由于背景复杂多样,且多数情况下目标数目远小于背景数目,使得高光谱图像的目标检测成为难点。多示例学习起源于药物活性检测,随着其应用的日益广泛,目前被认为是除有监督学习、无监督学习和强化学习以外的一种新的机器学习框架。不同于有监督学习的精确标记,多示例学习的训练样本以数据包的形式存在。若一个数据包被标记为正包,则说明该数据包至少包括一个正示例;若一个数据包被标记为负包,则说明该数据包不包含正示例。问题的核心就是通过不精确标记的样本尝试得到精确的判断。这种特性使得多示例学习逐渐在图像检索、文本分类、目标检测等各个领域得到了广泛的应用。因此将高光谱不精确标记下的目标检测问题建模为多示例问题,近年来逐渐成为研究的热点。目前多示例学习算法可以分为基于示例水平空间的多示例算法、基于包水平的多示例算法和基于嵌入空间的多示例算法。基于示例水平空间的多示例算法的核心是:首先训练一个示例水平的分类器,在此基础上集成包中各个示例的分类结果来获得包的标签。主要方法有Andrews等人提出的mi-SVM算法,它首先通过把包的标签分给每个示例,基于所有的示例训练一个初始的标准SVM分类器,然后用该分类器重新对正包中的示例进行分类,当正包中所有的示例被标记为负时,就把其中置信度最大的那个示例分成正示例,基于这些标记为正的示例和所有负包中的示例重新训练分类器,不断训练和标记,直至标签不发生变化。这种方法的不足之处在于当训练数据不平衡时,标准的SVM分类器难以获得良好的分类效果,且当数据量较大时,求解过程漫长。基于包水平的多示例算法主要有Leistner等人提出的MIForests方法,该方法把正包中各个示例的标签看作隐变量,利用了随机森林易并行、准确率高的优点,结合确定性退火算法,实现了多示例的随机森林树。这种方法虽然可以平衡不平衡数据带来的误差,但是在噪声较大的分类问题上容易过拟合。基于嵌入空间的多示例算法主要有YixinChen等人提出的MILES算法,该算法通过将每个数据包映射到所有示例构成的空间的方式,获得每个包在该空间的特征映射,然后训练SVM分类器获得包级水平的分类器,测试时通过反推正包中每个示例对包的分类的贡献,确定正包中的正示例。这种方法存在的缺点是当数据量较大时,特征映射所需的内存空间巨大,同时训练SVM分类器耗时长。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种基于多示例深度卷积记忆网络的高光谱目标检测方法,以提高检测的结果,减小由于噪声带来的过拟合。本专利技术的技术方案是:将高光谱数据的光谱信息看作序列数据,搭建一个多示例深度卷积记忆网络,利用深度学习强大的特征提取能力提取序列特征,同时采取一种最佳阈值选取策略,自适应地挑选出一个或多个最有可能是目标的像素的代替正包中的像素,参与网络后续的优化,从而得到更好的检测结果,其实现步骤包括如下:(1)对输入图像进行划分:(1a)输入高光谱图像,并对每幅图像作标准化处理;(1b)将标准化处理后的60%图像作为训练集A,20%的图像作为验证集B,剩余20%的图像作为测试集C;(1c)将每幅图像中标记为目标的像素及其周围的5×5像素块作为正包,其余非目标像素作为负包;(2)搭建依次包括一个输入层,中间三个重复的结构单元和一个输出层共11层结构的多示例深度卷积记忆网络N,每个结构单元包括一个一维卷积层,一个批量归一化层和一个长短时记忆网络层;(3)对多示例深度卷积记忆网络N进行迭代训练:(3a)设置初始迭代次数t0=0、初始训练代数e0=0、间隔观察代数e、最大迭代次数T、最大训练代数E、学习率l、损失函数L以及网络性能的评价指标NAUC;(3b)对多示例深度卷积记忆网络N进行初步训练:(3b1)将训练集A中各个正包和负包的标签分别作为该正包和负包中各个像素的标签,即正包中各个像素的标签为1,负包中各个像素的标签为0;(3b2)用带标签的像素训练多示例深度卷积记忆网络N,当经过间隔观察代数e网络在验证集B上的性能都没有提升或训练代数达到最大训练代数E时,停止训练,得到初步训练好的网络N;(3c)构造新的训练集A′:(3c1)利用当前训练好的网络N对训练集A各个正包和负包中的像素进行检测,得到各个像素属于目标的概率,并作出受试者工作特征曲线ROC;(3c2)依据受试者工作特征曲线ROC,找到曲线上与坐标点(0,1)距离最近的转折点,作为最佳阈值点,将其对应的概率作为最佳阈值θ*;(3c3)将训练集A每个正包中概率大于等于最佳阈值θ*的像素和每个正包中概率最大的像素筛选出来;(3c4)对训练集A中的每个正包,利用其中筛选出来的像素通过添加高斯噪声的方式生成新的像素,并将筛选出来的像素和生成的像素作为新的正包;(3c5)将所有新的正包与训练集A中的负包一起构成新的训练集A′;(3d)令迭代次数t0=t0+1,用训练集A′重新训练当前训练好的网络N,当经过间隔观察代数e网络N在验证集B上的性能都没有提升或训练代数达到最大训练代数E时,停止训练,得到重新训练好的网络N;(3e)判断重新训练好的网络N的性能较上一次训练是否不再提升或迭代次数t0是否达到最大迭代次数T:若是,则将重新训练好的网络N作为最终的训练好的网络N',执行步骤(4),否则,返回步骤(3c);(4)采用最终的训练好的网络N'对测试集C中各个正包和负包中的像素进行检测,输出各个像素属于目标的概率,作出测试集C的受试者特性曲线ROC。本专利技术与现有技术相比,具有以下优点:1)目标检测结果更好由于本专利技术采用多示例深度卷积记忆网络专注于提取像素更加本质的光谱特征,使得目标像素和非目标像素更加有区分度,提高了检测效果。2)减小了过拟合本专利技术通过找到受试者工作特征曲线ROC上的最佳阈值作为训练集A正包中目标的筛选依据,减小了数据分布不平衡带来的偏差,使得选取出的像素更具有可靠性,同时对选择的像素通过添加高斯噪声的方式生成新的像素,从而增加了训练集像素的多样性,减小了过拟合。附图说明图1是本专利技术的实现流程图;图2是本专利技术仿真使用的一幅高光谱图像目标标记的示意图;图3是用现有的MILES算法对图2所示的高光谱图像进行目标检测,得到的ROC曲线截取千分之一部分放大后的结果图;图4是用现有的MIForests算法在图2所示的高光谱图像进行目标检测,得到的ROC曲线截取千分之一部分放大后的结果图;...

【技术保护点】
1.一种基于多示例深度卷积记忆网络的高光谱目标检测方法,其特征在于,包括:/n(1)对输入图像进行划分:/n(1a)输入高光谱图像,并对每幅图像作标准化处理;/n(1b)将标准化处理后的60%图像作为训练集A,20%的图像作为验证集B,剩余20%的图像作为测试集C;/n(1c)将每幅图像中标记为目标的像素及其周围的5×5像素块作为正包,其余非目标像素作为负包;/n(2)搭建依次包括一个输入层,中间三个重复的结构单元和一个输出层共11层结构的多示例深度卷积记忆网络N,每个结构单元包括一个一维卷积层,一个批量归一化层和一个长短时记忆网络层;/n(3)对多示例深度卷积记忆网络N进行迭代训练:/n(3a)设置初始迭代次数t

【技术特征摘要】
1.一种基于多示例深度卷积记忆网络的高光谱目标检测方法,其特征在于,包括:
(1)对输入图像进行划分:
(1a)输入高光谱图像,并对每幅图像作标准化处理;
(1b)将标准化处理后的60%图像作为训练集A,20%的图像作为验证集B,剩余20%的图像作为测试集C;
(1c)将每幅图像中标记为目标的像素及其周围的5×5像素块作为正包,其余非目标像素作为负包;
(2)搭建依次包括一个输入层,中间三个重复的结构单元和一个输出层共11层结构的多示例深度卷积记忆网络N,每个结构单元包括一个一维卷积层,一个批量归一化层和一个长短时记忆网络层;
(3)对多示例深度卷积记忆网络N进行迭代训练:
(3a)设置初始迭代次数t0=0、初始训练代数e0=0、间隔观察代数e、最大迭代次数T、最大训练代数E、学习率l、损失函数L以及网络性能的评价指标NAUC;
(3b)对多示例深度卷积记忆网络N进行初步训练:
(3b1)将训练集A中各个正包和负包的标签分别作为该正包和负包中各个像素的标签,即正包中各个像素的标签为1,负包中各个像素的标签为0;
(3b2)用带标签的像素训练多示例深度卷积记忆网络N,当经过间隔观察代数e网络在验证集B上的性能都没有提升或训练代数达到最大训练代数E时,停止训练,得到初步训练好的网络N;
(3c)构造新的训练集A′:
(3c1)利用当前训练好的网络N对训练集A各个正包和负包中的像素进行检测,得到各个像素属于目标的概率,并作出受试者工作特征曲线ROC;
(3c2)依据受试者工作特征曲线ROC,找到曲线上与坐标点(0,1)距离最近的转折点,作为最佳阈值点,将其对应的概率作为最佳阈值θ*;
(3c3)将训练集A每个正包中概率大于等于最佳阈值θ*的像素和每个正包中概率最大的像素筛选出来;
(3c4)对训练集A中的每个正包,利用其中筛选出来的像素通过添加高斯噪声的方式生成新的像素,并将筛选出来的像素和生成的像素作为新的正包;
(3c5)将所有新的正包与训练集A中的负包一起构成新的训练集A′;
(3d)令迭代次数t0=t0+1,用训练集A′重新训练当前训练好的网络N,当经过间隔观察代数e网络在验证集B上的性能都没有提升或训练代数达到最大训练代数E时,停止训练,得到重新训练好的网络N;
(3e)判断重新训练好的网络N的性能较上一次训练是否不再提升或迭代次数t0是否达到最大...

【专利技术属性】
技术研发人员:焦昶哲陈晓莹卢云飞缑水平毛莎莎王秀秀程家馨
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1