当前位置: 首页 > 专利查询>常州大学专利>正文

一种基于训练样本自动优化的遥感影像循环分类方法技术

技术编号:21060808 阅读:30 留言:0更新日期:2019-05-08 07:19
本发明专利技术涉及一种基于训练样本自动优化的循环分类方法。这种方法充分利用前一次分类结果所提供的精度信息不断调整和优化用于下一次分类的训练样本,然后采用优化后的分类训练样本再次对遥感图像进行自动分类;如此形成一个循环分类过程,直到前后两次的分类精度趋于稳定则停止分类。该方法具有自动优化训练样本、同等量训练样本最大化利用、相比同等分类算法精度高、适用性强等特点。通过验证,该方法适用于遥感分类应用中的多数监督分类方法;尤其是当训练样本中含有很多噪声,需要自动对训练样本进行优化以提高分类精度的情况。在实际应用中,本方法主要应用于涉及大范围的土地覆盖/利用或专题(例如,农作物)的遥感分类。

【技术实现步骤摘要】
一种基于训练样本自动优化的遥感影像循环分类方法
本专利技术属于遥感机器学习分类应用领域,特别涉及采用遥感影像开展土地覆盖/利用、农作物分类的工程应用。
技术介绍
监督分类方法是土地覆盖/利用、农作物等遥感分类应用中常用的方法之一。监督分类方法的一般方法是先在影像上选择合适的训练样本,然后选择合适的机器学习分类器对影像进行分类,最后进行精度评价。研究表明:遥感分类成果的精度与训练样本质量、分类方法、分类后处理方法手段等因素高度相关。然而,随着分类器的性能不断提高和分类后的处理手段多样化,目前提高分类精度的主要方向是如何提高训练样本的质量[朱秀芳,潘耀忠,张锦水,王双,顾晓鹤,&徐超(2007).训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅰ)——训练样本与分类方法间分类精度响应关系研究.遥感学报,826-837]。然而,在实际分类过程中即使是精心选取的分类样本,也存在着大量的噪声和误差,严重地影响了分类的精度。类似的研究例如,朱秀芳分别从质量和数量的角度分析了训练样本对TM尺度的冬小麦测量精度影响,并指出不同分类器对不同质量和数量下的训练样本的不同的响应[朱秀芳,潘耀忠,王双,韩立建,&徐超(2009).训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅱ)——样本质量对小麦测量精度的影响分析.测绘科学,132-135]。目前,从训练样本的角度提高遥感分类精度的方法主要有两种:(1)选择地块内部的像元作为训练样本这种方法的前提假设是地块内部的像元光谱相对“纯净”,噪声较少。基本的做法是在初次选择训练样本的时候,选择地块中心附近的像元作为训练样本。然而,这种方法存在很多弊端,一是人为因素较高,很多地类中心仍然存在大量的混合像元(噪声);二是,对于部分适应混合像元的分类器,不能做到自动优化。(2)像元光谱阈值法这种方法的前提假设是训练样本在光谱空间上呈现正太分布,主要是通过计算每个类型的训练样本的均值和方差,然后剔除均值加三倍方差外的训练样本。这种方法起到了一定的效果,研究的例子例如,Arai(1992)利用光谱信息和空间信息来去除训练样本中光谱变异较大的像元,使最大似然分类法的总体精度提高了11.9%[Arai,K.(1992).Asupervisedthematicmapperclassificationwithapurificationoftrainingsamples.InternationalJournalofRemoteSensing,13,2039-2049]。吴健平等(1996)利用光谱阈值和空间方差的方法优化了训练样本,分类精度提高了6%[吴健平,杨星卫(1996).遥感数据监督分类中训练样本的纯化.国土资源遥感,36-41]。王毅等(2007)采用光谱搜索算法,设定阈值剔除了训练样本中的不纯部分,分类精度显著提高[王毅,张良培,&李平湘(2007).基于自动搜索和光谱匹配技术的训练样本纯化算法.武汉大学学报(信息科学版),216-219]。Kavzoglu(2009)先后利用可视化和直方图法去除了边缘混合像元之后,显著地提高了绿茶的分类精度。这种方法一般能将分类精度提高5%-10%左右,起到了一定的效果,但是存在一定的弊端:正太分布的假设并不适合于所有的区域,部分地区同一个地物类型光谱变异较大,光谱阈值法会以噪声的形式去除本应该属于训练样本的像元;部分地区同一地物类型的光谱较为均质,采用光谱阈值法会导致训练样本中仍然有很多的噪声[Kavzoglu,T.(2009).Increasingtheaccuracyofneuralnetworkclassificationusingrefinedtrainingdata.EnvironmentalModelling&Software,24,850-858]。综上所述,提高分类训练样本的质量是一种提高分类精度十分有效的方法。目前提高训练样本质量的方法主要依靠人工手段或单一的光谱阈值指标来进行筛选,并没有形成自动化的优化方法。
技术实现思路
本专利技术要解决的技术问题是:传统分类方法过程中训练样本的优化主要依靠手工调整,调整存在盲目性、耗时耗力等问题。本专利针对这些问题设计了一种基于训练样本自动优化的循环分类方法,这种方法充分利用前一次分类结果所提供的精度信息不断调整和优化用于下一次分类的训练样本,然后采用优化后的分类训练样本再次对遥感图像进行自动分类;如此形成一个循环分类过程,直到前后两次的分类精度趋于稳定则停止分类。专利技术该方法的目的是提高训练样本优化的效率、遥感分类的自动化程度以及分类结果的精度。本专利技术解决其技术问题所采用的技术方案是:一种基于训练样本自动优化的遥感影像循环分类方法,包含以下步骤:步骤1):选择遥感影像分类训练样本;步骤2):遥感影像分类器选择与分类;步骤3):分类总体精度评价;步骤4):计算分类训练样本中每个像元的分类正确概率;步骤5):设置概率阈值优化训练样本;步骤6):自动循环2-5步骤,直到前后两次步骤3)计算所得的分类总体精度的差值小于精度阈值就停止循环。一种基于训练样本自动优化的遥感影像循环分类方法各步骤具体为:步骤1):选择遥感影像分类训练样本:在待分类的遥感影像上为每一个待分类的类型选择训练样本,第k个类型的训练样本的数量记为其中符号T代表这是训练样本;其中待分类的类型可以是森林、草地、农作物、建筑、水体等;步骤2):遥感影像分类器选择与分类:在选择分类训练样本的基础上,对遥感影像选择机器学习算法进行分类,得到遥感分类结果图,假设像元总数为N;步骤3):分类总体精度评价:随机选择独立于分类训练样本的精度评价样本,样本的数量记为nA,其中符号A代表这是分类精度评价样本;然后,构建混淆矩阵对步骤2)中的第1次分类的结果进行精度评价,标记每个样本是否分类正确,正确的标记为“1”,错误的标记为“0”;计算第1次分类结果中类型为c的总体精度OA1(c);注意精度评价样本是固定的,在整个分类过程中一旦随机选定以后不会发生变化;其中,c是待分类的类型森林、草地、农作物、建筑、水体中的一种;步骤4):计算分类训练样本中每个像元的分类正确概率:利用分类精度评价的样本,采用logistic回归模型计算图像上每个像元的分类正确率。其中,分类正确率的回归模型如下:公式中,β0、βk为回归系数,该系数的获取方式为通过分类精度评价的样本中已知的2个自变量(最大后验概率Pmax(j)和像元的后验概率信息熵Hc(k)。P(c)为因变量)和应变量(分类是否正确(0或1))进行logistics回归获取。xk(c)为自变量,分别是最大后验概率Pmax(j)和像元的后验概率信息熵Hc(k)。P(c)为因变量,代表像元的分类正确率;步骤5):设置概率阈值优化训练样本:设置概率阈值,在对训练样本进行优化的过程中,假设第i次分类的训练样本的第c类阈值为Pi(c),第i+1次分类的训练样本的阈值为Pi+1(c),训练样本的优化的规则如下:在第i+1次分类中只有类型为c且当分类的正确率大于Pi+1(c)的像元才能作为训练样本进入第i+1次分类算法中,第i+1次分类训练样本的阈值与第i次分类训练样本的阈值的关系公式如下所示:Pi本文档来自技高网
...

【技术保护点】
1.一种基于训练样本自动优化的遥感影像循环分类方法,主要包含以下步骤:步骤1):选择遥感影像分类训练样本;步骤2):遥感影像分类器选择与分类;步骤3):分类总体精度评价;步骤4):计算分类训练样本中每个像元的分类正确概率;步骤5):设置概率阈值优化训练样本;步骤6):自动循环2‑5步骤,直到前后两次步骤3)计算所得的分类总体精度的差值小于精度阈值就停止循环。

【技术特征摘要】
1.一种基于训练样本自动优化的遥感影像循环分类方法,主要包含以下步骤:步骤1):选择遥感影像分类训练样本;步骤2):遥感影像分类器选择与分类;步骤3):分类总体精度评价;步骤4):计算分类训练样本中每个像元的分类正确概率;步骤5):设置概率阈值优化训练样本;步骤6):自动循环2-5步骤,直到前后两次步骤3)计算所得的分类总体精度的差值小于精度阈值就停止循环。2.如权利要求1所述的一种基于训练样本自动优化的遥感影像循环分类方法,其特征在于:所述步骤1)至步骤6)具体为:步骤1):选择遥感影像分类训练样本:在待分类的遥感影像上为每一个待分类的类型选择训练样本,第k个类型的训练样本的数量记为其中符号T代表这是训练样本;步骤2):遥感影像分类器选择与分类:在选择分类训练样本的基础上,对遥感影像选择机器学习算法进行分类,得到遥感分类结果图,假设像元总数为N;步骤3):分类总体精度评价:随机选择独立于分类训练样本的精度评价样本,样本的数量记为nA,其中符号A代表这是分类精度评价样本;然后,构建混淆矩阵对步骤2)中的第1次分类的结果进行精度评价,标记每个样本是否分类正确,正确的标记为“1”,错误的标记为“0”,计算第1次分类类型为c的总体精度OA1(c);步骤4):计算分类训练样本中每个像元的分类正确概率:利用分类精度评价的样本,采用logistic回归模型计算图像上每个像元的分类正确率,其中,正确率的回归模型如下:公式中,β0、βk为回归系数,xk(c)为自变量,P(c)为像元的正确率;步骤5):设置概率阈值优化训练样本:设置概率阈值,在对训练样本进行优化的过程中,假设第i次分类的训练样本的第c类阈值为Pi...

【专利技术属性】
技术研发人员:纪斯宬顾建宇陈强徐玉峰孙旭孙晨峰
申请(专利权)人:常州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1