基于集成学习的极化SAR图像半监督分类方法技术

技术编号:11263452 阅读:108 留言:0更新日期:2015-04-08 08:52
本发明专利技术公开了一种基于集成学习的极化SAR图像半监督分类方法,其实现步骤为:(1)输入一幅极化SAR图像;(2)提取极化SAR图像的散射特征,偏振参数和纹理特征;(3)利用Knn算法计算样本的抗噪因子;(4)根据样本的权重,抽取训练样本;(5)训练得到分类器,并计算错误率;(6)根据错误率调整样本的权重;(7)根据Wishart距离,选择置信度高的未标记样本,加入到训练集,并赋权重;(8)判断是否满足停止条件,满足则结束并输出分类结果,否则转到(4);本发明专利技术组合偏振参数,散射特征和纹理特征,能够更全面地描述地物真实情况,并利用部分未标记样本,丰富了原始训练样本,获得了较好的分类精度。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于集成学习的极化SAR图像半监督分类方法,其实现步骤为:(1)输入一幅极化SAR图像;(2)提取极化SAR图像的散射特征,偏振参数和纹理特征;(3)利用Knn算法计算样本的抗噪因子;(4)根据样本的权重,抽取训练样本;(5)训练得到分类器,并计算错误率;(6)根据错误率调整样本的权重;(7)根据Wishart距离,选择置信度高的未标记样本,加入到训练集,并赋权重;(8)判断是否满足停止条件,满足则结束并输出分类结果,否则转到(4);本专利技术组合偏振参数,散射特征和纹理特征,能够更全面地描述地物真实情况,并利用部分未标记样本,丰富了原始训练样本,获得了较好的分类精度。【专利说明】基于集成学习的极化SAR图像半监督分类方法
本专利技术属于图像处理
,具体设及一种基于集成学习的极化SAR图像半监 督分类方法。
技术介绍
极化SAR (合成孔径雷达)因其巨大的优势,不管是在民用或者是军用事业都得到 了广泛的应用,例如目标检测,地物分类,参数反演等等。其中,地物分类方面的应用是极化 SAR众多应用中非常重要的一个。 极化SAR图像分类方法大致包括两大步骤,即特征的选取和分类器的确定。如何 获取有价值的特征和好的分类策略是极化SAR图像分类问题的重点。特征方面,常用的有 偏振参数,散射矩阵和纹理特征。Cloude于1997年提出了著名的H/a分类方法,即由散射 矩阵分解得到散射滴H和散射角a,根据该两个值可W把一幅极化SAR图像分为8类。之 后,基于不同分解的极化SAR图像分类方法纷纷出现。由于实际地物具有复杂的种类结构, 因此由某一种分解表征地物的特性是不全面的。 一般情况下,极化SAR图像的标签都是通过人工标记获取的,因此,很容易由于人 为因素引入错误,而该些错误标签对于分类器而言,其影响是致命的。而一般的极化SAR分 类方法中,极少考虑了该部分问题,实际上该些由于人为因素引入的错误标签,对分类器的 影响是不可W忽略的。 极化SAR通过对目标进行全极化测量,而获取丰富全面的目标信息,使得极化SAR 在分类问题中优势非常明显。目前,不管是机载极化SAR还是星载极化SAR数据在网络上 都可W非常方便的获取到,而且极化SAR数据也已经非常丰富。但是极化SAR图像的自动 解译方法的发展没有想象中的那么迅速。如何对海量级别的极化SAR数据分析,成为今后 遥感图像处理的一个重要研究点。 极化SAR图像的分类大致分为无监督和有监督两大类。对于极化SAR图像的有 监督分类中,最常用的是基于极化数据的统计分布而进行的。例如基于协方差矩阵的复 Wishart分布,基于极化测量矢量的多元复高斯分布等等。而有监督分类必须知道一定数量 的有标记样本,而对于极化SAR数据而言,人工标记训练样本的该个过程,通常要花费大量 的人力和时间,而且通过人工标记不能保证训练样本的正确性,也不能根据有限的训练样 本,就能够估计出整个样本的分布。
技术实现思路
本专利技术的目的在于针对已有技术的不足,提出一种基于集成学习的极化SAR图 像半监督分类方法,一方面通过K近邻(Knn)算法抑制了标签噪声的影响,另一方面通过 Wishart距离添加一部分未标记样本帮助分类,提高了分类精度。 [000引为实现上述目的,本专利技术包括如下步骤: (1)提取一幅极化SAR图像的特征,特征包括偏振参数F1、散射特征巧和纹理特 征F3 ; (la)基于S矩阵,提取极化SAR图像的偏振参数FI ; Qb)基于极化散射分解,提取极化SAR图像的散射特征巧; (Ic)基于灰度共生矩阵,提取极化SAR图像的纹理特征F3; [001引 似从极化SAR图像的已标记样本中选择1%比率的样本作为训练样本,初始化训 练样本的权重{W。}; (3)用K近邻化nearest nei曲borhoods)算法计算每个训练样本的抗噪因子 C。,n = 1,. . .,N ; (3a)对极化SAR图像中每一个有标记的样本点,计算该样本点和该样本点的八个 近邻像素点的欧氏距离; (3b)选择该样本点的k个最近的近邻,计算该k个近邻与该样本点属于同一类别 的比率,即抗噪因子,k值取3; (4)进入迭代过程,并记录当前迭代次数t,初始t = 1,用弱分类器B训练此轮的 训练数据,得到基分类器、; 妨计算ht的错误率 【权利要求】1. 一种基于集成学习的极化SAR图像半监督分类方法,包括如下步骤: (1) 提取一幅极化SAR图像的特征,特征包括偏振参数Fl、散射特征F2和纹理特征F3 ; (la) 基于S矩阵,提取极化SAR图像的偏振参数Fl; (lb) 基于极化散射分解,提取极化SAR图像的散射特征F2 ; (lc) 基于灰度共生矩阵,提取极化SAR图像的纹理特征F3 ; (2) 从极化SAR图像的已标记样本中选择1 %比率的样本作为训练样本,训练样本的个 数为N,初始化所述训练样本的样本权重{WJ,初始值都设置为1/N; (3) 用K近邻(Knearestneighborhoods)算法计算每个训练样本的抗噪因子Cn,n= 1, ? ? ? ,N; (3a)对步骤(2)中的每个训练样本,计算该样本和该样本的八个近邻像素点的欧氏距 离; (3b)选择该样本的八个近邻像素点与该样本的欧式距离最小的k个像素点,计算这k个近邻像素点与该样本属于同一类别的比率,即抗噪因子,k值取3 ; (4) 根据步骤(1)提取的所述训练样本的极化SAR图像的特征,用弱分类器B对训练样 本进行训练,得到基分类器ht,并记录当前次数t,初始t= 1 ;其中,<是第t轮迭代中第i个样本的权重,ht(Xi)是第i个样本被预测的类别,5^是 第i个样本的真实类别,N是样本个数;其中,In是对数函数,et是错误率,Ct是抗噪因子; (7) 根据步骤(3)计算得到的训练样本的抗噪因子,更新步骤⑵中所述的训练样本的其中,<+1是第t+1轮迭代中第i个样本的权重,at是基分类器ht的权重,Ct是抗噪 因子,Zt是归一化因子,WJIlJ是第一次第n个样本的样本权重Fh1的简写; (8) 用(4)中训练得到的基分类器ht对极化SAR图像的未标记样本集U预测,分别计 算被预测为第m类的样本到第m类聚类中心的距离,取距离最近的两个样本加入有标记样 本,并给这两个样本赋权重:其中,彳是未标记样本集中的第i个样本,4是已标记样本中第j个样本,m为任意类 别标记; (9) 重复步骤(4)?(8),若达到设置的最大迭代次数或当错误率大于0.5则结束并跳 转到步骤(10),否则返回步骤(4)继续; (10) 将⑷?⑶步骤中产生的基分类器进行组合,得到组合分类器:其中,at是第t轮迭代的分类器的权重,ht(x)是基分类器ht对样本X的预测结果,sign是符号函数; (11) 利用步骤(10)中的组合分类器给极化SAR图像预测分类,输出极化SAR图像的分 类结果。2. 根据权利要求1所述的基于集成学习的极化SAR图像半监督分类方法,其特征在于, 步骤(Ia)所述的提取偏振参数Fl,包括如本文档来自技高网
...
基于集成学习的极化SAR图像半监督分类方法

【技术保护点】
一种基于集成学习的极化SAR图像半监督分类方法,包括如下步骤:(1)提取一幅极化SAR图像的特征,特征包括偏振参数F1、散射特征F2和纹理特征F3;(1a)基于S矩阵,提取极化SAR图像的偏振参数F1;(1b)基于极化散射分解,提取极化SAR图像的散射特征F2;(1c)基于灰度共生矩阵,提取极化SAR图像的纹理特征F3;(2)从极化SAR图像的已标记样本中选择1%比率的样本作为训练样本,训练样本的个数为N,初始化所述训练样本的样本权重{Wn},初始值都设置为1/N;(3)用K近邻(K nearest neighborhoods)算法计算每个训练样本的抗噪因子Cn,n=1,...,N;(3a)对步骤(2)中的每个训练样本,计算该样本和该样本的八个近邻像素点的欧氏距离;(3b)选择该样本的八个近邻像素点与该样本的欧式距离最小的k个像素点,计算这k个近邻像素点与该样本属于同一类别的比率,即抗噪因子,k值取3;(4)根据步骤(1)提取的所述训练样本的极化SAR图像的特征,用弱分类器B对训练样本进行训练,得到基分类器ht,并记录当前次数t,初始t=1;(5)计算步骤(4)中训练得到的基分类器ht的错误率其中,是第t轮迭代中第i个样本的权重,ht(xi)是第i个样本被预测的类别,yi是第i个样本的真实类别,N是样本个数;(6)计算步骤(4)中训练得到的基分类器ht的权重其中,ln是对数函数,εt是错误率,Ct是抗噪因子;(7)根据步骤(3)计算得到的训练样本的抗噪因子,更新步骤(2)中所述的训练样本的样本权重Wit+1=Wit*e-αtZtif(ht(xi)=yi)Wit*eαt+CtZtif(ht(xi)≠yi)]]>其中,是第t+1轮迭代中第i个样本的权重,αt是基分类器ht的权重,Ct是抗噪因子,Zt是归一化因子,Wn则是第一次第n个样本的样本权重的简写;(8)用(4)中训练得到的基分类器ht对极化SAR图像的未标记样本集U预测,分别计算被预测为第m类的样本到第m类聚类中心的距离,取距离最近的两个样本加入有标记样本,并给这两个样本赋权重:Wit+1(xiu)=1NlZtΣj=1NWt+1(xjl)]]>其中,是未标记样本集中的第i个样本,是已标记样本中第j个样本,m为任意类别标记;(9)重复步骤(4)~(8),若达到设置的最大迭代次数或当错误率大于0.5则结束并跳转到步骤(10),否则返回步骤(4)继续;(10)将(4)~(8)步骤中产生的基分类器进行组合,得到组合分类器:H(x)=sign(Σt=1Tαtht(x))]]>其中,αt是第t轮迭代的分类器的权重,ht(x)是基分类器ht对样本x的预测结果,sign是符号函数;(11)利用步骤(10)中的组合分类器给极化SAR图像预测分类,输出极化SAR图像的分类结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王爽焦李成陈国栋刘闯张涛刘红英熊涛马文萍
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1