一种遥感图像样本智能采集方法技术

技术编号:10311476 阅读:373 留言:0更新日期:2014-08-13 14:29
本发明专利技术提供一种遥感图像样本智能采集方法。该样本采集方法能够有效的选择图像分类所需要的样本集合,降低样本采集的时间和金钱成本。该方法包括以下步骤:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;将分类结果转换为各类别的概率;选取图像中最有信息量的一组未标记样本;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程;当满足一定的条件时,迭代停止,得到一组样本。

【技术实现步骤摘要】

本专利技术涉及遥感图像处理技术,具体的说,涉及一种遥感图像样本智能采集方法,该样本采集方法能够极大降低图像分类所需要的样本数目,从而降低样本采集的成本。
技术介绍
遥感技术在很多领域得到广泛应用,如森林资源规划、农作物估产、环境监测等。遥感图像分类技术是把遥感图像从数据转换为信息的关键步骤。从是否需要训练样本来分,遥感图像分类方法分为监督分类和非监督分类。在遥感图像分类中最常用的是监督分类方法。监督分类方法,需要人工地确定分类体系、各个类别的训练样本等。对监督分类方法而言,在分类器已经确定的情况下,分类效果的好坏很大程度上取决于训练样本的数量与质量。 目前遥感图像分类中样本采集的方法主要包括,随机采样和分层采样。随机采样是指随机地在整幅图像上选取一些点,然后去实地或者通过图像解译确定这些点的类别信息。随机采样的最大优点在于其统计上和参数估计上的简易性。当图像中某些类别占的数量较少时,随机采样往往会丢掉这些类别。为了保证每个类别都能在采样中出现,可以采用分层采样,即分别对每个类别进行随机采样。上述两种样本采集策略的主要缺点是:不能确定获得满意的分类效果需要多少数目的样本;不知道在已有数量样本的情况下能否获得好的分类效果。基本上可以认为,我们只是这样设计了样本采集的原则(可能耗费了很大的时间和金钱成本),但是能获得什么样的分类效果,只能听“天”由命了。并且,这种样本采集策略都是在图像分类之前完成的。 本专利提出了一种新型的遥感图像样本采集方法;针对遥感图像处理领域样本采集费时费力等特点,本专利提出了一种能够在分类过程中通过目前的分类结果预测出类别信息非常模糊的样本,然后由样本采集人员对这些样本点进行类别标记,形成更新后的训练样本集,并进行重新分类的样本采集方法。这种样本采集方法是一种迭代的过程,能够在初始有极少量样本的情况下,始终选择对分类最有效的样本集,避免了过多冗余样本的采集,从而很大程度上减少了样本采集的总量,进而降低样本采集的时间和金钱成本。
技术实现思路
本专利技术的目的是提供一种遥感图像样本智能采集方法。 本专利技术的基本思路为:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;依据某种准则,选取图像中分类效果最不准确的一组未标记的样本点;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程,得到一组样本。 本专利技术的技术方案提供的一种遥感图像样本智能采集的方法,其特征在于包括以下实施步骤: A 对于待分类的遥感图像,首先由用户随机标记少量的样本; B 使用已有的样本集对图像进行训练,并使用分类器对图像进行分类; C 对步骤B中每个像素的分类结果转换为各类别的概率; D 对步骤C中每个像素的类别概率,按照从小到大升序排列; E 求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和; F 对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本; G 由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合; H 重复步骤B-步骤G,直到获得足够多的样本集合。 上述实施步骤的特征在于: 步骤A中待分类的遥感图像主要是指光学图像数据;用户首先对待分类的遥感图像,确认好分类体系,确认总共有几个类别,假设为K个类别;对K个类别中的每一个类别首先选定少量(少于10个)样本;样本确认可以通过图像解译的方式或者实地样本采集的方式。 步骤B中所述的选用分类器进行分类,是指选用遥感图像分类中常用分类器,如最大似然分类器、支持向量机分类器等。 步骤C中所述的每个像素的分类结果转换为各类别的概率,是对某像素x,计算出其属于K个类别中各个类别的概率;对于某些分类器,如最大似然分类器,分类结果中就有属于各个类别的概率;而对于另一些分类器,如支持向量机分类器,分类结果并不直接输出各个类别的概率,需要通过一些计算过程把支持向量机输出结果转换为各个类别的概率。 步骤D是指,对于任意像素x,对应K个类别的概率按照从小到大进行排列,记为P(k),k=1,...,K,并且P(1)<P(2)<...<P(K)。 步骤E是指,对任意像素x,计算最小的c个概率的和其中1<c<K/2,c为整数。 步骤F是指对所有的Sx按照从小到大进行排列,并选择出Sx值最小的m个像素,其中m为大于1的整数。 步骤G是指,由用户对步骤F中所选的m个未标记样本进行类别属性的标记,标记过程同步骤A一样,可以通过图像解译的方式,也可以通过实地样本采集进行类别属性的确认的方式。 步骤H是指,重复步骤B-步骤G,直到采集的样本数目足够多迭代停止,输出总的采集的样本。 本专利技术与现有技术相比有如下特点:该样本采集方法是一个迭代的过程,当分类结果趋于稳定时,我们“确信”不需要采集更多的样本了;另外,通过这种样本采集方法,获得相同的分类精度,所需要的训练样本要远远少于随机样本采集方法,从而大大降低样本采集的时间和金钱的成本。 附图说明: 图1是一种遥感图像样本智能采集方法流程图 具体实施方式: 采用本专利技术实现一种遥感图像样本智能采集策略的实施例如图1所示,现结合图1对其进行描述。 处理单元100利用现有的样本信息,选用图像的光谱特征,对选定的分类器(如支持向量机分类器)进行分类器的训练,学习得到最佳的分类器参数。假设待分类的图像包括如下地物类型:农田、林地、草地、裸土、水体、建成区,即地物类型数目K=6,各个类别的初始样本数目都为5个。 处理单元101使用处理单元100训练得到的分类器,对图像中所有的像素进行分类,得到各个像素的类别信息。 处理单元102将分类结果转换为各类别的概率。具体的转换过程为: 对于K个类别,需要计算出对应各个类别的概率P(k),k=1,...,K,首先任意两个类别之间的概率rij; r ij = 1 本文档来自技高网
...
一种遥感图像样本智能采集方法

【技术保护点】
一种遥感图像样本智能采集方法,其特征在于包括以下步骤:A 对于待分类的遥感图像,首先由用户随机标记少量的样本;B 使用已有的样本集对图像进行训练,并使用分类器对图像进行分类;C 对步骤B中每个像素的分类结果转换为分类各类别的概率;D 对步骤C中每个像素的分类类别概率,按照从小到大升序排列;E 求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和;F 对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本;G 由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合;H 重复步骤B‑步骤G,直到获得足够多的样本集合。

【技术特征摘要】
1.一种遥感图像样本智能采集方法,其特征在于包括以下步骤:
A 对于待分类的遥感图像,首先由用户随机标记少量的样本;
B 使用已有的样本集对图像进行训练,并使用分类器对图像进行分类;
C 对步骤B中每个像素的分类结果转换为分类各类别的概率;
D 对步骤C中每个像素的分类类别概率,按照从小到大升序排列;
E 求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和;
F 对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并
选择出求和值最小的一组像素,作为未标记的样本;
G 由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合;
H 重复步骤B-步骤G,直到获得足够多的样本集...

【专利技术属性】
技术研发人员:霍连志赵理君李腾周增光胡昌苗郑柯
申请(专利权)人:中国科学院遥感与数字地球研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1