一种基于样本自适应扩充的集成学习方法技术

技术编号：19481182 阅读：34 留言：0更新日期：2018-11-17 10:39

本发明专利技术公开了一种基于样本自适应扩充的集成学习方法，一方面通过采用bootstrap特征抽样与动态加权投票的方式对多个弱分类器进行集成，继承了集成学习方法分类精度高、重复性好的优点；另一方面，该方法能够在少量地面调查样本的基础上，通过迭代分类与基于空间离散度和属性相似度的样本筛选，实现样本的自适应扩充，解决了分类中小样本导致的模型欠学习问题。本案所涉及的集成学习方法采用样本自适应扩充的方式，可以有效解决遥感分类过程中样本不足的问题，同时减少了研究人员获取样本所耗费的人力及时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本自适应扩充的集成学习方法
本专利技术涉及遥感
，具体涉及通过对少量采集的真实样本进行自适应扩充，以实现小样本情况下进行遥感信息提取的方法。
技术介绍
随着成像技术的提高，遥感数据获取的手段越来越多样，遥感数据的重要应用之一是图像分类。早期的遥感影像分类主要有监督分类和非监督分类两种方式，其中监督分类方式需要在地物样本支持下进行模型训练，进而对整幅影像进行分类。地物样本的获取主要有两种方式：一是依赖先验知识在影像上通过目视解译确定不同地物类型，从影像中选取各地类的样本；二是通过外业调查方式，实地获取不同地类的地理坐标和照片，尔后在内业分类中结合外业调查点坐标在影像上进行样本选择。样本的准确获取是一项费时费力的工作，尤其是在需通过实地调查获取样本的农业遥感应用中，样本量大小不仅与分类识别精度密切相关，同时也是成本控制需要考虑的重要因素。近年来，基于机器学习的遥感影像分类方法得到了长足的发展，相比于传统的遥感影像分类方法，其样本的需求量急剧增加。以深度学习方法进行遥感影像分类为例，地类样本数量一般为几百甚至几千个，样本选择工作量巨大，靠人工方式有时甚至难以获取足够的样本数据，而在缺少样本的前提下，机器学习分类的准确性难以得到保证。因此，在遥感大数据时代，样本在遥感影像分类方面的重要性日益凸显。此外，大量的样本采集和整理工作降低了分类的时效性，对于时效性要求较高的应用如灾情评估等，传统的样本获取方式难以满足应用需求。而另一方面，以往的遥感监督分类方法都是基于给定数目样本的基础上进行训练和分类，在整个分类信息提取过程中样本总量保持不变，模型输入的样...

【技术保护点】
1.一种基于样本自适应扩充的集成学习方法，其特征在于，包括下述步骤：1)建立目标研究区域的影像样本库；2)根据步骤1)所述影像样本库中的所有影像样本，采取有放回抽样法从样本特征集中抽样获得n个特征子集；其中，n为任意正整数；3)根据预设参数从分类算法模版库中生成n个弱分类器，并利用所述n个特征子集以一一对应的方式对每个弱分类器进行模型训练；其中，所述特征子集的数量与弱分类器的数量相同；4)使用所述训练好的n个弱分类器分别对所述影像样本进行分类，得到n个分类结果；5)基于步骤1)所述影像样本库对步骤4)所述n个分类结果进行精度检验，得到每个弱分类器对不同地类的分类精度，并据此对每个弱分类器进行权重赋值；6)对任一待分类象元，首先采用所述n个弱分类器分别对其进行分类得到n个弱分类结果；然后根据所述每个弱分类器的权重，对所述n个弱分类结果进行加权投票计算得到分类权重，并以权重和最高的地类作为所述待分类地类的象元所属类别，即得到强分类结果；7)判别所述强分类结果是否满足精度要求；当满足所述精度要求时，转向步骤10)；当不满足所述精度要求时，对于每一地类从强分类结果中取权重最高的20％像元作为该...

【技术特征摘要】
1.一种基于样本自适应扩充的集成学习方法，其特征在于，包括下述步骤：1)建立目标研究区域的影像样本库；2)根据步骤1)所述影像样本库中的所有影像样本，采取有放回抽样法从样本特征集中抽样获得n个特征子集；其中，n为任意正整数；3)根据预设参数从分类算法模版库中生成n个弱分类器，并利用所述n个特征子集以一一对应的方式对每个弱分类器进行模型训练；其中，所述特征子集的数量与弱分类器的数量相同；4)使用所述训练好的n个弱分类器分别对所述影像样本进行分类，得到n个分类结果；5)基于步骤1)所述影像样本库对步骤4)所述n个分类结果进行精度检验，得到每个弱分类器对不同地类的分类精度，并据此对每个弱分类器进行权重赋值；6)对任一待分类象元，首先采用所述n个弱分类器分别对其进行分类得到n个弱分类结果；然后根据所述每个弱分类器的权重，对所述n个弱分类结果进行加权投票计算得到分类权重，并以权重和最高的地类作为所述待分类地类的象元所属类别，即得到强分类结果；7)判别所述强分类结果是否满足精度要求；当满足所述精度要求时，转向步骤10)；当不满足所述精度要求时，对于每一地类从强分类结果中取权重最高的20％像元作为该地类的候选新增样本，组成候选新增样本集；8)在候选新增样本集下，计算每个候选新增样本与同一地类剩余候选新增样本的空间离散度及属性相似度，并与该候选新增样本的分类权重相乘，进而获得每个候选新增样本的总权重；9)在步骤8)的基础上，从每一地类的候选新增样本中筛选出10％总权重最高的样本作为新增样本，加入到步骤1)影像样本库中，以实现新样本的扩充，并重新执行步骤1)至9)的分类过程；10)终止分类过程并输出。2.根据权利要求1所述的集成学习方法，其特征在于，所述影像样本库中的影像样本包括基于地面调查点的遥感影像样本以及新增样本；其中，所述基于地面调查点的遥感影像样本通过各调查点的空间位置对影像象元进行采样及特征计算获得；所述遥感影像样本经过几何校正和辐射校正。3.根据权利要求1所述的集成学习方法，其特征在于，所述...

【专利技术属性】
技术研发人员：黄启厅，覃泽林，骆剑承，曾志康，张竹林，郜丽静，
申请(专利权)人：苏州中科天启遥感科技有限公司，广西壮族自治区农业科学院农业科技信息研究所，中国科学院遥感与数字地球研究所，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人