【技术实现步骤摘要】
基于局部特征选择的卫星影像数据聚类方法、装置及设备
本专利技术涉及数据处理领域,尤其涉及一种基于局部特征选择的卫星影像数据聚类方法、装置及设备。
技术介绍
陆地卫星通常用于调查地下矿藏、海洋资源和地下水资源,研究自然植物的生长和地貌,考察和预报各种严重的自然灾害(如地震)和环境污染,拍摄各种目标的图像,借以绘制各种专题图(如地质图、地貌图、水文图)等。随着一个以综合遥感方法为特征的时代的到来,通过综合多种类型和分辨率的空间数据(包括多光谱和雷达数据、显示地形、土地利用的地图等)来解释一个场景将具有重要意义。在现有技术中,W.Fan等提出了一种基于特征选择和狄利克雷过程(DirichletProcess,DP)的VM混合模型的聚类方法。该方法采用了变分贝叶斯推断方法来估算模型参数并被应用在了文本和植物图像数据的聚类分析中。其存在的缺陷是:由于DP混合模型通常无法识别出仅含有少量数据样本的类别,所以不能有效地对不平衡数据进行聚类分析。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于非 ...
【技术保护点】
1.一种基于局部特征选择的卫星影像数据聚类方法,其特征在于,包括:/nS101,获取待处理的卫星影像数据集
【技术特征摘要】
1.一种基于局部特征选择的卫星影像数据聚类方法,其特征在于,包括:
S101,获取待处理的卫星影像数据集其中,所述卫星影像数据集含有N条卫星影像数据,每条卫星影像数据用L2范数归一化为D维的数据特征向量:||·||为L2范数的计算;
S102,使用基于局部特征选择的非参数VM混合模型对卫星影像数据进行建模;
S103,通过变分贝叶斯推断算法估算所述非参数VM混合模型的模型参数并计算特征重要度;
S104,根据估算的所述模型参数,判断所述非参数VM混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;
S105,根据特征的重要度对卫星影像数据进行筛选以保留重要的卫星影像数据;
S106,根据指示因子的后验概率判断每条卫星影像数据的所属类别,从而根据所属类别对所述基因表达数据向量进行聚类。
2.根据权利要求1所述的基于局部特征选择的卫星影像数据聚类方法,其特征在于,所述使用基于局部特征选择的非参数VM混合模型对卫星影像数据进行建模具体包括:
对服从VM概率分布pvm(·)的卫星影像数据的特征,其D维数据的概率密度函数表示为:
其中,ynd1=xnd,ynd2在式中是为了确保向量满足L2范数归一化,为位置参数,为刻度参数并满足条件λd≥0,I0(λ)为修正的第一类0阶Bessel函数;
对于每条服从非参数VM混合模型的D维卫星影像数据获取其概率密度函数表达式:
其中,该非参数VM混合模型由无穷多个混合组件组成,每个混合组件对应D个VM概率分布的乘积:其中每个特征对应一个VM概率分布;是第k个混合组件中第d个特征的VM分布参数,而πk>0为相应的混合系数,并满足条件
为每个卫星影像数据指定一个二元隐变量做为指示因子:当Znk=1时,表明卫星影像数据属于第k个类别;否则,Znk=0;隐变量的概率分布为
将局部特征选择技术与非参数VM混合模型进行融合,得到每个卫星影像数据的特征xnd服从的概率分布:
其中,参数φnkd为二元参数,当φnkd=1时,表示特征xnd为相关特征且服从VM概率分布当φnkd=0时,表示特征xnd为不相关特征且服从VM概率分布参数服从Bernoulli分布:
其中,参数εkd表示第k个组件中的第d个特征的特征重要度;
采用VM-Gamma分布作为相关特征所属的VM分布的参数的联合先验分布:
其中pg(·)为Gamma分布;
采用VM-Gamma分布作为不相关特征所属的VM分布的参数的联合先验分布:
获取基于局部特征选择的非参数VM混合模型的全概率表达式:
3.根据权利要求2所述的基于局部特征选择的卫星影像数据聚类方法,其特征在于,非参数VM混合模型采用基于Stick-Breaking表示方法的Pitman-Yor过程模型构建而成;在基于Stick-Breaking表示方法的Pitman-Yor过程模型中,混合系数πk的表示如下:
服从Beta分布,表达形式如下
其中pb(·)为Beta分布,a为Pitman-Yor过程模型中的折扣参数并满足条件0≤a≤1,b为密度参数满足条件b>-a。
4.根据权利要求3所述的基于局部特征选择的卫星影像数据聚类方法,其特征在于,所述通过变分贝叶斯推断算法估算所述非参数VM混合模型的模型参数并计算特征重要度,具体包括:
初始化模型参数;其中,包括初始化截断层数K=15;初始化超参数ukd=0.1,u′kd=0.1,vkd=0.01,v′kd=0.01,βkd>0,β′kd>0,ak=0.5,bk=0.5使用K-Means算法初始化rnk;初始化
利用当前的模型参数更新变分后验、期望值以及特征重要度;
根据更新的期望值获取更新后的
获得当前迭代所产生的变分下界;
将当前迭代产生的变分下界与上一次迭代产生的变分下界进行对比以判断非参数VM混合模型是否收敛。
5.根据权利要求4所述的基于局部特征选择的卫星影像数据聚类方法,其特征在于,利用当前的模型参数更新变分后验、期望值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。