一种基于多源遥感数据的无监督特征选择方法及系统技术方案

技术编号:36894812 阅读:21 留言:0更新日期:2023-03-15 22:21
本发明专利技术公开了一种基于多源遥感数据的无监督特征选择方法及系统,方法包括:基于对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵;通过主成分分析方法对数据矩阵进行特征提取,得到主成分矩阵;根据主成分分析矩阵,训练目标深度原型分析网络,得到目标数据原型的系数矩阵;对系数矩阵进行分解,得到目标权重矩阵;基于目标权重矩阵,筛选得到关键原始特征。本发明专利技术通过将主成分分析法得到的主成分矩阵作为目标深度原型网络的辅助信息,进而通过训练目标深度原型分析网络,得到目标数据原型的系数矩阵,通过分解系数矩阵,能够得到权重矩阵并从中筛选出与原型个体相关度最高的关键原始特征,可广泛应用于遥感图像处理技术领域。图像处理技术领域。图像处理技术领域。

【技术实现步骤摘要】
一种基于多源遥感数据的无监督特征选择方法及系统


[0001]本专利技术涉及遥感图像处理
,尤其是一种基于多源遥感数据的无监督特征选择方法及系统。

技术介绍

[0002]近年来,一方面多光谱传感器与其他图像传感器逐渐小型化并不断提升可集成性,另一方面搭载这些传感器的无人机平台的载荷与稳定性亦有了长足进步,这些变化使得多种传感器联合、同步数据获取越来越成为主流的遥感探测方案之一。多模式传感数据的结合带来特征丰富性的同时,也造成了数据特征之间的冗余性。在应用这些遥感图像数据进行更深度的智能分析时,如何对这些数据进行合适的降维处理成为了迫切需要解决的问题。
[0003]当前最为主流的降维处理方法是主成分分析法,其原理是构造所有特征的线性组合成为主成分,同时通过选择线性组合中的权重,使主成分具有最大可能的方差,并且与之前的所有主成分正交。既可以让数据的特征维度大大降低,又能捕获其中包含的大部分变化。但经主成分分析处理得到的新特征无法具备实际意义,而在农业领域往往更关注特征信息本身。因此,如何基于多源遥感数据的实现特征选择为一个亟需解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种基于多源遥感数据的无监督特征选择方法及系统,能够实现筛选出有价值的关键特征。
[0005]一方面,本专利技术的实施例提供了一种基于多源遥感数据的无监督特征选择方法,包括:
[0006]对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵;
[0007]通过主成分分析方法对所述数据矩阵进行特征提取,得到主成分矩阵;
[0008]根据所述主成分分析矩阵,训练目标深度原型分析网络,得到目标数据原型的系数矩阵;
[0009]对所述系数矩阵进行分解,得到目标权重矩阵;
[0010]基于所述目标权重矩阵,筛选得到关键原始特征。
[0011]可选地,所述对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵,包括:
[0012]获取多源遥感数据的所有特征矩阵,确定特征矩阵数量和样本数量;
[0013]根据所述特征矩阵数量确定数据矩阵行数,根据所述样本数量确定数据矩阵列数;
[0014]基于所述数据矩阵行数和所述数据矩阵列数,对所述特征矩阵进行整合,得到数据矩阵。
[0015]可选地,所述通过主成分分析方法对所述数据矩阵进行特征提取,得到主成分矩
阵,包括:
[0016]基于主成分分析方法的目标损失函数,确定主成分方差;
[0017]基于所述主成分方差,通过主成分分析方法对所述数据矩阵进行特征提取,得到所述主成分方差累计贡献率达到90%的主成分矩阵。
[0018]可选地,还包括:
[0019]基于信息瓶颈方法和变分自编码器方法,构建深度原型分析网络;
[0020]基于所述深度原型分析网络,结合解码器分支得到第二深度原型分析网络;
[0021]基于所述第二深度原型分析网络,结合原型损失得到目标深度原型分析网络。
[0022]可选地,所述原型分析网络的表达式为:
[0023]min
p(t|x)
I(X;T)

λI(T;Y)
[0024]式中,p(t|x)表示在x发生的条件下t发生的概率,min
p(t|x)
表示通过控制p(t|x)来最小化式子的值,I表示相互信息,X表示数据矩阵,T表示隐变量,λ表示第一拉格朗日乘数;
[0025]其中,所述原型分析网络的表达式的参数化形式为:
[0026][0027]式中,Φ=p(t|x),θ=p(y|t),p(y|t)表示在t发生的条件下y发生的概率,表示通过控制p(t|x)和p(y|t)来最大化式子的值,t表示隐变量T的第t个数据点,x表示数据矩阵X的第x个数据点,y表示主成分矩阵Y的第y个数据点,I
Φ
(t;x)表示编码器,I
Φ,θ
(t;y)表示解码器。
[0028]可选地,所述基于所述深度原型分析网络,结合解码器分支得到第二深度原型分析网络,包括:
[0029]在所述深度原型分析网络增加解码器分支和与所述解码器分支关联的第二拉格朗日乘数,得到第二深度原型分析网络;
[0030]其中,所述第二深度原型分析网络的表达式为:
[0031][0032]式中,v表示第二拉格朗日乘数,表示在t发生的条件下发生的概率,表示数据矩阵X经过重建后得到的新数据矩阵中的第个数据点,表示解码器分支。
[0033]可选地,所述基于所述第二深度原型分析网络,结合原型损失得到目标深度原型分析网络,包括:
[0034]通过学习第一权重矩阵和第二权重矩阵,得到所述数据矩阵的非线性转换;
[0035]基于所述数据矩阵的非线性转换,驱动潜在空间的结构形成原型,对原型进行定位得到初始化原型矩阵;
[0036]基于所述第一权重矩阵、所述第二权重矩阵和所述初始化原型矩阵,得到原型损失;
[0037]通过所述第二深度原型分析网络,结合所述原型损失得到目标深度原型分析网络;
[0038]其中,所述目标深度原型分析网络的表达式为:
[0039][0040]式中,l
AT
表示原型损失。
[0041]可选地,所述对所述系数矩阵进行分解,得到目标权重矩阵,包括:
[0042]基于所述系数矩阵,通过矩阵分解计算结合线性优化,得到所述数据矩阵与所述系数矩阵之间联系的目标权重矩阵。
[0043]可选地,所述基于所述目标权重矩阵,筛选得到关键原始特征,包括:
[0044]基于所述目标权重矩阵,通过关键原始特征筛选计算,得到关键原始特征;
[0045]其中,所述关键原始特征筛选计算的表达式为:
[0046]E
g
={x
i
|C
g
(i)==max(C
g
)}
[0047]式中,E
g
表示关键原始特征的集合,x
i
表示数据矩阵X中的第i列数据,C
g
表示目标权重矩阵C中的第g列数据,C
g
(i)表示目标权重矩阵C中的第g列数据第i列行的值。
[0048]另一方面,本专利技术的实施例提供了一种基于多源遥感数据的无监督特征选择系统,包括:
[0049]第一模块,用于对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵;
[0050]第二模块,用于通过主成分分析方法对所述数据矩阵进行特征提取,得到主成分矩阵;
[0051]第三模块,用于根据所述主成分分析矩阵,训练目标深度原型分析网络,得到目标数据原型的系数矩阵;
[0052]第四模块,用于对所述系数矩阵进行分解,得到目标权重矩阵;
[0053]第五模块,用于基于所述目标权重矩阵,筛选得到关键原始特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源遥感数据的无监督特征选择方法,其特征在于,包括:对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵;通过主成分分析方法对所述数据矩阵进行特征提取,得到主成分矩阵;根据所述主成分分析矩阵,训练目标深度原型分析网络,得到目标数据原型的系数矩阵;对所述系数矩阵进行分解,得到目标权重矩阵;基于所述目标权重矩阵,筛选得到关键原始特征。2.根据权利要求1所述的一种基于多源遥感数据的无监督特征选择方法,其特征在于,所述对获取的多源遥感数据的特征矩阵进行整合,得到预设格式的数据矩阵,包括:获取多源遥感数据的所有特征矩阵,确定特征矩阵数量和样本数量;根据所述特征矩阵数量确定数据矩阵行数,根据所述样本数量确定数据矩阵列数;基于所述数据矩阵行数和所述数据矩阵列数,对所述特征矩阵进行整合,得到数据矩阵。3.根据权利要求1所述的一种基于多源遥感数据的无监督特征选择方法,其特征在于,所述通过主成分分析方法对所述数据矩阵进行特征提取,得到主成分矩阵,包括:基于主成分分析方法的目标损失函数,确定主成分方差;基于所述主成分方差,通过主成分分析方法对所述数据矩阵进行特征提取,得到所述主成分方差累计贡献率达到90%的主成分矩阵。4.根据权利要求1所述的一种基于多源遥感数据的无监督特征选择方法,其特征在于,还包括:基于信息瓶颈方法和变分自编码器方法,构建深度原型分析网络;基于所述深度原型分析网络,结合解码器分支得到第二深度原型分析网络;基于所述第二深度原型分析网络,结合原型损失得到目标深度原型分析网络。5.根据权利要求4所述的一种基于多源遥感数据的无监督特征选择方法,其特征在于,所述原型分析网络的表达式为:min
p(t|x)
I(X;T)

λI(T;Y)式中,p(t|x)表示在x发生的条件下t发生的概率,min
p(t|x)
表示通过控制p(t|x)来最小化式子的值,I表示相互信息,X表示数据矩阵,T表示隐变量,λ表示第一拉格朗日乘数;其中,所述原型分析网络的表达式的参数化形式为:式中,Φ=p(t|x),θ=p(y|t),p(y|t)表示在t发生的条件下y发生的概率,表示通过控制p(t|x)和p(y|t)来最大化式子的值,t表示隐变量T的第t个数据点,x表示数据矩阵X的第x个数据点,y表示主成分矩阵Y的第y个数据点,I
Φ
(t;x)表示编码器,I
Φ,θ
(t;y)表示解码器。6.根据权利要求5所述的一种基于多源遥感数据的无监督特征选择方法,其特征在于,所述基于所述深度原型分析网络,结合解码器分支得...

【专利技术属性】
技术研发人员:王卓薇卢育生赵艮平程良伦
申请(专利权)人:广东能哥知识科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1