【技术实现步骤摘要】
一种基于非对称k近邻矩阵的增量式共享近邻获取方法
[0001]本方法属于数据挖掘领域,具体涉及一种基于非对称k近邻矩阵的增量式共享近邻获取方法,适用于无人机飞行数据的近邻分析。
技术介绍
[0002]共享近邻是一种适用于变密度数据的数据间相似度的计算算法,该算法可根据数据集两两数据点之间的共享近邻数量探寻数据集的分布情况,若共享近邻数量越大表示两个数据点之间的相似度越高或分布越相近,反之则相似度越低或分布越疏远。共享近邻算法常用作基础算法与其他算法结合,目前被广泛应用于数据降维、聚类分析、模式识别、数据分类、故障诊断、异常度分析等领域。
[0003]在无人机飞行数据集D中两个数据点d
i
,d
j
之间的共享近邻计算法方法如下:设定k为数据的最近邻数量,NN
k
(d
i
)为无人机飞行数据集D中数据点d
i
除自身外的k个最近邻集合,NN
k
(d
j
)为无人机飞行数据集D中数据点d
j
除自身外的k个最近邻集合,则数据点d
i
,d
j
的共享近邻可由NN
k
(d
i
)与NN
k
(d
j
)的交集得到。无人机飞行数据集D中每个数据点都有多个共享近邻,称为该数据点的共享近邻集合,所有数据点的共享近邻集组成的矩阵称为无人机飞行数据集D的原始共享近邻矩阵。
[0004]在实际
【技术保护点】
【技术特征摘要】
1.一种基于非对称k近邻矩阵的增量式共享近邻获取方法,其特征在于,包括以下步骤:步骤1,获取无人机飞行数据集D的原始共享近邻矩阵,无人机飞行数据集D的数据点的个数赋值到数据量m,初始化并更新k近邻距离向量k_distvector,初始化并更新非对称k近邻矩阵ak_matrix,计算无人机飞行数据集D对应的上三角共享近邻矩阵us_matrix,根据上三角共享近邻矩阵us_matrix获得无人机飞行数据集D对应的原始共享近邻矩阵s_matrix;步骤2、计算新添数据点d
p
的k近邻行向量pk_vector和逆k近邻列向量rpk_vector,并更新非对称k近邻矩阵ak_matrix;初始化扩维后的非对称k近邻矩阵pk_matrix并赋值;步骤3、初始化并赋值更新后的共享近邻矩阵ps_matrix,结合新添数据点d
p
对步骤3.2中更新后的共享近邻矩阵ps_matrix中的部分数据点替换;步骤4、将数据量m自增1,新添数据点d
p
插入无人机飞行数据集D构成新的无人机飞行数据集D,将非对称k近邻矩阵ak_matrix替换为扩维后的非对称k近邻矩阵pk_matrix,将原始共享近邻矩阵s_matrix替换为更新后的共享近邻矩阵ps_matrix,取下一个新添数据点并重复步骤2和步骤3。2.根据权利要求1所述的一种基于非对称k近邻矩阵的增量式共享近邻获取方法,其特征在于,所述的步骤1包括以下步骤:步骤1.1,输入无人机飞行数据集D,无人机飞行数据集D的数据点的个数赋值到数据量m,计算每个数据点在无人机飞行数据集D中的k个最近邻;步骤1.2,初始化非对称k近邻矩阵ak_matrix为m行m列的全0矩阵,初始化k近邻距离向量k_distvector为m行1列的全0向量;步骤1.3,按照下式更新步骤1.2中k近邻距离向量k_distvector:其中,k_distvector(i1)表示k近邻距离向量k_distvector中第i1行第1列的数据点,d
t1
为数据点d
i1
的k近邻集合NN
k
(d
i1
)中的任意一个数据点,数据点d
i1
为无人机飞行数据集D中第i1个数据点,i1表示序号,i1∈[1,m];步骤1.4,按照下式更新步骤1.2中非对称k近邻矩阵ak_matrix:其中,d
i2
和d
j2
分别表示无人机飞行数据集D中的第i2个和第j2个数据点,NN
k
(d
i2
)为无人机飞行数据集D中数据点d
i2
除自身外的k个最近邻集合,ak_matrix(i2,j2)表示非对称k近邻矩阵ak_matrix中的第i2行第j2列数据,i2,j2∈[1,m];步骤1.5,基于步骤1.4得到的非对称k近邻矩阵ak_matrix计算无人机飞行数据集D对应的上三角共享近邻矩阵us_matrix,其中上三角共享近邻矩阵us_matrix中的第i3行第j3列数据us_matrix(i3,j3)由下式得到:
其中,ak_matrix(i3,:)和ak_matrix(j3,:)
T
分别表示非对称k近邻矩阵ak_matrix中第i3行数据组成的向量和第j3行数据组成的向量的转置向量,i3,j3∈[1,m],i3≤j3;按照下式计算无人机飞行数据集D对应的原始共享近邻矩阵s_matrix:s_matrix=us_matrix+us_matrix
T
。3.根据权利要求1所述的一种基于非对称k近邻矩阵的增量式共享近邻获取方法,其特征在于,所述的步骤2包括以下步骤:步骤2.1,输入新添数据点d
p
;步骤2.2,计算新添数据点d
p
与无人机飞行数据集D中每个数据点的距离,将距离值排序即可得到新添数据点d
p
在无人机飞行数据集D中的k近邻集合NN
k
(d
p
),按照下式计算新添数据点d
p
的k近邻行向量pk_vector和逆k近邻列向量rpk_vector,并更新非对称k近邻矩阵ak_matrix:(1)(2)(3)上式中pk_vector(1,j4)表示新添数据点d
p
的k近邻行向量的第1行第j4列数据点,d
j4
表示无人机飞行数据集D中第j4个数据点,j4∈[1,m],rpk_vector(i4,1)表示新添数据点d
p
的逆k近邻列向量的第i4行第1列数据点,d
i4
表示无人机飞行数据集D中第i4个数据点,k_distvector(i4)表示k...
【专利技术属性】
技术研发人员:梁少军,张世荣,杨毅,鲁漫洁,梁瑜,
申请(专利权)人:中国人民解放军陆军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。