一种面向目标识别的知识图谱辅助特征聚类与选择方法技术

技术编号：33647875 阅读：18 留言：0更新日期：2022-06-02 20:25

本发明专利技术涉及一种面向目标识别的知识图谱辅助特征聚类与选择方法，涉及计算机领域；该方法一方面提供了一种面向目标识别的知识图谱辅助特征聚类方法，该方法能够将目标识别的训练数据集和对应的知识图谱中的目标特征投影到一个公共特征空间，其中在同一投影方向上、具有大系数的异质变量形成一个公共模块。通过这种方法可以实现将显著特征聚类到显著共表达模块；另外一方面，提供一种面向目标识别的知识图谱辅助特征选择方法，能够将第一部分筛选出的训练数据集和目标数据集显著特征进行关联分析，进而按需求选出其中的Top特征用于后续分类。通过本发明专利技术的方法，解决了目标识别领域训练数据集特征冗余以及分类准确率低下的技术问题。低下的技术问题。低下的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向目标识别的知识图谱辅助特征聚类与选择方法

[0001]本专利技术涉及计算机领域，具体涉及一种面向目标识别的知识图谱辅助特征聚类与选择方法。

技术介绍

[0002]战场海空目标识别是指挥员进行作战决策的依据，将影响兵力分配、时机把握和作战效果，历次战争中出现过因目标识别错误而误伤的惨痛教训。为了提高目标识别能力，战场海空目标识别技术正向智能化方向发展。为了进一步准确地识别目标，需要使用标注数据预先训练一个分类模型。在识别模型训练过程中，需要对大量的识别目标进行特征选择，所选特征的数量及其重要程度直接影响到分类准确率，进而影响目标识别的识别效果。
[0003]现有的特征聚类算法以联合非负矩阵分解(Joint Non
‑
negative Matrix Factorization,JNMF)为主，JNMF算法同时将两种数据投影到一个公共特征空间，其中在同一投影方向上具有大系数的异质变量形成一个公共模块。在JNMF的基础上，将先验知识加入能够有效提高模型的特征关联分析性能。但是，大多数改进算法对数据中存在的噪声较为敏感，在噪声较大的情况下无法正确选择重要特征。联合稀疏典型相关分析(Joint Sparse Canonical Correlation Analysis,JSCCA)是一种具有代表性的特征选择算法。JSCAA通过得到两种数据特征之间最大相关性的线性组合挖掘更显著的特征。在JSCAA基础上，也可加入各种先验知识以增强数据之间的相关性。但是JSCAA及其改进算法大多为无监督方法，无法在...

【技术保护点】

【技术特征摘要】
1.一种面向目标识别的知识图谱辅助特征聚类方法，其特征在于，该方法包括：S1、对原始训练数据集经L2范数归一化,得到预处理后的训练样本数值矩阵X；S2、在知识图谱中依据训练数据标签找出对应的目标全部特征，对得到目标全部特征经L2范数归一化处理得到知识图谱中的数值矩阵Y；S3、将数值矩阵X和数值矩阵Y放入JCB
‑
SNMF模型中，JCB
‑
SNMF模型将数值矩阵X和数值矩阵Y拼接在一起后分解得到一个公共的基矩阵W和系数矩阵H1及系数矩阵H2；S4、使用z
‑
score对系数矩阵H1及系数矩阵H2分别归一化处理，得到系数矩阵H1及系数矩阵H2中每个元素的z得分；公共基矩阵的列数为模块数，设定阈值T，若元素的z得分大于阈值T，则该元素分配到共同表达模块中；S5、计算每个共同表达模块的显著性，选择显著性最高的共同表达模块；S6、提取显著性最高的共同表达模块中的特征更新到数值矩阵X和数值矩阵Y中。2.根据权利要求1所述的一种面向目标识别的知识图谱辅助特征聚类方法，其特征在于，将元素的z得分定义为z
ij
，其中h
ij
代表系数矩阵H1或系数矩阵H2中的元素，μ
i
代表系数矩阵H1或系数矩阵H2中每行的均值，σ
i
代表系数矩阵H1或系数矩阵H2中每行的标准差。3.根据权利要求1所述的一种面向目标识别的知识图谱辅助特征聚类方法，其特征在于，所述公共的基矩阵W包含样本聚类信息，系数矩阵H1和系数矩阵H2分别包含数值矩阵X和数值矩阵Y的所有特征。4.根据权利要求1所述的一种面向目标识别的知识图谱辅助特征聚类方法，其特征在于，计算共同表达模块的显著性时，先计算同一共同表达模块中元素的平均关联性ρ
*
，其中a
g
、b
t
分别表...

【专利技术属性】
技术研发人员：桂洪冠，位凯，陈运文，纪达麒，谭新，陈希雷，董学强，
申请(专利权)人：达而观信息科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人