基于互信息和分形维数的无监督特征选择方法技术

技术编号：19746470 阅读：35 留言：0更新日期：2018-12-12 04:57

本发明专利技术公开了一种结合互信息和分形维数的无监督特征选择方法，为解决多维原始特征中所含的冗余和不相关特征导致的子空间学习算法信息融合性能降低的问题。首先，利用原始特征提取方法对产品进行多维特征信息提取工作，得到产品时域、频域、时频域等多维特征信息；其次，基于互信息定义，在综合考虑多维特征间冗余度和相关度的基础上，对其进行特征重要度排序，得到已排序多维特征集；然后基于分形理论，基于分形采用维数的特征子集评价标准对已排序多维特征集进行特征子集选择，得到最优特征子集；最后，利用子空间学习方法对最优特征子集进行融合降维，得到产品综合特征。本发明专利技术在综合考虑特征冗余度和相关度的基础上，去除与特多维原始特征集相关程度小且冗余程度大特征，提高子空间学习方法信息融合性能，同时得到产品综合特征。

全部详细技术资料下载

【技术实现步骤摘要】
基于互信息和分形维数的无监督特征选择方法
本专利技术针对多维特征中包含的冗余和不相关特征导致的子空间学习算法信息融合性能降低的问题，提出一种基于互信息和分形维数的无监督特征选择方法，属于特征提取

技术介绍
随着科学技术研究的发展，在机械工程、数据挖掘、图像处理、信息检索、基因组工程等领域中，研究对象越来越复杂，人们从中获取的数据量在迅速增多，诸如产品故障数据、基因数据、文本信息、高分辨率图像信息等，其特征维数也因此逐渐增多。多维特征通常具有稀疏性，任意特征间信息存在交叉，同时在数据描述方面可能存在整体识别性差，计算量大，难以可视化，产生错误结论等问题。由此，子空间学习方法逐渐被应用于多维特征的信息融合过程中。常用的子空间学习方法有PrincipalComponentAnalysis(PCA)、KernelPrincipalComponentAnalysis(KPCA)、LinearDiscriminantAnalysis(LDA)、LocalityPreservingProjections(LPP)等。但上述研究并未考虑多维特征中可能存在冗余及不相关特征，其中冗余特征可能会降低子空间学习算法的信息融合效率，不相关特征可能有损子空间学习算法的性能，最终均可能导致上述子空间学习算法的信息融合性能降低，并会影响后续算法的精度和稳定性。特征选择方法能够在信息损失最小的前提下，依据相关标准得到最优特征子集，去除其中的冗余及不相关特征，从而提高后续算法性能并节省运行时间。因此针对上述问题，本专利技术拟采用特征选择方法去除特征集中的冗余及不相关特征。由于在实际...

【技术保护点】
1.基于互信息和分形维数的无监督特征选择方法，包括以下几个步骤：步骤二：多维原始特征重要度排序(1)基于互信息的特征重要度排序算法流程首先采用步进方式对n维原始特征集F＝[f1,f2,…,fn]中的各特征参数逐一进行重要度排序。设已排序特征集为G，并将其置空。1)根据互信息公式(1)计算F中每一特征fi(i＝1,2,…,n)与整个特征集F的平均互信息；

【技术特征摘要】
1.基于互信息和分形维数的无监督特征选择方法，包括以下几个步骤：步骤二：多维原始特征重要度排序(1)基于互信息的特征重要度排序算法流程首先采用步进方式对n维原始特征集F＝[f1,f2,…,fn]中的各特征参数逐一进行重要度排序。设已排序特征集为G，并将其置空。1)根据互信息公式(1)计算F中每一特征fi(i＝1,2,…,n)与整个特征集F的平均互信息；则G中第一个重要特征可以选择其中，该特征可以最大程度降低F中其余特征的不确定性。2)为得到G中第二个重要特征，将F＝[f1,f2,…,fj,…,fn-1]代替原有的F＝[f1,f2,…,fn]。此时，在F中任选一个特征fj，其中j＝1,2,…,n-1，并计算其相关度Rel(fj)、G中特征g1对fj的条件相关度Rel(g1|fi)以及fj对g1的冗余度Red(fj；g1)。其中相关度Rel(fj)定义为某一特征fj与F的平均互信息：其中H(fj)表示fj所含信息量；则表示fj与F中其他参数fk的共有信息量。其值越大表示其余特征可提供的“新”信息越少。因此，如果选择具有最大Rel(fj)值的特征参数，那么对应的参数集就可以最小程度地丢失信息。fj和g1的条件相关度Rel(g1|fi)定义为:fj对g1的冗余度Red(fj；g1)定义为：Red(fj；g1)＝Rel(g1)-Rel(g1|fj)(5)此时，综合考虑fj与F的相关度以及fj对于G的冗余度，得到特征参数fj重要度评价标准E：设则G中第2个特征为3)以此类推，为得到G中第p个重要特征，将F＝[f1,f...

【专利技术属性】
技术研发人员：王晓红，王立志，何一荻，袁宏杰，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人