面向增强分类器推广性能的有效特征样本识别技术制造技术

技术编号：14063111 阅读：99 留言：0更新日期：2016-11-28 01:33

本发明专利技术公开了一种面向增强分类器推广性能的有效特征样本识别技术，其特征在于，该方法包括如下步骤：1)分类器推广性能评价指标的建立；2)模糊聚类准则的构建；3)特征样本集一次聚类划分；4)类内平均距离与类间平均距离的定义；5)初始聚类优选准则的建立；6)特征样本集二次聚类识别。本发明专利技术的有益效果是，方法设计合理，使用简明，有效去除噪点或野点，特征样本识别率高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术基于信号处理理论，在数据聚类分析的基础上提出一种有效特征样本识别方法，利用聚类分析的模式自动划分特性，剔除特征数据中的野点或噪点，达到特征数据净化的目的，在此基础上提高支持向量机分类器的推广性能。该计算方法为解决机械故障诊断领域中涉及的精确模式识别与分类问题奠定了基础。
技术介绍
基于统计学习理论的支持向量机(SVM)方法在模式分类方面极具优势，已成功应用于故障诊断。理论上，SVM的最优分类面由位于类边缘的支持向量决定，而位于类边缘附近的野(值)点或噪(声)点往往与有效样本混杂在一起，导致所求出的分类面不是最优的，从而影响了分类器的推广性能[1,2]。在实际的故障诊断应用场合，信号检测中待诊断对象周边的外来干扰以及采集系统的内噪声等均可能在原始观测数据中引入噪声干扰；传感器件异常或故障、系统中力或运动的异常波动或仅仅是运行工况的改变，也可能产生异常的观测野值。这些存在于原始数据中的噪声或野值如果不适当处理，将随同特征提取进入特征空间，形成明显偏离整体类特征的噪点或野点。此外，还有许多影响故障诊断的负面因素，例如振动在机械结构中传递的散射与混响效应所导致的传感观测信息冗余，特征提取环节所选择的过高特征维数等。信息冗余将造成后续特征提取的困难，并进一步放大噪声或野值的负面作用；特征维数选择过高，则会使样本统计特性的估计更加困难，从而降低分类器的推广能力或泛化能力[3]。因此，必须首先对特征数据进行必要的净化处理，才能达到有效诊断的目的。
技术实现思路
本专利技术的目的是为了解决上述问题，开发了一种面向增强分类器推广性能的有效特征样本识别技术。实现上述目...

【技术保护点】
一种面向增强分类器推广性能的有效特征样本识别技术，其特征在于，该方法包括如下步骤：1)分类器推广性能评价指标的建立；2)模糊聚类准则的构建；3)特征样本集一次聚类划分；4)类内平均距离与类间平均距离的定义；5)初始聚类优选准则的建立；6)特征样本集二次聚类识别。

【技术特征摘要】
1.一种面向增强分类器推广性能的有效特征样本识别技术，其特征在于，该方法包括如下步骤：1)分类器推广性能评价指标的建立；2)模糊聚类准则的构建；3)特征样本集一次聚类划分；4)类内平均距离与类间平均距离的定义；5)初始聚类优选准则的建立；6)特征样本集二次聚类识别。2.根据权利要求1所述的面向增强分类器推广性能的有效特征样本识别技术，其特征在于，所述分类器推广性能评价指标的建立计算式为：R(w)＝Remp(w)+Φ(h/l),h≤min([r2a2],n)+1.式中Φ(·)为置信风险函数，h为分类函数的VC维，l为训练样本数。可以看到，真实风险R(w)由经验风险Remp(w)与置信风险Φ(·)两部分构成。[·]表示取整数部分。r为包含所有高维空间映射点的最小超球体半径。3.根据权利要求1所述的面向增强分类器推广性能的有效特征样本识别技术，其特征在于，所述模糊聚类准则的构建计算式为： min J F C M ( U , V ) = Σ k = 1 n Σ i = 1 c ( u i k ) m ( d i k ) 2 . ]]>式中dik＝||xk-vi||为样本xk与聚类中心vi之间的距离，一般采用欧式距离度量。m为模糊加权指数，通常取m＝2。JFCM(U,V)表示各类样本到聚类中心加权距离的平方和，权重是样本xk对第i类隶属度的m次方。4.根据权利要求1所述的面向增强分类器推广性能的有效特征样本识别技术，其特征在于，所述特征样本集一次聚类划分计算式为： v i ...

【专利技术属性】
技术研发人员：焦卫东，杨志强，
申请(专利权)人：浙江师范大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人