一种基于模糊核聚类高阶谱的数据分类方法技术

技术编号：11210325 阅读：133 留言：0更新日期：2015-03-26 19:46

本发明专利技术公开了一种基于模糊核聚类高阶谱的数据分类方法，步骤是：a把原始数据进行预处理，即分成已知的多类别数据和待分析的某类别数据；b获得学习样本和训练样本及其各自的高阶谱分析结果；c对学习样本和测试样本的高阶谱分析结果分别进行模糊阈值处理，分别得到其模糊阈值处理结果；d对学习样本的模糊阈值处理结果进行模糊核聚类处理，获取其模糊核聚类类别特征；e将测试样本的模糊阈值处理结果和模糊核聚类类别特征进行运算，以判断训练样本的类别归属。本发明专利技术可以在样本数量不稳定的情况下、特别是小样本情况下较好地提取模糊核聚类类别特征，获得较好的数据分类效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据分类方法的
，尤其是一种基于模糊核聚类高阶谱的数据分类方法。
技术介绍
数据分类方法在各个领域都有着广泛的应用，如机械的故障识别、医学心音信号的识别与判决、图像识别与归类、信号特征识别等。如在故障诊断领域，故障诊断过程其实就是对不同类别的故障特征进行分类的过程，属于数据分类的范畴。在以机器学习为代表的数据分类方法中，包括人工神经网络、支持向量机等，其基本原理都是通过机器模拟人的思维方式去学习某些类别特征，并建立稳定可靠的类别特证库，然后用测试样本去与类别特征库进行对比以判断其类别归属。这种方法对样本数量的要求较高，当样本数量不稳定或者样本数量较少时，难以达到较好的学习效果，因而建立的类别特征不具有代表性，容易产生类别识别错误，进而出现数据分类错误。
技术实现思路
本专利技术的目的在于解决样本数量不稳定或者样本数量较少时，也能较好完成数据分类，提出了，该方法克服了样本数量不稳定或样本数量较少的情况下数据分类存在的问题，在样本数量不稳定或样本数量较少时也能有效地提取类别特征，获得较好的分类效果。本专利技术解决其技术问题所采用的技术方法是： a对原始信号进行预处理，得到学习样本和训练样本； b对步骤a所得的学习样本和训练样本进行高阶谱分析，得到各自的高阶谱分析结果； C对步骤b所得的学习样本和测试样本的高阶谱分析结果进行模糊阈值处理，分别得到其模糊阈值处理结果； d对步骤C所得的学习样本的模糊阈值处理结果进行模糊核聚类处理，获取其模糊核聚类类...

【技术保护点】
一种基于模糊核聚类高阶谱的数据分类方法,其分类方法包括(a)、(b)、(c)、(d)、(e)五个步骤，其特征是：(a)对原始信号进行预处理，得到已知共计m类的数据，每一类数据取出n段数据，则得到m×n段供训练使用的学习样本，记为L(i,j)(其中i＝1,...,m，j＝1,...,n)；对于待分析类别的数据，取k段作为测试样本以供测试使用，记为T(i)(其中i＝1,...,k)。其中，每段数据的长度l可以根据计算条件确定；(b)高阶谱分析运算：Bx(ω1,ω2)=Στ1=-∞+∞Στ2=-∞+∞c3x(τ1,τ2)e-j(ω1τ1+ω2τ2)---(1)]]>式中，c3x为随机变量x的3阶累积量，Bx(ω1，ω2)为输出的高阶谱结果；学习样本L(i,j)的高阶谱分析结果记为BL(i,j)(ω1，ω2)(其中i＝1,...,m，j＝1,...,n)，测试样本T(i)的高阶谱分析结果记为BT(i)(ω1，ω2)(其中i＝1,...

【技术特征摘要】
1. 一种基于模糊核聚类高阶谱的数据分类方法，其分类方法包括（a)、（b)、（c)、（d)、 (e)五个步骤，其特征是： (a) 对原始信号进行预处理，得到已知共计m类的数据，每一类数据取出η段数据，则得到mXn段供训练使用的学习样本，记为L(i,j)(其中i= 1，. . .，m，j= 1，. . .，η);对于待分析类别的数据，取k段作为测试样本以供测试使用，记为T(i)(其中i= 1，. . .，k)。其中，每段数据的长度1可以根据计算条件确定； (b) 高阶谱分析运算：式中，c3x为随机变量X的3阶累积量，Bx(Q1,ω2)为输出的高阶谱结果；学习样本L(i,j)的高阶谱分析结果记为BuU(O1,ω2)(其中i= 1，. . .，m，j= 1，· · ·，η)，测试样本T(i)的高阶谱分析结果记为BT(i) (O1,ω2)(其中i= 1，· · ·，k); (c) 模糊阈值处理，对步骤（b)中的高阶谱分析结果ρω2)和Bt⑴（O1,ω2) 分别进行如下运算：式中，Βχ(ωι，ω2)为高阶谱分析结果，N为该高阶谱分析结果的长度，T为阈值...

【专利技术属性】
技术研发人员：刘文艺，张昱，韩继光，杨存智，
申请(专利权)人：江苏师范大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人