一种基于模糊核聚类高阶谱的数据分类方法技术

技术编号:11210325 阅读:133 留言:0更新日期:2015-03-26 19:46
本发明专利技术公开了一种基于模糊核聚类高阶谱的数据分类方法,步骤是:a把原始数据进行预处理,即分成已知的多类别数据和待分析的某类别数据;b获得学习样本和训练样本及其各自的高阶谱分析结果;c对学习样本和测试样本的高阶谱分析结果分别进行模糊阈值处理,分别得到其模糊阈值处理结果;d对学习样本的模糊阈值处理结果进行模糊核聚类处理,获取其模糊核聚类类别特征;e将测试样本的模糊阈值处理结果和模糊核聚类类别特征进行运算,以判断训练样本的类别归属。本发明专利技术可以在样本数量不稳定的情况下、特别是小样本情况下较好地提取模糊核聚类类别特征,获得较好的数据分类效果。

【技术实现步骤摘要】

本专利技术涉及数据分类方法的
,尤其是一种基于模糊核聚类高阶谱的数据 分类方法。
技术介绍
数据分类方法在各个领域都有着广泛的应用,如机械的故障识别、医学心音信号 的识别与判决、图像识别与归类、信号特征识别等。如在故障诊断领域,故障诊断过程其实 就是对不同类别的故障特征进行分类的过程,属于数据分类的范畴。 在以机器学习为代表的数据分类方法中,包括人工神经网络、支持向量机等,其基 本原理都是通过机器模拟人的思维方式去学习某些类别特征,并建立稳定可靠的类别特 证库,然后用测试样本去与类别特征库进行对比以判断其类别归属。这种方法对样本数量 的要求较高,当样本数量不稳定或者样本数量较少时,难以达到较好的学习效果,因而建立 的类别特征不具有代表性,容易产生类别识别错误,进而出现数据分类错误。
技术实现思路
本专利技术的目的在于解决样本数量不稳定或者样本数量较少时,也能较好完成数据 分类,提出了,该方法克服了样本数量不稳定 或样本数量较少的情况下数据分类存在的问题,在样本数量不稳定或样本数量较少时也能 有效地提取类别特征,获得较好的分类效果。 本专利技术解决其技术问题所采用的技术方法是: a对原始信号进行预处理,得到学习样本和训练样本; b对步骤a所得的学习样本和训练样本进行高阶谱分析,得到各自的高阶谱分析 结果; C对步骤b所得的学习样本和测试样本的高阶谱分析结果进行模糊阈值处理,分 别得到其模糊阈值处理结果; d对步骤C所得的学习样本的模糊阈值处理结果进行模糊核聚类处理,获取其模 糊核聚类类别特征; e对步骤c所得的测试样本的模糊阈值处理结果和步骤d)所得的模糊核聚类类别 特征进行运算,以判断训练样本的类别归属。 优选地,所述步骤a中对传感器采集到的原始信号进行预处理,得到已知共计m类 的数据,每一类数据取出η段数据,则得到mXn段供训练使用的学习样本,记为L (i,j)(其 中i = l,...,m,j = l,...,n);对于待分析类别的数据,取k段作为测试样本以供测试使 用,记为T(i)(其中i = 1,...,k)。其中,每段数据的长度1可以根据计算条件而人为确 定。 优选地,所述步骤b中的高阶谱分析是指如下运算:本文档来自技高网...

【技术保护点】
一种基于模糊核聚类高阶谱的数据分类方法,其分类方法包括(a)、(b)、(c)、(d)、(e)五个步骤,其特征是:(a)对原始信号进行预处理,得到已知共计m类的数据,每一类数据取出n段数据,则得到m×n段供训练使用的学习样本,记为L(i,j)(其中i=1,...,m,j=1,...,n);对于待分析类别的数据,取k段作为测试样本以供测试使用,记为T(i)(其中i=1,...,k)。其中,每段数据的长度l可以根据计算条件确定;(b)高阶谱分析运算:Bx(ω1,ω2)=Στ1=-∞+∞Στ2=-∞+∞c3x(τ1,τ2)e-j(ω1τ1+ω2τ2)---(1)]]>式中,c3x为随机变量x的3阶累积量,Bx(ω1,ω2)为输出的高阶谱结果;学习样本L(i,j)的高阶谱分析结果记为BL(i,j)(ω1,ω2)(其中i=1,...,m,j=1,...,n),测试样本T(i)的高阶谱分析结果记为BT(i)(ω1,ω2)(其中i=1,...,k);(c)模糊阈值处理,对步骤(b)中的高阶谱分析结果BL(i,j)(ω1,ω2)和BT(i)(ω1,ω2)分别进行如下运算:BBx(ω1,ω2)=1Bx(ω1,ω2)≥T0Bx(ω1,ω2)<T]]>T=1N×NΣω1=0N-1Σω2=0N-1Bx(ω1,ω2)---(3)]]>式中,Bx(ω1,ω2)为高阶谱分析结果,N为该高阶谱分析结果的长度,T为阈值,BBx(ω1,ω2)为运算结果;步骤(c)中的模糊阈值运算BL(i,j)(ω1,ω2)和BT(i)(ω1,ω2)的运算结果分别记为BBL(i,j)(ω1,ω2)(其中i=1,...,m,j=1,...,n)和BBT(i)(ω1,ω2)(其中i=1,...,k);(d)模糊核聚类处理,是指对n段同类别的运算结果BBL(i,j)(ω1,ω2)进行如下运算:(其中i=1,...,m,j=1,...,n)  (4)运算获得模糊核聚类类别特征、即共得到m种类别的每一类特征BMBL(i)(ω1,ω2)(其中i=1,...,m);(e)将步骤(c)中通过训练样本获得的模糊阈值运算结果BBT(i)(ω1,ω2)和步骤(d)中通过学习样本获得的模糊核聚类类别特征BMBL(i)(ω1,ω2)分别进行如下运算:BMR(i,j)=Σω1=0N-1Σω2=0N-1sgn(BBT(i)(ω1,ω2)-BMBL(j)(ω1,ω2))]]>(其中i=1,...,k,j=1,...,m)    (5)sgn(x)=1x>00x≤0---(6)]]>在结果BMR(i,j)中,每一个行向量中的最小值对应的模糊核聚类类别特征BMBL(i)(ω1,ω2)即是该测试样本的归属。...

【技术特征摘要】
1. 一种基于模糊核聚类高阶谱的数据分类方法,其分类方法包括(a)、(b)、(c)、(d)、 (e)五个步骤,其特征是: (a) 对原始信号进行预处理,得到已知共计m类的数据,每一类数据取出η段数据,则 得到mXn段供训练使用的学习样本,记为L(i,j)(其中i= 1,. . .,m,j= 1,. . .,η);对于 待分析类别的数据,取k段作为测试样本以供测试使用,记为T(i)(其中i= 1,. . .,k)。其 中,每段数据的长度1可以根据计算条件确定; (b) 高阶谱分析运算:式中,c3x为随机变量X的3阶累积量,Bx(Q1,ω2)为输出的高阶谱结果; 学习样本L(i,j)的高阶谱分析结果记为BuU(O1,ω2)(其中i= 1,. . .,m,j= 1,· · ·,η),测试样本T(i)的高阶谱分析结果记为BT(i) (O1,ω2)(其中i= 1,· · ·,k); (c) 模糊阈值处理,对步骤(b)中的高阶谱分析结果ρω2)和Bt⑴(O1,ω2) 分别进行如下运算:式中,Βχ(ωι,ω2)为高阶谱分析结果,N为该高阶谱分析结果的长度,T为阈值...

【专利技术属性】
技术研发人员:刘文艺张昱韩继光杨存智
申请(专利权)人:江苏师范大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1