一种基于变样本栈式自编码网络的模式识别方法技术

技术编号:20746216 阅读:34 留言:0更新日期:2019-04-03 10:34
一种基于变样本栈式自编码网络的模式识别方法,属于大数据模式识别领域。现有的模式识别方法在数据维度逐渐增高时,会出现模式识别精度和效率下降问题的问题。一种基于变样本栈式自编码网络的模式识别方法,一、通过变样本栈式自编码网络滤除高维空间样本中噪声,映射成低维空间去噪样本集合;二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练,得到低维空间去噪样本集合中的典型样本集合;三、基于步骤二获得的典型样本集合,采用逆映射到高维空间获得高维空间典型样本集合,并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别,完成待测试样本的类别判定。本发明专利技术与其它算法进行对比,提高了分类准确率。

【技术实现步骤摘要】
一种基于变样本栈式自编码网络的模式识别方法
本专利技术涉及一种模式识别方法,特别涉及一种采用变样栈式自编码网络的大规模高维度模式识别方法。
技术介绍
目前,各领域数据都表现出大规模、非线性、高维度的特性。例如,民航发动机的巡航信息包括排气温度偏差值、核心机转速偏差值、燃油流量偏差值等至少27个维度的数据,人脸识别中的一张图片可以看作几百维、甚至上千维的数据向量,医学上用于心脏诊断的数据包括主动脉瓣峰值压差、二尖瓣A峰流速、肺动脉瓣峰值流速等十几个维度的数据。这些高维数据在时间维度上的动态信息,就形成了大规模数据记录,例如民航发动机一个小时内的巡航记录通常以每秒钟以37.5kHz的频率采集,长时间连续记录的动态心电图更是数量庞大的数据记录。高维度、大数据量样本的噪声、非线性、高通量问题使得利用这些数据进行模式识别、故障诊断、状态预测时有较大的精度和效率问题。
技术实现思路
本专利技术的目的是为了解决现有的模式识别方法在数据维度逐渐增高时,会出现模式识别精度和效率下降问题的问题,而提出一种基于变样本栈式自编码网络的模式识别方法。一种基于变样本栈式自编码网络的模式识别方法,所述的方法通过以下步本文档来自技高网...

【技术保护点】
1.一种基于变样本栈式自编码网络的模式识别方法,其特征在于:所述方法包括以下步骤:步骤一、通过变样本栈式自编码网络滤除高维空间样本中噪声,映射成低维空间去噪样本集合;步骤二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练,得到低维空间去噪样本集合中的典型样本集合;步骤三、基于步骤二获得的典型样本集合,采用逆映射到高维空间获得高维空间典型样本集合,并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别,完成待测试样本的类别判定。

【技术特征摘要】
1.一种基于变样本栈式自编码网络的模式识别方法,其特征在于:所述方法包括以下步骤:步骤一、通过变样本栈式自编码网络滤除高维空间样本中噪声,映射成低维空间去噪样本集合;步骤二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练,得到低维空间去噪样本集合中的典型样本集合;步骤三、基于步骤二获得的典型样本集合,采用逆映射到高维空间获得高维空间典型样本集合,并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别,完成待测试样本的类别判定。2.根据权利要求1所述的一种基于变样本栈式自编码网络的模式识别方法,其特征在于:所述的步骤一中,通过变样本栈式自编码网络滤除高维空间样本中噪声,映射成低维空间去噪样本集合的过程,具体为:首先,建立栈式自编码网络,通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本,在栈式底部获得低维空间样本集合。3.根据权利要求1或2所述的一种基于变样本栈式自编码网络的模式识别方法,其特征在于:所述的建立栈式自编码网络,之后通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本,在栈式底部获得低维空间样本集合的过程,具体为:步骤一一、建立栈式自编码网络:(1)、建立n层栈式自编码网络模型:M=[H1,H2,…,Hn],构造出n-1层自编码网络;其中,所述的n层栈式自编码网络模型中,输入层H1对应高维训练样本,输出层Hn对应低维去噪样本集合;H2至Hn-1为栈式自编码网络模型M的中间层,表示输入样本H1的抽象映射空间;所述的n-1层自编码网络的第i层自编码网络为其模型参数为Wi、Bi、Hi表示自编码网络的输入向量;表示重构的自编码网络的输出向量;Hi+1表示自编码网络的隐含层向量;(2)、训练自编码网络,使由自编码网络的输出向量与自编码网络的输入向量Hi之间的误差所成的重构误差达到最小,如式1所示:其中,表示激活函数;步骤一二、层间无监督聚类分离离群样本:(1)、对于步骤一一建立的n层栈式自编码网络模型M,将第i层自编码网络的输入样本Hi设置为Ii,数量是Ni;(2)、设定聚类阈值α,获得聚类度或分类辨识度大于α的样本作为第i+1层自编码网络的输入,即:Ii+1={Hi+1|F(Hi+1)≥α}(2)其中,Hi+1是第i+1层自编码网络的隐含层向量,Ii+1是第i+1层自编码网络的输入向量,F(·)是聚类函数或分类器;(3)、设计基于无迹变换的聚类器F(·),进行第i层自编码器AEi与第i+1层自编码器AEi+1的层间去噪;根据设置的聚类阈值α,以F(·)<α为条件选择敏感特征进入网络下一层自编码器AEi+1。4.根据权利要求3所述的一种基于变样本栈式自编码网络的模式识别方法,其特征在于:所述的步骤一二中,设计基于无迹变换的聚类器F(·),进行第i层自编码器AEi与第i+1层自编码器AEi+1的层间去噪,根据设置的聚类阈值α,以F(·)<α为条件选择敏感特征进入网络下一层自编码器AEi+1,具体为:(1)、通过式(3)计算自编码器AEi输入样本的均值,通过式(4)计算自编码器AEi输入样本的方差:(2)、采用式(5)生成能捕获高斯随机变量均值和协方差的2n+1个sigma采样点:其中,κ是比例参数,是矩阵(n+κ)P第j行的平方根,ω...

【专利技术属性】
技术研发人员:林琳王芳郭丰钟诗胜
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1