当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于Fisher分类器组的离散型数据预处理方法技术

技术编号:14198457 阅读:86 留言:0更新日期:2016-12-15 20:08
本发明专利技术公开了一种基于Fisher分类器组的离散型数据预处理方法,使用Fisher判别准则生成多个Fisher分类器,多个Fisher分类形成Fisher分类器组;利用Fisher分类器组的输出获得一定的样本分类冗余信息,随后在离散型编码过程中减小奇异值和野值对后续分类器进行映射影响;最后将映射结果的编码作为该样本数据预处理结果。本发明专利技术可在不改变分类器性能的情况下,提高分类器的准确度;现有技术中,不采用任何预处理方法正确识别率为92.06%,使用PCA方法预处理结果正确识别率为50.79%;使用归一化方法,将样本矢量x转换正确识别率为92.06%;本发明专利技术提出的方法正确识别率为95.24%。

【技术实现步骤摘要】

本专利技术属于数据处理
,尤其涉及一种基于Fisher分类器组的离散型数据预处理方法
技术介绍
随着人工智能技术的不断发展,模拟人类嗅觉感知过程的人工嗅觉系统应运而生,该系统由“气体传感器阵列”和“模式识别”两大部分构成。其中,“气体传感器阵列”由多种具有广谱响应的气体传感器组成,对各种气体产生不同的“响应图谱”;“模式识别”部分则利用合适的数学模型对“响应图谱”进行判别,为保证识别结果的准确性与鲁棒性,通常需要在图谱数据进入“模式识别”方法之前进行“数据预处理”。当前的人工嗅觉系统“数据预处理”方法主要包括主成分分析(PCA)、独立分量分析(ICA)、时频变换、归一化处理等。PCA以多维信号相关性作为判断准则,在降维过程中尽可能多地保留有用信息;ICA则以信号独立性为判断依据,对信号进行分解与重组,但存在信号分解过程中会损失原始信号中的幅度信息;时频变换则适用于有效信号与干扰信号频率特性明显相异的情况;归一化处理着重于解决信号幅度差异过大对模式识别方法造成的影响。然而,以上数据预处理方法的处理原则并不以最优分类为目标,即预处理过程中可能将有益于分类的信息剔除而保留某些对分类无用的信息,进而导致:对于同一分类器,往往数据经过预处理后的分类准确率弱于预处理前。因此需要一种以分类准确率为导向的数据预处理方法,保证在不增加分类器复杂度的情况下,获得较好的分类准确率。
技术实现思路
本专利技术的目的在于提供一种基于Fisher分类器组的离散型数据预处理方法,旨在解决现有的数据预处理方法导致对于同一分类器,往往数据经过预处理后的分类准确率弱于预处理前,分类准确率低的问题。本专利技术提供一种基于Fisher分类器组的离散型数据预处理方法,该基于Fisher分类器组的离散型数据预处理方法为:使用Fisher判别准则生成多个Fisher分类器,组成Fisher分类器组:对训练子集选择与生成,依据训练样本类别,由两类样本组成多个训练子集,利用训练子集生成多个Fisher判别模型,并生成对应的多个Fisher分类器,多个Fisher分类形成Fisher分类器组;每个样本原始数据按照Fisher分类器的规则进行映射:利用Fisher分类器组的输出获得一定的样本分类冗余信息,随后在离散型编码过程中减小奇异值和野值对后续分类器进行映射影响;最后将映射结果的编码作为该样本数据预处理结果。该基于Fisher分类器组的离散型数据预处理方法具体包括以下步骤:步骤一、训练子集选择与生成:通过获得若干组观察数据与所属类别的信息作为算法模型建立的依据,每一条信息称为一个训练样本,若干训练样本组成训练集;若训练样本有k类,k≥2;则依据训练样本类别,由两类样本组成个训练子集,训练子集Xn表示为:Xn={{xi本文档来自技高网...
一种基于Fisher分类器组的离散型数据预处理方法

【技术保护点】
一种基于Fisher分类器组的离散型数据预处理方法,其特征在于,该基于Fisher分类器组的离散型数据预处理方法为:使用Fisher判别准则生成多个Fisher分类器,组成Fisher分类器组:对训练子集选择与生成,依据训练样本类别,由两类样本组成多个训练子集;利用训练子集生成多个Fisher判别模型,并生成对应的多个Fisher分类器,多个Fisher分类形成Fisher分类器组;每个样本原始数据按照Fisher分类器的规则进行映射:利用Fisher分类器组的输出获得一定的样本分类冗余信息,随后在离散型编码过程中减小奇异值和野值对后续分类器进行映射影响;最后将映射结果的编码作为该样本数据预处理结果。

【技术特征摘要】
1.一种基于Fisher分类器组的离散型数据预处理方法,其特征在于,该基于Fisher分类器组的离散型数据预处理方法为:使用Fisher判别准则生成多个Fisher分类器,组成Fisher分类器组:对训练子集选择与生成,依据训练样本类别,由两类样本组成多个训练子集;利用训练子集生成多个Fisher判别模型,并生成对应的多个Fisher分类器,多个Fisher分类形成Fisher分类器组;每个样本原始数据按照Fisher分类器的规则进行映射:利用Fisher分类器组的输出获得一定的样本分类冗余信息,随...

【专利技术属性】
技术研发人员:刘涛武萌雅陈艳兵李东琦崔兴瑞
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1