一种基于测试样本加权与类别假设的分类方法技术

技术编号:14517226 阅读:50 留言:0更新日期:2017-02-01 19:36
本发明专利技术公开一种基于测试样本加权与类别假设的分类方法,通过将测试样本假定为某一分类类别,并运用混沌算法在全空间参数搜索上的优势给出其对应的最佳权值,让加权的测试样本参与到分类器模型的训练中,与训练样本一同训练得出新的分类器模型;借助该分类器重新计算每个训练样本的分类情况,进而得出分类器整体分类精度;重新对测试样本的分类情况进行假设,使其遍历所有可能的分类并分别训练对应分类器模型,计算分类精度;对全部训练所得分类器按分类精度进行排序,基于分类器的分类精度越高测试样本分类假设越合理的原则,找到对测试样本的最佳分类假设作为该样本的类别判断。与其它分类方法相比,本发明专利技术的方法具有更好表现。

【技术实现步骤摘要】

本专利技术涉及模式识别方法,尤其涉及一种基于测试样本加权与类别假设的分类方法。
技术介绍
分类是人工智能、机器学习、模式识别中最核心、最基础的内容。它可以描述为利用某种算法从分类的可选方案中选择最合适的分类假设。分类算法性能好坏决定了最终分类器的质量,因此如何设计一种高质量分类算法已成为人们研究的热点。人们投入了大量的时间和精力研究诸如C4.5、支持向量机、贝叶斯算法、AdaBoost算法和K-最近邻分类算法等分类算法,并将它们应用于面部识别、笔迹验证、数据分析和医学应用等不同领域。大多数分类算法基于现有训练样本进行训练,并依据使现有训练样本获得最高分类精度这一假设来构建分类器模型。基于这一目标和现有训练样本,通过各种分类算法以及优化算法进行分类器模型的设计,然后基于该设计模型分类后续的测试样本。尽管该分类器模型基于训练样本最高分类精度进行设计,但并不能说明使用该分类器模型就一定能正确分类测试样本。这是因为测试样本并没有直接参与分类器模型的训练过程,对分类器模型的构建可能没有考虑测试样本因素或可能考虑该因素的影响不够充分,上述原因可能会导致不正确的测试样本分类判断。很明显,如果测试样本也能参与到分类器模型的构建过程中,并分配以合适的权重将有助于提高整个分类器的分类性能。基于以上考虑,本专利提出一种基于测试样本加权与类别假设的分类方法。基于测试样本的分类假设,让其与训练样本一同对分类器模型进行推导,并利用新模型对训练样本进行分类,由分类精度做出关于测试样本的最合理假设。同时,可以通过为当前测试样本赋予合适的权值来增加测试样本对最终分类器模型的影响,使得测试样本的分类假设正确与否可依据分类器分类精度加以判断。
技术实现思路
针对传统分类模型训练方法的缺陷和与检测方法的不足,提出一种基于测试样本加权与类别假设的分类方法。不同于以往的分类器训练和检测算法,将训练过程与分类过程严格割裂开来,测试样本不参与分类器模型的训练。因为分类器训练过程中缺乏对测试样本因素的考虑,导致仅仅依赖于训练样本给出的分类器在检测测试样本时可能性能不够理想。本专利通过将测试样本假定为某一分类类别,并运用混沌算法在全空间参数搜索上的优势给出其对应的最佳权值,让加权的测试样本参与到分类器模型的训练中,与训练样本一同训练得出新的分类器模型。借助该分类器重新计算每个训练样本的分类情况,进而得出分类器整体分类精度。重新对测试样本的分类情况进行假设,使其遍历所有可能的分类并分别训练对应分类器模型,计算分类精度。对全部训练所得分类器按分类精度进行排序,基于分类器的分类精度越高测试样本分类假设越合理的原则,找到对测试样本的最佳分类假设作为该样本的类别判断。最后,应用本文方法进行了笔迹鉴权,实验结果证明与其它分类方法相比,本专利技术提出的方法具有更好表现。一种基于测试样本加权与类别假设的分类方法,包括如下步骤:步骤(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器,设置初始分类精度ao,,同时设置初始类别号为i=0;步骤(2)待测试样本类别假设当有待测试样本到来时,对其类别进行假设,设其分类为Ci;步骤(3)权值选择基于混沌算法,在参数空间上对测试样本的权值进行全局搜索,把分类精度作为目标函数,就当前测试样本的分类假设给出其对应的最佳权值;步骤(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型,重新计算分类器精度ai,然后设置i=i+1;步骤(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别;步骤(6)分类精度计算计算全部分类器模型所对应的样本分类精度;步骤(7)最终分类模型选出找出最高的分类精度和它所对应的类别假设,判断该待测试样本为这一假设的类别。作为优选,步骤(3)中采用z(k+1)=u·z(k)(1-z(k))产生混沌系统,u=3.9是该系统处于混沌状态,把测试样本的权值表示为Nt=ε1·Ng+ε2·Ni,Nt是待求样本权值,Ng和Ni分别是全部样本数量和当前测试样本假设类别的样本数量,求解Nt的问题就转化为利用混沌算法在全局空间中搜索最佳的ε1和ε2的问题,其中,k为迭代次数;z(k)为混沌序列;ε1和ε2:ε1和ε2分别与构建分类器模型样本的总数和该待测试样本被假定为的类别所对应的样本数量,是两个比例系数,满足公式Nt=ε1·Ng+ε2·Ni。与现有技术相比,本专利技术具有以下明显的优势和有益效果:(1)本专利技术提出一种基于测试样本加权与类别假设的分类方法,通过将测试样本假定为某一分类类别,并运用混沌算法在全空间参数搜索上的优势给出其对应的最佳权值,让加权的测试样本参与到分类器模型的训练中,与训练样本一同训练得出新的分类器模型,使分类模型分类性能更好。这是因为测试样本直接参与分类器模型的训练过程,在分类器模型的构建中充分考虑了测试样本因素,避免了可能导致的不正确测试样本分类判断。(2)本专利技术利用测试样本的直接参与,以及依据混沌算法给出的最佳权值,实现了分类模型的准确构建。为验证本分类算法,运用本专利技术方法到笔迹验证试验中,对笔迹书写人身份进行判断,当测试样本权值设置最合适时,其分类精度可达到98.83%。附图说明图1为本专利技术所提出的一种基于测试样本加权与类别假设的分类方法功能框图;图2为本专利技术所涉及方法的流程图。具体实施方式下面结合附图和具体实施方式对本专利技术做进一步的描述。如图1、2所示,本专利技术实施例提供一种基于测试样本加权与类别假设的分类方法,包括以下步骤:(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器,设置初始分类精度ao,,同时设置初始类别号为i=0,本实验中,根据实验需求每次从HIT-MW样本库随机的选取50个不同人的多份笔迹样本(随机选取,1到10份)作为训练样本,并从这些人的剩余笔迹样本中随机选取1个笔迹样本作为测试样本,重复上述试验多次,取平均精度;(2)待测试样本类别假设当有待测试样本到来时,对其类别进行假设,设其分类为Ci;(3)权值选择基于混沌算法,在参数空间上对测试样本的权值进行全局搜索,把分类精度作为目标函数,就当前测试样本的分类假设给出其对应的最佳权值。本步骤中,采用z(k+1)=u·z(k)(1-z(k))产生混沌系统,u=3.9是该系统处于混沌状态,把测试样本的权值表示为Nt=ε1·Ng+ε2·Ni,Nt是待求样本权值,Ng和Ni分别是全部样本数量和当前测试样本假设类别的样本数量,求解Nt的问题就转化为利用混沌算法在全局空间中搜索最佳的ε1和ε2的问题;其中,k为迭代次数;z(k)为混沌序列;ε1和ε2:ε1和ε2分别与构建分类器模型样本的总数和该待测试样本被假定为的类别所对应的样本数量,是两个比例系数,满足公式Nt=ε1·Ng+ε2·Ni。(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型,计算分类器分类精度ai,然后设置i=i+1;(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别;(6)分类精度计算计算全部分类器模型所对应的样本分类精度ai;(7)最终分类模型选出找出其中分类精度最高的分类器模型所对应的测试样本分类假设amax,判断该待测试样本为这一假设的类别。运用本专利技术方法到笔迹验证试验中。本实验中,根据实验需求本文档来自技高网
...

【技术保护点】
一种基于测试样本加权与类别假设的分类方法,包括如下步骤:步骤(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器,设置初始分类精度ao,,同时设置初始类别号为i=0;步骤(2)待测试样本类别假设当有待测试样本到来时,对其类别进行假设,设其分类为Ci;步骤(3)权值选择基于混沌算法,在参数空间上对测试样本的权值进行全局搜索,把分类精度作为目标函数,就当前测试样本的分类假设给出其对应的最佳权值;步骤(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型,重新计算分类器精度ai,然后设置i=i+1;步骤(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别;步骤(6)分类精度计算计算全部分类器模型所对应的样本分类精度;步骤(7)最终分类模型选出找出最高的分类精度和它所对应的类别假设,判断该待测试样本为这一假设的类别。

【技术特征摘要】
1.一种基于测试样本加权与类别假设的分类方法,包括如下步骤:步骤(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器,设置初始分类精度ao,,同时设置初始类别号为i=0;步骤(2)待测试样本类别假设当有待测试样本到来时,对其类别进行假设,设其分类为Ci;步骤(3)权值选择基于混沌算法,在参数空间上对测试样本的权值进行全局搜索,把分类精度作为目标函数,就当前测试样本的分类假设给出其对应的最佳权值;步骤(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型,重新计算分类器精度ai,然后设置i=i+1;步骤(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别;步骤(6)分类精度计算计算全部分类器模型所对应的样本分类精度;步骤(7...

【专利技术属性】
技术研发人员:曹万鹏
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1