一种基于测试样本加权与类别假设的分类方法技术

技术编号：14517226 阅读：50 留言：0更新日期：2017-02-01 19:36

本发明专利技术公开一种基于测试样本加权与类别假设的分类方法，通过将测试样本假定为某一分类类别，并运用混沌算法在全空间参数搜索上的优势给出其对应的最佳权值，让加权的测试样本参与到分类器模型的训练中，与训练样本一同训练得出新的分类器模型；借助该分类器重新计算每个训练样本的分类情况，进而得出分类器整体分类精度；重新对测试样本的分类情况进行假设，使其遍历所有可能的分类并分别训练对应分类器模型，计算分类精度；对全部训练所得分类器按分类精度进行排序，基于分类器的分类精度越高测试样本分类假设越合理的原则，找到对测试样本的最佳分类假设作为该样本的类别判断。与其它分类方法相比，本发明专利技术的方法具有更好表现。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别方法，尤其涉及一种基于测试样本加权与类别假设的分类方法。
技术介绍
分类是人工智能、机器学习、模式识别中最核心、最基础的内容。它可以描述为利用某种算法从分类的可选方案中选择最合适的分类假设。分类算法性能好坏决定了最终分类器的质量，因此如何设计一种高质量分类算法已成为人们研究的热点。人们投入了大量的时间和精力研究诸如C4.5、支持向量机、贝叶斯算法、AdaBoost算法和K-最近邻分类算法等分类算法，并将它们应用于面部识别、笔迹验证、数据分析和医学应用等不同领域。大多数分类算法基于现有训练样本进行训练，并依据使现有训练样本获得最高分类精度这一假设来构建分类器模型。基于这一目标和现有训练样本，通过各种分类算法以及优化算法进行分类器模型的设计，然后基于该设计模型分类后续的测试样本。尽管该分类器模型基于训练样本最高分类精度进行设计，但并不能说明使用该分类器模型就一定能正确分类测试样本。这是因为测试样本并没有直接参与分类器模型的训练过程，对分类器模型的构建可能没有考虑测试样本因素或可能考虑该因素的影响不够充分，上述原因可能会导致不正确的测试样本分类判断。很明显，如果测试样本也能参与到分类器模型的构建过程中，并分配以合适的权重将有助于提高整个分类器的分类性能。基于以上考虑，本专利提出一种基于测试样本加权与类别假设的分类方法。基于测试样本的分类假设，让其与训练样本一同对分类器模型进行推导，并利用新模型对训练样本进行分类，由分类精度做出关于测试样本的最合理假设。同时，可以通过为当前测试样本赋予合适的权值来增加测试样本对最终分类器模型的影响，使得测试...

【技术保护点】
一种基于测试样本加权与类别假设的分类方法，包括如下步骤：步骤(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器，设置初始分类精度ao,，同时设置初始类别号为i＝0；步骤(2)待测试样本类别假设当有待测试样本到来时，对其类别进行假设，设其分类为Ci；步骤(3)权值选择基于混沌算法，在参数空间上对测试样本的权值进行全局搜索，把分类精度作为目标函数，就当前测试样本的分类假设给出其对应的最佳权值；步骤(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型，重新计算分类器精度ai，然后设置i＝i+1；步骤(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别；步骤(6)分类精度计算计算全部分类器模型所对应的样本分类精度；步骤(7)最终分类模型选出找出最高的分类精度和它所对应的类别假设，判断该待测试样本为这一假设的类别。

【技术特征摘要】
1.一种基于测试样本加权与类别假设的分类方法，包括如下步骤：步骤(1)初始参数设置基于朴素贝叶斯分类器由训练样本训练最初的分类器，设置初始分类精度ao,，同时设置初始类别号为i＝0；步骤(2)待测试样本类别假设当有待测试样本到来时，对其类别进行假设，设其分类为Ci；步骤(3)权值选择基于混沌算法，在参数空间上对测试样本的权值进行全局搜索，把分类精度作为目标函数，就当前测试样本的分类假设给出其对应的最佳权值；步骤(4)分类器模型训练基于上述朴素贝叶斯分类算法训练得到的分类器模型，重新计算分类器精度ai，然后设置i＝i+1；步骤(5)迭代循环重复步骤2到步骤4直到对待测试样本的假设遍历每一类别；步骤(6)分类精度计算计算全部分类器模型所对应的样本分类精度；步骤(7...

【专利技术属性】
技术研发人员：曹万鹏，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人