一种案例推理分类器案例检索方法技术

技术编号：22166819 阅读：61 留言：0更新日期：2019-09-21 10:32

本发明专利技术公开了一种案例推理分类器案例检索方法，包括：S1，案例库规约特征选择；S2，C4.5算法与案例库分簇决策树训练；S3，加权投票KNN方法。本发明专利技术对案例推理分类器的案例检索方法进行了改进研究：提出在近邻案例检索中集成使用归纳索引策略的方法，采用信息增益比率的特征评价方法，选择信息增益率较显著的特征训练案例库分簇决策树；案例检索时，首先依据分簇决策树检索目标案例对应簇，然后在案例簇内进行近邻案例检索。开源数据集的实验数据表明：与传统的CBR模型相比，本发明专利技术改进的模型能够充分利用案例特征的分类能力进行案例检索，有效降低CBR推理分类器的计算时间复杂度，改善了推理准确性。

A Case Retrieval Method for Case Reasoning Classifier

全部详细技术资料下载

【技术实现步骤摘要】
一种案例推理分类器案例检索方法
本专利技术具体涉及案例推理方法，具体涉及一种改进的案例推理分类器案例检索方法。
技术介绍
案例推理(Case-basedreasoning，CBR)是人工智能领域一种类比求解问题方法，它起源于从认知科学角度对人类的推理和学习机制进行的探索研究，20世纪80年代由美国耶鲁大学的认知科学和人工智能专家罗杰•沙克（RogerSehank)）在动态记忆理论基础上提出，乔治亚理工学院珍妮•克洛德纳(JanelL.Kolodner)教授最早开发出应用CBR专家系统。用类比思想求解新问题(或称目标案例)的解法时，要回忆过去类似问题的经验案例(源案例)解法进行推理。因此，案例推理系统的计算模型除了要存储经验案例数据和案例解法外，还应具有获取与目标案例相似经验案例的技能。在众多CBR系统结构中，广泛被采纳的是1994年由奥莫特（Aamodt）和普拉扎（Plaza）等建立的4R模型。4R模型把CBR视作一个循环过程，这一循环过程由检索（Retrieve）、重用（Reuse）、修正（Revise）和存储（Retain）四个阶段组成，即通过检索得到一个或几个相似的源案例；然后重用相应的解决方案或者以此为基础修正案例来解决新问题；最后，存储新案例供未来的问题求解使用。经过四十多年的发展，CBR技术已在医疗诊断、故障维护、军事决策、软件成本估算、财务危机预警、交通管理等领域体现出有效应用潜力。从这些领域，可以归纳出CBR可承担的智能推理任务有：解释问题、解决问题或预测问题等。解释型CBR的推理目标是通过比较和对比已经被分类的案例，来对一个新案例进行分类...

【技术保护点】
1.一种案例推理分类器案例检索方法，其特征在于，包括：S1，案例库规约特征选择；S2，C4.5算法与案例库分簇决策树训练；S3，加权投票KNN方法。

【技术特征摘要】
1.一种案例推理分类器案例检索方法，其特征在于，包括：S1，案例库规约特征选择；S2，C4.5算法与案例库分簇决策树训练；S3，加权投票KNN方法。2.根据权利要求1所述的案例推理分类器案例检索方法，其特征在于，所述步骤S1包括：采用基于信息增益比率的特征排列评估方法，按照特征排列次序，由小到大，利用过滤器算法，以逐步后向删除方向进行特征选择，采用C4.5算法进行特征分类性能评价，直至分类准确率开始下降为止；决策树规约特征选择算法流程如下：S11，以信息增益比率作为评估标准，生成FA排列次序；S12，过滤FA中信息增益比率为0的特征，生成初次选择特征集FA1;S13，调用C4.5算法，在FA1上生成训练数据集D的分类准确率A1；S14，去除FA1中信息增益比率最小的特征为特征集FA2;S15，调用C4.5算法，在FA2上生成训练数据集D的分类准确率A2；S16，如果A2>=A1,则A1=A2,FA1=FA2,转向步骤S14；S17，输出A=FA1。3.根据权利要求1所述的案例推理分类器案例检索方法，其特征在于，所述步骤S2包括：GWCBR分类器采用C4.5算法训练案例库分簇决策树，用案例特征的信息增益比选择决策树结点，信息增益比率的计算以熵为基础，熵表示案例库的类别纯度；若案例库S的类特征有m个取值，S的熵定义为：（2-1）其中，为类i在案例库S中出现的概率；条件熵表示在已知特征值A的条件下，案例库S的不确定性，定义为：（2-2）其中,是属性A的值域集合，是S中属性A取值为v的子集；案例特征A的信息增益(Informationgain)指的是使用特征A划分案例库，划分前后熵的变化，用(2-3)式表示：(2-3)应用案例特征的信息增益作为决策树生成结点选择准则，存在偏袒多值特征的内在缺陷，需引入信息增益比进行校正，用(2-4)式表示：(2-4)其中，案例库S的分簇决策树训练算法如下：S21，如果S...

【专利技术属性】
技术研发人员：代祖华，徐进，李克龙，王玉环，李晓婷，李泓毅，张光辉，周安伟，
申请(专利权)人：西北师范大学，
类型：发明
国别省市：甘肃,62

全部详细技术资料下载我是这个专利的主人