The invention provides a definition and method of local attribute reduction under decision table under the similar approximation. It can reduce attribute complexity and reduce computation complexity while satisfying some decision class of decision table. The definition includes: acquiring decision table (U, C, D), wherein said U domain, C said the condition attribute set, D said the decision attribute set; determine the domain U of the decision attribute set D quotient set, get the decision class Dl; a nonempty set B set C set. If B satisfies the preset conditions, then B is called C on the decision class under the Dl approximation to the local invariant attribute reduction. The method includes: maintaining decision table attribute reduction algorithm based on approximate invariant, the decision table is calculated Dl class decision discernibility matrix; according to the corresponding discernibility matrix, discernibility function, conversion from conjunctive paradigm based disjunctive, local attribute reduction results of all. The present invention is applicable to attribute reduction of rough set decision table.
【技术实现步骤摘要】
一种决策表下近似不变的局部属性约简定义及方法
本专利技术涉及数据挖掘、知识发现、模式识别与机器学习
,特别是一种决策表下近似不变的局部属性约简定义及方法。
技术介绍
属性约简也称之为特征选取,来源于机器学习。属性约简在许多领域都有重要的应用,例如辅助决策、数据挖掘、模式识别等领域。2016年,X.Jia等学者总结了22种属性约简类型,包括正区域约简、分布约简、变精度约简、覆盖约简、交互信息约简和代价敏感性约简。实际上,约简的类型有更多。但目前,针对属性约简问题的研究,基本上属于对决策属性值的整体约简范畴。一般说来,要计算出信息系统所有的约简,目前只能通过分辨矩阵的方法来实现,其基本的算法由波兰学者Skowron和Rauszer给出,大体上通过以下三个步骤来实现:(1)计算分辨矩阵;(2)将分辨函数从其主合取范式(conjunctivenormalform,CNF)转换为主析取范式(disjunctivenormalform,DNF);(3)得出所有约简。但该算法的计算复杂性较高,S.K.Wong和W.Ziarko在1985年已经证明:找出一个信息系统或决策表的所有属性约简子集,是一个NP-hard问题,其中,NP表示非确定性多项式(Non-deterministicPolynomial)。这是由数据组合爆炸引起的,不存在统一、规范的高效方法。
技术实现思路
本专利技术要解决的技术问题是提供一种决策表下近似不变的局部属性约简定义及方法,以解决现有技术所存在的计算复杂性高的问题。为解决上述技术问题,本专利技术实施例提供一种决策表下近似不变的局部属性约简定义, ...
【技术保护点】
一种决策表下近似不变的局部属性约简定义,其特征在于,包括:获取决策表(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;确定论域U关于决策属性集D的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l的取值为l∈{1,2,……,k},k为正整数;设集合B为集合C的非空子集:
【技术特征摘要】
1.一种决策表下近似不变的局部属性约简定义,其特征在于,包括:获取决策表(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;确定论域U关于决策属性集D的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l的取值为l∈{1,2,……,k},k为正整数;设集合B为集合C的非空子集:对于给定的正整数l∈{1,2,……,k},若B满足:(1)RC(Dl)=RB(Dl),其中,RC(Dl)表示保持决策类Dl的等价关系RC的下近似不变的对应元素x的集合,RB(Dl)表示保持决策类Dl的等价关系RB的下近似不变的对应元素x的集合,x∈U;(2)若则RC(Dl)≠RB′(Dl),其中,集合B′为集合B的非空真子集,RB′(Dl)表示保持决策类Dl的等价关系RB’的下近似不变的对应元素x的集合,x∈U;则称B为C的关于决策类Dl的下近似不变的局部属性约简。2.根据权利要求1所述的局部属性约简定义,其特征在于,所述其中,[x]C为包含x的关于等价关系RC的等价类;所述其中,[x]B为包含x的关于等价关系RB的等价类;所述其中,[x]B’为包含x的关于等价关系RB’的等价类。3.一种根据权利要求1所述的定义确定的局部属性约简方法,其特征在于,包括:基于保持决策表下近似不变的属性约简...
【专利技术属性】
技术研发人员:李吉梅,刘贵龙,花正,冯艳宾,邹继阳,
申请(专利权)人:北京语言大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。