基于乐观概念的不完备决策信息系统规则提取算法技术方案

技术编号:22847959 阅读:27 留言:0更新日期:2019-12-17 23:04
本发明专利技术公开了基于乐观概念的不完备决策信息系统规则提取算法,针对不完备决策信息系统的规则提取算法,首次提出了一种基于相容关系的乐观概念格,并在此基础上提出相应的不完备决策信息系统的规则提取算法。该算法引入了粒度的概念,在由粗到细的粒度空间下求取每层的乐观概念,并根据乐观概念与决策信息系统中决策属性的关系获取决策信息系统中的最简规则,设定已提取到规则的论域元素是否覆盖整个论域为算法终止条件,最终实现决策信息系统的规则提取过程。并通过定理证明、实例分析说明了新算法的正确性和有效性,并通过实验验证了算法的有效性和快速性。

Rules extraction algorithm of incomplete decision information system based on optimistic concept

【技术实现步骤摘要】
基于乐观概念的不完备决策信息系统规则提取算法
本专利技术基于乐观概念的不完备决策信息系统规则提取算法,属于决策信息系统规则提取

技术介绍
信息系统是机器学习的主要研究对象,决策信息系统是信息系统的一种重要的表现形式。决策信息系统的规则提取是数据分析的研究内容之一,粗糙集理论(roughsettheory,RST)是一种有效的处理数据的数学工具,近年来利用粗糙集对决策信息系统的规则提取吸引了大多数学者的研究。1982年Wille提出了概念格(conceptlattice)理论,它是一种刻画不完整和不确定信息的数学工具,能有效地分析不精确、不一致、不完整等各种不完备信息。运用概念格进行数据分析,可以发现数据中隐含的知识、揭示潜在的规律.概念格的研究对象往往是形式背景,且用形式概念表示从形式背景中获得的知识粒,因此概念格理论也被称作形式概念分析(formalconceptanalysis,FCA)。近年来,很多学者利用FCA对决策信息系统的规则提取进行了广泛的研究:针对完备决策信息系统的研究相对较多。不完备决策信息系统的研究更具有显示意义,李想等人将不完备信息系统转换为一种特殊的形式背景,提出了相容概念以及相容概念格,最后基于相容概念获取规则。但相容概念的求取过程比较繁琐,获取的决策规则中存在冗余。魏玲等人研究了基于k阶关系的近似概念获取问题,并分析了它们与形式概念、面向属性概念、面向对象概念之间的关系,但是并没有进行知识获取。FCA和RST具有相同的研究背景和目标,必然也存在一些本质联系.魏玲讨论了FCA与RST中等价类幂集之间的关系,并且给出了由分划构造概念格、由概念格获得划分的具体方法;Kang基于FCA理论提出了一种粗糙集理论模型,该模型提供了一个信息系统中代数结构问题的解决方案,并定义了粗糙集概念来进行规则提取,但是该模型最终约简的规则中存在冗余规则;Zhu同时将FCA和RST理论用于决策信息系统的多知识获取中,提出了一种新的知识获取算法,该算法降低了传统概念格规则提取算法的复杂度;李金海比较了通过FCA和RST两种理论进行规则提取的过程,用两个规则提取的算法比较了两种方式之间的异同,并对以后两种理论的发展进行了展望,但是文献并没有探讨两种理论之间的对应关系。
技术实现思路
为克服现有技术的不足,本专利技术提供了基于乐观概念的不完备决策信息系统规则提取算法,该算法复杂度低、收敛速度快。本专利技术通过以下技术方案实现:基于乐观概念的不完备决策信息系统规则提取算法,包括如下步骤:步骤一:计算不完备决策信息系统的决策属性下所有相容类,在不同粒度下计算决策属性子集关于论域的相容类;步骤二:计算所有相容类所对应的最小乐观概念;步骤三:对于任意的乐观概念,判断其外延是否为某个决策相容类的子集:针对乐观概念的外延是某个决策相容类的子集的情况,将得到的规则中各属性添加属性值存入规则集;针对乐观概念的外延不是某个决策相容类的子集的情况,对下一个乐观概念进行判断,直至所得到的规则将论域对象完全覆盖为止;步骤四:输出逻辑规则,实现对不完备决策信息系统的规则提取。优选地,所述不完备决策信息系统是指:设完备决策信息系统用一个四元组T={U,A,V,f}来表示,其中U为对象集,A表示属性集,V为全部属性A的值域;f:U×A→V是信息函数;它指定U中每个对象的属性值;对于任意的满足条件的属性集合B,一种不可分辨关系被定义为式中RB表示不可分辨关系,x表示表示论域中任一的对象,y表示表示论域中任一的对象,a表示属性集中的任一属性,f(x,a)表示论域中对象x关于属性a所对应的属性值,f(y,a)表示论域中对象y关于属性a所对应的属性值;而U关于RB的划分表示为U/RB,则U/RB={[x]B|x∈U};其中[x]B表示论域对象x在属性B下的等价类,[x]B={y∈U|(x,y)∈RB};不完备决策信息系统是指:不完备决策信息系统是指:完备决策信息系统中存在使得f(x,a)未知的属性值,记做(f(x,a)=*),则称决策表是不完备的,否则称决策表是完备的。优选地,所述最小乐观概念通过如下方法得到:1)获得最小概念:根据形式概念进行规则提取,因概念的内涵存在冗余属性导致决策规则存在冗余,因此本专利技术在原概念定义的基础上提出了最小概念的定义。在形式背景T=(U,A,I)中,令2U、2A分别为对象集U和属性集A的幂集,对于任意对象集合和任意属性集合Wille定义了两个映射P↑:2U→2A和Q↓:2A→2U:易知,(↑,↓)为2U和2A之间的伽罗瓦(Galois)连接;a表示属性集A中的任一属性,u表示对象集U中的任一对象;三元组T=(U,A,I)为一个形式背景,U为对象集,A表示属性集,表示对象与属性之间的二元关系;对于集合满足P↑=Q且Q↓=P;若存在满足且不存在满足则定义概念(P,Q1)为最小概念;通过提取形式背景中的最小概念,在规则提取时可以减少冗余规则的判断,降低算法的复杂度。2)获得乐观概念:由FCA基本概念可知,其研究对象为单值形式背景和多值形式背景,而多值形式背景在形式上与决策信息系统相同,因此FCA也可对决策信息系统进行数据分析。在FCA中,首先需要将决策信息系统转化为单值形式背景,转化之后,每个属性下的每个属性值均在单值背景下充当一个属性。为了避免决策信息系统的扩展会导致增加计算的复杂性,本专利技术考虑概念格与粗糙集的联系,定义了乐观概念。在不完备决策信息系统T=(U,A,V,f)中,U为对象集,A表示属性集,V为全部属性A的值域,f:U×A→V是信息函数,它指定U中每个对象的属性值;设B表示属性集A的子集,B’表示扩展属性集合的子集,P表示对象集U的子集,则集合且由T转化为的单值背景下B扩展的所有属性值为{b1,b2,…,bs};将存在使得B′↓=P的情况,定义(P,B)为一个乐观概念;3)获得最小乐观概念:若在将决策信息系统转化为的单值形式背景下,根据传统形式概念,其内涵不仅蕴含属性并且蕴含属性值;若直接对决策信息系统计算乐观概念,根据我们的专利技术的乐观概念其内涵仅仅蕴含属性。不完备决策信息系统中所有属性子集产生的相容类之间可能存在重复,由此得到外延相同、内涵不同的多个乐观概念。在这种情况下,为保证最终提取的规则中不含冗余,本专利技术定义最小乐观概念便于提取最简规则。在不完备决策信息系统T=(U,A,V,f)中,其中U为对象集,A表示属性集,V为全部属性A的值域,f:U×A→V是信息函数,它指定U中每个对象的属性值;对于任意满足条件的属性集合B,设属性集B关于U的任一个相容类为UB,针对不存在的情况,使得B′关于U的相容类为UB′,UB′满足UB′=UB,则称乐观概念(UB,B)为最小乐观概念。在相同的粒度下,设两个属性子集为B1和B2,且满足|B1|=|B本文档来自技高网
...

【技术保护点】
1.基于乐观概念的不完备决策信息系统规则提取算法,其特征在于,包括如下步骤:/n步骤一:计算不完备决策信息系统的决策属性下所有等价类,在不同粒度下计算决策属性子集关于论域的相容类;/n步骤二:计算所有相容类所对应的最小乐观概念;/n步骤三:对于任意的乐观概念,判断其外延是否为某个决策相容类的子集:/n针对乐观概念的外延是某个决策相容类的子集的情况,将得到的规则中各属性添加属性值存入规则集;/n针对乐观概念的外延不是某个决策相容类的子集的情况,对下一个乐观概念进行判断,直至所得到的规则将论域对象完全覆盖为止;/n步骤四:输出逻辑规则,实现对不完备决策信息系统的规则提取。/n

【技术特征摘要】
1.基于乐观概念的不完备决策信息系统规则提取算法,其特征在于,包括如下步骤:
步骤一:计算不完备决策信息系统的决策属性下所有等价类,在不同粒度下计算决策属性子集关于论域的相容类;
步骤二:计算所有相容类所对应的最小乐观概念;
步骤三:对于任意的乐观概念,判断其外延是否为某个决策相容类的子集:
针对乐观概念的外延是某个决策相容类的子集的情况,将得到的规则中各属性添加属性值存入规则集;
针对乐观概念的外延不是某个决策相容类的子集的情况,对下一个乐观概念进行判断,直至所得到的规则将论域对象完全覆盖为止;
步骤四:输出逻辑规则,实现对不完备决策信息系统的规则提取。


2.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法,其特征在于,
所述不完备决策信息系统是指:
设完备决策信息系统用一个四元组T={U,A,V,f}来表示,其中U为对象集,A表示属性集,V为全部属性A的值域;f:U×A→V是信息函数;它指定U中每个对象的属性值;
对于任意的满足条件的属性集合B,一种不可分辨关系被定义为
式中,RB表示不可分辨关系,x、y表示论域中任一的对象,a表示属性集中的任一属性,f(x,a)表示论域中对象x关于属性a所对应的属性值,f(y,a)表示论域中对象y关于属性a所对应的属性值;
而U关于RB的划分表示为U/RB,则U/RB={[x]B|x∈U};其中[x]B表示论域对象x在属性B下的等价类,[x]B={y∈U|(x,y)∈RB};
不完备决策信息系统是指:完备决策信息系统中存在使得f(x,a)未知的属性值,记做(f(x,a)=*),则称决策表是不完备的,否则称决策表是完备的。


3.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法,其特征在于,所述最小乐观概念通过如下方法得到:
1)获得最小概念:
在形式背景T=(U,A,I)中,令2U、2A分别为对象集U和属性集A的幂集,对于任意对象集合和任意属性集合Wille定义了两个映射P↑:2U→2A和Q↓:2A→2U:






易知,(↑,↓)为2U和2A之间的伽罗瓦(Galois)连接;a表示属性集A中的任一属性,u表示对象集U中的任一对象;
三元组T=(U,A,I)为一个形式背景,U为对象集,A表示属性集,表示对象与属性之间的二元关系;对于集合满足P↑=Q且Q↓=P;
若存在满足且不存在满足则定义概念(P,Q1)为最小概念;
2)获得乐观概念:
在不完备决策信息系统T=(U,A,V,f)中,U为对象集,A表示属性集,V为全部属性A的值域,f:U×A→V是信息函...

【专利技术属性】
技术研发人员:陈泽华闫心怡柴晶赵哲峰刘晓峰刘帆
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1