一种基于知识粒度的矩阵增量约简方法技术

技术编号:11191808 阅读:157 留言:0更新日期:2015-03-25 20:25
本发明专利技术公开了一种基于知识粒度的矩阵增量约简方法,包括如下步骤:首先利用等价关系矩阵计算已有决策表(称为旧决策表)的最小属性约简(REDU);接着当一些新对象添加到旧决策表后(称为新决策表),通过矩阵增量方法计算旧决策表中最小属性约简的知识粒度和新决策表的知识粒度,并判断他们是否相等,如不相等,在新决策表中利用矩阵增量方法计算除REDU之外所有属性的外部重要性,并依次循环选取其中外部重要性最大的属性添加到REDU中,再计算REDU的知识粒度,直到其与新决策表的知识粒度相等为止;最后循环删除REDU中的冗余属性,得到新决策表的最小属性约简。本发明专利技术有效地解决了决策表中对象动态增加时快速求解最小属性约简的问题,从而有助于提高知识发现的效率。

【技术实现步骤摘要】
一种基于知识粒度的矩阵增量约简方法
本专利技术涉及人工智能中粒计算和粗糙集理论的
,具体涉及一种基于知识粒度的矩阵增量约简方法。
技术介绍
目前随着存储技术的不断发展和广泛应用,实际应用中的信息系统不仅积累了海量的、各种各样的数据,而且这些实时数据每时每刻都会发生变化,用传统批量学习的知识获取方法对复杂数据进行挖掘,需要耗费大量的时间,这使得批量学习算法将很难及时、高效地从动态数据中提取有用的信息及知识。增量学习是一个能够不断从来自环境的新样本中学习到新的知识,并能保留大部分以前已有知识的学习系统。通过使用增量学习技术,可以渐进地进行知识更新,修正和加强以前的知识,而不必重新学习全部数据,这在一定程度更能适应实际需求。由于经典的知识粒度约简方法是利用集合交与并的方式来实现,计算和表示形式都比较复杂,矩阵理论是一门具有实用价值的数学理论,它是处理大量有限维空间方式与数量关系的强有力工具,已广泛应用于科学研究和工程应用等领域,用矩阵方法解决粗糙集属性约简问题具有重要应用价值。本专利技术基于知识粒度的矩阵增量约简方法,只涉及到矩阵运算,通过等价关系矩阵的加减计算决策表的知识粒度、决策表的核、条件属性的内部和外部重要性等,由于现有大部分软件工具(如MATLAB等)支持矩阵运算,故本专利技术提出的基于知识粒度的矩阵增量约简方法可以借助已有工具易于实现。
技术实现思路
鉴于现有的实时数据每时每刻都会发生变化,传统批量学习的知识获取方法需要耗费大量的时间,很难及时、高效地从动态数据中提取有用的信息,本专利技术的目的是运用矩阵运算操作简单的优势,有效地解决决策表中对象动态增加时,充分利用旧决策表已经得到的结果,快速求解最小属性约简的问题,避免重复计算,提高约简效率。本专利技术的目的是通过如下手段实现:一种基于知识粒度的矩阵增量约简方法,利用旧决策表计算约简的过程中已经得到的结果—包括旧决策表的知识粒度、属性外部重要性及最小属性约简来计算新决策表的知识粒度、外部重要性及最小属性约简,避免重复计算,具体包括如下步骤:步骤1:输入旧决策表及其最小属性约简REDU、C-REDU中每个属性a相对于REDU的外部重要性知识粒度GPU(D|C)、REDU的知识粒度GPU(D|REDU)和增量数据集UX={xn+1,xn+2,L,xn+t};步骤2:计算增加对象后新决策表的等价关系矩阵步骤3:在旧决策表知识粒度GPU(D|C)和最小属性约简GPU(D|REDU)基础上,利用增量方法计算新决策表知识粒度和REDU的知识粒度如果则跳转到步骤5,否则跳转到步骤4;步骤4:当在旧决策表属性子集C-REDU中每个属性a相对于REDU的外部重要性基础上,通过增量方法计算新决策表属性子集C-REDU中每个属性a相对于REDU的外部重要性依次循环选取最大的属性重要性添加到REDU中,即REDU←REDU∪{a0},计算增加a0后REDU的知识粒度直到其与新决策表的知识粒度相等为止;步骤5:在新决策表中,从后向前遍历REDU中的每一个属性a,利用矩阵方法计算REDU删除属性a后的知识粒度如果则删除属性a,即REDU←REDU-{a}。最后得到的REDU为新决策表的最小属性约简;步骤6:输出新决策表的最小属性约简其中GPU(D|C)为旧决策表的知识粒度,GPU(D|REDU)为旧决策表中REDU的知识粒度,为旧决策表属性子集C-REDU中属性a相对于REDU的外部重要性,REDU为旧决策表的最小属性约简,为新决策表的等价关系矩阵,其中为新决策表的知识粒度,为新决策表中REDU的知识粒度,为新决策表属性子集C-REDU中属性a相对于REDU的外部重要性,为新决策表REDU除去属性a的知识粒度,为新决策表的最小属性约简。本专利技术方法在旧决策表的等价关系矩阵、知识粒度及外部属性重要性的基础上,利用增量方法计算新决策表的等价关系矩阵、知识粒度以及外部属性重要性分别为:其中为新决策表的等价关系矩阵,为旧决策表的等价关系矩阵,为新决策表的增量等价关系矩阵,是的转置矩阵,为新决策表的条件属性和决策属性的等价关系增量矩阵,为增量数据集的等价关系矩阵,为新决策表的知识粒度,GPU(D|C)为旧决策表的知识粒度,为增量数据集的知识粒度,|U∪UX|是新决策表所有对象的个数,|U|是旧决策表所有对象的个数,|UX|是增量数据集所有对象的个数,是属性子集C-REDU中属性a相对于REDU的外部重要性,Sum(·)t×n为矩阵所有元素的和,|·|2代表对象个数的平方。本专利技术提供了一种基于知识粒度的矩阵增量约简方法,该方法通过旧决策表的等价关系矩阵来计算旧决策表的知识粒度、核及其属性内部和外部的重要性等。在此基础上,当一些新对象添加到旧决策表后(称为新决策表),使用增量学习方法,定义了新决策表的等价关系增量矩阵,以及新决策表的知识粒度和属性内部及外部的重要性的增量更新机理。在旧决策表最小属性约简的基础上,构造了基于知识粒度的矩阵增量约简算法,能够有效地解决决策表中对象动态增加时快速求解最小属性约简的问题。当一些新对象添加到旧决策表后,计算新决策表的最小属性约简,非增量矩阵约简算法每次都需要重新开始计算,找到新的最小属性约简消耗时间巨大;而采用本专利技术的增量约简算法则是在旧决策表的等价关系、属性外部重要性、知识粒度以及最小属性约简的基础上,计算新决策表的等价关系矩阵、属性外部重要性及知识粒度,能够快速找到新决策表的最小属性约简,所以本算法计算新决策表最小属性约简速度远快于非增量矩阵方法。与现有技术相比,本专利技术的积极效果是:一、区别于经典的知识粒度约简方法,本专利技术通过等价关系矩阵的加减计算决策表的知识粒度、核及其属性内部和外部的重要性等,计算操作简单,实现容易。由于经典的知识粒度约简方法是利用集合交与并的方式来实现,计算和表示形式都比较复杂,本专利技术基于知识粒度的矩阵约简方法,只涉及到矩阵运算。由于现有大部分软件工具(如MATLAB等)支持矩阵运算,故本专利技术提出的基于知识粒度的矩阵增量约简的方法可以借助已有工具易于实现。二、区别于经典的矩阵约简方法,本专利技术在旧决策表增加新对象后可快速找出新决策表的最小属性约简。目前现有的大多数算法均是以静态决策表为基础而设计的,因而导致不能有效地利用旧决策表中计算约简的过程中产生的大量有用信息,特别是对一些实时性要求较高的场合不太适宜。由于现实中许多决策表中的对象都是动态增加的,本专利技术通过增量更新方法,在旧决策表的知识粒度、属性外部重要性及最小属性约简的基础上,计算新决策表的知识粒度、属性外部重要性及最小属性约简,避免重复计算,缩减计算时间,能够快速找到新决策表的最小属性约简,提高约简计算效率。附图说明图1为本专利技术针对不同数据集,矩阵增量约简方法和非增量约简方法的计算时间比较结果图图2为本专利技术针对增加不同大小的对象集时,矩阵增量约简方法和非增量约简方法的计算时间比较结果图子图a)为把不同百分比的对象增加到cancer数据集时,矩阵增量约简方法和非增量约简方法的计算时间比较结果图子图b)为把不同百分比的对象集增加到Kr-vs-kp数据集时,矩阵增量约简方法和非增量约简方法的计算时间比较结果图子图c)为把不同百分比的对象集增加到Dermatology数据集时,矩阵本文档来自技高网...
一种基于知识粒度的矩阵增量约简方法

【技术保护点】
一种基于知识粒度的矩阵增量约简方法,利用旧决策表计算约简的过程中已经得到的结果—包括旧决策表的知识粒度、属性外部重要性及最小属性约简来计算新决策表的知识粒度、外部重要性及最小属性约简,避免重复计算,具体包括如下步骤:步骤1:输入旧决策表及其最小属性约简REDU、C‑REDU中每个属性a相对于REDU的外部重要性知识粒度GPU(D|C)、REDU的知识粒度GPU(D|REDU)和增量数据集UX={xn+1,xn+2,…,xn+t};步骤2:计算增加对象后新决策表的等价关系矩阵步骤3:在旧决策表知识粒度GPU(D|C)和最小属性约简GPU(D|REDU)基础上,利用增量方法计算新决策表知识粒度和REDU的知识粒度如果则跳转到步骤5,否则跳转到步骤4;步骤4:当在旧决策表属性子集C‑REDU中每个属性a相对于REDU的外部重要性基础上,通过增量方法计算新决策表属性子集C‑REDU中每个属性a相对于REDU的外部重要性依次循环选取最大的属性重要性添加到REDU中,即REDU←REDU∪{a0},计算增加a0后REDU的知识粒度直到其与新决策表的知识粒度相等为止;步骤5:在新决策表中,从后向前遍历REDU中的每一个属性a,利用矩阵方法计算REDU删除属性a后的知识粒度如果则删除属性a,即REDU←REDU‑{a}。最后得到的REDU为新决策表的最小属性约简;步骤6:输出新决策表的最小属性约简其中GPU(D|C)为旧决策表的知识粒度,GPU(D|REDU)为旧决策表中REDU的知识粒度,为旧决策表属性子集C‑REDU中属性a相对于REDU的外部重要性,REDU为旧决策表的最小属性约简,为新决策表的等价关系矩阵,其中为新决策表的知识粒度,为新决策表中REDU的知识粒度,为 新决策表属性子集C‑REDU中属性a相对于REDU的外部重要性,为新决策表中REDU除去属性a的知识粒度,为新决策表的最小属性约简。...

【技术特征摘要】
1.一种基于知识粒度的矩阵增量约简方法,利用旧决策表计算约简的过程中已经得到的结果—包括旧决策表的知识粒度、属性外部重要性及最小属性约简来计算新决策表的知识粒度、外部重要性及最小属性约简,避免重复计算,具体包括如下步骤:步骤1:输入旧决策表及其最小属性约简REDU、C-REDU中每个属性a相对于REDU的外部重要性知识粒度GPU(D|C)、REDU的知识粒度GPU(D|REDU)和增量数据集UX={xn+1,xn+2,…,xn+t};步骤2:计算增加对象后新决策表的等价关系矩阵步骤3:在旧决策表知识粒度GPU(D|C)和最小属性约简GPU(D|REDU)基础上,利用增量方法计算新决策表知识粒度和REDU的知识粒度如果则跳转到步骤5,否则跳转到步骤4;步骤4:当在旧决策表属性子集C-REDU中每个属性a相对于REDU的外部重要性基础上,通过增量方法计算新决策表属性子集C-REDU中每个属性a相对于REDU的外部重要性依次循环选取最大的属性重要性添加到REDU中,即REDU←REDU∪{a0},计算增加a0后REDU的知识粒度直到其与新决策表的知识粒度相等为止;步骤5:在新决策表中,从后向前遍历REDU中的每一个属性a,利用矩阵方法计算REDU删除属性a后的知识粒度如果则删除属性a,即REDU←REDU-{a},最后得到的REDU为新决策表的最小属性约简;步骤6:输出新决策表的最小属性约简其中C为条件属性集,D为决策属性集,GPU(D|C)为旧决策表的知识粒度,GPU(D|REDU)为旧决策表中REDU的知识粒度,为旧决策表属性子集C-REDU中属性a相对于REDU的外部重要性,REDU为旧决策表的最小属性约简,为新决策表的等价关系矩阵,其中为新决策表的知识粒度,为新决策表中REDU的知识粒度,为新决策表属性子集C-REDU中属性a相对于REDU的外部重要性,为新决策表中REDU除去属性a的知识粒度,为新决策表的最小属性约简。2.根据权利要求1所述的一种基于知识粒度的矩阵增量约简方法,其特征在于:在旧决策表的等价关系矩阵、知识粒度及外部属性重要性的基础上,利用增量方法计算新决策表的等价关系矩阵、知识粒度以及外部属性重要性分别为:

【专利技术属性】
技术研发人员:李天瑞景运革余增
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1