一种应用于不完备多粒度信息系统的属性约简技术方案

技术编号：19009574 阅读：24 留言：0更新日期：2018-09-22 09:23

本发明专利技术公开了一种应用于不完备多粒度信息系统的属性约简方法，属于数据挖掘与知识发现技术领域。本发明专利技术提出的属性约简算法解决了传统采用不可分辨矩阵的计算复杂度高等缺点，它结合了证据理论，将下近似约简问题转化为保持信任度计算的问题，通过信任度的启发式的方式将相对信任度最高的属性添加到约简集合中，直至满足约束条件。该方法缩短了不完备多粒度序信息系统的属性约简时间，提高了结果的准确性。

Attribute reduction applied to incomplete multi granularity information systems

The invention discloses an attribute reduction method applied to an incomplete multi-granularity information system, belonging to the technical field of data mining and knowledge discovery. The attribute reduction algorithm proposed by the invention solves the shortcoming of high computational complexity of traditional indistinguishable matrix. It combines the evidence theory, transforms the problem of lower approximation reduction into the problem of trust-preserving computation, and adds the attribute with the highest relative trust degree to the reduction set through the heuristic method of trust degree. Until the constraint condition is satisfied. This method shortens the attribute reduction time of incomplete multi-granularity order information system and improves the accuracy of the result.

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于不完备多粒度信息系统的属性约简
本专利技术涉及一种应用于不完备多粒度序信息系统的属性约简，属于数据挖掘与知识发现

技术介绍
在现实生活中，由于现实的数据日益复杂化和多样，经典粗糙集理论已无法很好的满足实际需。通常一个信息系统中每一个对象的每一个属性只能呈现一个观测值，这样的信息系统反应固定尺度下的对象信息，经典的Pawlak信息系统便是一个单尺度的信息系统.然而，在实际应用中，人们观察数据时，根据不同的尺度可以得到不同层次观测值，且不同层次间并不是独立度.例如，某班一次考试成绩用百分制时，成绩取值范围为0到100；用五级制表示成绩时，取值范围为优、良、中、及格和不及格；用二级制表示成绩时，取值范围为合格和不合格，等等.当选取不同粒度偏好的时候，往往问题的求解会变的更加容易。目前多粒度信息系统由于其本身的应用价值已经受到了广泛地关注。对于多粒度信息系统而言，其属性并不是具有相同的重要性，甚至有些属性是冗余的，不必要的。与其它数据降维的方法相比，其优势在于能够保持其数据本身的语义特征。目前关于多粒度信息系统的属性约简主要是基于传统的不可分辨矩阵展开的，这种方法由于其计算复杂性以及计算量大，导致其不能够应用于大型数据。证据理论是处理不确定性问题的重要工具，它与粗糙集具有较强的互补性。因此考虑将证据理论中的信任函数与似然函数引入到多粒度信息系统中，从而从一个新的角度构建出一个算法。
技术实现思路
本专利技术的目的是为了解决多粒度信息系统中属性约简复杂、难以计算、不可并行化以及难以应用大数据的问题，提出了一种新的基于信任结构的属性约简方法，通过信任函...
一种应用于不完备多粒度信息系统的属性约简

【技术保护点】
1.一种应用于不完备多粒度信息系统的属性约简方法。其主要的特点为通过证据结构的似然函数和信任函数表示多粒度序信息系统的每一个粒度层的上、下近似；通过属性的相对重要性以及信任函数之和来获取每一个粒度层的约简集合，从而使粗粒度层的约简集合即为整个信息系统的约简集合。

【技术特征摘要】
1.一种应用于不完备多粒度信息系统的属性约简方法。其主要的特点为通过证据结构的似然函数和信任函数表示多粒度序信息系统的每一个粒度层的上、下近似；通过属性的相对重要性以及信任函数之和来获取每一个粒度层的约简集合，从而使粗粒度层的约简集合即为整个信息系统的约简集合。2.根据权利要求1所述的方法，其中，通过属性的...

【专利技术属性】
技术研发人员：帅勇，王加阳，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人