一种基于邻域粗糙集属性约简算法的数据检测方法技术

技术编号:37167311 阅读:21 留言:0更新日期:2023-04-20 22:40
本发明专利技术属于数据分析处理技术领域,具体涉及一种基于邻域粗糙集属性约简算法的数据检测方法,该方法包括:获取待检测样本,待检测样本包括决策属性集和邻域半径;对决策属性集中的属性进行筛选,得到候选属性子集;跟据邻域半径采用快速邻域搜索机制对候选属性子集中的数据进行处理,将处理后的数据进行存储,当候选属性子集中所有的数据处理完成,输出存储的数据;本发明专利技术提供的多属性下的快速邻域计算方法,可适用于任何多属性下的邻域计算,减小了邻域计算中的邻域搜索范围,提高了多属性下的邻域计算效率。的邻域计算效率。的邻域计算效率。

【技术实现步骤摘要】
一种基于邻域粗糙集属性约简算法的数据检测方法


[0001]本专利技术属于数据分析处理
,具体涉及一种基于邻域粗糙集属性约简算法的数据检测方法。

技术介绍

[0002]随着社会的不断发展,人民群众对医疗的需求不断增长,然而现有的医疗资源分配不均、医疗资源匮乏成为一大社会矛盾。传统医疗完全依靠医生综合分析病人的多种仪器和设备的检查和检验项目做出病情诊断,整个诊断周期持续时间长。人工智能辅助医疗是人工智能的重要应用,借助人工智能机器学习、医学图像处理、深度学习等技术,提高医学诊断的效率,是缓解当前医疗诊断效率低下的重要手段。
[0003]医疗数据中存在对病情诊断冗余或不相关的属性,这些属性的存在甚至会降低最终诊断结果的准确性。属性约简也叫特征选择,是保持分类器分类性能不变的情况下消除冗余和不相关属性的重要方法。邻域粗糙集属性约简是属性约简中一种常用的方法。其使用样本之间的邻域关系来判断样本的是否可以被正确分类。然而传统邻域计算中,求解每个样本的邻域时需要计算该样本和论域内所有样本之间的关系。假设论域内有n个样本,则每个样本需要计算n次,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,包括:获取待检测样本,待检测样本包括决策属性集和邻域半径;对决策属性集中的属性进行筛选,得到候选属性子集;跟据邻域半径采用快速邻域搜索机制对候选属性子集中的数据进行处理,将处理后的数据进行存储,当候选属性子集中所有的数据处理完成,输出存储的数据。2.根据权利要求1所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,对决策属性集中的属性进行筛选的过程包括:跟据决策属性集中的数据属性对数据进行划分,划分的标准为样本数据中的属性数量;若只存在一个属性,则将该样本数据划分为单属性样本数据;若存在两个及两个以上的属性,则该样本数据划分为多属性样本数据;将单属性样本数据和多属性样本数据作为候选属性子集。3.根据权利要求1所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,采用快速邻域搜索机制对候选属性子集中的数据进行处理的过程包括:S1、初始化非冗余属性子集S2、跟据候选数据集中的数据为非冗余属性子集添加候选属性;S3、采用快速邻域搜索机制对非冗余属性子集中的属性进行计算,得到其中,B{a
i
}表示属性集合B并上a
i
后生成的新的集合;表示样本x
j
在B{a
i
}下生成的δ

邻域;S4、对内的所有样本标签进行判断,若所有样本标签一致,则该样本为正域样本,且POS
i

POS
i
{x
j
};否则该样本为边界域样本;其中,POS
i
表示B{a
i
}关于决策属性D的正域,D为论域U的决策属性;S5、获取最大POS
i
所对应的属性,并将该属性添加到非冗余属性子集B中;S6、确定候选数据集中的数据是否处理完,若处理完则输出非冗余属性子集B,否则返回步骤S2。4.根据权利要求3所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,快速邻域搜索机制包括单属性下的快速邻域搜索机制和多属性下的快速邻域搜索机制。5.根据权利要求4所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,采用单属性下的快速邻域搜索机...

【专利技术属性】
技术研发人员:彭小利王平龚远林王成蒲宬亘钱洁陈伟琪
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1