System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于一致粒化的特征选择方法及系统。
技术介绍
1、随着信息采集技术的飞速发展,数据规模的爆发式增长容易导致“维度灾难”。特征选择是粗糙集理论在机器学习和数据挖掘领域中最重要的应用之一。
2、然而,现有的特征选择算法,当处理大规模数据集时,基于粗糙集理论的大多数特征选择算法由于计算复杂度过高而很难在有限的资源下完成计算;例如:基于粗糙集理论的特征选择方法在计算效率和分类精度方面的表现通常无法满足大规模数据的需求。
技术实现思路
1、本专利技术目的在于公开一种基于一致粒化的特征选择方法及系统,以提高特征选择的效率。
2、为达上述目的,本专利技术方法包括:
3、步骤s1、获取至少两个样本与至少两个特征之间的关系表;
4、步骤s2、对所述关系表进行归一化处理;
5、步骤s3、将归一化处理后的对各特征在0至1之间的取值范围均分成统一数量的至少两个区间;
6、步骤s4、对任一特征,根据各样本对应的标签依次执行无粒子区间删除、相邻区间同标签一致性粒子之间的区间融合及区间内粒子非一致性的区间去除处理;再确定所保留区间的粒子半径;
7、步骤s5、判断是否对各特征根据统一设置的粒子半径阈值进行去躁处理,如果否,转步骤s6;如果是,转步骤s7;
8、步骤s6、对任一特征,将被纳入相对应保留区间中的样本赋值为1,对未被纳入保留区间中的样本赋值为0,得到第一特征一致性关系表;
...【技术保护点】
1.一种基于一致粒化的特征选择方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,样本标签采用二分类标签。
3.根据权利要求1所述的方法,其特征在于,所述粒子半径阈值大于区间数量与标签分类数量乘积的倒数。
4.一种基于一致粒化的特征选择系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至3任一所述方法。
【技术特征摘要】
1.一种基于一致粒化的特征选择方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,样本标签采用二分类标签。
3.根据权利要求1所述的方法,其特征在于,所述粒子半径阈值大于区间数量与...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。