【技术实现步骤摘要】
本申请涉及数据挖掘领域,特别是涉及一种基于优化鸦群搜索算法的特征选择方法及装置。
技术介绍
1、在当前的医疗数据挖掘任务中,特征选择是是指从已有的m个特征中选择n个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,所以特征选择是解决大规模数据处理的重要方法之一,然而,现有的特征选择主要通过滤器、包装器进行特征选择,通过过滤器来进行特征选择较为简单,不会占用很多计算资源,但选择特征的质量较低,包装器可以通过分类的方法来选择最佳特征,但包装器的计算开销过大,极易过拟合。
2、另外,有些特征选择方法在全局搜索和局部搜索之间的平衡不足,如遗传算法、粒子群优化和差分进化等算法虽然被广泛应用于特征选择,但这些算法很容易困于局部最优解从而影响特征选择算法的鲁棒性和选择效率,而像混沌理论算法虽然可以平衡局部搜索和全局搜索之间的关系,但其得到的特征选择结果并不是很理想。
3、医疗数据往往数据维度较高且专业性较强,而上述的算法在对高维数据进行特征选择时由于计算复
...【技术保护点】
1.一种基于优化鸦群搜索算法的特征选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“基于选择目标计算每个特征子集的适应度”步骤中,根据特征选择任务的选择目标构建准确性函数,使用准确性函数计算每个特征子集的特征选择准确性,获取每个特征子集的特征选择数量,使用每个特征子集的特征选择准确性和特征选择数量来计算每个特征子集的适应度。
3.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“基于意识概率上限、意识概率下限和每个特征子集在乌鸦适应度序列中的排名计算每
...【技术特征摘要】
1.一种基于优化鸦群搜索算法的特征选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“基于选择目标计算每个特征子集的适应度”步骤中,根据特征选择任务的选择目标构建准确性函数,使用准确性函数计算每个特征子集的特征选择准确性,获取每个特征子集的特征选择数量,使用每个特征子集的特征选择准确性和特征选择数量来计算每个特征子集的适应度。
3.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“基于意识概率上限、意识概率下限和每个特征子集在乌鸦适应度序列中的排名计算每个特征子集的动态意识概率”步骤中,所述动态意识概率的计算公式如下所示:
4.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“对所述全局搜索子集集合执行全局搜索策略得到全局集合”步骤中,获取所述全局搜索子集集合中适应度最高的特征子集作为全局最优特征子集,所述全局集合中的每一特征子集为全局最优特征子集中的特征与医疗数据特征集合中第一数量随机特征的并集。
5.根据权利要求1所述的一种基于优化鸦群搜索算法的特征选择方法,其特征在于,在“对所述局部搜索子集集合执行局部搜索策略得到局部集合”步骤中,根据适应度对所述局部搜索子集集合进行降序排序后得到排序局部搜索子集集合,在排序局部搜索子集集合的顶端顺序选取第二数量的特征子集作为优选局部特征子集,将...
【专利技术属性】
技术研发人员:许振影,张旷,傅亦婷,周华健,曹天佑,蔡静,方震宇,
申请(专利权)人:浙江一山智慧医疗研究有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。