【技术实现步骤摘要】
本专利技术涉及机器学习,尤其涉及一种基于遗传算法的生物标志物识别方法。
技术介绍
1、随着科学技术的发展,生物医学数据分析引起了越来越多研究人员的关注,临床上已证实很多疾病同基因之间存在着密切的关系。通常,表达水平与疾病发生高度相关的基因被称为生物标志物。生物标志物的发现对于研究人员以及医学或制药公司而言都是至关重要的。为寻找信息最丰富的标志物以及过滤多余和不相关的标志物,微阵列数据分析(特征选择)技术应运而生,该技术能选择有效的标志物,这些标志物可以实现对疾病的预测、诊断。
2、特征选择用于选择最重要的基因特征,同时最大限度地提高分类准确率,可实现生物标志物的提取。根据评估标准的不同,特征选择方法可分为三类:过滤法(filter)、包装法(wrapper)和嵌入法(embedded)。过滤法通过单独评估每个特征和统计评分来选择特征,而不使用任何分类器。包装法使用分类器的性能准确性来评估特征,在性能方面比过滤法更有效,但计算成本较高。嵌入法的模型效果在过滤法与包装法之间,但需要模型的支持。使用一种特征选择方法并不能保证获得普
...【技术保护点】
1.一种基于遗传算法的生物标志物识别方法,其特征在于:对高维的基因微阵列数据进行过滤,保留M个特征;再通过多种机器学习算法对过滤后的基因微阵列数据进行特征选择,结合特征选择结果与OBL算法得到初始化种群,然后通过加入聚类,改进遗传算子与种群更新操作平衡全局搜索和局部优化,从而保留最优特征子集,实现生物标志物的识别。
2.根据权利要求1所述的一种基于遗传算法的生物标志物识别方法,其特征在于:包括以下步骤:
3.根据权利要求2所述的一种基于遗传算法的生物标志物识别方法,其特征在于:所述步骤1利用最小冗余最大相关算法mRMR对给定的基因微阵列数据进行
...【技术特征摘要】
1.一种基于遗传算法的生物标志物识别方法,其特征在于:对高维的基因微阵列数据进行过滤,保留m个特征;再通过多种机器学习算法对过滤后的基因微阵列数据进行特征选择,结合特征选择结果与obl算法得到初始化种群,然后通过加入聚类,改进遗传算子与种群更新操作平衡全局搜索和局部优化,从而保留最优特征子集,实现生物标志物的识别。
2.根据权利要求1所述的一种基于遗传算法的生物标志物识别方法,其特征在于:包括以下步骤:
3.根据权利要求2所述的一种基于遗传算法的生物标志物识别方法,其特征在于:所述步骤1利用最小冗余最大相关算法mrmr对给定的基因微阵列数据进行过滤,保留和目标基因具有最小冗余和最大相关的特征,初步得到m个特征构成的特征样本数据集data。
4.根据权利要求2所述的一种基于遗传算法的生物标志物识别...
【专利技术属性】
技术研发人员:栗伟,赵敏清,潘智超,谢维冬,冯朝路,杨金柱,覃文军,曹鹏,赵大哲,
申请(专利权)人:东北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。