当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于遗传算法的生物标志物识别方法技术

技术编号:41385226 阅读:20 留言:0更新日期:2024-05-20 19:06
本发明专利技术提供一种基于遗传算法的生物标志物识别方法,涉及机器学习技术领域。该方法首先利用mRMR算法对高维的基因微阵列数据进行过滤;然后通过多种机器学习方法的特征选择结果与OBL算法相结合生成初始化种群,最后使用改进的遗传算法进行最优特征子集的选择,实现生物标志物的识别。该方法融合了不同特征选择算法的优势,还结合了全局搜索和局部搜索进行特征选择,得到的最优个体向量能够保留较少的特征数目且具备较高的分类准确率,实现了较好的分类效果。

【技术实现步骤摘要】

本专利技术涉及机器学习,尤其涉及一种基于遗传算法的生物标志物识别方法


技术介绍

1、随着科学技术的发展,生物医学数据分析引起了越来越多研究人员的关注,临床上已证实很多疾病同基因之间存在着密切的关系。通常,表达水平与疾病发生高度相关的基因被称为生物标志物。生物标志物的发现对于研究人员以及医学或制药公司而言都是至关重要的。为寻找信息最丰富的标志物以及过滤多余和不相关的标志物,微阵列数据分析(特征选择)技术应运而生,该技术能选择有效的标志物,这些标志物可以实现对疾病的预测、诊断。

2、特征选择用于选择最重要的基因特征,同时最大限度地提高分类准确率,可实现生物标志物的提取。根据评估标准的不同,特征选择方法可分为三类:过滤法(filter)、包装法(wrapper)和嵌入法(embedded)。过滤法通过单独评估每个特征和统计评分来选择特征,而不使用任何分类器。包装法使用分类器的性能准确性来评估特征,在性能方面比过滤法更有效,但计算成本较高。嵌入法的模型效果在过滤法与包装法之间,但需要模型的支持。使用一种特征选择方法并不能保证获得普遍最优的特征子集。因本文档来自技高网...

【技术保护点】

1.一种基于遗传算法的生物标志物识别方法,其特征在于:对高维的基因微阵列数据进行过滤,保留M个特征;再通过多种机器学习算法对过滤后的基因微阵列数据进行特征选择,结合特征选择结果与OBL算法得到初始化种群,然后通过加入聚类,改进遗传算子与种群更新操作平衡全局搜索和局部优化,从而保留最优特征子集,实现生物标志物的识别。

2.根据权利要求1所述的一种基于遗传算法的生物标志物识别方法,其特征在于:包括以下步骤:

3.根据权利要求2所述的一种基于遗传算法的生物标志物识别方法,其特征在于:所述步骤1利用最小冗余最大相关算法mRMR对给定的基因微阵列数据进行过滤,保留和目标基因...

【技术特征摘要】

1.一种基于遗传算法的生物标志物识别方法,其特征在于:对高维的基因微阵列数据进行过滤,保留m个特征;再通过多种机器学习算法对过滤后的基因微阵列数据进行特征选择,结合特征选择结果与obl算法得到初始化种群,然后通过加入聚类,改进遗传算子与种群更新操作平衡全局搜索和局部优化,从而保留最优特征子集,实现生物标志物的识别。

2.根据权利要求1所述的一种基于遗传算法的生物标志物识别方法,其特征在于:包括以下步骤:

3.根据权利要求2所述的一种基于遗传算法的生物标志物识别方法,其特征在于:所述步骤1利用最小冗余最大相关算法mrmr对给定的基因微阵列数据进行过滤,保留和目标基因具有最小冗余和最大相关的特征,初步得到m个特征构成的特征样本数据集data。

4.根据权利要求2所述的一种基于遗传算法的生物标志物识别...

【专利技术属性】
技术研发人员:栗伟赵敏清潘智超谢维冬冯朝路杨金柱覃文军曹鹏赵大哲
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1