【技术实现步骤摘要】
一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
本专利技术属于肿瘤基因表达谱数据的计算机分析技术的应用领域,具体涉及一种基于粒子群优化和打分准则的肿瘤关键基因识别方法。
技术介绍
近几年的统计研究表明,肿瘤已成为危害人类健康的主要疾病之一,其患病率逐年递增,肿瘤的不同亚型对治疗手段有很大区别,因此对肿瘤的分类和亚型判别是疾病能否治愈的首要关键。然而研究表明,肿瘤的治病基因通常为少量的几个至几十个,而微阵列数据高维小样本的特点成为筛选致病基因的巨大挑战,因此从几千万个基因中挑选出疾病的特征基因是要解决的关键问题。关键基因识别即通过数据分析手段,从成千上万个基因中准确挑选出那些与肿瘤类型和亚型相关的基因,以便于建立准确的分类模型。常见的基因选择方法有很多,通常分为三类:过滤法、缠绕法和嵌入法,其主要区别在于是否有分类器的参与。随着研究的深入,进化算法逐渐被引用到基因选择中来,如遗传算法,模拟退火算法,蚁群算法和粒子群算法等。相比于其它算法,粒子群算法PSO简便,高效,易于收敛于全局最优解的优点使它受到大量学者的青睐。PSO具有无复杂的遗传操作,可调参数少,易于实现 ...
【技术保护点】
一种基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,包括下列步骤:步骤1肿瘤基因表达谱数据的预处理,包括肿瘤基因表达谱数据集的归一化和初步降维,同时将肿瘤基因表达谱数据集划分为训练集和测试集;步骤2定义打分准则结合极端学习机对各基因进行评价,并筛选出得分靠前的基因建立备选基因库;步骤3结合基因打分信息,利用粒子群优化从备选基因库中筛选出最优的肿瘤关键基因子集。
【技术特征摘要】
1.一种基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,包括下列步骤:步骤1肿瘤基因表达谱数据的预处理,包括肿瘤基因表达谱数据集的归一化和初步降维,同时将肿瘤基因表达谱数据集划分为训练集和测试集;步骤2定义打分准则结合极端学习机对各基因进行评价,并筛选出得分靠前的基因建立备选基因库;步骤3结合基因打分信息,利用粒子群优化从备选基因库中筛选出最优的肿瘤关键基因子集。2.根据权利要求1所述的基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,所述步骤1中包含下列步骤:步骤1.1利用“信噪比”指标及对样本的分类贡献构建分类信息指数;步骤1.2利用步骤1.1的方法删选出200-400个基因;步骤1.3将删选出的基因组合,构成基因集合。3.根据权利要求1所述的基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,所述步骤2中包含下列步骤:步骤2.1基于有效的基因评价集合对每个基因进行打分,其中每个基因的分数由2个部分组成:从基因集合1:基因集合α循环执行:在score1打分准则中,若该基因集合含有此基因,则:score1=score1+α-R(1)其中R为该集合按适应度值的排名;若该基因集合不包含有此基因,则:score1=score1+0(2)在score2打分准则中,若该基因集合含有此基因,则:score2=score2+1(3)若该基因集合不包含有此基因,则:score2=score2+0(4)根据上述方法计算出所有基因的score1和score2,并对所有基因的score1和score2进行归一化处理,得到S1和S2;则第i个基因的最终得分为:Score(i)=S1(i)+S2(i)(5)步骤2.2根据每个基因的最终得分由高到低排序,选取得分较高的前40个基因,将这些基因的集合称为有效基因集合。4.根据权利要求1所述的基于...
【专利技术属性】
技术研发人员:韩飞,唐迪,程准,李秋玮,凌青华,周从华,崔宝祥,
申请(专利权)人:江苏大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。