当前位置: 首页 > 专利查询>江苏大学专利>正文

一种基于粒子群优化和打分准则的肿瘤关键基因识别方法技术

技术编号:15823000 阅读:35 留言:0更新日期:2017-07-15 05:06
本发明专利技术公开了一种基于粒子群优化和打分准则的肿瘤关键基因识别方法,包括定义一种基因打分准则来获取基因分类能力信息以过滤于肿瘤类别低相关的基因;结合基因分类能力信息利用Metropolis准则改进粒子群PSO算法以实现肿瘤关键基因的识别。本发明专利技术基因分类信息和改进PSO的新方法克服了传统的基于PSO识别肿瘤关键基因方法易于陷入局部最优解的缺点,并能选出数目更少且与肿瘤类别高度相关的基因子集,从而有助于提高后续的肿瘤识别。

【技术实现步骤摘要】
一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
本专利技术属于肿瘤基因表达谱数据的计算机分析技术的应用领域,具体涉及一种基于粒子群优化和打分准则的肿瘤关键基因识别方法。
技术介绍
近几年的统计研究表明,肿瘤已成为危害人类健康的主要疾病之一,其患病率逐年递增,肿瘤的不同亚型对治疗手段有很大区别,因此对肿瘤的分类和亚型判别是疾病能否治愈的首要关键。然而研究表明,肿瘤的治病基因通常为少量的几个至几十个,而微阵列数据高维小样本的特点成为筛选致病基因的巨大挑战,因此从几千万个基因中挑选出疾病的特征基因是要解决的关键问题。关键基因识别即通过数据分析手段,从成千上万个基因中准确挑选出那些与肿瘤类型和亚型相关的基因,以便于建立准确的分类模型。常见的基因选择方法有很多,通常分为三类:过滤法、缠绕法和嵌入法,其主要区别在于是否有分类器的参与。随着研究的深入,进化算法逐渐被引用到基因选择中来,如遗传算法,模拟退火算法,蚁群算法和粒子群算法等。相比于其它算法,粒子群算法PSO简便,高效,易于收敛于全局最优解的优点使它受到大量学者的青睐。PSO具有无复杂的遗传操作,可调参数少,易于实现等优点,因此近年来它本文档来自技高网...
一种基于粒子群优化和打分准则的肿瘤关键基因识别方法

【技术保护点】
一种基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,包括下列步骤:步骤1肿瘤基因表达谱数据的预处理,包括肿瘤基因表达谱数据集的归一化和初步降维,同时将肿瘤基因表达谱数据集划分为训练集和测试集;步骤2定义打分准则结合极端学习机对各基因进行评价,并筛选出得分靠前的基因建立备选基因库;步骤3结合基因打分信息,利用粒子群优化从备选基因库中筛选出最优的肿瘤关键基因子集。

【技术特征摘要】
1.一种基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,包括下列步骤:步骤1肿瘤基因表达谱数据的预处理,包括肿瘤基因表达谱数据集的归一化和初步降维,同时将肿瘤基因表达谱数据集划分为训练集和测试集;步骤2定义打分准则结合极端学习机对各基因进行评价,并筛选出得分靠前的基因建立备选基因库;步骤3结合基因打分信息,利用粒子群优化从备选基因库中筛选出最优的肿瘤关键基因子集。2.根据权利要求1所述的基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,所述步骤1中包含下列步骤:步骤1.1利用“信噪比”指标及对样本的分类贡献构建分类信息指数;步骤1.2利用步骤1.1的方法删选出200-400个基因;步骤1.3将删选出的基因组合,构成基因集合。3.根据权利要求1所述的基于粒子群优化和打分准则的肿瘤关键基因识别方法,其特征在于,所述步骤2中包含下列步骤:步骤2.1基于有效的基因评价集合对每个基因进行打分,其中每个基因的分数由2个部分组成:从基因集合1:基因集合α循环执行:在score1打分准则中,若该基因集合含有此基因,则:score1=score1+α-R(1)其中R为该集合按适应度值的排名;若该基因集合不包含有此基因,则:score1=score1+0(2)在score2打分准则中,若该基因集合含有此基因,则:score2=score2+1(3)若该基因集合不包含有此基因,则:score2=score2+0(4)根据上述方法计算出所有基因的score1和score2,并对所有基因的score1和score2进行归一化处理,得到S1和S2;则第i个基因的最终得分为:Score(i)=S1(i)+S2(i)(5)步骤2.2根据每个基因的最终得分由高到低排序,选取得分较高的前40个基因,将这些基因的集合称为有效基因集合。4.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:韩飞唐迪程准李秋玮凌青华周从华崔宝祥
申请(专利权)人:江苏大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1