【技术实现步骤摘要】
一种乳腺癌发生相关特征基因筛选方法
本专利技术属于生物信息学领域,涉及一种乳腺癌发生相关特征基因筛选方法,用于癌症发生相关特征基因的识别以及自动化诊断,具有高效性以及普适性。
技术介绍
基因微阵列技术等高通量基因测序技术及生物信息学的快速发展,为从基因组水平大规模地筛选癌症发病相关基因提供了必要的手段。然而基因甲基化微阵列数据的超高维高噪声小样本特性使少数重要基因信息很容易淹没于全基因组数万基因的噪声中造成信息饱和现象,对特征基因筛选和癌症基因水平的早期诊断造成困难。因此首要的任务是通过特征选择使数据降维。如XieJY等通过辨识度和独立性相结合的特征选择方法,根据基因表达数据对乳腺癌的辨识能力不同,将所有基因按照辨识能力由大到小进行排序,筛选出一组由10个基因组成的基因团,能够很好地区分乳腺癌组织和正常组织(准确率85.32%);王伟,罗林开提出的一种基于信噪比的特征基因筛选方法,对lymphoma数据的分类准确率达到96.15%;阮晓钢,晁浩提出的一种综合信噪比和聚类的特征基因筛选方法,对白血病数据的分类结果达到94.15%;张世芝提出了一种基于支持向量机(Su ...
【技术保护点】
一种乳腺癌发生相关特征基因筛选方法,其特征在于,基于TCGA癌症基因组学数据库中的乳腺癌数据,采用多重筛选方法筛选癌症发生特征基因用于分类模型进行分类。
【技术特征摘要】
1.一种乳腺癌发生相关特征基因筛选方法,其特征在于,基于TCGA癌症基因组学数据库中的乳腺癌数据,采用多重筛选方法筛选癌症发生特征基因用于分类模型进行分类。2.如权利要求1所述的乳腺癌发生相关特征基因筛选方法,其特征在于,所述多重筛选方法综合相关性筛选、差异显著性筛选和弹性网络筛选对全基因组进行多步筛选。3.如权利要求2所述的乳腺癌发生相关特征基因筛选方法,其特征在于,特征基因筛选方法的具体步骤为:1.相关性筛选,筛选甲基化水平与基因表达水平具有明显相关性(甲基化水平与基因表达水平spearman相关系数的绝对值大于0.5)的基因作为候选基因集的第一部分;2.差异显著性筛选,首先,筛选甲基化水平与分类结果具有明显相关性的基因(保留相关系数r>0.5的基因);其次...
【专利技术属性】
技术研发人员:李晓琴,王学栋,常宇,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。