【技术实现步骤摘要】
基于集成学习的癌症预测系统
[0001]本专利技术涉及生物科学领域,尤其涉及一种基于集成学习的癌症预测系统。
技术介绍
[0002]癌症作为当前医学领域最难克服的疾病之一,已经有了很长的研究历史。而随着计算机科学技术的不断发展,采用大数据来分析当前医学领域的大量病患数据已经成为了当前研究的主流。而在如今的数据挖掘研究当中,采用各类机器学习算法对大数据进行切分处理,提取关键特征数据并搭建数学模型也成为了最为热门的方法之一;在更深层次的研究当中,计算机根据医学C
‑
T图像对患癌的病人图片进行深度学习挖掘,通过搭建人工神经网络来学习癌症病理特征的分布以及肿瘤构成形状,通过研究反馈给医生,并做出更加准确的医疗判断。机器学习当中经典的分类预测模型包括决策树、支持向量机等算法,能够准确对病理数据进行分析。深度学习中的人工神经网络,自适应神经网络等算法能够搭建更加复杂的肿瘤分析网络完成更加深度的分析,得到更细致的分析结论。在生物科学研究领域,对于生物基因的研究也促进了癌症诱导因素的分析发展,而当前的研究当中主要是对可表达 ...
【技术保护点】
【技术特征摘要】
1.一种基于集成学习的癌症预测系统,其特征在于:系统包括:特征提取模块,用于对研究数据集中的样本进行特征提取,研究数据集包括病患的生活习惯样本、环境因素样本、体检报告样本;训练优化模块,用于将特征提取模块提取的特征信息作为输入数据集,对分类器进行训练,并在模型训练过程中对支持向量机参数进行优化,进而得到基分类器;集成模块,用于将完成训练的多个基分类器进行集成,得到用于对癌症发病风险进行预测的异态分类器。2.根据权利要求1所述基于集成学习的癌症预测系统,其特征在于:所述特征提取模块基于Relief算法对研究数据集中的样本进行特征提取。3.根据权利要求2所述基于集成学习的癌症预测系统,其特征在于:所述特征提取模块进行特征提取包括:基于Relief算法对研究数据集中的样本进行特征提取得到初始相关性排序数据集;采用局部加权聚类算法对初始相关性排序数据集中样本进行聚类分析,进而将高影响度特征聚类为高相关度聚类组,并将与高影响度特征产生相关的中影响度及低影响度的特征也聚类为高相关度聚类组,将高相关度聚类组作为输入数据集。4.根据权利要求3所述基于集成学习的癌症预测系统,其特征在于:所述采用局部加权聚类...
【专利技术属性】
技术研发人员:周永,付锦涛,李林涛,郑德生,刘建超,温冬,田序伟,尚小磊,李晓瑜,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。