一种医学分析方法、装置、设备及存储介质制造方法及图纸

技术编号:24615017 阅读:20 留言:0更新日期:2020-06-24 01:56
本发明专利技术适用于计算机技术领域,尤其涉及一种医学分析方法、装置、设备及存储介质,所述医学分析方法包括:根据基于集成学习算法训练生成的生物标志物分类模型以及获取的生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果;其中生物标志物分类模型的综合评价分值最高;所述综合评价至少包括准确率评价、特异性评价以及敏感度评价中的两种。本发明专利技术实施例提供的医学分析方法,由于集成学习算法训练生成的生物标志物分类模型是预先在多种特征选择算法和分类算法下集成训练生成的综合评价分值最高的生物标志物集成模型,此时利用该生物标志物模型进行医学分析所得到的分析结果的准确率更高。

A medical analysis method, device, equipment and storage medium

【技术实现步骤摘要】
一种医学分析方法、装置、设备及存储介质
本专利技术属于计算机
,尤其涉及一种医学分析方法、装置、设备及存储介质。
技术介绍
生物标志物可以定义为“作为正常生物过程、致病过程或治疗干预的药理学反应指标而被客观测量和评估的特征”,从大量实验数据中筛选出分类效果好的生物标志物并训练生成相应的医学分析模型可以大大降低后续医学分析的流程。其中筛选出分类效果好的生物标志物通常被称为特征选择。然而,现有的特征选择方法通常都是利用单一的机器学习算法进行特征筛选的,事实上,此时所筛选出的分类效果好的生物标志物的重复性却不一定较高,生物标志物的重复性要求是指被筛选出的生物标志物应该始终表现出良好的性能,在不同的研究中区分病例与对照。也就是说,利用单一的机器学习算法进行特征选择筛选出的生物标志物所训练生成的分析模型稳定性较差,实际应用能力低。可见,利用现有的特征选择方法所筛选出的生物标志物进行训练所生成的分析模型还存在着稳定性较差,实际应用能力低的技术问题。
技术实现思路
本专利技术实施例的目的在于提供一种医学分析方法,旨在解决利用现有的特征选择方法所筛选出的生物标志物进行训练所生成的分析模型还存在着稳定性较差,实际应用能力低的技术问题。本专利技术实施例是这样实现的,一种分析方法,包括:根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果;其中所述基于集成学习算法训练生成的生物标志物分类模型的综合评价分值最高;所述综合评价至少包括准确率评价、特异性评价以及敏感度评价中的两种。本专利技术实施例的另一目的在于提供一种基于集成模型的医学分析装置,包括:分析模块,用于根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果;其中所述基于集成学习算法训练生成的生物标志物分类模型的综合评价分值最高;所述综合评价至少包括准确率评价、特异性评价以及敏感度评价中的两种。本专利技术实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器如上述所述医学分析方法的步骤。本专利技术实施例的另一目的在于提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述所述的医学分析方法的步骤。本专利技术实施例提供的一种医学分析方法,是根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果,由于其中基于集成学习算法训练生成的生物标志物分类模型是预先在多种分类算法下集成训练下生成的综合评价分值最高的生物标志物分类模型,因此此时根据该分类模型所直接分析确定的医学分析结果的准确率以及稳定性均能保持较高的水平,相比于现有的利用其它机器学习方法所训练生成的生物标志物分类模型,在模型分析的效率以及效果上均具有显著地提升,即提供了一种稳定性高,实际应用效果好的医学分析方法。附图说明图1为本专利技术实施例提供的一种医学分析方法的步骤流程图;图2为本专利技术实施例提供的一种训练生成生物标志物分类模型的步骤流程图;图3为本专利技术实施例提供的另一种训练生成生物标志物分类模型的步骤流程图;图4为本专利技术实施例提供的又一种训练生成生物标志物分类模型的步骤流程图;图5为本专利技术实施例提供的一种预先获得潜在生物标志物集合的步骤流程图;图6为本专利技术实施例提供的一种计算潜在生物标志物重要度分值的步骤流程图;图7为为本专利技术实施例提供的一种计算综合评价分值的步骤流程图;图8为本专利技术实施例提供的一种医学分析装置的结构示意图;图9为本专利技术实施例提供的一种用于执行医学分析方法的计算机设备的内部结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。图1为本专利技术实施例提供的一种集成模型的医学分析方法的步骤流程图,具体包括以下步骤步骤S102,根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果。在本专利技术实施例中,所述基于集成学习算法训练生成的生物标志物分类模型的综合评价分值最高。在本专利技术实施例中,所述生物标志物的检测数据主要是指医学中常用作生物标志物的物质例如基因、蛋白质、代谢物的检测含量,本专利技术对具体的生物标志物的种类不做限定,凡是可以用做生物标志物的组别均应当在本专利技术包含的范围之内。在本专利技术实施例中,先利用集成学习算法从多个潜在生物标志物中筛选出在不同算法下对分类效果均具有明显贡献的多个候选生物标志物,筛选的过程中利用AUC(AreaundertheCurveofROC,ROC曲线下方的面积,一种评价模型的指标)进行筛选,然后进一步利用预设的分类算法对筛选出的候选生物标志物进行训练生成AUC、准确率、特异性以及敏感度等综合评价分值最高的生物标志物分类模型。其中,训练生成所述生物标志物分类模型具体请参阅后续图2~图7的解释说明。本专利技术实施例提供的一种医学分析方法,是根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果,由于其中基于集成学习算法训练生成的生物标志物分类模型是预先在多种分类算法下集成训练下生成的综合评价分值最高的生物标志物分类模型,因此此时根据该分类模型所直接分析确定的医学分析结果的准确率以及稳定性均能保持较高的水平,相比于现有的利用其它机器学习方法所训练生成的生物标志物分类模型,在模型分析的效率以及效果上均具有显著地提升,即提供了一种稳定性高,实际应用效果好的医学分析方法。如图2所示,为本专利技术实施例提供的一种训练生成生物标志物集成模型的步骤流程图,具体包括以下步骤:步骤S202,根据样本数据、多种分类算法以及预先获得的潜在生物标志物集合,确定与所述多种分类算法分别对应的多个潜在生物标志物子集合;所述潜在生物标志物集合包括多个潜在生物标志物。在本专利技术实施例中,所述多种分类算法譬如可以是随机森林算法,当然可以是支持向量机,逻辑回归等其他常用的分类算法,本专利技术对具体的分类算法不做限制,凡是利用多种算法进行特征筛选出多个与分类算法分别对应的潜在生物标志物子集合的步骤均应当在本专利技术所要求保护的范围之内。步骤S204,根据预设的评分规则以及所述多个潜在生物标志物子集合,确定各个所述潜在生物标志物的重要度分值,并筛选出多个候选生物标志物。在本专利技术实施例中,每个潜在生物标志物子集合中都会包含多个不同的潜在生物标志物,其中通过评分可以对潜本文档来自技高网...

【技术保护点】
1.一种医学分析方法,其特征在于,包括:/n根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果;其中/n所述基于集成学习算法训练生成的生物标志物分类模型的综合评价分值最高;所述综合评价至少包括准确率评价、特异性评价以及敏感度评价中的两种。/n

【技术特征摘要】
1.一种医学分析方法,其特征在于,包括:
根据基于集成学习算法训练生成的生物标志物分类模型以及获取的所述生物标志物分类模型中的生物标志物的检测数据确定并输出医学分析结果;其中
所述基于集成学习算法训练生成的生物标志物分类模型的综合评价分值最高;所述综合评价至少包括准确率评价、特异性评价以及敏感度评价中的两种。


2.根据权利要求1所述的医学分析方法,其特征在于,所述生物标志物分类模型训练生成的步骤,具体包括:
根据样本数据、多种分类算法以及预先获得的潜在生物标志物集合,确定与所述多种分类算法分别对应的多个潜在生物标志物子集合;所述潜在生物标志物集合包括多个潜在生物标志物;
根据预设的评分规则以及所述多个潜在生物标志物子集合,确定各个所述潜在生物标志物的重要度分值,并筛选出多个候选生物标志物;
根据所述样本数据,分别计算多个候选生物标志物筛选模型在所述多种分类算法下的综合评价分值;所述候选生物标志物筛选模型包括若干个候选生物标志物;
按照预设的分类算法对所述综合评价分值最高的候选生物标志物筛选模型进行训练,生成生物标志物分类模型。


3.根据权利要求2所述的医学分析方法,其特征在于,在所述根据样本数据、多种分类算法以及预先获得的潜在生物标志物集合,确定与所述多种分类算法分别对应的多个潜在生物标志物子集合的步骤之前,还包括:
对缺失的样本数据进行填充,生成完整样本数据;
对所述完整样本数据进行对数转换,生成正态分布样本数据;
所述根据样本数据、多种分类算法以及预先获得的潜在生物标志物集合,确定与所述多种分类算法分别对应的多个潜在生物标志物子集合的步骤具体为:
根据所述正态分布样本数据、多种分类算法以及预先获得的潜在生物标志物集合,确定与所述多种分类算法分别对应的多个潜在生物标志物子集合。


4.根据权利要求2或3所述的医学分析方法,其特征在于,在所述按照预设的分类算法对所述综合评价分值最高的候选生物标志物筛选模型进行训练,生成集成学习生物标志物分类模型的步骤之后,还包括:
根据测试数据,计算所述集成学习生物标志物分类模型的综合评价分值。


5.根据权利...

【专利技术属性】
技术研发人员:王君兰
申请(专利权)人:上海中科新生命生物科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1