当前位置: 首页 > 专利查询>季凯专利>正文

一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法技术

技术编号:37746576 阅读:14 留言:0更新日期:2023-06-05 23:33
本发明专利技术公开一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,属于医疗数据处理领域。该方法包括:采集临床数据构建样本集;对样本集数据进行预处理;选择年龄、性别以及体检中常用数据作为样本特征;选取训练集、验证集,使用多种不平衡样本机器学习算法构建子模型;对子模型进行多目标集成学习算法计算,利用敏感度和特异性两个目标搜索Pareto最优前沿,并根据Pareto最优前沿生成多种风险预警模型。本发明专利技术利用常见的体检数据建立多目标集成学习风险预警模型,通过对敏感度和特异性两个目标的寻优计算,提高了预警的精度和鲁棒性,创新了恶性肿瘤预警方式。创新了恶性肿瘤预警方式。创新了恶性肿瘤预警方式。

【技术实现步骤摘要】
一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法


[0001]本专利技术属于医疗数据处理领域,一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003][0004]恶性肿瘤患者治疗时间较长、费用较高,住院次数也较多,这些均给患者及其家庭成员带来了巨大的经济与心理压力,也对医疗卫生服务系统、国民经济与社会发展造成了沉重负担。
[0005]如果能利用基本的体检指标,建立人工智能风险评估模型,识别某些肿瘤高危特征的人群,再针对高危人群投放肿瘤筛查资源,是一种经济高效的提高肿瘤的早诊早治效果的方法。

技术实现思路

[0006]为了解决上述问题,本专利技术一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,利用常见的体检数据建立多目标集成学习风险预警模型,通过对敏感度和特异性两个目标的寻优计算,提高了预警的精度和鲁棒性,创新了恶性肿瘤预警方式。
[0007]为了实现上述目的,本专利技术采用如下技术方案:采集临床数据构建样本集;选择年龄、性别以及体检中常用数据作为样本特征,包括血常规、肝功生化、肾功生化、尿常规、肿瘤标志物;
[0008]对样本集进行数据预处理,选取训练集、验证集;使用多种不平衡样本机器学习算法构建子模型;使用多目标优化的集成学习算法建立多个恶性肿瘤风险预警模型;利用风险预警模型计算恶性肿瘤风险。
附图说明
[0009]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是本专利技术实施一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法
示意图。
具体实施方式
[0011]下面结合附图与实施例对本专利技术作进一步说明。
[0012]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0013]图1给出了本实施例的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其包括:(1)采集临床数据构建样本集,获取年龄、性别、临床诊断信息以及临床检验数据,临床检验数据包括血常规、肝功生化、肾功生化、尿常规、肿瘤标志物。
[0014](2)选择年龄、性别以及体检中常用数据作为样本特征,将临床数据分为健康人群和恶性肿瘤人群,数量比例为10:1,健康人群中也包括了非恶性肿瘤的其他常见疾病人群,样本分为训练集和验证集。
[0015](3)对训练集使用多种不平衡机器学习算法建立多个恶性肿瘤风险预警子模型。机器学习算法模型可以为预设的算法,SMOTE+XGBoost、SMOTE+LightGBM、ClusterCentroids+Random_Forest。也可以为其他多种算法组合。
[0016](4)通过集成算法合并子模型,通过权重系数控制每个子模型的权重,权重系数的和为1。以验证集的敏感度和特异性为两个目标,通过多目标优化算法搜索子模型权重系数,寻找多目标Pareto最优前沿对应的权重系数。多目标优化可以为预设的算法,包括带精英策略的非支配排序的遗传算法NSGA

II、多目标粒子群算法PSO、多目标鳟海鞘算法MSSA、非支配排序的鲸鱼优化算法NSWOA。
[0017](5)通过利用多种多目标优化算法搜索子模型权重系数,将多种算法结果相比较,确定多目标Pareto最优前沿对应的权重系数。根据Pareto最优前沿对应的子模型权重系数生成多个恶性肿瘤风险预警模型。
[0018](6)单独建立只包含60岁以上老年人的样本训练集和验证集,并生成恶性肿瘤风险预警模型,以提高老年人恶性肿瘤风险预警的准确性。
[0019](7)利用多个恶性肿瘤风险预警模型预警恶性肿瘤。列举不同模型在验证集上的敏感度、特异性、阳性检测值、引擎检测值,以满足不同场景下的筛查需求。
[0020]对于本领域的技术人员来说,本专利技术可以有各种更改和变化,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,包括:采集临床数据构建样本集;选择年龄、性别以及体检中常用数据作为样本特征,包括血常规、肝功生化、肾功生化、尿常规、肿瘤标志物;对样本集进行数据预处理,选取训练集、验证集;使用多种不平衡样本机器学习算法构建子模型;使用多目标优化的集成学习算法建立多个恶性肿瘤风险预警模型;利用风险预警模型计算恶性肿瘤风险。2.如权利要求1所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,学习样本中分为健康人群和恶性肿瘤患者两类人群,数量比例为10:1;健康人群中也包括了非恶性肿瘤的其他常见疾病人群;样本分为训练集和验证集。3.如权利要求2所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,对训练集使用多种不平衡样本机器学习算法建立多个恶性肿瘤风险预警子模型。4.如权利...

【专利技术属性】
技术研发人员:王正季凯
申请(专利权)人:季凯
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1