预测前列腺癌风险分层的临床特征-机器学习列线图方法技术

技术编号:38820582 阅读:13 留言:0更新日期:2023-09-15 19:59
本发明专利技术提供了预测前列腺癌风险分层的临床特征

【技术实现步骤摘要】
预测前列腺癌风险分层的临床特征

机器学习列线图方法


[0001]本专利技术属于机器学习
,具体涉及预测前列腺癌风险分层的临床特征

机器学习列线图方法。

技术介绍

[0002]前列腺特异性抗原(PSA)是临床中常用的筛查和诊断前列腺癌的生物标志物,而其作为前列腺癌生物标志物的高假阳性率一直受到质疑。基于血液或尿液的最小化方法(“液体活检”)越来越多地被用于癌症检测,实现了精准肿瘤学方法,通过液体活检得到患者的临床指标,通常需要经验丰富的临床医生或查询泌尿外科指南对前列腺癌患者的临床特征进行综合判断,但由于临床医生的主观判断和不断增加的临床指标数量,对前列腺癌患者进行精准的风险分层带来了挑战。
[0003]机器学习算法的使用有助于提高对特定疾病诊断系统的可靠性和准确性,通过机器学习算法开发的临床决策支持工具可以辅助临床医生快速对患者的健康情况进行一个初步诊断,从而帮助他们制定有关治疗、用药、心理健康和患者其它需求方面的决策。机器学习算法能够从数据中自动学习并提取有显著性的特征用于分类任务,因此被广泛应用到对前列腺癌的辅助检测和良恶性分析。基于外周血淋巴细胞亚群的机器学习方法能够区分良恶性,或低/中危和高危前列腺癌。
[0004]近年来,由于具有简单、直观、可解释的特点,列线图在临床诊断中的应用受到欢迎。对于应用于医学辅助诊断领域的机器学习模型来说,模型预测结果的可解释性至关重要。因此,基于医学临床数据建立的机器学习模型在实际应用中通常借助于列线图(Nomogram)来展示其结果的解释性说明。在多因素回归的基础上,通过设置标尺评分来表征多因素回归模型内各个变量的变化情况,最终计算出总的评分来进行预测事件发生的概率情况。列线图的实现过程就是将逻辑回归或Cox回归的结果进行可视化呈现,根据所有自变量回归系数的大小来制定评分标准,给每个自变量的每个取值水平给定一个分值。对于每个对象计算得到一个总分,然后通过得分与结果发生概率之间的转换函数来计算每个对象的模型预测结果发生的概率。
[0005]尽管现有的机器学习方法和列线图在前列腺癌风险分层的预测问题上取得了较大进展,但是一方面,机器学习方法并没有完全满足临床需求,解释能力差,可推广性低。另一方面,列线图本质是通过回归模型构建的,模型的性能在一定程度上受到了限制,导致列线图的临床效用较差。为了应对这些挑战,需要开发一个易于使用、可解释性好和功能强大的临床特征

机器学习列线图用于对前列腺患者进行无创诊断和风险分层评估。

技术实现思路

[0006]本专利技术要解决的技术问题是:提供预测前列腺癌风险分层的临床特征

机器学习列线图方法,用于构建预测前列腺癌风险分层的临床特征

机器学习列线图。
[0007]本专利技术为解决上述技术问题所采取的技术方案为:预测前列腺癌风险分层的临床
特征

机器学习列线图方法,包括以下步骤:
[0008]S0:构建机器学习模型,包括机器学习模型池模块、机器学习列线图模块和临床特征

机器学习列线图模块;机器学习模型池模块用于使用多种机器学习模型对临床数据进行学习;机器学习列线图模块用于基于多种机器学习模型的预测概率构建机器学习列线图;临床特征

机器学习列线图模块用于提出一种特征映射算法,将机器学习列线图转换为临床特征

机器学习列线图;
[0009]S1:机器学习模型池模块将对象的多个临床特征组成的数据集输入到不同的机器学习模型中,使用机器学习模型的预测结果构建机器学习列线图,并从中提取机器学习列线图的变量评分;
[0010]S2:机器学习列线图模块使用训练好的机器学习模型对数据集中每个样本的预测概率保存相应的特征权重,并构建机器学习列线图;
[0011]S3:临床特征

机器学习列线图模块通过特征映射算法,结合临床特征在多个机器学习模型的特征权重与机器学习列线图评分,构建临床特征

机器学习列线图;
[0012]S4:从临床特征

机器学习列线图上得到每一个特征变量的得分,最终得到对象的总标签得分与对应的低、中、高风险分层的分布。
[0013]按上述方案,所述的步骤S0中,机器学习模型池模块包括支持向量机、决策树、随机森林、XGBoost和AdaBoost。
[0014]进一步的,所述的步骤S1中,机器学习模型采用10折交叉验证方法在多个临床特征组成的数据集中进行训练。
[0015]按上述方案,所述的步骤S2中,具体步骤为:
[0016]S21:机器学习列线图模块使用训练好的机器学习模型对数据集的每个样本的风险分层的预测概率作为新的特征,保存相应的特征权重,与对应的分化程度标签组合形成新的训练数据集;
[0017]S22:通过逻辑回归模型对新的特征进行显著性分析,筛选用于构建列线图的有效特征;
[0018]S23:基于筛选后的特征采用有序逻辑回归模型构建机器学习列线图;机器学习列线图的变量是经过筛选的机器学习模型。
[0019]按上述方案,所述的步骤S3中,具体步骤为:
[0020]S31:临床特征

机器学习列线图模块将步骤S1得到的机器学习列线图的变量评分结合步骤S2得到的变量对应的机器学习模型中的特征权重,通过特征映射算法转换为构建机器学习模型的临床特征对应的评分;
[0021]S32:使用评分绘制临床特征

机器学习列线图;临床特征

机器学习列线图的变量即是构建数据集的临床特征。
[0022]进一步的,所述的步骤S31中,设CF
i
是第i个临床特征在最终得到的临床特征

机器学习列线图中的评分;FI
i,j
是第i个临床特征在第j个训练好的机器学习模型中的特征权重;MV
j
是第j个机器学习模型预测概率在机器学习列线图中的评分,i∈(1,M),j∈(1,N),其中M是临床特征的数量,N是机器学习模型的数量;则特征映射算法的计算公式为:
[0023][0024]按上述方案,还包括以下步骤:
[0025]通过ROC曲线、决策曲线或校准曲线评估临床特征

机器学习列线图的性能。
[0026]一种计算机存储介质,其内存储有可被计算机处理器执行的计算机程序,该计算机程序执行预测前列腺癌风险分层的临床特征

机器学习列线图方法。
[0027]本专利技术的有益效果为:
[0028]1.本专利技术的预测前列腺癌风险分层的临床特征

机器学习列线图方法,涉及数据处理、数据分析、机器学习和列线图,通过结合机器学习和列线图技术,构建了一个易于使用、可解释性好且功能强大的临床特征

机器学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.预测前列腺癌风险分层的临床特征

机器学习列线图方法,其特征在于:包括以下步骤:S0:构建机器学习模型,包括机器学习模型池模块、机器学习列线图模块和临床特征

机器学习列线图模块;机器学习模型池模块用于使用多种机器学习模型对临床数据进行学习;机器学习列线图模块用于基于多种机器学习模型的预测概率构建机器学习列线图;临床特征

机器学习列线图模块用于提出一种特征映射算法,将机器学习列线图转换为临床特征

机器学习列线图;S1:机器学习模型池模块将对象的多个临床特征组成的数据集输入到不同的机器学习模型中,使用机器学习模型的预测结果构建机器学习列线图,并从中提取机器学习列线图的变量评分;S2:机器学习列线图模块使用训练好的机器学习模型对数据集中每个样本的预测概率保存相应的特征权重,并构建机器学习列线图;S3:临床特征

机器学习列线图模块通过特征映射算法,结合临床特征在多个机器学习模型的特征权重与机器学习列线图评分,构建临床特征

机器学习列线图;S4:从临床特征

机器学习列线图上得到每一个特征变量的得分,最终得到对象的总标签得分与对应的低、中、高风险分层的分布。2.根据权利要求1所述的预测前列腺癌风险分层的临床特征

机器学习列线图方法,其特征在于:所述的步骤S0中,机器学习模型池模块包括支持向量机、决策树、随机森林、XGBoost和AdaBoost。3.根据权利要求2所述的预测前列腺癌风险分层的临床特征

机器学习列线图方法,其特征在于:所述的步骤S1中,机器学习模型采用10折交叉验证方法在多个临床特征组成的数据集中进行训练。4.根据权利要求1所述的预测前列腺癌风险分层的临床特征

机器学习列线图方法,其特征在于:所述的步骤S2中,具体步骤为:S21:机器学习列线图模块使用训练好的机器学习模型对数据集的每个样本的风险分层的预测概率...

【专利技术属性】
技术研发人员:吴兴隆曹新宇方银杨春光徐国平
申请(专利权)人:武汉工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1