一种肺动脉高压发生概率的确认方法、辅助决策系统技术方案

技术编号:38136399 阅读:7 留言:0更新日期:2023-07-08 09:48
本申请提供一种肺动脉高压发生概率的确认方法、辅助决策系统。方法包括:获取目标患者的实时特征;对实时特征进行预处理,获得预处理后的实时特征;根据预处理后的实时特征,从多个应用模型中选择第一应用模型;将预处理后的实时特征输入第一应用模型中,对目标患者进行肺动脉高压发生概率预测,目标患者的实时特征与第一组训练集相匹配;获取第一应用模型对目标患者进行预测的第一肺动脉高压发生概率值。本申请通过采用上述方法,解决相关技术中,由于患者的特征信息存在多样性,部分患者的特征信息较少,在面对这部分患者时,进行PH肺动脉高压发生概率预测时无法得到想要的结果的问题。问题。问题。

【技术实现步骤摘要】
一种肺动脉高压发生概率的确认方法、辅助决策系统


[0001]本申请涉及数据处理的
,具体涉及一种肺动脉高压发生概率的确认方法、辅助决策系统及电子设备。

技术介绍

[0002]肺动脉高压(pulmonary hypertension,PH)是一种由异源性疾病或病因和不同发病机制所致肺血管结构或功能改变,引起肺血管阻力和肺动脉压力升高的临床和病理生理综合征。PH早期筛查困难,治疗棘手,预后恶劣。因早期症状隐匿,PH患者常被误诊或漏诊,其中动脉性肺动脉高压患者从出现症状到确诊平均需要2

4年,且持续性的PH会导致患者的右心室持续超负荷,最终可发展为右心衰竭而导致死亡。在我国,未经治疗的PH患者5年平均生存率仅为20.8%。研究表明,早期筛查并得到有效治疗的PH患者远期生存率远高于中晚期的患者。因此,为减少PH带来的死亡和不良影响,提升患者的预期寿命并改善患者的生活质量,做到PH的早期筛查显得至关重要。
[0003]当前,常见的早期筛查PH风险的方法主要包括生物标志物法和模型识别两种。其中,模型识别的相关技术方案中,多应用传统的机器学习模型。在应用传统机器学习模型对患者产生PH的肺动脉高压发生概率进行预测时,由于各类患者的特征信息存在多样性,而采用的模型常为特定模型。不能根据患者的实际特征信息,选择更加匹配患者特征信息的模型进行PH肺动脉高压发生概率的预测。
[0004]目前,亟需一种肺动脉高压发生概率的确认方法、辅助决策系统及电子设备来解决相关技术存在的问题。

技术实现思路

[0005]本申请提供了一种肺动脉高压发生概率的确认方法、辅助决策系统,用于解决传统的应用机器学习模型对患者的早期PH发生概率进行预测时,不能根据患者的实际特征信息,选择更加匹配患者特征信息的模型进行PH肺动脉高压发生概率的预测的问题。
[0006]本申请第一方面提供了一种肺动脉高压发生概率的确定方法,方法包括:获取目标患者的实时特征;对实时特征进行预处理,获得预处理后的实时特征;根据预处理后的实时特征,从多个应用模型中选择第一应用模型,多个应用模型由多组训练集通过待训练模型进行训练得到,多组训练集根据历史患者的结构化特征得到,多组训练集包括第一组训练集,第一应用模型根据第一组训练集训练得到;将预处理后的实时特征输入第一应用模型中,对目标患者进行肺动脉高压发生概率预测,目标患者的实时特征与第一组训练集相匹配; 获取第一应用模型对目标患者进行预测的第一肺动脉高压发生概率值。
[0007]可选的,多组应用模型还包括第二应用模型,多组训练集还包括第二训练集,方法还包括:当第一肺动脉高压发生概率大于或等于第一肺动脉高压发生概率阈值时,获取目标患者的剩余特征;剩余特征是除实时特征之外的其他特征,剩余特征包括第一剩余特征;将第一剩余特征添加进目标患者的实时特征,得到第二实时特征;采用第二应用模型对目
标患者进行预测,第二训练集与第二实时特征相匹配,第二应用模型根据第二训练集训练得到;获取第二应用模型对目标患者进行预测的第二肺动脉高压发生概率值;当第二肺动脉高压发生概率值大于或等于第二肺动脉高压发生概率阈值时,输出第二肺动脉高压发生概率值。
[0008]可选的,多组训练集还包括第三训练集,多组应用模型还包括第三应用模型,第三应用模型根据第三训练集训练得到;获取目标患者的剩余特征之前,方法还包括:获取第三应用模型的模型效果指标与第二应用模型的模型效果指标;当第二应用模型的模型效果指标大于或等于第三应用模型的模型效果指标时,获取目标患者的剩余特征,第二训练集与第三训练集的关系通过以下关系确定:A
s
=[X1,X2.....X
N
,C
s
];A
t
=[X1,X2.....X
N
,C
t
];其中,A
s
为第二训练集,A
t
为第三训练集,C
s
为剩余特征的第二集合,C
t
为剩余特征的第三集合;第二集合与第三集合中的剩余特征的数量相同,且仅存在一个不同的剩余特征。
[0009]可选的,根据历史患者的结构化特征得到多组训练集,具体包括:获取历史患者的结构化特征,历史患者的结构化特征包括常规特征以及剩余特征;根据历史患者的结构化特征构建多组训练集;其中,多组训练集中任意一个训练集根据以下公式构成:A
2n =[X1,X2.....X
N
,C
2n
];Q=[X1,X2.....X
N
];P=[0,Y1,Y2.....Y
n
];其中,A
2n
为任意一个训练集;Q为常规特征的集合;P为剩余特征的集合;N为常规特征的个数;n为剩余特征的个数;C
2n
为剩余特征的集合中任意一种数学组合集合;X
N
为第N常规特征;Y
n
为第n剩余特征。
[0010]可选的,待训练模型为DeepFM

Att模型,方法还包括:将DeepFM模型中的Deep组件替换为注意力机制,得到DeepFM

Att模型,DeepFM

Att模型为待训练模型。可选的,应用模型的获取方法包括:获取患者历史特征及标签,以构建基础数据集;对基础数据集进行预处理,以得到稀疏特征;将稀疏特征分为多组训练集,同一组训练集中每个训练集包括的特征种类相同;采用多组训练集,分别输入多个待训练模型中,训练得到与多组训练集对应的多个应用模型。
[0011]可选的,采用多组训练集,分别输入多个待训练模型中,训练得到与多组训练集对应的多个应用模型,具体包括:将一组训练集输入待训练模型,使用待训练模型处理稀疏特征,得到特征嵌入矩阵、一阶组合特征、二阶组合特征;将一阶组合特征、二阶组合特征拼接组合特征矩阵;将特征嵌入矩阵输入待训练模型的注意力机制,得到注意力机制的输出;将组合特征矩阵和注意力机制的输出拼接,形成待训练模型的最终隐藏嵌入矩阵,采用带有预设激活函数的全连接层将最终隐藏嵌入矩阵转换为肺动脉高压的发生概率值,并计算分类损失;根据最终隐藏嵌入矩阵,计算对比损失;根据分类损失以及对比损失,计算最终损失,最终损失用于对待训练模型的参数进行调整,得到与训练集对应的多个应用模型。
[0012]可选的,根据分类损失以及对比损失,计算最终损失,具体根据以下公式得到:L=L
BCE
+α · L
SCL
;L为最终损失;L
BCE
为分类损失;L
SCL
为对比损失;α为超参数。
[0013]本申请第二方面提供一种辅助决策系统,系统包括:特征获取单元、特征处理单
元、模型选择单元、第一模型应用单元以及第一结果输出单元;特征获取单元,用于获取目标患者的实时特征;特征处理单元,用于对实时特征进行预处理,获得预处理后的实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种肺动脉高压发生概率的确定方法,其特征在于,所述方法包括:获取目标患者的实时特征;对所述实时特征进行预处理,获得预处理后的实时特征;根据预处理后的实时特征,从多个应用模型中选择第一应用模型,多个所述应用模型由多组训练集通过待训练模型进行训练得到,多组所述训练集根据历史患者的结构化特征得到,多组所述训练集包括第一组训练集,所述第一应用模型根据所述第一组训练集训练得到;将所述预处理后的实时特征输入所述第一应用模型中,对目标患者进行肺动脉高压发生概率预测,所述目标患者的实时特征与所述第一组训练集相匹配;获取所述第一应用模型对所述目标患者进行预测的第一肺动脉高压发生概率值。2.根据权利要求1所述的方法,其特征在于,多组所述应用模型还包括第二应用模型,多组所述训练集还包括第二训练集,所述方法还包括:当所述第一肺动脉高压发生概率大于或等于第一肺动脉高压发生概率阈值时,获取所述目标患者的剩余特征;所述剩余特征是除所述实时特征之外的其他特征,所述剩余特征包括第一剩余特征;将所述第一剩余特征添加进所述目标患者的实时特征,得到第二实时特征;采用第二应用模型对所述目标患者进行预测,所述第二训练集与所述第二实时特征相匹配,所述第二应用模型根据所述第二训练集训练得到;获取所述第二应用模型对所述目标患者进行预测的第二肺动脉高压发生概率值;当所述第二肺动脉高压发生概率值大于或等于第二肺动脉高压发生概率阈值时,输出第二肺动脉高压发生概率值。3.根据权利要求2所述的方法,其特征在于,多组所述训练集还包括第三训练集,多组所述应用模型还包括第三应用模型,所述第三应用模型根据所述第三训练集训练得到;所述获取所述目标患者的剩余特征之前,所述方法还包括:获取所述第三应用模型的模型效果指标与所述第二应用模型的模型效果指标;当所述第二应用模型的模型效果指标大于或等于所述第三应用模型的模型效果指标时,获取所述目标患者的剩余特征,所述第二训练集与所述第三训练集的关系通过以下关系确定:A
s
=[X1,X2.....X
N
,C
s
];A
t
=[X1,X2.....X
N
,C
t
];其中,A
s
为所述第二训练集,A
t
为所述第三训练集,C
s
为所述剩余特征的第二集合,C
t
为所述剩余特征的第三集合;所述第二集合与所述第三集合中的剩余特征的数量相同,且仅存在一个不同的剩余特征。4.根据权利要求1所述的方法,其特征在于,根据所述历史患者的结构化特征得到多组所述训练集,具体包括:获取历史患者的结构化特征,所述历史患者的结构化特征包括常规特征以及剩余特征;根据所述历史患者的结构化特征构建多组所述训练集;其中,多组所述训练集中任意一个训练集根据以下公式构成:
A
2n =[X1,X2.....X
N
,C
2n
];Q=[X1,X2.....X
N
];P=[0,Y1,Y2.....Y
n
];其中,A
2n
为任意一个训练集;Q为所述常规特征的集合;P为所述剩余特征的集合;N为所述常规特征的个数;n为所述剩余特征的个数;C
2n
为所述剩余特征的集合中任意一种数学组合集合;X
N
为第N常规特征;Y
n
为第n剩余特征。5.根据权利要求1所述的方法,其特征在于,所述待训练模型为DeepFM

Att模型,所述方法还包括:将DeepFM模型中的Deep组件替换为注意力机制,得到所述DeepFM

Att模型,所述DeepFM

Att模型为所述待训练模型。6.根据权利要求5所述的方法,其特征在于,所述应用模型的获取方法包括:获取患者历史特征及标签,以构建基础数据集;对所述基础数据集进行预处理,以得到稀疏特征;将稀疏特征分为多组所述训练集,同一组所述训练集中每个所述训练集包括的特征种类相同;采用多组所述训练集,分别输入多个所述待训练模型中,训练得到与多组训练集对应的多个所述应用模型。7.根据权利要求6所述的方法,其特征在于,所述采用多组所述训练集,分别输入多个所述待训练模型中,训练得到与多组训练集对应的多个所述应用模型,具体包括:将一组训练集输入所述待训练模型,使用所述待训练模型处理稀疏特征,得到特征嵌入矩阵、一阶组合特征、二阶组合特征;将所述一阶组合特征、所述二阶组合特征拼接组...

【专利技术属性】
技术研发人员:赵韡柳志红袁靖赵帅罗勤夏芸黄志华杨展
申请(专利权)人:中国医学科学院阜外医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1