当前位置: 首页 > 专利查询>之江实验室专利>正文

一种伪标签演变趋势正则的预后预测装置制造方法及图纸

技术编号:38459575 阅读:78 留言:0更新日期:2023-08-11 14:36
本发明专利技术公开了一种伪标签演变趋势正则的预后预测装置,其执行时:获取包含多名患者的预后数据集,选择出患者发生终点事件或失访的时间最大值并将其划分成多个等间隔的时间段,计算所有患者每个时间段内的预后标签结果,其中利用KM曲线计算患者失访的时间段及其之后各时间段内的伪标签结果;构建预后预测模型,预测患者每个时间段内发生终点事件的概率;构建损失函数,包括各时间段内预测结果和预后标签结果之间的误差,以及根据预后标签结果计算的预后演变趋势正则化项;基于损失函数对预后预测模型进行参数优化;利用优化的预后预测模型进行预后预测。型进行预后预测。型进行预后预测。

【技术实现步骤摘要】
一种伪标签演变趋势正则的预后预测装置


[0001]本专利技术涉及医疗数据挖掘
,特别涉及预后预测方面,具体涉及一种伪标签演变趋势正则的预后预测装置。

技术介绍

[0002]预后预测是指预测当前时间点之后未来某时间点发生终点事件风险的研究。常见的预后预测问题有生存分析、癌症复发预测等等。
[0003]预后数据有一类典型特征,即为删失数据。删失数据指的是在随访期间,还未发生终点事件的患者,在某一时间点失访,从而在失访时间点后患者是否发生终点事件处于未知状态。
[0004]针对预后数据的这一特点,研究人员首先利用Cox比例风险回归、随机生存森林、Deepsurv等生存分析方法,来构建预后预测模型。然而,这类方法通常具有比例风险假设,且得到的预测结果还需要通过配合估计得到的基线生存函数才能得到患者在某时刻的生存积累(Jared L. Katzman, Uri Shaham, Alexander Cloninger, Jonathan Bates, Tingting Jiang, Yuval Kluger. DeepSurv: personalized treatment recommender system using a Cox proportional hazards deep neural network. BMC Medical Research Methodology, 2018, 18(1): 24.)。
[0005]另一种方式是将预后预测问题转换成分类问题,即预测患者在某时间段内发生终点事件的风险。然而,这一类方法首先无法应对删失数据,因为在某些时间段内,患者数据出现删失则无法确定患者的标签是什么;此外,这类方法在同时预测多个时间段预后情况,也并未考虑不同时间段患者预后情况的演变趋势(Shengqiang Chi, Yu Tian, Feng Wang, Yu Wang, Ming Chen, Jingsong Li. Deep Semisupervised Multitask Learning Model and Its Interpretability for Survival Analysis. IEEE Journal of Biomedical and Health Informatics, 2021, 25(8): 3185

96.)。

技术实现思路

[0006]针对上述技术问题以及本领域存在的不足之处,本专利技术提供了一种伪标签演变趋势正则的预后预测装置,利用KM曲线(Kaplan

Meier生存曲线)估计患者失访导致的删失数据在失访以及之后的时间段内发生终点事件的概率作为伪标签,然后将分类任务转换为回归任务预测患者各个时间段内的发生终点事件的概率,最后利用正则化项,将不同时间段预后情况的演变趋势添加到对应模型参数之中,从而实现更为精准的预后预测。
[0007]一种伪标签演变趋势正则的预后预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,处理器执行计算机程序时实现以下步骤:获取包含多名患者的预后数据集,选择出患者发生终点事件或失访的时间最大值(即最长的随访时间)并将其划分成多个等间隔的时间段,计算所有患者每个时间段内的预后标签结果,其中利用KM曲线计算患者失访的时间段及其之后各时间段内的伪标签结果;
构建预后预测模型,预测患者每个时间段内发生终点事件的概率;构建损失函数,包括各时间段内预测结果和预后标签结果之间的误差,以及根据预后标签结果计算的预后演变趋势正则化项;基于损失函数对预后预测模型进行参数优化;利用优化的预后预测模型进行预后预测。
[0008]所述的伪标签演变趋势正则的预后预测装置,时间段间隔可根据研究的具体预后事件发生事件跨度进行选择,例如可以为1小时、1天、1周、1月或1年等。
[0009]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,对于未失访的患者,尚未发生终点事件的时间段内的预后标签结果为0,发生终点事件及之后的时间段内的预后标签结果为1。
[0010]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,对于失访患者,在失访的时间段之前的各时间段内的预后标签结果为0。
[0011]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,预后预测模型中设置的参数向量的数量与时间段的数量一致,各参数向量的长度等于患者临床数据的长度,采用Sigmoid函数基于患者临床数据预测患者每个时间段内发生终点事件的概率。
[0012]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,采用均方误差计算各时间段内预测结果和预后标签结果之间的误差。
[0013]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,构建的损失函数还包括利用范数2正则化约束预后预测模型参数矩阵数值大小。
[0014]在一实施例中,所述的伪标签演变趋势正则的预后预测装置,构建的损失函数还包括利用排序损失约束不同时间段预测结果大小关系,使得后面时间段的预测结果不小于前面时间段的预测结果。
[0015]所述的伪标签演变趋势正则的预后预测装置,根据预后标签结果计算的预后演变趋势正则化项可将不同时间段内患者预后的演变趋势融入预后预测模型的参数学习中,使得两个时间段内的患者预后标签结果相近时对应的预后预测模型参数也相近,其中可采用高斯核函数、范数2距离的平方或者范数1距离等计算两个时间段内所有患者预后标签结果之间的相似性。
[0016]本专利技术还提供了一种伪标签演变趋势正则的预后预测装置,包括:数据获取单元,用于获取包含多名患者的预后数据集,选择出患者发生终点事件或失访的时间最大值并将其划分成多个等间隔的时间段,计算所有患者每个时间段内的预后标签结果,其中利用KM曲线计算患者失访的时间段及其之后各时间段内的伪标签结果;模型构建单元,用于构建预后预测模型,预测患者每个时间段内发生终点事件的概率;损失函数构建单元,用于构建损失函数,包括各时间段内预测结果和预后标签结果之间的误差,以及根据预后标签结果计算的预后演变趋势正则化项;训练单元,用于基于损失函数对预后预测模型进行参数优化;应用单元,用于利用优化的预后预测模型进行预后预测。
[0017]本专利技术与现有技术相比,有益效果有:首先,根据患者随访数据将随访阶段划分为多个连续时间段;然后根据患者随访
数据确定患者在每个时间段内的终点事件发生情况;针对患者失访而导致出现删失的情况,利用KM曲线计算该患者在失访以及失访之后的时间段内的终点事件发生的概率;然后利用模型预测每个时间段内发生终点事件的概率并利用误差损失以回归任务训练模型;并可利用排序损失Loss
rank
保证后续时间段的预测结果大于前面时间段的预测结果;利用根据预后标签结果计算的预后演变趋势正则化项Loss
evol
添加不同时间段预后情况的演变趋势,使得预后情况相近的两个时间段对应的模型参数相近,预后情况差异较大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种伪标签演变趋势正则的预后预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,其特征在于,处理器执行计算机程序时实现以下步骤:获取包含多名患者的预后数据集,选择出患者发生终点事件或失访的时间最大值并将其划分成多个等间隔的时间段,计算所有患者每个时间段内的预后标签结果,其中利用KM曲线计算患者失访的时间段及其之后各时间段内的伪标签结果;构建预后预测模型,预测患者每个时间段内发生终点事件的概率;构建损失函数,包括各时间段内预测结果和预后标签结果之间的误差,以及根据预后标签结果计算的预后演变趋势正则化项;基于损失函数对预后预测模型进行参数优化;利用优化的预后预测模型进行预后预测。2.根据权利要求1所述的伪标签演变趋势正则的预后预测装置,其特征在于,时间段间隔为1小时、1天、1周、1月或1年。3.根据权利要求1所述的伪标签演变趋势正则的预后预测装置,其特征在于,对于未失访的患者,尚未发生终点事件的时间段内的预后标签结果为0,发生终点事件及之后的时间段内的预后标签结果为1。4.根据权利要求1所述的伪标签演变趋势正则的预后预测装置,其特征在于,对于失访患者,在失访的时间段之前的各时间段内的预后标签结果为0。5.根据权利要求1所述的伪标签演变趋势正则的预后预测装置,其特征在于,预后预测模型中设置的参数向量的数量与时间段的数量一致,各参数向量的长度等于患者临床数据的长度,采用Sigmoid函数基于患者临床数据预测患者每个时间段内发生终点事件的概率。6.根据权利要求1所述的伪标签演变趋势正则的预后预测装置,其特征在于,采用...

【专利技术属性】
技术研发人员:胡丹青朱晓峰苏慧
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1