System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于时序数据的因果发现与疾病发展轨迹预测系统及方法技术方案_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

基于时序数据的因果发现与疾病发展轨迹预测系统及方法技术方案

技术编号:41151171 阅读:8 留言:0更新日期:2024-04-30 18:17
本发明专利技术公开了一种基于时序数据的因果发现与疾病发展轨迹预测系统及方法。系统包括用于预处理患者时间序列疾病数据的数据预处理模块,用于预测患者的疾病特征导数量和疾病特征间预测关系的因果衍生模块,以及预测患者的疾病特征状态轨迹的轨迹预测模块;方法包括:对因果发现与疾病发展轨迹预测系统进行优化,完成后进行预测获得患者的疾病预测轨迹和疾病特征间预测关系矩阵,实现疾病的因果发现与疾病发展轨迹预测。本发明专利技术可基于患者慢性疾病的纵向数据挖掘出因果关系,给出因果可解释的疾病发展预测轨迹,解决深度学习进行轨迹预测不可解释和具有因果关系的父子特征互相影响的问题,从而辅助医生进行临床决策。

【技术实现步骤摘要】

本专利技术涉及了一种因果发现与疾病发展轨迹预测系统,涉及数据处理领域,具体涉及一种基于时序数据的因果发现与疾病发展轨迹预测系统及方法


技术介绍

1、如果能够预测患病后的疾病发展情况,如一段时间后病种,数年后死亡,对于医生提前采取治疗措施很有帮助。在此假设下,最近的研究主要集中在利用机器学习方法来获得更准确的预测模型。

2、然而,采用机器学习的方法预测疾病发展往往不能给医生带来足够的指导,机器学习是一个黑箱模型,通过数学的方式进行拟合不能告诉医生哪些因素会导致疾病发生怎样的变化。类似阿尔茨海默病这样机理不明确的疾病,发掘人体在经历疾病时各种因素之间的因果关系对医生决策更有指导意义。

3、在轨迹预测方面,研究者们通常使用循环神经网络rnn和transformer来从序列化的病患数据中学习表征,并预测其疾病进展轨迹。但是,这两种方法都是设计用来建模具有固定时间间隔的离散轨迹,而实际上我们可能需要生成连续的病患轨迹。近期的研究通常采用两种方法来建模连续的轨迹。

4、第一种方法将轨迹预测问题建模为解决动力系统。通过神经ode求解器,可以优化一个神经网络参数化的动力系统,从而使连续的病患轨迹预测成为可能。第二种方法通过修改循环神经网络rnn或transformer的架构来建模连续的轨迹。虽然这些模型具有良好的性能,但通常不能应用于治疗效果分析,因为它们没有捕捉到数据中的因果信息。

5、关于因果发现,一般有两种方法可以从序列数据中发现因果关系。第一种方法是使用基于ode的线性动态系统来建模数据生成过程,并采用稀疏惩罚(例如岭损失)来消除不必要的特征交互。先前的研究已经证明,这种方法可以在给定观测数据的情况下正确重构因果结构。被称为物理信息网络pin的方法被广泛用于发现物理过程中的控制方程。第二种方法利用格兰杰因果性假设,假设每个采样变量只受早期观察的影响。然后,通过分析格兰杰因果信息来总结因果图。因果发现方法明显具有辅助预后分析的能力,然而目前并未被应用到包括线性和非线性关系的疾病轨迹预测中。

6、已有的模型dag-gnn(有向无环图神经网络)添加整体的非线性,没有考虑到线性和非线性结合的情况;数据驱动的模型则发掘现有参数的因果关系,考虑不到隐藏的影响因子;使用逆时间注意力机制的模型则无法发掘相关关系,无法判断直接相关性。


技术实现思路

1、为了解决
技术介绍
中存在的问题,本专利技术所提供一种基于时序数据的因果发现与疾病发展轨迹预测系统及方法。本专利技术克服现有疾病发展轨迹预测方法性能与可解释性无法兼顾的缺陷,以医务人员可以理解的方式挖掘患者疾病时间序列数据中的因果关系,实现基于电子病历的因果发现和轨迹预测,从而使对因果关系中的子特征进行干预而祖先特征不受影响成为可能,辅助完成临床决策支持任务。

2、本专利技术采用的技术方案是:

3、一、一种基于时序数据的因果发现与疾病发展轨迹预测系统,包括:

4、数据预处理模块,用于预处理患者的时间序列疾病数据。

5、因果衍生模块,用于根据预处理后的患者的时间序列疾病数据预测获得患者的疾病特征导数量以及疾病特征间预测关系矩阵。

6、轨迹预测模块,用于根据预处理后的患者的时间序列疾病数据以及疾病特征导数量获得患者的疾病特征状态预测轨迹。

7、所述的患者的时间序列疾病数据包括以文本形式记录的不同时间点对应的患者的多项疾病特征数据。

8、二、一种因果发现与疾病发展轨迹预测系统的预测方法,包括:

9、1)将各个患者的电子病历真实疾病数据和预设模拟疾病数据输入因果发现与疾病发展轨迹预测系统中,同时不断优化因果发现与疾病发展轨迹预测系统,获得优化完成的因果发现与疾病发展轨迹预测系统;预设模拟疾病数据和电子病历真实疾病数据的形式一致。

10、2)将待预测的患者的电子病历真实疾病数据输入优化完成的因果发现与疾病发展轨迹预测系统中处理,处理后输出待预测的患者的疾病预测轨迹和疾病特征间预测关系矩阵,实现疾病的因果发现与发展轨迹的预测。

11、所述的步骤1)中,不断优化因果发现与疾病发展轨迹预测系统,具体为使用优化模块不断优化因果发现与疾病发展轨迹预测系统,在优化过程中使用因果图识别模块根据优化过程中获得的各个优化后的因果发现与疾病发展轨迹预测系统构建因果掩码矩阵,最终将因果掩码矩阵输入因果衍生模块中作为因果衍生模块的处理矩阵。保留的模型更有可能识别正确的因果关系。

12、因果图识别模块通过训练的多个系统的性能和稳定性来识别最可靠的因果关系,并返回因果关系矩阵,即因果掩码矩阵。

13、所述的优化模块具体使用增广拉格朗日方法进行优化,根据损失函数计算最终的损失保留损失小于预设损失阈值δ的各个优化后的因果发现与疾病发展轨迹预测系统,针对每个保留的优化后的因果发现与疾病发展轨迹预测系统,因果图识别模块获取因果发现与疾病发展轨迹预测系统的神经连接矩阵,具体如下:

14、

15、其中,mij表示第i个疾病特征是第j个疾病特征的原因;表示第i个疾病特征是第j个疾病特征的原因的确定性,当时则表示不确定,当时则表示确定;k表示疾病特征的总数;

16、当第i个疾病特征和第j个疾病特征的无效比例yij大于预设接受比例ρ,认为第i个疾病特征和第j个疾病特征之间的连接无效,则mij=0和当第i个疾病特征和第j个疾病特征的无效比例yij小于预设不可接受比例1-ρ,认为第i个疾病特征和第j个疾病特征之间的连接有效,则mij=1和其中,yij表示n个保留的优化后的系统中认为连接i→j无效的模型数量占总系统数量的比例,即无效比例,yij=eij/n,eij表示第i个疾病特征和第j个疾病特征连接有效的收敛系统数量。

17、直至因果发现与疾病发展轨迹预测系统中的各个疾病特征之间的因果关系均确定后构建获得因果掩码矩阵mk,此时

18、在开始时,初始化了矩阵m和每个因果关系都是不确定的。

19、所述的步骤2)中,将待预测的患者的电子病历真实疾病数据输入优化完成的因果发现与疾病发展轨迹预测系统中处理,具体如下:

20、2.1)将待预测的患者的电子病历真实疾病数据输入数据预处理模块中处理,处理后输出预处理真实疾病数据。

21、2.2)将预处理真实疾病数据和因果掩码矩阵mk输入因果衍生模块中处理,处理后输出患者的疾病特征导数量及疾病特征间预测关系矩阵。

22、2.3)将预处理真实疾病数据以及疾病特征导数量输入轨迹预测模块中处理,处理后输出患者的疾病特征状态预测轨迹。

23、所述的步骤2.1)中,数据预处理模块将待预测的患者的电子病历真实疾病数据按照时间序列整合为文本数据,然后依次进行格式统一处理、缺失数据处理和异常值处理后获得输出预处理真实疾病数据。

24、格式统一处理具体为将数据的单位进行统一;缺失数据处理具体为将缺失率高于30%的疾病特本文档来自技高网...

【技术保护点】

1.一种基于时序数据的因果发现与疾病发展轨迹预测系统,其特征在于,包括:

2.根据权利要求1所述的基于时序数据的因果发现与疾病发展轨迹预测系统,其特征在于:所述的患者的时间序列疾病数据包括以文本形式记录的不同时间点对应的患者的多项疾病特征数据。

3.根据权利要求1-2任一所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于,包括:

4.根据权利要求3所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤1)中,不断优化因果发现与疾病发展轨迹预测系统,具体为使用优化模块不断优化因果发现与疾病发展轨迹预测系统,在优化过程中使用因果图识别模块根据优化过程中获得的各个优化后的因果发现与疾病发展轨迹预测系统构建因果掩码矩阵,最终将因果掩码矩阵输入因果衍生模块中作为因果衍生模块的处理矩阵。

5.根据权利要求4所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的优化模块具体使用增广拉格朗日方法进行优化,根据损失函数计算最终的损失保留损失小于预设损失阈值δ的各个优化后的因果发现与疾病发展轨迹预测系统,针对每个保留的优化后的因果发现与疾病发展轨迹预测系统,因果图识别模块获取因果发现与疾病发展轨迹预测系统的神经连接矩阵,具体如下:

6.根据权利要求4所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2)中,将待预测的患者的电子病历真实疾病数据输入优化完成的因果发现与疾病发展轨迹预测系统中处理,具体如下:

7.根据权利要求6所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2.1)中,数据预处理模块将待预测的患者的电子病历真实疾病数据按照时间序列整合为文本数据,然后依次进行格式统一处理、缺失数据处理和异常值处理后获得输出预处理真实疾病数据。

8.根据权利要求6所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2.2)中,因果衍生模块包括冈贝尔激活函数Gumbel Sigmoid、循环神经网络、前馈神经网络和稀疏惩罚,首先将预处理真实疾病数据中的离散变量使用冈贝尔激活函数Gumbel Sigmoid函数映射为连续变量,然后将映射后的预处理真实疾病数据输入循环神经网络中处理,处理后的输出和因果掩码矩阵mk相乘后输入前馈神经网络中处理,处理后输出患者的疾病特征导数量和邻接矩阵,将邻接矩阵构建为有向无环图DAG后进行稀疏惩罚获得患者的疾病特征间预测关系矩阵。

9.根据权利要求6所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2.3)中,轨迹预测模块包括长短时记忆网络LSTM、重参数化方法和数值ODE求解器,将预处理真实疾病数据输入长短时记忆网络LSTM中处理后输出患者的疾病特征统计量,然后使用重参数化方法对疾病特征统计量进行随机采样后获得患者的疾病初始状态,将患者的疾病初始状态和疾病特征导数量输入数值ODE求解器中处理后输出患者的疾病特征状态预测轨迹。

10.根据权利要求9所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的数值ODE求解器中使用变分自动编码器VAE来估计患者的疾病初始状态的后验概率分布,根据患者的疾病特征导数量、疾病初始状态及其后验概率分布估计获得患者的疾病特征的变化速率,从而预测获得患者的疾病特征状态预测轨迹。

...

【技术特征摘要】

1.一种基于时序数据的因果发现与疾病发展轨迹预测系统,其特征在于,包括:

2.根据权利要求1所述的基于时序数据的因果发现与疾病发展轨迹预测系统,其特征在于:所述的患者的时间序列疾病数据包括以文本形式记录的不同时间点对应的患者的多项疾病特征数据。

3.根据权利要求1-2任一所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于,包括:

4.根据权利要求3所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤1)中,不断优化因果发现与疾病发展轨迹预测系统,具体为使用优化模块不断优化因果发现与疾病发展轨迹预测系统,在优化过程中使用因果图识别模块根据优化过程中获得的各个优化后的因果发现与疾病发展轨迹预测系统构建因果掩码矩阵,最终将因果掩码矩阵输入因果衍生模块中作为因果衍生模块的处理矩阵。

5.根据权利要求4所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的优化模块具体使用增广拉格朗日方法进行优化,根据损失函数计算最终的损失保留损失小于预设损失阈值δ的各个优化后的因果发现与疾病发展轨迹预测系统,针对每个保留的优化后的因果发现与疾病发展轨迹预测系统,因果图识别模块获取因果发现与疾病发展轨迹预测系统的神经连接矩阵,具体如下:

6.根据权利要求4所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2)中,将待预测的患者的电子病历真实疾病数据输入优化完成的因果发现与疾病发展轨迹预测系统中处理,具体如下:

7.根据权利要求6所述的因果发现与疾病发展轨迹预测系统的预测方法,其特征在于:所述的步骤2.1)中,数据预处理模...

【专利技术属性】
技术研发人员:丁鼐张文卓孙周健
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1