本发明专利技术公开了一种基于时序演进过程解释的疾病预后预测系统,该系统包括:数据采集模块,用于从电子病历数据库中提取患者的相关健康医疗数据;数据预处理模块,用于对相关健康医疗数据进行预处理;预后预测与归因模块,用于预测不同时间节点的预后,并对风险因素进行重要程度解释;可视化模块,基于预后预测与归因模块中得到的结果,解释预测结果并进行数据可视化。本发明专利技术融合了结构化的实验室检查数据和非结构化的病程记录的长期数据,在为患者不同时间周期下的预后做出精准预测的同时,对模型做出充分解释,并且提供可视化方法增加模型的透明度与可信度,利于责任相关方为患者提供优质、持续性的服务。持续性的服务。持续性的服务。
【技术实现步骤摘要】
一种基于时序演进过程解释的疾病预后预测系统
[0001]本专利技术涉及疾病预后预测领域,尤其涉及一种基于时序演进过程解释的疾病预后预测系统。
技术介绍
[0002]疾病预后预测是指根据患者的现状预测疾病未来的进展和结果,准确的预后预测对于疾病管理有着至关重要的作用。对于治疗而言,如果能够精准的预测未来疾病对患者的影响,可以帮助医生制定能够减轻甚至预防这些影响的有效治疗方案,而有效的治疗方案将直接对预后产生正面影响。对于患者而言,获得预后信息有助于帮助患者做出重要决策,例如如何根据自身健康状况进行健康管理,是否接受某些治疗方案等。
[0003]然而,目前现有的疾病预后和风险评估方法由于缺乏以下两方面的考虑而受到制约:缺乏临床可解释性和基于时序演进过程解释的患者预后预测方法。现有的预后预测方法主要包括两类,第一类方法是基于医疗领域的专家经验,人工的构建关于疾病预后的指标评分系统,用于预测疾病发生的风险和预后评估。第二类方法是基于算法,通过机器学习和深度学习等方法挖掘与疾病预后相关的指标,弥补了人工筛选的主观性。常见的方法包括神经网络、贝叶斯网络、逻辑回归等。
[0004]1)现有的机器学习预后预测方法虽充分利用了大量的临床数据,但是在实际应用过程中缺乏明确的临床解释性,从而影响了相关技术的临床转化,难以满足临床决策支持的实际需要。
[0005]2)当前的预后预测方法通常基于患者的单次就诊所产生的实验室检验等数据建模,然而这类方法只能给出短期内的预后预测,忽略了患者的身体状况会随时间推移发生改变的情况。这类方法的适用范围较小,对于会随时间不断变化发展的疾病,例如慢性疾病,缺乏临床可行性。
[0006]3)缺少系统评价预后的方法,当前主流的方法主要是通过治疗期的指标和短期结果来改善护理质量,最常见的是跟踪住院死亡类指标、医院感染类指标和手术并发症类指标。长期结果(例如,在1年和5年后),以及以患者为中心的结果(以冠心病为例,心绞痛负担、身体功能状态和与健康相关的生活质量),更多的反映了治疗最终效果,但鲜有相关方法能够实现长期预后的评估。因此,现有的方法未结合患者出院后的长期健康状况演变对预后进行综合考量,无法驱动医院以患者为核心,为患者提供优质医疗服务。
[0007]4)现有模型或方法缺乏对非结构化数据的应用。现有的方法普遍从结构化数据(即,电子病历)中提取患者的诊疗数据,并通过人工定义的医疗质量指标公式或者是机器学习算法挖掘的相关指标公式进行计算。然而,这类方法对于数据的格式、质量和数量要求较高,且忽略了以文本的形式储存的病程记录等信息。因此,模型或方法对于综合性预后的评价相对较为片面。
技术实现思路
[0008]本专利技术目的在于针对现有技术的不足,本专利技术提出一种基于时序演进过程解释的疾病预后预测系统。
[0009]本专利技术的目的是通过以下技术方案来实现的:一种基于时序演进过程解释的疾病预后预测系统,该系统包括数据采集模块、数据预处理模块、预后预测与归因模块和可视化模块;所述数据采集模块用于从电子病历数据库中提取患者的相关健康医疗数据;所述数据预处理模块用于对患者的相关健康医疗数据进行预处理;所述预后预测与归因模块包括数据融合子模块、时间卷积网络子模块和深度泰勒分解子模块;所述数据融合子模块用于输入预处理后的患者的相关健康医疗数据,对结构化数据进行处理使数据格式与预后指标保持一致,对非结构化数据进行处理得到向量化语义特征,与处理后的结构化数据拼接后输入时间卷积网络子模块预测患者的预后;所述深度泰勒分解子模块用于获取预后与输入特征之间的关联,对当前预测预后的原因进行解释,判断预测预后的影响因素;所述可视化模块基于预后预测与归因模块中得到的结果,解释预测结果并进行数据可视化。
[0010]进一步地,所述患者的相关健康医疗数据包括患者的病程记录、实验室检查记录和随访记录;病程记录包括用药记录和手术记录。
[0011]进一步地,患者的相关健康医疗数据存储在数据库的多张表中,且表间存在键值连接使得各表信息得到关联。
[0012]进一步地,所述预处理包括实验室检验数据的去极值处理、数据缺失值以及预测目标的标签处理。
[0013]进一步地,所述预测目标的标签包括术后病发症的短期指标和患者自评估的中长期指标。
[0014]进一步地,对结构化数据进行处理具体过程为:基于长短期记忆网络LSTM对结构化数据进行编码后,通过池化进行融合使数据格式与预后指标保持一致。
[0015]进一步地,对非结构化数据进行处理具体过程为:根据预设的病程记录模版,构造病程输入数据,使用大语言模型LLM输出病程记录文本对应的病程向量化特征;所述病程记录模版形式为:[病程记录元素_1:元素值_1, 病程记录元素_2:元素值_2, ......, 病程记录元素_i:元素值_i],其中病程记录元素为记录的事件类型,元素值为对应症状数据。
[0016]进一步地,所述深度泰勒分解子模块将时间卷积网络子模块预测的预后作为输入,将其通过网络反向传播进行局部更新,并递归地定义上一层所有激活神经元对预测结果的贡献;通过深度泰勒分解,从一个神经元到前一层激活神经元的局部反向传播通过在被选中的节点上进行一阶泰勒分解来解释非线性因素,并对输出神经元的所有贡献度分数求和,获得节点的贡献度分数,最后得到不同输入特征对当前预测症状的影响权重。
[0017]进一步地,所述数据可视化包括当前患者后期可能出现的症状,以及这些症状出现的日期,且这些症状是由当前的哪些特征导致的。
[0018]进一步地,可视化模块实现患者维度数据可视化,患者维度的可视化界面由参数
多选列表、点阵图和直方图构成,点阵图中包含数据点特征,直方图中包含数据点特征的分布情况,以及对应数据点在分布中的具体位置和其真实数值。
[0019]本专利技术的有益效果:本专利技术融合了结构化的实验室检查数据和非结构化的病程记录(包括体征、症状、既往史、用药和手术等)的长期数据(1
‑
5年);其次,通过由时序卷积网络和深度泰勒分解构成的预测模型进行短期和长期预后的预测,可根据患者的身体状况变化做出不同时期下的预后预测,并通过归因溯源对于患者预后产生重要影响的时期和相应的特征;基于预后预测和归因溯源的结果,提供一种可视化方法,从队列、患者维度分别呈现模型输入特征对于某一预后结果的影响;最终构建一种可解释的长期预后预测系统,在为患者不同时间周期下的预后做出精准预测的同时,对模型做出充分解释,并且提供可视化方法增加模型的透明度与可信度,利于责任相关方(例如医院、医生)为患者提供优质、持续性的服务。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
[0021]图1为本专利技术提供的一种基于时本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于时序演进过程解释的疾病预后预测系统,其特征在于,该系统包括数据采集模块、数据预处理模块、预后预测与归因模块和可视化模块;所述数据采集模块用于从电子病历数据库中提取患者的相关健康医疗数据;所述数据预处理模块用于对患者的相关健康医疗数据进行预处理;所述预后预测与归因模块包括数据融合子模块、时间卷积网络子模块和深度泰勒分解子模块;所述数据融合子模块用于输入预处理后的患者的相关健康医疗数据,对结构化数据进行处理使数据格式与预后指标保持一致,对非结构化数据进行处理得到向量化语义特征,与处理后的结构化数据拼接后输入时间卷积网络子模块预测患者的预后;所述深度泰勒分解子模块用于获取预后与输入特征之间的关联,对当前预测预后的原因进行解释,判断预测预后的影响因素;所述可视化模块基于预后预测与归因模块中得到的结果,解释预测结果并进行数据可视化。2.根据权利要求1所述的一种基于时序演进过程解释的疾病预后预测系统,其特征在于,所述患者的相关健康医疗数据包括患者的病程记录、实验室检查记录和随访记录;病程记录包括用药记录和手术记录。3.根据权利要求1所述的一种基于时序演进过程解释的疾病预后预测系统,其特征在于,患者的相关健康医疗数据存储在数据库的多张表中,且表间存在键值连接使得各表信息得到关联。4.根据权利要求1所述的一种基于时序演进过程解释的疾病预后预测系统,其特征在于,所述预处理包括实验室检验数据的去极值处理、数据缺失值以及预测目标的标签处理。5.根据权利要求4所述的一种基于时序演进过程解释的疾病预后预测系统,其特征在于,所述预测目标的标签包括术后病发症的短期指标和患者自评估的中长期指标。6.根据权利要求1所述的一种基于时序演进过程解释的疾病预后预测系统,其特征在...
【专利技术属性】
技术研发人员:李劲松,金雨青,吴承凯,周天舒,田雨,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。