基于循环时间卷积网络的疾病诊断系统、设备及介质技术方案

技术编号:25992896 阅读:43 留言:0更新日期:2020-10-20 19:01
本发明专利技术公开了一种基于循环时间卷积网络的疾病诊断系统、设备及介质,包括:预测模型构建与训练模块,用于根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;疾病诊断预测模块,用于根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。基于时间卷积网络融合长短时循环网络构建的循环时间卷积网络预测模型,将疾病诊断结果与历史电子病历诊断信息建立联系,保留长时历史信息,对序列数据进行长程建模预测,实现对长序列数据信息进行精细化预测。

【技术实现步骤摘要】
基于循环时间卷积网络的疾病诊断系统、设备及介质
本专利技术涉及医疗数据挖掘
,特别是涉及一种基于循环时间卷积网络的疾病诊断系统、设备及介质。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。随着医疗记录数据的不断增加,疾病智能诊断能够为医生起到很好的辅助作用,目前,研究人员常常于电子病历(EMR)中选取数据,进行进一步的诊断和预测,EMR是居民个人在医疗机构历次就诊过程中产生和被记录的完整、详细的临床信息资源,几乎囊括了患者过去与现在的所有医疗信息,而专利技术人发现,其中部分患者拥有较长的病程序列,传统的预测模型往往无法保留长时历史信息,难以对序列数据进行长程建模,造成预测模型耗时长,精度低,为后期诊断预测造成了极大困难;因此对EMR的数据处理和在其基础上的疾病诊断已经成为一项固有的挑战,仅仅依赖于传统机器学习方法已经不足以对长序列数据信息进行精细化表示,目前,能够捕获长程时间依赖关系,并进一步进行精细化预测的多疾病诊断系统尚未出现。
技术实现思路
为了解决上述问题,本专利技术提出了一种基于循环时间卷积网络的疾病诊断系统、设备及介质,基于时间卷积网络融合长短时循环网络构建的循环时间卷积网络预测模型,将疾病诊断结果与历史电子病历诊断信息建立联系,保留长时历史信息,对序列数据进行长程建模预测,实现对长序列数据信息进行精细化预测。为了实现上述目的,本专利技术采用如下技术方案:第一方面,本专利技术提供一种基于循环时间卷积网络的疾病诊断系统,包括:预测模型构建与训练模块,用于根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;疾病诊断预测模块,用于根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。第二方面,本专利技术提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成以下步骤:根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。第三方面,本专利技术提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成以下步骤:根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。与现有技术相比,本专利技术的有益效果为:本专利技术根据长时历史病历诊断信息,提取与疾病诊断结果相关的诊断信息,构建已知病程向量训练集;基于时间卷积网络融合长短时循环网络构建循环时间卷积网络预测模型,以已知病程向量训练集对该模型进行训练,使得各类疾病诊断预测结果与病患的历史疾病诊断建立联系,对疾病测试准确度高、可靠性强且较稳定,实现对长序列病历数据信息进行精细化预测。附图说明构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1为本专利技术实施例1提供的基于循环时间卷积网络的疾病诊断系统示意图;图2为本专利技术实施例1提供的Skip-gram编码模块示意图;图3为本专利技术实施例1提供的特征提取模块卷积过程示意图;图4为本专利技术实施例1提供的长短期记忆网络示意图;图5为本专利技术实施例1提供的循环时间卷积网络结构图;图6为本专利技术方法与其他方法比较的召回率迭代对比图。具体实施方式:下面结合附图与实施例对本专利技术做进一步说明。应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。实施例1如图1所示,本实施例提供一种基于循环时间卷积网络的疾病诊断系统,包括:预测模型构建与训练模块,用于根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;疾病诊断预测模块,用于根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。所述预测模型构建与训练模块中,包括:训练数据采集子模块,被配置为采集已知疾病诊断结果的患者历史就诊电子病历;可以理解的,所述电子病历包括药物记录、疾病诊断记录、生理指标、化验结果、非文字记录等。训练数据预处理子模块,被配置为对采集的历史就诊电子病历信息,进行预处理,得到预处理后的历史就诊电子病历信息;训练数据提取子模块,被配置为从预处理后的历史电子病历信息中提取每个已知疾病诊断结果患者的已知病程序列;可以理解的,所述病程序列包括患者历史疾病诊断信息,如[心脏病、高血压、肺癌]等;训练数据编码子模块,被配置为根据所提取的已知病程序列对每个已知疾病诊断结果进行编码表示,得到已知疾病诊断结果的若干个已知病程向量。在本实施例中,训练数据预处理子模块包括:数据筛选单元,被配置为对采集的历史电子病历信息进行初次筛选,具体为筛选历史疾病诊断结果和诊断时间,删除非需求数据;从初次筛选结果中删除预设定的若干项非重要疾病的诊断结果,保留重要疾病的诊断结果和诊断时间;可以理解的,所述非需求数据包括:测试号、姓名、种族、检查科室等;数据拟合单元,被配置为对诊断时间的缺失值进行拟合;格式转换单元,被配置为对重要疾病的诊断结果和诊断时间均进行格式转换。在本实施例中,训练数据编码子模块中包括:建立患者与历史疾病诊断结果对应的已知病程序列作为第一样本,如患者1:[艾滋病、高血压、肺癌];患者2[脓毒症、肠癌、冠心病、脑溢血]等;采用Skip-gram方法对第一样本进行编码,得到历史疾病诊断结果对应的若干个已知病程向量本文档来自技高网
...

【技术保护点】
1.一种基于循环时间卷积网络的疾病诊断系统,其特征在于,包括:/n预测模型构建与训练模块,用于根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;/n疾病诊断预测模块,用于根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。/n

【技术特征摘要】
1.一种基于循环时间卷积网络的疾病诊断系统,其特征在于,包括:
预测模型构建与训练模块,用于根据历史电子病历提取已知疾病诊断结果的已知病程向量,以已知病程向量作为训练集训练构建的循环时间卷积网络预测模型;
疾病诊断预测模块,用于根据待预测患者的电子病历信息提取待测病程向量,将待测病程向量输入至训练后的循环时间卷积网络预测模型中,得到待预测患者的疾病诊断预测结果。


2.如权利要求1所述的一种基于循环时间卷积网络的疾病诊断系统,其特征在于,对获取的历史电子病历进行预处理,具体为:
筛选已知疾病诊断结果和诊断时间,删除预设的非需求数据和非重要诊断结果,对诊断时间的缺失值进行拟合,对重要诊断结果和诊断时间进行格式转换。


3.如权利要求1所述的一种基于循环时间卷积网络的疾病诊断系统,其特征在于,所述提取已知疾病诊断结果的已知病程向量包括:
建立患者与已知疾病诊断结果对应的已知病程序列作为第一样本,采用Skip-gram方法对第一样本进行编码,得到已知疾病诊断结果对应的若干个已知病程向量。


4.如权利要求3所述的一种基于循环时间卷积网络的疾病诊断系统,其特征在于,采用Skip-gram方法,根据目标词汇预测其邻居出现的疾病词汇;
以词向量内积定义相似度函数,根据相似度函数求解目标函数,得到在疾病诊断向量中以滑动窗口选择的目标词汇的最优预测值,取得已知病程向量;
所述目标函数为:



其中,T为疾病诊断向量的长度,c为上下文单词,ωt为中心诊断概念词,ωc为ωt的上下文诊断概念词,Ct为ωt的邻居诊断单词集,s为概念词相似度函数,Nt为单词集。


5.如权利要求1所述的一种基于循环时间卷积网络的疾病诊断系统,其特征在于,所述循环时间卷积网络预测模型由基于时间卷积网络融合长短时循环网络所构建。

...

【专利技术属性】
技术研发人员:王红王露潼李威庄鲁贺韩书张慧于晓梅阎小燕张伟胡斌
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1