基于长短期记忆模型的疾病预测方法、装置和计算机设备制造方法及图纸

技术编号:22566823 阅读:42 留言:0更新日期:2019-11-16 12:47
本申请揭示了一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质,所述方法包括:获取目标对象的第一医疗数据和关联对象的第二医疗数据;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病;输出所述疾病预测结果与所述关联疾病,从而提高预测的准确性。

Disease prediction method, device and computer equipment based on long-term and short-term memory model

The application discloses a disease prediction method, device, computer device and storage medium based on the long-term memory model, the method includes: obtaining the first medical data of the target object and the second medical data of the associated object; inputting the first medical data and the second medical data into the first long-term memory network of the trained long-term memory model, The hidden state vector sequence in the first long-term and short-term memory network is obtained; the hidden state vector sequence is input into the second long-term and short-term memory network for operation, and the disease prediction result is obtained; the predicted diseases whose disease probability is higher than the preset threshold are selected from the disease prediction result, and recorded as the designated diseases, and the designated diseases are obtained according to the preset disease association network The disease is directly related to the disease; the disease prediction result and the related disease are output, so as to improve the accuracy of prediction.

【技术实现步骤摘要】
基于长短期记忆模型的疾病预测方法、装置和计算机设备
本申请涉及到计算机领域,特别是涉及到一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质。
技术介绍
疾病风险预测是人工智能和医学结合产生的,它的核心是预测未来一段时间内患某种疾病的概率,主要的计算方法包括经典的回归分析,传统的机器学习方法和新兴的深度学习方法。但是真实世界的医学数据质量差,数据维度高,数据不平衡和医学数据不连续的时序性,导致准确地预测疾病的风险难度很大。现有的疾病风险预测系统需要患者的体检数据,但是体检过程耗时费力;同时现有产品只能分析单一疾病的风险,不能考虑疾病之间的关联;此外,现有产品的风险预测只能预测未来一段时间的患病风险,不能考虑输入变量的时间信息;并且,现有的疾病预测只考虑被测对象的医疗数据,预测准确度有待提高;现有的疾病预测产品仅采用单一的预测模型,预测准确度不足。
技术实现思路
本申请的主要目的为提供一种基于长短期记忆模型的疾病预测方法、装置、计算机设备和存储介质,旨在提高疾病预测的准确度。为了实现上述专利技术目的,本申请提出一种基于长短期记忆模型的疾病预测方法,包括以下步骤:获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;输出所述疾病预测结果与所述关联疾病。进一步地,所述将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:将所述第一医疗数据根据预设的时间段分为多段数据序列;根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。进一步地,所述将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段。进一步地,所述将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2...、hn,其中共有n个时间段的步骤,包括:根据公式:eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2...、cn。进一步地,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤,包括:将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,从而得到所述第二长短期记忆网络输出的高维向量序列;根据预设的分向量与预测结果含义对应关系,解读所述高维向量序列,从而得到在将来不同时间段内的疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率。进一步地,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率的步骤之后,包括:接收输入的多个改善因素组,并将所述改善因素组与第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中进行计算,其中所述改善因素组包括在指定时间点进行用药或者手术;获取所述长短期记忆模型输出的与所述多个改善因素组分别对应的多组改善疾病预测结果,其中所述改善疾病预测结果包括预测疾病类型与对应的发病机率;根据预设的选择规则,从所述多组改善疾病预测结果中筛选出最终改善疾病预测结果,并生成治疗推荐方案,其中所述治疗推荐方案附有所述最终改善疾病预测结果对应的改善因素组。进一步地,所述疾病关联网络为知识图谱网络,所述根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型的步骤之前,包括:采用预设的知识图谱构建工具从预先收集的指定信息中识别出初始实体,其中所述指定信息至少记载了所述指定疾病,所述初始实体至少包括所述指定疾病;对所述初始实体进行去重处理,从而获取最终实体;从所述指定信息中提取出最终实体之间的关系,从而形成三元组,并依据所述三元组生成所述知识图谱网络。本申请提供一种基于长短期记忆模型的疾病预测装置,包括:医疗数据获取单元,用于获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;隐藏状态向量序列获取单元,用于将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;疾病预测结果获取单元,用于将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;关联疾病获取单元,用于从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;输出单元,用于输出所述疾病预测结果与所述关联疾病。本申请提供一种计算机设备,包括存储器和本文档来自技高网...

【技术保护点】
1.一种基于长短期记忆模型的疾病预测方法,其特征在于,包括:/n获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;/n将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;/n将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;/n从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;/n输出所述疾病预测结果与所述关联疾病。/n

【技术特征摘要】
1.一种基于长短期记忆模型的疾病预测方法,其特征在于,包括:
获取目标对象的第一医疗数据和关联对象的第二医疗数据,其中所述目标对象与关联对象存在血缘关系,第一医疗数据包括用药史、疾病史和手术史,第二医疗数据包括遗传病治疗史;
将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列,所述长短期记忆模型包括用于编码的第一长短期记忆网络和用于解码的第二长短期记忆网络;
将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型与对应的发病机率;
从所述疾病预测结果中筛选出发病机率高于预设阈值的预测疾病,记为指定疾病,并根据预设的疾病关联网络获取与所述指定疾病直接连接的关联疾病,其中关联网络的网络节点为不同的疾病类型;
输出所述疾病预测结果与所述关联疾病。


2.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将第一医疗数据和第二医疗数据输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
将所述第一医疗数据根据预设的时间段分为多段数据序列;
根据预设的遗传病与其他疾病的影响因子对应关系,获取所述第二医疗数据中的遗传病对其他疾病的指定影响因子;
将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列。


3.根据权利要求2所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将所述多段数据序列与所述指定影响因子输入已训练完成的长短期记忆模型中的第一长短期记忆网络中运算,得到所述第一长短期记忆网络中的隐藏状态向量序列的步骤,包括:
根据公式:ht=LSTMenc(xt,ht-1),获得所述第一长短期记忆网络中的隐藏状态向量ht,其中t为第t个时间段,ht为对应于第t个时间段的隐藏状态向量,ht-1为对应于第t-1个时间段的隐藏状态向量,Xt为第t个时间段的输入数据,LSTMenc指利用第一长短期记忆网络进行编码运算,其中Xt包括第t个时间段的第一医疗数据和第t个时间段的指定影响因子;
将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2…、hn,其中共有n个时间段。


4.根据权利要求3所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将多个预设的时间段对应的隐藏状态向量构成隐藏状态向量序列h1、h2…、hn,其中共有n个时间段的步骤,包括:
根据公式:eij=score(si,hj),获取所述第一长短期记忆网络中最终隐藏状态向量ci,aij为权重参数,其中共有n个时间段,si为所述第二长短期记忆网络中的第i个隐藏状态向量,score(si,hj)指采用预设的score函数根据si和hj计算出的分数;
将多个预设的时间段对应的最终隐藏状态向量构成隐藏状态向量序列c1、c2…、cn。


5.根据权利要求1所述的基于长短期记忆模型的疾病预测方法,其特征在于,所述将所述隐藏状态向量序列输入所述第二长短期记忆网络中运算,得到疾病预测结果,其中所述疾病预测结果包括预测疾病类型...

【专利技术属性】
技术研发人员:贾文笑谭克为李响谢国彤
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1