一种基于先验医学知识的疾病风险预测方法技术

技术编号：21161915 阅读：24 留言：0更新日期：2019-05-22 08:31

本发明专利技术公开了一种基于先验医学知识的疾病风险预测方法，包括以下步骤：S1、以向量形式输入患者p的EHR记录数据；S2、使用基于卷积神经网络的预测模型来获得预测概率，从而获得目标函数；S3、整合先验医学知识融入步骤S2的预测模型，引入一个期望分布值并设置约束特征，通过正则化方法得到损失函数；S4、通过损失函数计算新的目标函数，并获得风险预测模型的最优参数；通过最优参数预测患者P的疾病风险。本发明专利技术使用后验正则化方法自动将离散的医学知识或规则结合到深度预测模型中，其构建的预测模型实现了比最先进的基线更准确的预测结果。

A Prediction Method of Disease Risk Based on Priori Medical Knowledge

The invention discloses a disease risk prediction method based on prior medical knowledge, which includes the following steps: S1, input EHR record data of patient P in vector form; S2, use prediction model based on convolution neural network to obtain prediction probability, thereby obtaining objective function; S3, integrate prior medical knowledge into prediction model of Constraint features are set and loss function is obtained by regularization method. S4. New objective function is calculated by loss function and the optimal parameters of risk prediction model are obtained. Disease risk of patient P is predicted by optimal parameters. The invention uses a posterior regularization method to automatically combine discrete medical knowledge or rules into a depth prediction model, and the prediction model constructed by the method achieves more accurate prediction results than the most advanced baseline.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于先验医学知识的疾病风险预测方法
本专利技术涉及先验医学知识
，尤其涉及一种基于先验医学知识的疾病风险预测方法。
技术介绍
随着电子健康记录的大量积累对这些数据的分析使研究人员和医疗服务提供者更接近个性化医疗的目标。然而，原始EHR数据有其自身的问题，如高维数、时间性、稀疏性、不规则性、偏倚等。这些挑战大大增加了直接传统机器学习或统计模型用于预测患者潜在疾病的应用难度，这是中世纪医学领域的一个核心任务，称为风险预测。最近，深度学习模型显示了直接从原始电子健康记录中提取出有意义特征的能力，包括计算表型、诊断预测、风险预测等。特别是在风险预测任务中，采用了基于注意力的递归神经网络来预测患者心衰。随着性能的提高，卷积神经网络也被用来捕捉患者来访时的局部时间特征，并预测疾病的风险。虽然上述基于深度学习的模型在风险预测任务中取得了很好的效果，但是他们都忽视了先验医学知识的重要性，例如疾病与其相应风险因素之间的关系。众所周知，先验医学知识在医疗领域起着重要作用。当一个病人去看医生时，医生首先会检查病人目前的症状，然后会仔细检查病史，如药物、吸烟史、饮酒史、家族史等，这些都是疾病的危险因素。
技术实现思路
本专利技术目的是克服现有技术上的不足，将先验医学知识与预测模型合理结合，提供一种基于先验医学知识的疾病风险预测方法。本专利技术是一种新颖的预测模型PRIME，它可以成功地将异构离散的先验医学知识集成到预测模型中以提高性能，该模型可以采用所有现成的基于深度学习的方法作为基本预测模型。模型构建包括以下步骤：1).以向量形式输入第p位患者的EHR记录数据X(p)。2...

【技术保护点】
1.一种基于先验医学知识的疾病风险预测方法，其特征在于：包括以下步骤：S1、以向量形式输入患者p的EHR记录数据；S2、使用基于卷积神经网络的预测模型来获得预测概率，从而获得目标函数；S3、整合先验医学知识融入步骤S2的预测模型，引入一个期望分布值并设置约束特征，通过正则化方法得到损失函数；S4、通过损失函数计算新的目标函数，并获得风险预测模型的最优参数；通过最优参数预测患者P的疾病风险。

【技术特征摘要】
1.一种基于先验医学知识的疾病风险预测方法，其特征在于：包括以下步骤：S1、以向量形式输入患者p的EHR记录数据；S2、使用基于卷积神经网络的预测模型来获得预测概率，从而获得目标函数；S3、整合先验医学知识融入步骤S2的预测模型，引入一个期望分布值并设置约束特征，通过正则化方法得到损失函数；S4、通过损失函数计算新的目标函数，并获得风险预测模型的最优参数；通过最优参数预测患者P的疾病风险。2.如权利要求1所述的基于先验医学知识的疾病风险预测方法，其特征在于：所述步骤S1中第p位患者的EHR记录数据为将xt嵌入到访问级中则：vt＝Wυxt+bυ其中，和是需要学习的参数，k是潜在表示的大小。3.如权利要求2所述的基于先验医学知识的疾病风险预测方法，其特征在于：所述步骤S2中获得预测概率向量包括以下步骤：S21、设l表示时间窗口的大小，vt：t+l-1表示从vt到vt+l-1的l次的连接，滤波器应用于l次访问的窗口来产生一个新的特征使用ReLU激活如下：ft＝ReLU(Wfvt：t+l-1+bf)ReLU(f)＝max(f，0)其中，bf是偏置项；则生成图像特征：S21、应用一个全连接的softmax层用以产生预测概率，如下：4.如权利要求3所述的基于先验医学知识的疾病风险预测方法，其特征在于：所述步骤S2中预测概率由后验分布P(yp|X(p)；θ)表示，其中yp是真实值，真实值yp和预测概率之间的交叉熵被用于计算损失，则风险预测的目标函数为交叉熵的平均值：5.如权利要求4所述的基于先验医学知识的疾病风险预测方法，其特征在于：所述步骤S3中得到损失函数包括以下步骤：S31、设Q是后验信息约束的集合，则：其中，φ(...

【专利技术属性】
技术研发人员：莫毓昌，李灿东，林栋，黄华林，连志杰，
申请(专利权)人：华侨大学，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人