一种基于循环神经网络的诊疗项目预测方法技术

技术编号:32850646 阅读:18 留言:0更新日期:2022-03-30 19:05
本发明专利技术涉及一种基于循环神经网络的诊疗项目预测方法,包括:将清洗后的诊疗记录按照特定的时间间隔转化成诊疗记录序列;将每一个诊疗记录转化成独热码并用向量表示,并将每一条诊疗记录的最后一个时间间隔的诊疗记录作为预测目标,将其作为该条记录的标签,得到已标注的诊疗记录数据;挖掘规范的诊疗模式,并训练循环神经网络预测模型。在基于当前的诊疗序列预测后续的诊疗项目时,首先计算当前诊疗序列与规范诊疗模式的相似度,若规范则输入到预测模型中得到最终的预测结果。本发明专利技术弥补传统方法在数据特征处理方面的缺陷,提高了训练速度以及模型的准确率,而且在预测前先判断当前诊疗过程的规范性,达到了规范诊疗的目标,使预测结果更加合理。使预测结果更加合理。使预测结果更加合理。

【技术实现步骤摘要】
一种基于循环神经网络的诊疗项目预测方法


[0001]本专利技术属于医学辅助诊疗领域,具体说是一种基于循环神经网络的诊疗项目预测方法。

技术介绍

[0002]临床路径是指基于循证医学,针对某一疾病构建的标准化、程序化诊疗计划。临床路径的核心可归结为“在正确的时间进行正确的诊疗项目”,其通常将疾病的诊疗过程可以划分为若干个阶段,每个阶段都有所需的诊疗项目。采用这种规范化的诊疗过程,能够有效提升治疗效果、降低医疗费用、规范医疗行为。因此,对每一阶段诊疗项目进行预测是临床路径个性化规划的一项重要任务。
[0003]传统的临床路径主要通过医疗专家制定,制定出来的临床路径通常在很长一段时间内不再更新,由于疾病在治疗过程中的动态演变性以及不同医院之间实时方案的差异,导致人工制定的临床路径变异率极高,难以满足不同医院和病人的个性化需求。
[0004]随着人工智能技术的发展,医院开始借助机器来辅助医生进行每一阶段诊疗项目的决策。然而,现有的技术存在着以下不足:(1)部分方法基于决策树、逻辑回归、支持向量机等传统机器学习算法,这些算法依赖于数据特征的选取,但是医疗数据存在着数据量大、不完整度高、来源多样以及非结构化的特点,传统的由人工参与的特征提取方式在面对大量的复杂的医疗数据时,效率低且容易遗漏重要的信息,从而降低了预测结果的准确性;(2)部分方法只是基于过去的诊疗项目预测后续的诊疗项目,未考虑过去每一个阶段的诊疗项目是否符合规范的临床路径;(3)部分方法未考虑到病人住院过程的医疗数据具有半时序性的特征,患者住院期间,发生在同一时间间隔的诊疗记录不区分发生的先后顺序,但是不同时间间隔的诊疗记录之间具有时序性。

技术实现思路

[0005]为了提高后续诊疗项目预测的准确性,满足临床路径个性化规划的需求,本专利技术提供一种基于循环神经网络的诊疗项目预测方法,其能充分的捕获复杂的临床数据的特征,并且在预测后续的诊疗项目之前先判断过去诊疗项目是否符合规范的临床路径,提高了诊疗项目预测结果的准确率,增强了预测结果的合理性。
[0006]本专利技术为实现上述目的所采用的技术方案是:
[0007]一种基于循环神经网络的诊疗项目预测方法,包括以下步骤:
[0008]获取诊疗记录数据,并对诊疗记录数据进行清洗;
[0009]将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,并将该序列分为训练集、验证集和测试集;
[0010]使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列;
[0011]使用诊疗记录时间序列构建诊疗项目预测模型;
[0012]计算待检测诊疗记录时间序列与规范诊疗模式序列的相似度,若相似度大于阈
值,则将待检测诊疗记录时间序列输入诊疗项目预测模型,得到最后一个时间间隔内诊疗项目发生的概率,否则,不对该待检测诊疗记录时间序列进行处理。
[0013]所述诊疗记录数据包括:诊断结果、医嘱、用药情况、检查项目。
[0014]所述对诊疗记录数据进行清洗具体为:
[0015]删除与预测任务无关的字段,采用设定的标准值填充或者删除的方式处理诊疗记录数据中的缺失值和噪声。
[0016]所述将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,包括以下步骤:
[0017]将清洗后的诊疗记录数据按照设定的时间间隔转化成诊疗记录序列;
[0018]统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;
[0019]用skip-gram算法将诊疗记录集合的编码转化成向量表示,得到向量形式的诊疗记录序列;
[0020]将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从向量形式的诊疗记录序列中删除,得到已标注的向量形式的诊疗记录时间序列即去掉最后一个时间间隔的诊疗记录集合向量的数据。
[0021]所述使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列,包括以下步骤:
[0022]1)将所有向量形式的诊疗记录时间序列初始化为一个簇并加入簇表;
[0023]2)在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中;
[0024]3)重复步骤2),直到产生设定的K个簇时停止,将K个簇的质心作为规范诊疗模式序列。
[0025]用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:
[0026][0027]式中X是簇C
i
中的样本即一条向量形式的诊疗记录序列,c
i
是簇C
i
的质心,P是和样本X同维度的全1列向量,

表示矩阵的哈达马乘积,
×
表示矩阵乘法;
[0028]样本X和质心c
i
之间的距离为:
[0029][0030]式中cos<X,c
i
>[j][j]表示余弦相似度结果矩阵cos<X,c
i
>中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数;
[0031]簇总体相似度表达式为:
[0032][0033]式中k是当前簇的个数,SSE的值越大说明相似度越低。
[0034]所述使用诊疗记录时间序列构建诊疗项目预测模型,包括以下步骤:
[0035]1)构建基于门控循环单元的两层循环神经网络层;
[0036]2)构建以softmax函数作为分类器的循环神经网络预测模型输出层;
[0037]3)将诊疗记录时间序列输入到循环神经网络预测模型中;
[0038]4)根据预设的超参数进行训练,训练的过程中根据验证集的结果调整神经网络预测模型的超参数,所述的超参数为:优化器学习率、随机断开神经元的概率、权重衰减系数;
[0039]5)进行迭代训练预设的次数后,保存神经网络预测模型的超参数;输入测试集的数据,获得测试结果即每一个诊疗记录发生的概率;重复步骤3)至5),直至模型收敛,即得到诊疗项目预测模型。
[0040]所述构建基于门控循环单元的两层循环神经网络层具体为:
[0041]z
t
=σ(W
z
x
t
+U
z
h
t-1
+b
z
)
[0042]r
t
=σ(W
r
x
t
+U
r
h
t-1
+b
r
)
[0043][0044][0045]式中z
t
,r
t
分别表示循环神经网络中门控循环单元的更新门和重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于循环神经网络的诊疗项目预测方法,其特征在于,包括以下步骤:获取诊疗记录数据,并对诊疗记录数据进行清洗;将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,并将该序列分为训练集、验证集和测试集;使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列;使用诊疗记录时间序列构建诊疗项目预测模型;计算待检测诊疗记录时间序列与规范诊疗模式序列的相似度,若相似度大于阈值,则将待检测诊疗记录时间序列输入诊疗项目预测模型,得到最后一个时间间隔内诊疗项目发生的概率,否则,不对该待检测诊疗记录时间序列进行处理。2.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述诊疗记录数据包括:诊断结果、医嘱、用药情况、检查项目。3.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述对诊疗记录数据进行清洗具体为:删除与预测任务无关的字段,采用设定的标准值填充或者删除的方式处理诊疗记录数据中的缺失值和噪声。4.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,包括以下步骤:将清洗后的诊疗记录数据按照设定的时间间隔转化成诊疗记录序列;统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;用skip-gram算法将诊疗记录集合的编码转化成向量表示,得到向量形式的诊疗记录序列;将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从向量形式的诊疗记录序列中删除,得到已标注的向量形式的诊疗记录时间序列即去掉最后一个时间间隔的诊疗记录集合向量的数据。5.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列,包括以下步骤:1)将所有向量形式的诊疗记录时间序列初始化为一个簇并加入簇表;2)在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中;3)重复步骤2),直到产生设定的K个簇时停止,将K个簇的质心作为规范诊疗模式序列。6.根据权利要求5所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:式中X是簇C
i
中的样本即一条向量形式的诊疗记录序列,c
i
是簇C
i
的质心,P是和样本X同维度的全1列向量,

表示矩阵的哈达马乘积,
×
表示矩阵乘法;
样本X和质心c
i
之间的距离为:式中cos<X,c
i
>[j][j]表示余弦相似度结果矩阵cos<X,c
i
>中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数;...

【专利技术属性】
技术研发人员:赵奎闫玉芳曹吉龙马慧敏魏景峰张帅康高天董莉颖
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1