一种疾病分期的智能预测方法、电子设备及存储介质技术

技术编号:38609411 阅读:12 留言:0更新日期:2023-08-26 23:39
一种疾病分期的智能预测方法、电子设备及存储介质,属于智能医疗技术领域。为解决通过智能医疗帮助疾病分期诊断的问题。本发明专利技术采集某种疾病的病例数据,进行数据清洗,构建医疗数据集;进行特征值提取,得到特征值集合F1;构建医疗知识图谱;提取疾病分期的关键词集合在医疗知识图谱中进行一跳查询,得到医疗知识图谱的子图集合输入到GDLN模型中得到GDLN模型输出的节点特征集合R1;将F1划分为数值类型特征集合F2、文本类型特征集合F3,将F2进行归一化处理,将F3进行遮蔽处理,得到融合后的集合R2;以横向连接的方式融合R1和R2,然后输入到深度前馈神经网络模型,进行对疾病不同分期的预测。本发明专利技术用于疾病分期预测。本发明专利技术用于疾病分期预测。本发明专利技术用于疾病分期预测。

【技术实现步骤摘要】
一种疾病分期的智能预测方法、电子设备及存储介质


[0001]本专利技术属于智能医疗
,具体涉及一种疾病分期的智能预测方法、电子设备及存储介质。

技术介绍

[0002]医生的诊疗过程是基于病人的病情,结合其自身多年来积累的临床经验和相关领域的医疗专业知识,提出对症的诊疗方案。在这个过程中,患者病情的具体细节说明和专业医疗知识都是非常重要的。患者病情的具体细节信息是从医院提供的电子病历当中获得的,这是诊断的基础。伴随机器学习的发展和电子病历的完善,数据驱动的智能医疗诊疗方法成为主流。智能医疗是近几年学术界研究的热点,也是计算机和医疗领域结合的热门关注点,因此如何通过智能医疗帮助疾病分期预测,是要解决的问题。
[0003]知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,在医疗领域中可以准确的存储大量医疗知识,这是诊断的依据。知识图谱在知识驱动的系统应用中有着广泛的应用,实体和关系多通过三元组的形式进行组织。相比于传统的知识表示形式,知识图谱的覆盖范围更加广泛,所能表示的语义信息更加多样,可以快速复制医学专家的领域知识和临床经验,以其为基础搭建的智能医疗预测方法可以为广大基层医生提供医疗决策支持,提升医疗质量。

技术实现思路

[0004]本专利技术要解决的问题是通过智能医疗帮助疾病分期诊断的问题,提出一种疾病分期的智能预测方法、电子设备及存储介质。
[0005]为实现上述目的,本专利技术通过以下技术方案实现:
[0006]一种疾病分期的智能预测方法,包括如下步骤:
[0007]S1、采集某种疾病的病例数据,进行数据清洗,构建医疗数据集;
[0008]S2、将步骤S1得到的医疗数据集进行特征值提取,得到特征值集合F1;
[0009]S3、构建步骤S1所述的某种疾病的医疗知识图谱;
[0010]S4、提取步骤S2得到的特征值集合F1中的疾病分期的关键词集合K,将得到的关键词集合K在步骤S3构建的某种疾病的医疗知识图谱中进行一跳查询,得到某种疾病的医疗知识图谱的子图集合G;
[0011]S5、将步骤S4得到的某种疾病的医疗知识图谱的子图集合G输入到GDLN模型中进行训练,得到GDLN模型输出的节点特征集合R1;
[0012]S6、将步骤S2得到的特征值集合F1划分为数值类型特征集合F2、文本类型特征集合F3,将数值类型特征集合F2进行归一化处理,将文本类型特征集合F3输入到MH

BERT模型中进行遮蔽处理,得到MH

BERT模型输出的节点特征,然后以横向连接的方式融合处理后的F2和F3,得到融合后的集合R2;
[0013]S7、以横向连接的方式融合R1和R2,然后输入到深度前馈神经网络模型,进行对疾
病不同分期的预测。
[0014]进一步的,步骤S2中所述的特征值包括患者的年龄、性别、身体质量指数、主诉、现病史、其他病史、检查结果,所述检查结果包括血、尿、生化检测结果。
[0015]进一步的,步骤S3所述的医疗知识图谱基于疾病的诊断标准以及疾病相关的权威医学书籍构建,包括疾病类图谱、病因类图谱、临床表现类图谱、实验室检查类图谱、影像学检查类图谱、辅助检查类图谱。
[0016]进一步的,步骤S4中提取疾病分期的关键词集合K的方法包括如下步骤:
[0017]S4.1、收集疾病相关的医疗专业术语构建关键词词库;
[0018]S4.2、然后用特征值集合F1中的数据与关键词词库中的数据匹配,提取病历数据中的关键词集合K,K={k1,k2,

,kn},kn为第n个病历数据中的关键词。
[0019]进一步的,步骤S5的具体实现方法包括如下步骤:
[0020]S5.1、设置步骤S4得到的某种疾病的医疗知识图谱的子图集合G包括n个节点,每个节点的特征表示为一个D维向量;
[0021]S5.2、将G中的一个节点的特征输入到GDLN模型中,设置D的邻接矩阵为A,A为n
×
n维矩阵,则得输出的节点特征的表达式为:
[0022][0023]其中,H
(L)
为第L层的节点特征,sigmoid为GDLN模型的激活函数,W
(L

1)
为第L

1层到第L层的权重矩阵,为的度矩阵,H
(L

1)
为第L

1层的节点特征,为图的邻接矩阵;
[0024]S5.3、将步骤S4得到的某种疾病的医疗知识图谱的子图集合G中的所有节点特征输入到步骤S5.2的GDLN模型中进行训练,得到GDLN模型输出的节点特征集合为R1。
[0025]进一步的,步骤S6的具体实现方法包括如下步骤:
[0026]S6.1、将数值类型特征集合F2进行归一化处理:将数值类型特征集合F2中的特征值的实际值减去均值后除以标准差,得到的归一化处理后的特征z满足均值为0,标准差为1的正态分布,表达式为:
[0027][0028]其中,x2为数值类型特征集合F2中的特征值,μ为平均数,σ为标准差;
[0029]S6.2、将文本类型特征集合F3输入到MH

BERT模型中进行遮蔽处理:
[0030]S6.2.1、构建MH

BERT模型,表达式为:
[0031]M1=masking(x3)
[0032]H1=transformer(M1)
[0033]其中,x3为文本特征集F3中的特征值,M1为MH

BERT模型第一层遮蔽层的输入,H1为MH

BERT模型第一层遮蔽层的输出;
[0034]S6.2.2、每个遮蔽层的输出会被传递到下一个遮蔽层进行进一步的处理,表达式为:
[0035]M
L
=masking(H
L
‑1)
[0036]H
L
=transformer(M
L
)
[0037]其中,H
L
‑1为第L

1层的输出,M
L
为第L层遮蔽层的输入,H
L
为第L层遮蔽层的输出;
[0038]直到最后一层输出整个序列,得到MH

BERT模型输出的节点特征;
[0039]S6.3、以横向连接的方式融合步骤S6.1处理后的F2和步骤S6.2处理后的F3,得到融合后的集合R2。
[0040]进一步的,步骤S7的具体实现方法包括如下步骤:
[0041]S7.1、以横向连接的方式融合步骤S5得到的R1和步骤S6得到的R2,得到集合R;
[0042]S7.2、将步骤S7.1得到的集合R中的特征输入到深度前馈神经网络模型,进行对疾病不同分期的预测;
[0043]S7.2.1、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种疾病分期的智能预测方法,其特征在于,包括如下步骤:S1、采集某种疾病的病例数据,进行数据清洗,构建医疗数据集;S2、将步骤S1得到的医疗数据集进行特征值提取,得到特征值集合F1;S3、构建步骤S1所述的某种疾病的医疗知识图谱;S4、提取步骤S2得到的特征值集合F1中的疾病分期的关键词集合K,将得到的关键词集合K在步骤S3构建的某种疾病的医疗知识图谱中进行一跳查询,得到某种疾病的医疗知识图谱的子图集合G;S5、将步骤S4得到的某种疾病的医疗知识图谱的子图集合G输入到GDLN模型中进行训练,得到GDLN模型输出的节点特征集合R1;S6、将步骤S2得到的特征值集合F1划分为数值类型特征集合F2、文本类型特征集合F3,将数值类型特征集合F2进行归一化处理,将文本类型特征集合F3输入到MH

BERT模型中进行遮蔽处理,得到MH

BERT模型输出的节点特征,然后以横向连接的方式融合处理后的F2和F3,得到融合后的集合R2;S7、以横向连接的方式融合R1和R2,然后输入到深度前馈神经网络模型,进行对疾病不同分期的预测。2.根据权利要求1所述的一种疾病分期的智能预测方法,其特征在于,步骤S2中所述的特征值包括患者的年龄、性别、身体质量指数、主诉、现病史、其他病史、检查结果,所述检查结果包括血、尿、生化检测结果。3.根据权利要求1或2所述的一种疾病分期的智能预测方法,其特征在于,步骤S3所述的医疗知识图谱基于疾病的诊断标准以及疾病相关的权威医学书籍构建,包括疾病类图谱、病因类图谱、临床表现类图谱、实验室检查类图谱、影像学检查类图谱、辅助检查类图谱。4.根据权利要求3所述的一种疾病分期的智能预测方法,其特征在于,步骤S4中提取疾病分期的关键词集合K的方法包括如下步骤:S4.1、收集疾病相关的医疗专业术语构建关键词词库;S4.2、然后用特征值集合F1中的数据与关键词词库中的数据匹配,提取病历数据中的关键词集合K,K={k1,k2,

,kn},kn为第n个病历数据中的关键词。5.根据权利要求4所述的一种疾病分期的智能预测方法,其特征在于,步骤S5的具体实现方法包括如下步骤:S5.1、设置步骤S4得到的某种疾病的医疗知识图谱的子图集合G包括n个节点,每个节点的特征表示为一个D维向量;S5.2、将G中的一个节点的特征输入到GDLN模型中,设置D的邻接矩阵为A,A为n
×
n维矩阵,则得输出的节点特征的表达式为:其中,H
(L)
为第L层的节点特征,sigmoid为GDLN模型的激活函数,W
(L

1)
为第L

1层到第L层的权重矩阵,为的度矩阵,H
(L

1)
为第L

1层的节点特征,为图的邻接矩阵;S5.3、将步骤S4得到的某种疾病的医疗知识图谱的子图集合G中的所有节点特征输入到步骤S5.2的GDLN模型中进行训练,得到GDLN模型输出的节点特征集合为R1。
6.根据权利要求5所述的一种疾病分期的智能预测方法,其特征在于,步骤S6的具体实现方法包括如下步骤:S6.1、将数值类型特征集合F2进行归一化处理:将数值类型特征集合F2中的特征值的实际值减去均值后除以标准差,得到的归一化处理后的特征z满足均值为0,标准差为1的正态分布,表达式为:其中,x2为数值类型特征集合F2中的特征值,μ为平均数,σ为标准差;S6.2、将文本类型特征集合F3输入到MH

【专利技术属性】
技术研发人员:赵石磊王浩丞马超叶子黄海曲家兴
申请(专利权)人:黑龙江省网络空间研究中心黑龙江省信息安全测评中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1