融合知识图谱和深度学习的糖尿病预测方法及系统技术方案

技术编号:36701885 阅读:13 留言:0更新日期:2023-03-01 09:19
本发明专利技术提供一种融合知识图谱和深度学习的糖尿病预测方法及系统,该方法通过构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,得到体检数据向量;构建糖尿病领域知识图谱;基于构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;融合自注意力机制与卷积神经网络,构建分类预测模型,由分类预测模型获得预测结果。本发明专利技术与现有方法相比,能够通过同时考虑患者体检数据与症状描述,并基于知识和数据双驱动,具有更高的准确性和可解释性。解释性。解释性。

【技术实现步骤摘要】
融合知识图谱和深度学习的糖尿病预测方法及系统


[0001]本专利技术涉及一种融合知识图谱和深度学习的糖尿病预测方法及系统,属于医疗信息化


技术介绍

[0002]糖尿病是因机体胰岛素分泌相对或绝对不足导致血糖过高,而引起蛋白质和脂肪代谢紊乱的一种常见内分泌代谢性疾病。糖尿病的症状常表现为多饮、多食、多尿、体重下降,但主要危害在于患者长期血糖升高会引发各种严重的并发症,给肾脏、血管、神经、眼睛等器官带来巨大的危害,甚至危及生命。
[0003]目前,糖尿病仍然无法被完全治愈,但如果在糖尿病早期对患者进行适当的护理,改变其生活方式并辅助药物治疗,能够使糖尿病并发症的风险降低30%~60%。因此,糖尿病的早期发现至关重要。在医学上,糖尿病的诊断主要依靠指尖采血的方式,诊断标准为空腹血糖≥7.0mmol/L或者糖耐量试验后两小时血糖≥11.1mmol/L。
[0004]但随着人工智能技术和智慧医疗的飞速发展,研究人员开始将人工智能方法应用于糖尿病的预测。主要是采用机器学习或深度学习相关算法自动处理糖尿病数据,挖掘出数据中的隐藏信息,以此来判断患者是否患有糖尿病。目前已有的糖尿病分类预测模型虽然能有效识别糖尿病高危人群,可为健康管理、疾病预防决策提供依据,但仍然存在一些不足之处。
[0005]例如,目前的糖尿病分类预测模型大多基于数据驱动的方法实现,受到数据质量的限制。而且大多模型仅考虑患者的体检数据,并未考虑到患者的生活习惯以及自身症状对预测结果的影响。
[0006]此外,仅基于机器学习或深度学习方法的分类预测模型可解释性较低,且缺乏外部医学专业知识的支撑。医疗决策往往伴随着生命风险,如果将如此重要的决策交给无法提供责任且缺乏解释性的机器,无异于推卸责任,可能导致灾难性后果。
[0007]上述问题是在糖尿病预测过程中应当予以考虑并解决的问题。

技术实现思路

[0008]本专利技术的目的是提供一种融合知识图谱和深度学习的糖尿病预测方法及系统解决现有技术中存在的仅考虑患者的体检数据,预测结果的准确性较低,且缺乏可解释性的问题。
[0009]本专利技术的技术解决方案是:
[0010]一种融合知识图谱和深度学习的糖尿病预测方法,包括以下步骤,
[0011]S1、构建体检数据实体向量库,基于体检数据实体向量库得到患者体检数据的向量表示,得到体检数据向量;
[0012]S2、获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型TransR将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图
谱;
[0013]S3、基于步骤S2构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;
[0014]S4、融合自注意力机制与卷积神经网络,构建分类预测模型,由步骤S1得到的体检数据向量与步骤S3得到的症状描述向量,由分类预测模型获得预测结果。
[0015]进一步地,步骤S1中,构建体检数据实体向量库,具体为,
[0016]S11、依据医学上定义的体检指标正常范围,将体检指标的检测值划分为更具细粒度的若干参考范围,并确定对应的关系;
[0017]S12、基于划分的参考范围,将体检指标、关系与检测值表示成三元组的形式,采用知识表示模型TransH得到体检数据实体向量库。
[0018]进一步地,步骤S2中,获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型TransR将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱,具体为,
[0019]S21、获取用于构建知识图谱的糖尿病领域专业文献;
[0020]S22、进行知识抽取,包括实体抽取和关系抽取,其中,实体抽取为基于双向长短期记忆网络BiLSTM和条件随机场CRF模型抽取出步骤S21得到的糖尿病领域专业文献中与糖尿病相关的实体;关系抽取为通过对文本进行句法分析抽取出文本中隐含的实体之间的关系,并表示成三元组(头实体,关系,尾实体)的形式;
[0021]S23、进行知识融合,通过实体对齐和实体链接对抽取的知识实体整合、消歧,通过关系推理进行正确性判断,进而更新三元组中的实体和关系;
[0022]S24、进行知识表示,基于知识表示模型TransR将糖尿病领域知识图谱中的实体和关系表示成向量形式,得到构建的糖尿病领域知识图谱。
[0023]进一步地,步骤S3中,进而获得患者自身状况的矩阵,具体为,
[0024]S31、判定患者是否进行体检获得体检数据,如是,进入步骤S32;如否,则进入步骤S33;
[0025]S32、在患者进行体检获得体检数据时,由得到的症状描述向量与步骤S1得到的患者体检数据向量拼接成描述患者自身状况的矩阵;
[0026]S33、在患者未进行体检未获得体检数据时,由得到的症状描述向量单独拼接成描述患者自身状况的矩阵。
[0027]进一步地,步骤S4中,融合自注意力机制与卷积神经网络,构建分类预测模型,分类预测模型包括输入层、自注意力层、卷积层、全连接层、Softmax层和输出层,具体为,
[0028]S41、分类预测模型的输入层将患者自身状况的矩阵输入到自注意力层中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息矩阵;
[0029]S42、将获取的全局信息矩阵输入到卷积层中,进行局部特征提取,得到患者体检数据和症状描述的最终表示向量;
[0030]S43、将步骤S42得到的患者体检数据和症状描述的最终表示向量,经全连接层的变换后得到患者是否患有糖尿病的得分向量s;
[0031]S44、将得分向量s输入到Softmax层,得分向量s经由Softmax层计算,得到患者是
否患有糖尿病的概率分布,根据概率分布获得患者是否患有糖尿病的预测结果,并由输出层输出预测结果。
[0032]进一步地,步骤S41中,由自注意力层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息,具体为,
[0033]S411、定义三个权重矩阵:w
q
∈R
q
×
k
,w
k
∈R
q
×
k
,w
v
∈R
v
×
k
,根据式其中,表示患者自身状况矩阵的列向量,将矩阵中的每个向量被线性映射到三个不同的空间,得到查询向量q
i
、键向量k
i
和值向量v
i

[0034]S412、将查询向量q
i
、键向量k
i
和值向量v
i
分别合并成查询矩阵Q、键矩阵K、值矩阵V,根据下式计算出自注意力机制获取的全局信息矩阵即输出矩阵:
[0035本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合知识图谱和深度学习的糖尿病预测方法,其特征在于:包括以下步骤,S1、构建体检数据实体向量库,基于体检数据实体向量库将患者体检数据表示成向量形式,得到体检数据向量;S2、获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型TransR将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱;S3、基于步骤S2构建的糖尿病领域知识图谱,抽取患者症状描述中的实体和关系,并表示成向量的形式,得到症状描述向量,进而获得患者自身状况的矩阵;S4、融合自注意力机制与卷积神经网络,构建分类预测模型,由患者自身状况的矩阵,通过构建的分类预测模型获得预测结果。2.如权利要求1所述的融合知识图谱和深度学习的糖尿病预测方法,其特征在于:步骤S1中,构建体检数据实体向量库,具体为,S11、依据医学上定义的体检指标正常范围,将体检指标的检测值划分为更具细粒度的若干参考范围,并确定对应的关系;S12、基于划分的参考范围,将体检指标、关系与检测值表示成三元组的形式,采用知识表示模型TransH得到体检数据实体向量库。3.如权利要求1所述的融合知识图谱和深度学习的糖尿病预测方法,其特征在于:步骤S2中,获取糖尿病专业文献,进行知识抽取和知识融合,并基于知识表示模型TransR将糖尿病领域知识图谱中的所有实体和关系表示成向量的形式,构建糖尿病领域知识图谱,具体为,S21、获取用于构建知识图谱的糖尿病领域专业文献;S22、进行知识抽取,包括实体抽取和关系抽取,其中,实体抽取为基于双向长短期记忆网络BiLSTM和条件随机场CRF模型抽取出步骤S21得到的糖尿病领域专业文献中与糖尿病相关的实体;关系抽取为通过对文本进行句法分析抽取出文本中隐含的实体之间的关系,并表示成三元组(头实体,关系,尾实体)的形式;S23、进行知识融合,通过实体对齐和实体链接对抽取的知识实体整合、消歧,通过关系推理进行正确性判断,进而更新三元组中的实体和关系;S24、进行知识表示,基于知识表示模型TransR将三元组中的实体和关系表示成向量形式,得到构建的糖尿病领域知识图谱。4.如权利要求1

3任一项所述的融合知识图谱和深度学习的糖尿病预测方法,其特征在于:步骤S3中,进而获得患者自身状况的矩阵,具体为,S31、判定患者是否进行体检获得体检数据,如是,进入步骤S32;如否,则进入步骤S33;S32、在患者进行体检获得体检数据时,由得到的症状描述向量与步骤S1得到的患者体检数据向量拼接成描述患者自身状况的矩阵;S33、在患者未进行体检未获得体检数据时,由得到的症状描述向量单独拼接成描述患者自身状况的矩阵。5.如权利要求1

3任一项所述的融合知识图谱和深度学习的糖尿病预测方法,其特征在于:步骤S4中,融合自注意力机制与卷积神经网络,构建分类预测模型,分类预测模型包括输入层、自注意力层、卷积层、全连接层、Softmax层和输出层,具体为,S41、分类预测模型的输入层将患者自身状况的矩阵输入到自注意力层中,由自注意力
层的自注意力机制挖掘患者体检数据与症状描述间的相互影响关系,获取全局信息矩阵;S42、将获取的全局信息矩阵输入到卷积层中,进行局部特征提取,得到患者体检数据和症状描述的最终表示向量;S43、将步骤S42得到的患者体检数据和症状描述的最终表示向量,经全连接层的变换后得到患者是否患有糖尿病的得分向量s;S44、将得分向量s输入到Softmax层,得分向量s经由Softmax层计算,得到患者是否患有糖尿病的概率分布,根据概率分布获得患者是否患有糖尿病的预测结果,并由输出层输出预测结果。6.如权利要求5所述的融合知识图谱和深度学习的糖尿病预测方法,其特征在于:步骤S41中,由自注意力层的自注意力机制挖掘患者体检数据...

【专利技术属性】
技术研发人员:徐鹤郑群力王汝传李鹏程海涛季一木
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1