【技术实现步骤摘要】
一种基于知识图谱和自适应机制的辅助疾病推理系统
[0001]本专利技术涉及计算机技术、辅助医疗机械的
,更具体地,涉及一种基于知识图谱和自适应机制的辅助疾病推理系统。
技术介绍
[0002]随着计算机技术的发展,目前出现了很多基于计算机技术的疾病推理辅助医疗系统设备。基于计算机技术的疾病推理相比人工推理有很大的进步,而且辅助疾病推理系统作为医生诊断疾病的辅助工具,通过学习、继承和发扬医学专家的宝贵理论知识以及丰富的临床经验知识,借助信息技术和智能计算技术,根据患者当前的病症信息,对病情进行分析提示。
[0003]目前,辅助疾病推理系统所依据的推理技术例如借助深度学习的方法,将含有不同症状数的疾病输入到同一个深度学习模型中进行训练,未考虑到不同疾病含有症状数不同的问题,即输入不平衡性的问题,而且单个模型需要处理整个数据集。基于知识图谱的医学推理模型是一种典型的结构推理模型,知识图谱利用其图结构的特性,可直观表示医学实体以及实体间的关系,形成带语义的网络化知识库,增强医学知识的连通性,并支持领域知识的权威检索与浏览 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱和自适应机制的疾病推理系统,其特征在于,所述系统包括:数据获取模块,用于构建以三元组<症状,发生部位,疾病>为结构的知识图谱,确定由若干个三元组<症状,发生部位,疾病>组成的训练数据集;确定<症状,发生部位>组成的测试数据集;疾病推理模型构建模块,基于TransE翻译模型和朴素贝叶斯分类器,构建疾病推理模型;数据分割模块,用于将训练数据集划分,将测试数据集划分;疾病推理模型训练模块,利用训练数据集训练疾病推理模型,确定训练数据集划分下,疾病推理模型中TransE翻译模型的个数n、朴素贝叶斯分类器的个数m及边界值M;测试模块,以划分下的测试数据集<症状,发生部位>作为输入数据组,将输入数据组的数目与边界值M进行比较,输入至具有不同TransE翻译模型个数及朴素贝叶斯分类器个数的疾病推理模型中,输出疾病预测值。2.根据权利要求1所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,数据获取模块构建以三元组<症状,发生部位,疾病>为结构的知识图谱的过程为:获取知识图谱所需医学字段,对医学字段进行分词操作,将“疾病”、“发生部位”、“症状”信息与除三者之外的无用信息进行分离;对分离后的“疾病”、“发生部位”、“症状”信息做关键词提取,得到以三元组<症状,发生部位,疾病>为结构的知识图谱;所述由若干个三元组<症状,发生部位,疾病>组成的训练数据集为若干个“疾病”病种分别对应下的<症状,发生部位>数据组成的三元组<症状,发生部位,疾病>集合;所述测试数据集为<症状,发生部位>数据组成的集合。3.根据权利要求2所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,所需医学字段通过Python的urllib库从网页获取,基于Pkuseg分词包对医学字段进行分词操作,基于THUOCL_medical词库对分离后的“疾病”、“发生部位”、“症状”信息做关键词提取。4.根据权利要求2所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,三元组<症状,发生部位,疾病>中的“症状”和“疾病”分别为头部实体和尾部实体,“发生部位”为关系,疾病推理模型构建模块基于TransE翻译模型将知识图谱中的三元组实体和关系均表示为同一空间中的向量,并将关系看作实体间的平移向量。5.根据权利要求4所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,设头部“症状”实体表示为头向量h,“发生部位”关系表示成为向量r,尾部“疾病”实体表示为尾向量t,L类疾病分别为{b1,b2,
…
,b
L
},b
j
表示第j类疾病;设存在K组<症状,发生部位>数据待推理疾病,疾病推理模型构建模块基于TransE翻译模型和朴素贝叶斯分类器,构建的疾病推理模型为:其中,疾病推理模型由n个TransE翻译模型的距离值和m个朴素贝叶斯分类器的概率值组成,表示TransE翻译模型在K组<症状,发生部位>数据输入时的距离值,通过累乘得到TransE翻译模型的最终距离值D(b
j
):
其中,L1为曼哈顿距离,L2为欧氏距离;表示朴素贝叶斯分类器在K组<症状,发生部位>数据输入时的距离值,通过累乘获得朴素贝叶斯分类器的最大概率值d
max
,表示为:其中,P(t
bj
)指先验概率,是指一种“症状”特征在未进入朴素贝叶斯分类器前,这种症状属于疾病b
j
的概率;d
max
为朴素贝叶斯分类器的最大概率值,在求取后添加负号,与n个TransE翻译模型的距离值相乘之后求取最小值,得到疾病推理模型,F表示疾病推理模型的预测结果。6.根据权利要求5所述的基于知识图...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。