当前位置: 首页 > 专利查询>东北大学专利>正文

一种智慧医疗知识图谱的构建方法技术

技术编号:19748325 阅读:37 留言:0更新日期:2018-12-12 05:16
本发明专利技术涉及一种智慧医疗知识图谱的构建方法,包括如下步骤:A、获取病历数据,并提取病历中识别的医疗实体;B、对病历数据和提取到的医疗实体进行预处理,获取病人和医疗实体的共现矩阵;C、采用朴素贝叶斯模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT,或采用NoisyOR模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;D、对步骤C中计算获得的所有置信度值按照从大到小进行排名,以前n个或置信度置大于某一阀值的关系为边,以所有的医疗实体为节点构建智慧医疗知识图谱;本发明专利技术提供的智慧医疗知识图谱的构建方法,能够实现对疾病问题的智能辅助诊断的目的。

【技术实现步骤摘要】
一种智慧医疗知识图谱的构建方法
本专利技术属于面向知识图谱
,具体涉及一种智慧医疗知识图谱的构建方法。
技术介绍
随着人工智能的蓬勃发展,知识图谱涉及到的知识抽取、表示、融合、推理、问答等关键问题得到一定程度的解决和突破,知识图谱成为知识服务领域的一个新热点,受到国内外学者和工业界广泛关注。知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展,比如渐增式的数据模式设计;良好的数据集成;现有RDF、OWL等标准支持;语义搜索和知识推理能力等。在医学领域,随着区域卫生信息化及医疗信息系统的发展,积累了海量的医学数据。如何从这些数据中提炼信息,并加以管理、共享及应用,是推进医学智能化的关键问题,是医学知识检索、临床诊断、医疗质量管理、电子病历及健康档案智能化处理的基础。近年来,对医学上的临床决策支持和辅助诊断系统的需求大幅增加。现有的平台或系统依赖于通过大量专业人员手工编辑的知识库或使用简单的统计数据生成。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题,本专利技术提供的一种智慧医疗知识图谱的构建方法,能够实现对疾病问题的智能辅助诊断的目的。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括以下步骤:一种智慧医疗知识图谱的构建方法,包括如下步骤:A、获取病历数据,并提取病历中识别的医疗实体;B、对病历数据和提取到的医疗实体进行预处理,获取病人和医疗实体的共现矩阵;C、采用朴素贝叶斯模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT,或采用NoisyOR模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;D、对步骤C中计算获得的所有置信度值按照从大到小进行排名,以前n个或置信度置大于某一阀值的关系为边,以所有的医疗实体为节点构建智慧医疗知识图谱;所述朴素贝叶斯模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型;所述NoisyOR模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型。优选地,当步骤C中采用朴素贝叶斯模型计算获取所有置信度值时,所述步骤B和步骤C之间还包括:对所述步骤B中获取的共现矩阵进行去噪,去噪后的共现矩阵用以所述朴素贝叶斯模型计算获取置信度值。优选地,所述步骤A还包括如下子步骤:A1、获取所有病历的数据;A2、提取每条病历中已经识别的非否定范围内的医疗实体,其中,所述医疗实体包括:疾病、症状和检查。优选地,所述步骤B还包括如下子步骤:B1、以单条病历为数据基本单位,每条电子病历对应一位病人,并且给每个病人分配一个编号;B2、根据提取的所有医疗实体和相对应的病人获取所有病历数据集下的病人-疾病,病人-症状和病人-检查的共现矩阵;其中,检查包括检查的过程和检查的结果。优选地,所述步骤C中采用朴素贝叶斯模型计算获取所有置信度值时,所述方法还包括:根据步骤B中获取的共现矩阵,获取朴素贝叶斯计算所需要的参数,然后根据如下公式计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;所述公式为:IMPTNB=log(p(xi=1|yj=1))-log(p(xi=1|yj=0))其中,xi为表示存在症状i的二元变量;yj为表示存在疾病j的二元变量;P(xi=1|yj=1):是表示条件概率,即在存在疾病j的情况下,存在症状i的概率;P(xi=1|yj=0):表示条件概率,即在没有疾病j的情况下,存在症状i的概率。优选地,所述步骤C中采用NoisyOR模型计算获取所有置信度值时,所述方法还包括:根据步骤B中获取的共现矩阵,获取NoisyOR模型计算所需要的参数,然后根据如下公式计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;所述公式为:其中,yj为出现的疾病;xi为子症状。(三)有益效果本专利技术的有益效果是:本专利技术提供的一种智慧医疗知识图谱的构建方法,本专利技术直接从电子病历挖掘疾病与症状、疾病与检查的关系,构建了一种智慧医疗知识图谱,为智能问答、辅助疾病诊断等应用奠定了基础。在提取的医疗实体概念的基础之上,选取其中正面出现在病历中的医疗实体,去除否定文本范围内的实体,使用朴素贝叶斯和NoisyOR等机器学习算法学习疾病-症状与疾病-检查关系,从而根据实体和实体关系建立相应的疾病-症状和疾病-检查的智慧医疗知识图谱。附图说明图1为本专利技术一种智慧医疗知识图谱的构建方法到的流程示意图;图2为本专利技术一种智慧医疗知识图谱的构建方法到的流程示意图;图3为本专利技术一种智慧医疗知识图谱的构建方法到的流程示意图;图4为本专利技术一种智慧医疗知识图谱的构建方法到的流程示意图;图5为本专利技术一种智慧医疗知识图谱的构建方法到的流程示意图。具体实施方式为了更好的解释本专利技术,以便于理解,下面结合附图,通过具体实施方式,对本专利技术作详细描述。下面结合附图对本专利技术的具体实施方式做详细说明。实施例1如图1所示:本实施例公开了一种智慧医疗知识图谱的构建方法,包括如下步骤:A、获取病历数据,并提取病历中识别的医疗实体。本步骤为从现有电子病历中读取并识别病历中的医疗实体,这里所述的医疗实体包括:病症、症状和检查;这里所述的检查包括检查方法、过程和治疗方法过程和结果。B、对病历数据和提取到的医疗实体进行预处理,获取病人和医疗实体的共现矩阵。本步骤中通过对提取到的医疗实体进行预处理,得到病人和医疗实体之间的共现矩阵。C、采用朴素贝叶斯模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT,或采用NoisyOR模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT。本步骤通过朴素贝叶斯模型或NoisyOR模型计算获取共现矩阵中所有节点之间的置信度值IMPT,这里所述的置信度值还可称为权重值,用于体现节点之间的关联度。D、对步骤C中计算获得的所有置信度值按照从大到小进行排名,以前n个或置信度置大于某一阀值的关系为边,以所有的医疗实体为节点构建智慧医疗知识图谱。应说明的是:本实施例中所述的朴素贝叶斯模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型。本实施例中所述的NoisyOR模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型。此外,应指出的是:当步骤C中采用朴素贝叶斯模型计算获取所有置信度值时,所述步骤B和步骤C之间还包括:对所述步骤B中获取的共现矩阵进行去噪,去噪后的共现矩阵用以所述朴素贝叶斯模型计算获取置信度值。这里的去噪方法为设定一个阀值5,当病症和病状同时出现的次数小于5次时,将两者的关联信息当做不充分舍去。这里去噪的步骤是为了弥补朴素贝叶斯模型在计算置信度值时的缺陷,提高最终计算结果的准确率。此外,如图2所示,本实施例中所述的步骤A还包括如下子步骤:A1、获取所有病历的数据。A2、提取每条病历中已经识别的非否定范围内的医疗实体,其中,所述医疗实体包括:疾病、症状和检查。此外,如图3所示:本实施例中所述的步骤B还包括如下子步骤:B1、以单条病历为数据基本单位,每条电子病历对应一位病人,并且给每个病人分配一个编号。B2、根据提取的所有医疗实体和相对应的病人获取所有病历数据集下的病人-疾病,病人-症状和病人-检查的共现矩阵。其中,应说明的是:这里所述的检查包括检查的本文档来自技高网...

【技术保护点】
1.一种智慧医疗知识图谱的构建方法,其特征在于,包括如下步骤:A、获取病历数据,并提取病历中识别的医疗实体;B、对病历数据和提取到的医疗实体进行预处理,获取病人和医疗实体的共现矩阵;C、采用朴素贝叶斯模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT,或采用NoisyOR模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;D、对步骤C中计算获得的所有置信度值按照从大到小进行排名,以前n个或置信度置大于某一阀值的关系为边,以所有的医疗实体为节点构建智慧医疗知识图谱;所述朴素贝叶斯模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型;所述NoisyOR模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型。

【技术特征摘要】
1.一种智慧医疗知识图谱的构建方法,其特征在于,包括如下步骤:A、获取病历数据,并提取病历中识别的医疗实体;B、对病历数据和提取到的医疗实体进行预处理,获取病人和医疗实体的共现矩阵;C、采用朴素贝叶斯模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT,或采用NoisyOR模型计算获取步骤B中共现矩阵中每对节点之间关系存在的置信度值IMPT;D、对步骤C中计算获得的所有置信度值按照从大到小进行排名,以前n个或置信度置大于某一阀值的关系为边,以所有的医疗实体为节点构建智慧医疗知识图谱;所述朴素贝叶斯模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型;所述NoisyOR模型为能够计算共现矩阵中每对节点之间关系存在的置信度值的算法模型。2.根据权利要求1所述的构建方法,其特征在于,当步骤C中采用朴素贝叶斯模型计算获取所有置信度值时,所述步骤B和步骤C之间还包括:对所述步骤B中获取的共现矩阵进行去噪,去噪后的共现矩阵用以所述朴素贝叶斯模型计算获取置信度值。3.根据权利要求1所述的方法,其特征在于,所述步骤A还包括如下子步骤:A1、获取所有病历的数据;A2、提取每条病历中已经识别的非否定范围内的医疗实体,其中,所述医疗实体包括:疾病、症状和检查。4.根据权利要求3所述的方法,其特征在于,所述步骤B还包括如下...

【专利技术属性】
技术研发人员:刘莹林同茂郭清妍郑德全
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1