一种高血压药物治疗知识图谱构建方法以及装置制造方法及图纸

技术编号:32856456 阅读:205 留言:0更新日期:2022-03-30 19:28
一种高血压药物治疗知识图谱构建方法,包括:高血压药物治疗知识图谱采用自上而下的方式,先构建Schema,再抽取知识;构建过程根据抽取和应用实际情况,不断完善和优化Schema;构建属性图模型;对属性图模型采用HugeGraph和MongoDB混合数据存储模式;数据加工和专家审核相结合增加知识准确度。本发明专利技术的有益效果是:通过属性图模型,解决了多元关系在临床医学知识表示中建模的问题。学知识表示中建模的问题。学知识表示中建模的问题。

【技术实现步骤摘要】
一种高血压药物治疗知识图谱构建方法以及装置


[0001]本专利技术涉及医学知识图谱
,尤其涉及一种高血压药物治疗知识图谱构建方法以及装置。

技术介绍

[0002]知识图谱是一种基于图的数据结构,由实体(节点)和实体间的关系(边)组成。知识图谱广义概念是作为一种技术体系,是指大数据知识工程中一系列代表性技术的总称;知识图谱狭义概念是作为一种知识表示形式,是大规模语义网络,包含实体、概念及其之间的各种语义关系。
[0003]目前大多通用知识图谱都采用自底向上构建方法,从开放链接数据源中提取实体、属性和关系,再加入到知识图谱的数据层,然后将这些知识要素进行归纳组织,逐步往上抽象为概念,最后形成模式层。具体流程如图1所示,为一种自底向上知识图谱的构建流程,现有技术的知识图谱由数据层(data layer)和模式层(schema layer) 构成。模式层是知识图谱的概念模型和逻辑基础,对数据层进行规范约束。多采用本体作为知识图谱的模式层,借助本体定义的规则和公理约束知识图谱的数据层。在数据层,事实以“实体
‑<br/>关系
...

【技术保护点】

【技术特征摘要】
1.一种高血压药物治疗知识图谱构建方法,其特征在于:高血压药物治疗知识图谱采用自上而下的方式,先构建Schema,再抽取知识;构建过程根据抽取和应用实际情况,不断完善和优化Schema;构建属性图模型;对属性图模型采用HugeGraph和MongoDB混合数据存储模式;采用数据加工和专家审核相结合增加知识准确度。2.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述的构建Schema的步骤为:a确定领域范畴;b选取合适的知识源;c梳理重要的医学术语;d建立关系;e存储及可视化。3.根据权利要求2所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述的梳理重要的医学术语,包含建立高血压领域的标准术语词库,所述标准术语词库内设有中英文一一对应术语映射表,每一个词条还设有详细的中英文解释,以实现在高血压领域内部使用规范术语,从而对帮助知识图谱构建过程中术语使用准确。4.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述构建属性图模型中,采用顶点表示现实世界中的实体,有向的边来表示实体与实体之间的关系;顶点和边都可通过键值对形式被关联上任意数量的属性,所述高血压药物治疗知识图谱以六元组形式,分别采用Subject,Subject_Property,Edge,Edge_Property,Object,Object_Property来表示复杂的医学知识,其中Subject表示起始顶点,Subject_Property表示起始顶点的属性,Edge表示有向边,Edge_Property表示有向边的属性,Object表示目标顶点,Object_Property表示目标顶点的属性;针对高血压药物治疗决策支持这一使用临床需求,从而构建了以属性图为数据模型的高血压药物治疗知识图谱本体。5.根据权利要求1所述的一种高血压药物治疗知识图谱构建方法,其特征在于,所述Hugegraph负责存储高血压药物治疗相关基础医学知识,所述MongoDB负责存储临床证据的知识,主要包括高血压药物治疗相关RCT研究文章、最新的高血压诊疗临床指南,所述数据加工通过文本信息自动抽取和医师人工录入,所述文本信息自动抽取的部分数据来源于爬虫,为确保获取数据的准确性和完整性,所述爬虫在采集数据时,采用三级链接数据爬取的方式,运用机器学习算法模型对文本实体标注,文本关系标注;为确保标注数据的正确性,在数据加工和更新至知识图谱之间,还设有专家审核数据审核的步骤。6.根据权利要求5所述的一种高血压药物治疗...

【专利技术属性】
技术研发人员:匡泽民鄂海红宋美娜谢晓璇王晴川谭玲
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1