一种疾病知识图谱构建方法和平台系统、设备、存储介质技术方案

技术编号:20221796 阅读:49 留言:0更新日期:2019-01-28 20:17
本发明专利技术公开了一种疾病知识图谱构建方法及其系统、设备、存储介质,属于疾病知识图谱技术领域。其中,疾病知识图谱构建方法,包括以下步骤:A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;B、知识融合:对知识进行整合,以消除矛盾和歧义;C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。还包括疾病知识图谱平台系统、设备和存储介质。针对现有技术中存在的问题,它从多个数据源中抽取实体、属性及其之间的关系,并进行融合、加工,可以快速构建规范化和标准化的疾病知识图谱。

【技术实现步骤摘要】
一种疾病知识图谱构建方法和平台系统、设备、存储介质
本专利技术涉及疾病知识图谱
,尤其涉及一种疾病知识图谱构建方法及其系统、设备、存储介质。
技术介绍
知识图谱的前身是语义网,它吸收了语义网、本体在知识组织和表达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工。具体来说,一个知识图谱由模式图、数据图及两者之间的关系组成:模式图对人类知识领域的概念层面进行描述,强调概念及概念关系的形式化表达,模式图中节点是概念实体,边是概念间的语义关系,如part-of;数据图对物理世界层面进行描述,强调一系列客观事实。数据图中的节点有两类,一是模式图中的概念实体,二是描述性字符串,数据图中的边是具体事实的语义描述;模式图和数据图之间的关系指数据图的实例与模式图的概念之间的对应,或者说模式图是数据图的模具。著名的通用知识图谱中有,谷歌“KnowledgeGraph”、搜狗“知立方”、YAGO、DBpedia等,它们具有规模大、领域宽,包含大量常识等特点。目前,医学是知识图谱应用最广的垂直领域之一,如上海曙光医院构建的中医药知识图谱、本体医疗知识库SNOMED-CT,IBMW本文档来自技高网...

【技术保护点】
1.一种疾病知识图谱构建方法,其特征在于,包括以下步骤:A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;B、知识融合:对知识进行整合,以消除矛盾和歧义;C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。

【技术特征摘要】
1.一种疾病知识图谱构建方法,其特征在于,包括以下步骤:A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;B、知识融合:对知识进行整合,以消除矛盾和歧义;C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。2.根据权利要求1所述的一种疾病知识图谱构建方法,其特征在于,步骤C之后还包括:D、知识图谱的更新。3.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中所述的多源数据库为开放链接数据库和百科,实体的提取步骤为:A101、实体学习;A102、实体对齐学习;A103、上下位关系学习和整合;进一步地,步骤A中,属性的提取步骤为:A201、从开放链接数据集中获取实体的属性;A202、从在线百科中学习实体的属性,并对实体属性进行往上规约从而生成概念的属性。4.根据1所述的一种疾病知识图谱构建方法,其特征在于,步骤A中,还包括规则和公理的学习,所述的规则和公理的学习由用户针对领域和应用场景添加相应的规则和公理;优选地,步骤A还包括学习过程中的冲突解决,所述的冲突解决包括冲突检测和冲突解决方法。5.根据权利要求3所述的一种疾病知识图谱构建方法,其特征在于,A102、实体对齐的学习方法为:先把从百科中学习到的实体中描述同一目标的内容进行合并,再把经过合并后的结果实体集与从开放链接数据中抽取的实体进行合并;优选地,步骤A103上下位关系学习和整合包括:从开放链接数据集中抽取上下位关系、从百科中抽取上下位关系、基于CRF的开放上下位关系学习和分类树整合;优选地,步骤D中所述知识图谱的更新包括数据模式层的更新和数据层的更新。6.根据权利要求7所述的一种疾病知识图谱构建...

【专利技术属性】
技术研发人员:蒋小云
申请(专利权)人:长沙瀚云信息科技有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1