【技术实现步骤摘要】
一种新型冠状病毒知识图谱的构建方法及系统
[0001]本专利技术涉及计算机
及生物医学领域,特别涉及一种新型冠状病毒知识图谱的构建方法及系统。
技术介绍
[0002]随着新型冠状病毒肺炎疫情的流行与扩散,导致相关的研究工作数量激增,以及科学文献以及数据库被广泛发布,研究人员对多源异构的各类数据中知识的及时跟踪变成了一个较为艰难的任务。
[0003]现有技术中,以COVID
‑
19KnowledgeGraph为代表的新型冠状病毒知识图谱虽然提供了新型冠状病毒病理学的相关知识服务,但是由于这类知识图谱的构建较大程度上依赖信息学手段,对生物医学领域的先验知识结合不足,知识未必具有领域意义;而且这类知识图谱往往侧重于某个具体方向,缺乏对新型冠状病毒领域知识更全面、细致的梳理和组织。
技术实现思路
[0004]本专利技术提供了一种新型冠状病毒知识图谱的构建方法及系统,以解决现有技术无法从多源异构数据源中精确抽取知识以及有序整合的问题。
[0005]本专利技术提供了一种新型冠状病毒知识图谱的构建方法,包括以下步骤:
[0006]基于冠状病毒传染病本体CIDO、基因本体GO、疾病本体DOID、疾病本体ICD
‑
11、手术操作本体ICD
‑9‑
CM、检验标准库LOINC、解剖本体Uber Ontology、药学数据库DrugBank和组学数据库NCBI,设置新型冠状病毒本体,并根据所述新型冠状病毒本体,设置新型冠状病毒知识图谱的概念层 ...
【技术保护点】
【技术特征摘要】
1.一种新型冠状病毒知识图谱的构建方法,其特征在于,包括以下步骤:基于冠状病毒传染病本体CIDO、基因本体GO、疾病本体DOID、疾病本体ICD
‑
11、手术操作本体ICD
‑9‑
CM、检验标准库LOINC、解剖本体UberOntology、药学数据库DrugBank和组学数据库NCBI,设置新型冠状病毒本体,并根据新型冠状病毒本体,设置新型冠状病毒知识图谱的概念层,所述概念层用于规范新型冠状病毒知识图谱的概念类型和关系类型;从多源异构数据源中抽取所述概念层中定义的各类实体的名称和编码属性信息以及不同实体之间的关系;将各个实体的属性信息分别建模成新型冠状病毒知识图谱中的节点,将所述不同实体之间的关系建模成对应节点之间的链接的边,所述属性信息包括名称信息、类型信息和定义信息。2.如权利要求1所述的方法,其特征在于,所述概念层规范的概念类型包括以下类型中的多个:疾病、药物、基因、生物过程、分子功能、细胞成分、蛋白质、DNA、RNA、解剖、病毒和干预措施;所述概念层规范的关系类型包括以下类型中的多个:载体、局限于、类似于、关联、上调、下调、子类、体现、参与、相互作用、调节、共变、触发条件和可治疗。3.如权利要求2所述的方法,其特征在于,所述病毒与所述疾病之间的关系类型为触发条件,不同的疾病之间的关系类型为子类,所述药物与所述疾病之间的关系类型为可治疗。4.如权利要求1所述的方法,其特征在于,所述从多源异构数据源中抽取所述概念层中定义的多个实体的名称信息以及不同实体之间的关系,包括:对多源异构数据源中的数据进行断句和分词,得到预处理后的数据;通过命名实体识别从所述预处理后的数据中抽取所述概念层中定义的多个实体的名称信息,所述名称信息包含在所述数据的实体语句中;基于深度神经网络的关系抽取方法,从所述实体语句中识别所述概念层中定义的不同实体之间的关系。5.如权利要求4所述的方法,其特征在于,所述基于深度神经网络的关系抽取方法,从所述实体语句中识别所述概念层中定义的不同实体之间的关系,包括:以单词为基本单位,使用词向量和位置向量表征所述实体语句,得到所述实体语句对应的向量拼接结果;将所述向量拼接结果输入深度神经网络,通过所述深度神经网络进行关系分类判别,所述深度神经网络包括注意力模型、全连接神经网络层和卷积神经网络模型;针对所述深度神经网络判别出具有关系的实体语句,进行句法结构分析,并依据实体间的依存关系抽取关系词,得到因果关系元组,所述因果关系元组包括不同实体之间的...
【专利技术属性】
技术研发人员:宋伟,郑翔文,刘圣,王鹏飞,马斌,焦亚鑫,
申请(专利权)人:北京迈迪培尔信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。