【技术实现步骤摘要】
一种药学知识图谱构建方法和装置
[0001]本申请属于计算机
,具体涉及一种药学知识图谱构建方法和装置。
技术介绍
[0002]随着人们健康意识的提升,互联网技术的发展,医药数据大量涌现,突发公共卫生事件给药物研发和数据挖掘带来了巨大挑战。传统的药学相关研究和智能分析往往专注于单个药物,但随着药学知识体系的不断深入和扩展,知识间的关系已经成为数据深入分析挖掘的基础工作之一。
[0003]在大数据背景下,知识图谱(Knowledge Graph)成为资源管理和知识应用的重要技术,它用于整合、挖掘和展示专业知识及其内在关系,为智能化信息应用、搜索引擎和语义处理等技术奠定了基础。知识图谱旨在描述客观世界中的实体、概念、事件、属性以及这些因素之间的联系。知识图谱本质上是语义网络(Semantic Network)的知识库,也可以简单地理解为多关系图(Multi
‑
relational Graph)。知识图谱涉及知识表示、知识提取、知识融合和知识推理等关键技术,知识图谱的构建包括本体构建、自然语言处理、网络爬虫、属性抽取、实体对齐、知识存储和知识可视化等内容。知识图谱在医学领域具有广泛应用前景,主要用于处理医疗大数据中知识分散、异构、冗余和碎片化的问题。目前医学知识图谱主要应用于疾病分析和预测、药物的研究、医疗智能问答,医学知识搜索引擎等领域。
[0004]目前,与药学知识图谱类似的应用多数侧重于生物医学一个具体领域,如药物基础研究、临床治疗、疾病诊断、医学文献等,这些领域和药学信息部分 ...
【技术保护点】
【技术特征摘要】
1.一种药学知识图谱构建方法,其特征在于,包括以下步骤:获取多个药学数据源中的药学数据,以药学领域中的概念和术语为基础,参考权威数据源中的数据表示方法和层级关系,结合生物医学本体库,并根据所述多个药学数据源中的药学数据格式和药学数据内容,构建药学本体模型;根据所述药学本体模型,构建关系数据模型和图数据模型,生成关系数据与图数据之间的映射关系;将所述多个药学数据源中的药学数据导入与所述关系数据模型对应的关系数据库,将每个药学数据源中的药学数据作为独立的数据库存储,不同的药学数据库之间没有关联;根据关系数据与图数据之间的映射关系,将所述关系数据库中的关系数据转换为图数据,并将所述图数据导入与所述图数据模型对应的图数据库,生成药学数据的知识网络。2.根据权利要求1所述的方法,其特征在于,所述以药学领域中的概念和术语为基础,参考权威数据源中的数据表示方法和层级关系,结合生物医学本体库,并根据所述多个药学数据源中的药学数据格式和药学数据内容,构建药学本体模型,具体包括:根据所述多个药学数据源中的药学数据格式和药学数据内容,结合生物医学本体和医学词表,确定药学本体中的概念、属性、层次、范围、类型和定义,明确药学概念之间的关系,复用部分现有本体并建立药学本体模型,所述药学本体模型包括概念/类、关系、函数、公理和实例,制定每类概念的数据层次、范围、类型和定义,实现药学概念的结构化、标准化和规范化的描述,并构建药学术语集。3.根据权利要求1所述的方法,其特征在于,所述药学本体模型中的概念类型包括:药物、疾病、症状、非活性成分、药品、临床试验、不良反应、仪器设备、生产、试验方法、机构、器官组织、文献、专利、靶点、治疗和生物分子;所述药学本体模型中的药学概念之间的关系包括:药物作用关系(is_drug_action_on)、相互作用关系(is_interaction_with)、化学反应产物关系(is_chemical_reaction_poduct_from)、导致关系(causes)、成分关系(is_ingredient_of)、参比/标准制剂关系(is_reference_listed_drug_to)、对象关系(is_object_of)、鉴定关系(is_identified_by)、有关关系(is_relation_with)、引用关系(is_citatioin_from)、来源于(is_source_from)、是(is_a)、部分关系(is_part_of)、相同关系(is_same_as)、产物关系(is_product_of)和有关(is_relation_with);此外,每个概念还有hasName、hasDescription、hasEntityClass、hasSynonyms、hasSource和hasID基本属性。4.根据权利要求1所述的方法,其特征在于,所述根据所述药学本体模型,构建关系数据模型和图数据模型,生成关系数据与图数据之间的映射关系,具体包括:根据关系数据库规范,以所述多个药学数据源中的药学数据格式、药学数据内容和药学本体及概念之间关系为参考,结合本体模型,进行关系数据的数据定义、数据操作和数据约束,构建关系数据模型;从图数据设计出发,结合所述药学本体模型,确定每个药学数据源中的实体,及每个药学数据源直接给出的实体间的关系;以关系数据模型为基础,建立三元组形式的数据标准,确定每个实体的定义和描述、实体间的关系类型和实体的属性,并生成图数据库以及关系数据与图数据之间的映射关系,
所述三元组形式的数据标准为第一实体
‑
第二实体
‑
关系的数据标准,或者实体
‑
属性
‑
属性值的数据标准。5.根据权利要求1所述的方法,其特征在于,所述根据关系数据与图数据之间的映射关系,将所述关系数据库中的关系数据转换为图数据,并将所述图数据导入与所述图数据模型对应的图数据库,生成药学数据的知识网络,具体包括:根据关系数据与图数据之间的映射关系,从所述关系数据库中抽取关系数据,将所述关系数据转换为第一实体
‑
第二实体
‑
关系
‑
属性...
【专利技术属性】
技术研发人员:王鹏飞,毛逸清,宋伟,蒋文婷,马斌,刘圣,
申请(专利权)人:北京迈迪培尔信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。