一种用于网络药理学的数据挖掘方法及装置制造方法及图纸

技术编号:35155540 阅读:53 留言:0更新日期:2022-10-05 10:36
本发明专利技术公开了一种用于网络药理学的数据挖掘方法,包括:获取多个关键词;基于多个关键词,获取与多个关键词具有关联关系的多个关联词,并以所述多个关键词和多个关联词作为节点构建第一相关信息网络图,对多个关键词进行聚类;确定目标关键词,以及目标关键词所属分类;获取与目标关键词最相似的相似关键词,并确定与相似关键词具有连通关系的至少一个第一关联词;获取相似关联词,并获取与第二关联词;以目标关键词、目标关键词的关联词、目标关键词的相似关键词、所述第一关联词与所述第二关联词构建第二相关信息网络图;基于所述第二相关信息网络图进行数据挖掘。本发明专利技术可清晰的从复杂的复方作用图中提取关键作用机理信息,阐明复方的科学性,并为解释中医药理论的科学性提供数据支撑,从而为发现经方,验方,制剂,已上市新药的新药效提供指导。市新药的新药效提供指导。市新药的新药效提供指导。

【技术实现步骤摘要】
一种用于网络药理学的数据挖掘方法及装置


[0001]本专利技术涉及数据分析领域,具体涉及一种用于网络药理学的数据挖掘方法及装置。

技术介绍

[0002]近年来,随着中药新药法规提出的新要求,中药新药的申请也面临着新的挑战,如何阐明中药复方的药效机制及毒理机制,直接关系着中药复方现代化的实现,并在创新药的市场中占有一席之地;且在一个基因、一种药物、一种疾病思想的质疑和反思的背景下,网络药理学及系统生物学等思想相继提出,而中药及中药复方多成分,多靶点,相互作用和相互调节发挥作用的特点,与网络药理学思想不谋而和,利用网络药理学思想阐明中药复方作用机制将在中药现代化过程中发挥关键作用。然而中药复方的多成分多靶点网络关系之复杂程度也为研究带来了巨大的挑战。

技术实现思路

[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种用于网络药理学的数据挖掘方法及装置,以解决现有技术中的至少一个缺陷。
[0004]为实现上述目的及其他相关目的,本专利技术提供一种基于网络药理学的中药复方机制挖掘方法,包括:
[0005]获取多个关键词;
[0006]基于所述多个关键词,从预先构建的网络药理学数据库中获取与多个关键词具有关联关系的多个关联词,并以所述多个关键词和所述多个关联词作为节点构建第一相关信息网络图,节点与节点之间具有连通关系;其中,关联词是基于所述关键词确定的;
[0007]对所述多个关键词进行聚类,得到多个关键词分类;
[0008]确定目标关键词,以及所述目标关键词所属分类,所述目标关键词为多个关键词中的一个;
[0009]在目标关键词所属分类中,获取与目标关键词最相似的相似关键词,并确定与相似关键词具有连通关系的至少一个第一关联词;
[0010]获取与相似关键词具有连通关系的至少一个相似关联词,并获取与所述相似关联词具有连通关系的至少一个第二关联词;
[0011]以目标关键词、目标关键词的关联词、目标关键词的相似关键词、所述第一关联词与所述第二关联词构建第二相关信息网络图;
[0012]基于所述第二相关信息网络图进行数据挖掘。
[0013]可选地,所述对所述多个关键词进行聚类,包括:
[0014]对所述多个关键词使用密度峰值聚类。
[0015]可选地,所述获取与目标关键词最相似的相似关键词,包括:
[0016]计算所述目标关键词中的每一个关键词与目标关键词之间的余弦相似度;
[0017]将与目标关键词具有最大余弦相似度的关键词作为相似关键词。
[0018]可选地,所述网络药理学数据库中包括以下数据:复方、药材、成分、靶点、疾病。
[0019]可选地,在对所述多个关键词进行聚类前,将多个关键词使用oneHot编码,得到关键词的向量表示;在对多个关键词进行聚类时,对多个关键词的向量表示进行聚类。
[0020]为实现上述目的及其他相关目的,本专利技术提供一种用于网络药理学的数据挖掘装置,所述装置包括:
[0021]关键词获取模块,用于获取多个关键词;
[0022]第一相关信息网络图构建模块,用于基于所述多个关键词,从预先构建的网络药理学数据库中获取与多个关键词具有关联关系的多个关联词,并以所述多个关键词和所述多个关联词作为节点构建第一相关信息网络图,节点与节点之间具有连通关系;其中,关联词是基于所述关键词确定的;
[0023]聚类模块,用于对所述多个关键词进行聚类,得到多个关键词分类;
[0024]关键词确定模块,用于确定目标关键词,以及所述目标关键词所属分类,所述目标关键词为多个关键词中的一个;
[0025]相似度计算模块,用于在目标关键词所属分类中,获取与目标关键词最相似的相似关键词,并确定与相似关键词具有连通关系的至少一个第一关联词;
[0026]关联词获取模块,用于获取与相似关键词具有连通关系的至少一个相似关联词,并获取与所述相似关联词具有连通关系的至少一个第二关联词;
[0027]第二相关信息网络图构建模块,用于以目标关键词、相似关键词、所述第一关联词与所述第二关联词构建第二相关信息网络图;
[0028]数据挖掘模块,用于基于所述第二相关信息网络图进行数据挖掘。
[0029]可选地,所述聚类模块对所述多个关键词使用密度峰值聚类。
[0030]可选地,所述获取与目标关键词最相似的相似关键词,包括:
[0031]计算所述目标关键词中的每一个关键词与目标关键词之间的余弦相似度;
[0032]将与目标关键词具有最大余弦相似度的关键词作为相似关键词。
[0033]可选地,所述网络药理学数据库中包括以下数据:复方、药材、成分、靶点、疾病。
[0034]可选地,在对所述多个关键词进行聚类前,将多个关键词使用oneHot编码,得到关键词的向量表示;在对多个关键词进行聚类时,对多个关键词的向量表示进行聚类。
[0035]如上所述,本专利技术的一种用于网络药理学的数据挖掘方法及装置,具有以下有益效果:
[0036]本专利技术的一种用于网络药理学的数据挖掘方法,包括:获取多个关键词;基于多个关键词,获取与多个关键词具有关联关系的多个关联词,并以所述多个关键词和多个关联词作为节点构建第一相关信息网络图,对多个关键词进行聚类;确定目标关键词,以及目标关键词所属分类;获取与目标关键词最相似的相似关键词,并确定与相似关键词具有连通关系的至少一个第一关联词;获取相似关联词,并获取与第二关联词;以目标关键词、目标关键词的关联词、目标关键词的相似关键词、所述第一关联词与所述第二关联词构建第二相关信息网络图;基于所述第二相关信息网络图进行数据挖掘。通过上述步骤,得到第二相关信息网络图,然后可以基于第二相关信息网络图,从复杂的复方作用图中提取关键作用机理信息,阐明复方的科学性,并为解释中医药理论的科学性提供数据支撑,从而为发现经
方,验方,制剂,已上市新药的新药效提供指导。
附图说明
[0037]图1为本专利技术一实施例一种用于网络药理学的数据挖掘方法的流程图;
[0038]图2为本专利技术一实施例第一相关信息网络图的示意图;
[0039]图3为本发是一实施例第二相关信息网络图的示意图;
[0040]图4为本专利技术一实施例网络图的示意图;
[0041]图5为本专利技术一实施例网络图的示意图;
[0042]图6为本专利技术一实施例网络图的示意图;
[0043]图7为本专利技术一实施例网络图的示意图;
[0044]图8为本专利技术一实施例一种用于网络药理学的数据挖掘装置的结构图。
具体实施方式
[0045]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于网络药理学的数据挖掘方法,其特征在于,所述方法包括:获取多个关键词;基于所述多个关键词,从预先构建的网络药理学数据库中获取与多个关键词具有关联关系的多个关联词,并以所述多个关键词和所述多个关联词作为节点构建第一相关信息网络图,节点与节点之间具有连通关系;其中,关联词是基于所述关键词确定的;对所述多个关键词进行聚类,得到多个关键词分类;确定目标关键词,以及所述目标关键词所属分类,所述目标关键词为多个关键词中的一个;在目标关键词所属分类中,获取与目标关键词最相似的相似关键词,并确定与相似关键词具有连通关系的至少一个第一关联词;获取与相似关键词具有连通关系的至少一个相似关联词,并获取与所述相似关联词具有连通关系的至少一个第二关联词;以目标关键词、目标关键词的关联词、目标关键词的相似关键词、所述第一关联词与所述第二关联词构建第二相关信息网络图;基于所述第二相关信息网络图进行数据挖掘。2.根据权利要求1所述的一种用于网络药理学的数据挖掘方法,其特征在于,所述对所述多个关键词进行聚类,包括:对所述多个关键词使用密度峰值聚类。3.根据权利要求1所述的一种用于网络药理学的数据挖掘方法,其特征在于,所述获取与目标关键词最相似的相似关键词,包括:计算所述目标关键词中的每一个关键词与目标关键词之间的余弦相似度;将与目标关键词具有最大余弦相似度的关键词作为相似关键词。4.根据权利要求1所述的一种用于网络药理学的数据挖掘方法,其特征在于,所述网络药理学数据库中包括以下数据:复方、药材、成分、靶点、疾病。5.根据权利要求1所述的一种用于网络药理学的数据挖掘方法,其特征在于,在对所述多个关键词进行聚类前,将多个关键词使用oneHot编码,得到关键词的向量表示;在对多个关键词进行聚类时,对多个关键词的向量表示进行聚类。6.一种用于网络药理学的数据挖掘装置,其特征在于,所述装置包括:关键词获取模块,用于获取多...

【专利技术属性】
技术研发人员:李天泉石远平史晓雨陈浩张敏锐张玉君苟先莉张纹静郭诗琦曾柯翔
申请(专利权)人:重庆康洲大数据集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1