【技术实现步骤摘要】
一种基于局部网络相似性比较的天然药物分子靶标蛋白的冷启动筛选方法
本专利技术属于天然药物领域与计算机领域,特别涉及一种基于局部网络相似性比较的天然药物分子靶标蛋白的冷启动筛选方法。
技术介绍
根据数据库TraditionalChineseMedicineSystemsPharmacologyDatabaseandAnalysisPlatform(TCMSP)中的数据记录可知,目前从药用动植物中已发现13729个天然药物分子,并且共有3339个具有治疗作用的靶标;但是天然药物分子与靶标的对应关系仅有18865组。因此,依旧有大量的天然药物分子与靶标的相互作用关系未被发掘。冷启动:指的是,预测样本数据没有出现在训练集当中,用一个已经建立好的规则对一个全新的数据(相对于预测系统)进行预测。在过去的几十年里,有很多科研工作者基于已有的药物与靶标蛋白的相关性数据,对药物分子与靶标蛋白的缺失连边进行预测探索,开发出了非常多的算法来预测药物与靶标蛋白之间的相互作用关系,为旧药新用和新药研发提供了很大的帮助。但是,针 ...
【技术保护点】
1.一种基于局部网络相似性比较的天然药物分子靶标蛋白的冷启动筛选方法,其特征在于,包括以下步骤:/n步骤1、采集天然药物分子的结构数据和待筛选靶标蛋白已有的相互作用关系数据。/n步骤2、采集与步骤1中所得待筛选靶标蛋白已有连边药物分子的结构数据(根据数据库的不同,该药物分子可以是中药活性分子或者化学药物分子)。/n步骤3、将步骤1中所采集的天然药物分子和步骤2中所采集的药物分子采用基于rdkit的MACCSKEYS方法提取相应的分子指纹数据。/n步骤4、利用步骤3中所得分子指纹数据,采用tanimoto系数的方法,计算所有药物分子(包括该天然药物分子与靶标蛋白的相互作用药物 ...
【技术特征摘要】
1.一种基于局部网络相似性比较的天然药物分子靶标蛋白的冷启动筛选方法,其特征在于,包括以下步骤:
步骤1、采集天然药物分子的结构数据和待筛选靶标蛋白已有的相互作用关系数据。
步骤2、采集与步骤1中所得待筛选靶标蛋白已有连边药物分子的结构数据(根据数据库的不同,该药物分子可以是中药活性分子或者化学药物分子)。
步骤3、将步骤1中所采集的天然药物分子和步骤2中所采集的药物分子采用基于rdkit的MACCSKEYS方法提取相应的分子指纹数据。
步骤4、利用步骤3中所得分子指纹数据,采用tanimoto系数的方法,计算所有药物分子(包括该天然药物分子与靶标蛋白的相互作用药物分子)之间的相似性。
步骤5、利用靶标蛋白和天然药物分子的连边数据构建“靶标蛋白-药物分子”的局部二元异构网络。
步骤6、利用步骤5中所得局部二元异构网络数据和步骤3中所计算药物分子的指纹数据,构建“靶标蛋白的分子指纹式表达向量”TF。
步骤7、采用步骤6中所构建的“靶标蛋白的分子指纹式表达向量”TF和步骤3中所计算的天然药物分子的指纹数据,计算靶标蛋白与该天然药物分子的相关性WTI。
步骤8、采用步骤5中所得局部二元异构网络和步骤4中所得药物分子之间相似性的数据,计算该二元网络内部药物分子之间的平均相似性S1。
步骤9、采用步骤5中所得局部二元异构网络数据和步骤4中所得药物分子之间相似性的数据,计算该天然药物分子与局部二元异构网络内部药物分子所形成新网络的平均相似性S2。
步骤10、利用步骤9中所得的新网络的平均相似性S2比上S2与步骤8中所得的局部二元异构网络内部平均相似性S1的和,以此比值(S2/(S1+S2))与步骤7中所得靶标蛋白与天然药物分子的相关性WTI相乘来表示该天然药物分子与该待筛选靶标蛋白有连边的可能性S(S=WTI*S2/(S2+S1))。
2.如权利要求1所述的一种基于局部网络相似性比较的天然药物分子靶标蛋白的冷启动筛选方法,其特征在于,所述步骤3中提取分子指纹的方法具体如下:
基于rdkit将化学分子的特征利用二进制表示,MDL公司开发的MACCSke...
【专利技术属性】
技术研发人员:施建宇,赵鹏程,吕诚,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。