【技术实现步骤摘要】
基于图表示学习的新冠病毒靶标预测和药物发现方法
本专利技术涉及基于图表示学习的新冠病毒靶标预测和药物发现方法,属于生物信息学领域。
技术介绍
新冠肺炎(COVID-19),由新型冠状病毒(2019-nCoV,SARS-CoV-2)引起,急需发现或研发更多能抑制这种病毒的药物。而药物重定位不仅在药物研发初期可节约不少药物设计和筛选的成本,而且因已使用药物的药代动力学性质和毒性被比较彻底的研究,研发后期风险明显降低。通过计算机预测的方法来研究药物靶标的相关性,缩小候选实验药物的搜索空间,可为药物的发现与重定位提供参考并减少相应的时间投入与成本消耗。近些年来的许多努力集中在使用基于机器学习的方法来进行药物-靶标相关性预测。故涌现了很多预测性能提升的机器学习模型。这些努力多数是基于相关联原则,将预测任务视为二元分类任务,即预测药物-靶标相关作用是否存在。但是在某些机器学习方法中,仅将模型约束成较为简单的形式(如,双线性或对数双线性函数等),可能不足以获得异构数据背后的复杂隐藏特征。随着深度学习的兴起和发展,科研人员可以构造更 ...
【技术保护点】
1.一种基于图表示学习的新冠病毒靶标预测和药物发现方法,其特征在于,包括如下步骤:/n第一步、准备异构网络数据集:构造包含药物、靶标、副作用、疾病之间的作用关系的异构关系网络,其中药物-靶标相互作用和药物-药物相互作用网络基于DRUGBANK数据库,靶标-靶标相互作用网络基于HPRD数据库,药物-疾病关联和靶标-疾病关联网络基于CTD数据库,药物-副作用关联网络基于SIDER数据库;在构造异构网络数据集的过程中,保留相互作用网络中共同有的对象,将处理好的相互作用网络视为一个异构网络,并作为模型的数据集;/n第二步、对数据集进行划分:/n2.1.对数据集中的药物-靶标相互作用 ...
【技术特征摘要】
1.一种基于图表示学习的新冠病毒靶标预测和药物发现方法,其特征在于,包括如下步骤:
第一步、准备异构网络数据集:构造包含药物、靶标、副作用、疾病之间的作用关系的异构关系网络,其中药物-靶标相互作用和药物-药物相互作用网络基于DRUGBANK数据库,靶标-靶标相互作用网络基于HPRD数据库,药物-疾病关联和靶标-疾病关联网络基于CTD数据库,药物-副作用关联网络基于SIDER数据库;在构造异构网络数据集的过程中,保留相互作用网络中共同有的对象,将处理好的相互作用网络视为一个异构网络,并作为模型的数据集;
第二步、对数据集进行划分:
2.1.对数据集中的药物-靶标相互作用网络的所有阴性样本进行随机抽样,抽取数目为正例数量的十倍,并把药物-靶标相互作用网络中抽样出来的反例和所有正例以及其他相互作用网络所有正反例组成训练模型的数据集,其中,所述阴性样本的节点与节点之间没有相互作用关系,而阳性样本则有;
2.2.将2.1中处理好的数据集分为10个大小相同且互斥的子集,并且每个子集通过随机的分层采样得到;然后每次把9个互斥的子集合当成训练集合,并在这个训练集合中随机抽取5%作为验证集,剩下的一个互斥子集作为测试集合,即通过十折交叉验证来训练和测试模型;
2.3.重复十折交叉验证10次;
第三步、构造模型;
3.1.构造3层堆叠的神经网络,其中一、二层使用图卷积神经网络整合划分好的数据集中复杂的异构关系网络的邻域信息,给定第l层节点自身嵌入和节点邻居嵌入则下一层节点的特征表示如下:
其中表示关系r下节点i的邻居集合,ci,r表示节点i与其边类型为r的邻居们之间的边值总和,s(e)表示节点i和节点j之间的边值,和W(l)表示图卷积神经网络中的权重,σ表示激活函数ReLU;
3.2.在第三层的神经网络是由图卷积神经网络和注意力机制组成,即经过图卷积神经网络处理得到不同关系类型的邻域信息总和后,使用注意力机制反映不同关系类型的邻域信息总和对节...
【专利技术属性】
技术研发人员:彭绍亮,周德山,王小奇,徐志建,王力,李肯立,钟武,
申请(专利权)人:湖南大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。