当前位置: 首页 > 专利查询>汤永专利>正文

基于重启超图双随机游走的抗病毒药物筛选方法技术

技术编号:37802140 阅读:8 留言:0更新日期:2023-06-09 09:32
本发明专利技术公开了一种基于重启超图双随机游走的抗病毒药物筛选方法,属于人工智能与生物学交叉领域。具体包括如下步骤:构建病毒

【技术实现步骤摘要】
基于重启超图双随机游走的抗病毒药物筛选方法


[0001]本专利技术属于生物信息学、计算生物学与人工智能交叉领域,具体涉及一种基于重启超图双随机游走的抗病毒药物筛选方法。

技术介绍

[0002]新型冠状病毒引发了严重公共健康问题,有效的抗病毒药物对消除疫情影响、恢复正常经济秩序具有举足轻重的价值。但从头开始设计一种新药非常困难,面临着耗时长、成本大、风险高等多种困难。与传统药物发现方法相比,已上市的药物再利用(即药物重定位)可以明显缩短药物开发时间,降低开发成本,一定程度上规避投入风险。
[0003]在药物重定位发展之初,分子对接等生物学方法占了大部分。分子对接可以直接确定药物靶点,但通常需要对所有药物进行枚举,实验效率较低。近年来,随着机器学习方法的快速发展,机器建模等计算方法逐渐被提出并在生物信息学领域得到广泛应用。已报道的方法大致可以分为两类,基于相似性的和基于网络的方法。前者受限于相似性信息不足造成预测性能较不理想,后者难以捕获节点之间的高阶关系,且容易存在“冷启动”问题。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术提供一种基于重启超图双随机游走的抗病毒药物筛选方法(Virus

Drug Associations prediction based on Hypergraph Bi

Random Walk with Restart,简称HBRWRVDA),其步骤大体为,首先通过构建病毒

药物关联的邻接矩阵,分别计算病毒高斯距离相似性、药物高斯距离相似性,然后根据病毒基因组序列计算病毒序列相似性,根据药物化学结构计算药物化学结构相似性,再使用快速核学习法计算整合病毒相似性、整合药物相似性;基于邻接矩阵和相似矩阵分别构建病毒超图、药物超图,得到对应的转移概率矩阵,然后使用带重启的超图双随机游走计算得到病毒

药物关联预测得分矩阵,筛选、排序给出最终预测结果。本方法能根据已有病毒

药物关联数据,准确高效地预测抗病毒相关药物。
[0005]本专利技术提供的技术方案具体包括以下步骤:
[0006]步骤一,输入已知的病毒

药物关联对,构建邻接矩阵A,若为已知关联对则对应位置为1,否则为0,此矩阵的行数为病毒数量nv,列数为药物数量nd;
[0007]步骤二,分别计算药物间高斯距离相似性和病毒间高斯距离相似性:若药物d(i)与某个病毒之间存在关联,则对应位置记为1否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性
[0008][0009]上式中,参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:
[0010][0011]以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i));
[0012][0013][0014]以上γ

d
和γ

v
都是常数;
[0015]步骤三,输入病毒基因组序列,使用既有较为成熟的多序列比方法计算病毒序列相似性,输入药物的化学结构得到药物MACCS指纹,采用谷本系数(Tanimoto Coefficient,即Jaccard相似度)计算药物化学结构相似性;
[0016]步骤四,使用快速核学习方法整合病毒基因组序列相似矩阵和病毒高斯距离相似矩阵,具体是通过求解下面的半正定规划式:
[0017][0018]式中,第一项为范数项表示相似矩阵的整合误差大小,第二项为为正则化项,作用是避免过拟合,其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵、病毒基因组序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒的整合相似矩阵;类似方法可获得药物结构相似性与药物高斯距离相似性集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵,其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵、药物结构相似矩阵;
[0019]步骤五,使用关联矩阵和病毒(药物)整合相似矩阵构建病毒(药物)超图,分别计算病毒(药物)加权关联矩阵、加权相关性矩阵。具体为,基于关联矩阵、病毒相似性矩阵(或关联矩阵、药物相似性矩阵)分别建立病毒超图HV(或药物超图HD),构造加权关联矩阵H
|V|
×
|E|

[0020][0021]其中H=(V, E)中V代表病毒(或药物)节点集,E代表超边集,h(v)是节点v在超边e中的权重;矩阵表示病毒(或药物)顶点v∈V的度,为顶点度的对角矩阵。接下来,计算病毒(或药物)超图H加权相关性矩阵W
|V|
×
|E|
如下:
[0022][0023]其中的权重w(v)=h(v)s(v),s(v)的值等于病毒(或药物)节点v在矩阵S
v
(或S
d
)病毒(或药物)对应列的相似度之和;超边e∈E的度数,矩阵D
e
=diag(d(e))为超边度的对角矩阵。
[0024]步骤六,计算病毒(药物)超图的转移概率矩阵。病毒超图中随机游走的转移概率
矩阵,其中对角矩阵W
e|E|
×
|E|
=diag(w(e))表示病毒节点选择某超边的概率。类似地,可计算得到药物超图HD的转移概率矩阵PD。
[0025]步骤七,使用带重启的超图双随机游走计算病毒

药物关联得分;首先,对病毒和药物转移概率矩阵矩阵PV和PD进行列归一化处理,得到归一化矩阵VP和DP;然后,用迭代方法对病毒超图和药物超图进行双随机游走:
[0026][0027][0028]其中RV和RD分别表示病毒、病毒视角的预测得分;α为重启概率,t是迭代步数,可通过限定t实现不同的随机游走策略;R0为初始归一化的概率矩阵。最后,通过线性组合得到预测得分矩阵R
t =(r1·
RV+r2·
RD)/(r1+r2)。
[0029]根据病毒

药物关联对预测分数R
t
筛选出目标病毒所对应的行,排序即得到最终预测结果。
[0030]本专利技术的技术效果和优点:
[0031]1、相对于传统的图结构只能考虑两个顶点之间的成对交互关系,本方法将数据组织成超图可以捕获节点之间的高阶关系,进而获得较佳预测结果;
[0032]2、使用随机游走方法不仅能捕获病毒

药物关联网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于重启超图双随机游走的抗病毒药物筛选方法,其特征在于具体包括如下步骤:步骤一,输入已知的病毒

药物关联对,构建邻接矩阵;步骤二,使用邻接矩阵分别计算药物高斯距离相似性、病毒高斯距离相似性;步骤三,输入病毒基因组序列,使用多序列比对法计算病毒序列相似性;输入药物的化学结构的SMILES编码,使用谷本系数计算药物化学结构相似性矩阵;步骤四,使用快速核学习方法整合病毒基因组序列相似矩阵和病毒高斯距离相似矩阵、药物结构相似矩阵和药物高斯距离相似矩阵,得到整合病毒相似矩阵、整合药物相似矩阵;步骤五,使用关联矩阵和病毒(或药物)整合相似矩阵构建病毒(或药物)超图,分别计算病毒(或药物)加权关联矩阵、加权相关性矩阵;步骤...

【专利技术属性】
技术研发人员:汤永张益萌柴勇
申请(专利权)人:汤永
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1