当前位置: 首页 > 专利查询>汤永专利>正文

基于L1范数图的抗病毒药物筛选方法技术

技术编号:37274612 阅读:8 留言:0更新日期:2023-04-20 23:42
本发明专利技术公开了一种基于L1范数图的抗病毒药物筛选方法,属于人工智能与生物学交叉领域。具体包括如下步骤:构建病毒

【技术实现步骤摘要】
基于L1范数图的抗病毒药物筛选方法


[0001]本专利技术属于生物信息学、计算生物学与人工智能交叉领域,具体涉及一种基于L1范数图的抗病毒药物筛选方法。

技术介绍

[0002]冠状病毒SARS

CoV

2引发全球性疫情,成为了世界公共卫生的严重威胁,寻找有效的抗病毒药成为极为紧迫的任务。然而,按常规方法研发药物可能需要耗时十多年、耗资数十亿美元,在短时间内开发出一种有效抗病毒药物是极为困难的。考虑到已成熟的药品其有效性、安全性和毒性都是经过测试的,于是“老药新用”从已经应用的药品中寻找有效方案是应对突发疫情应对药物的一种高效的解决方法。
[0003]抗病毒药物筛选方法已有报道,其中一类是基于结构的虚拟筛选方法,如使用动力学模拟技术计算潜在药物和靶标间的结合能力,通过分子动力学模拟计算药物的吸收、分布、代谢、排泄和毒性等。此类方法通常存在模拟过程复杂、对使用者经验要求高等不足。国防科技大学天河超算团队提出了基于自由能微扰

绝对结合自由能方法的新冠药物虚拟筛选方法,但这种基于自由能的大规模筛选方法对算力要求较高,需要借助超级计算机平台,且耗时以周计算。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术提供一种基于L1范数图的抗病毒药物筛选方法(Virus

Drug

Association

prediction

based

on

L1‑
norm

graph,简称L1norm

VDA),其步骤大体为,首先通过构建病毒

药物关联的邻接矩阵,分别计算病毒高斯距离相似性、药物高斯距离相似性,然后根据病毒基因组序列计算病毒序列相似性,根据药物化学结构计算药物化学结构相似性,再使用快速核学习法计算整合病毒相似性、整合药物相似性;接下来使用病毒

药物关联邻接矩阵、整合病毒相似性构建目标函数并求解得到病毒视角的预测得分矩阵,再使用病毒

药物关联邻接矩阵、整合药物相似性构建目标函数并求解得到药物视角的预测得分矩阵;然后将上述两个得分矩阵加权组合得到总预测得分矩阵,最后排序给出最终预测结果。本方法能根据病毒

药物关联数据,准确高效地预测抗病毒相关药物。
[0005]本专利技术提供的技术方案具体包括以下步骤:
[0006]步骤一,输入已知的病毒

药物关联对,构建邻接矩阵A,若为已知关联对则对应位置为1,否则为0,此矩阵的行数为病毒数量nv,列数为药物数量nd;
[0007]步骤二,分别计算药物间高斯距离相似性和病毒间高斯距离相似性:若药物d(i)与某个病毒之间存在关联,则对应位置记为1否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性
[0008][0009]上式中,参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:
[0010][0011]以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i));
[0012][0013][0014]以上γ

d
和γ

v
都是常数;
[0015]步骤三,输入病毒基因组序列,使用既有较为成熟的多序列比方法计算病毒序列相似性,输入药物的化学结构得到药物MACCS指纹,采用谷本系数(Tanimoto

Coefficient,即Jaccard相似度)计算药物化学结构相似性;
[0016]步骤四,使用快速核学习方法整合病毒基因组序列相似矩阵和病毒高斯距离相似矩阵,具体是通过求解下面的半正定规划式:
[0017][0018]式中,第一项为范数项表示相似矩阵的整合误差大小,第二项为为正则化项,作用是避免过拟合,其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵、病毒基因组序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒的整合相似矩阵;类似方法可获得药物结构相似性与药物高斯距离相似性集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵,其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵、药物结构相似矩阵;
[0019]步骤五,基于半监督学习方法,从病毒空间视角构造目标函数,具体为:
[0020][0021]其中S
v
为病毒相似性矩阵,Q
v
表示待求的病毒

药物关联概率矩阵,q
iv
和q
jv
分别表示Q
v
的第i和第j列;U
v
为对角矩阵,A为已知的病毒

药物关联矩阵。
[0022]步骤六,使用L1范数重写上述目标函数得到:,其中p
v
表示大小为nv
×
nv,第(i , j)个元素为的矩阵;然后通过在每轮迭代期间更新计算,得到加权相似度矩阵;通过求导再反解可得病毒视角得分矩阵,其中是拉普拉斯矩阵,是对角矩阵,其第i个对角元素为;类似地方法,从疾病空间的视角构建基于L1范数的目标函数,可得药物视角得分矩
阵;
[0023]步骤七,求算数平均值,得到最终的预测结果,根据病毒

药物关联对预测分数Q
final
筛选出特定病毒所对应的行,排序即得到最终预测结果。
[0024]本专利技术的技术效果和优点:
[0025]1、通过引入稀疏范数约束项使目标函数生成稀疏解,能有效减轻训练数据集中存在的内在噪声的影响,进而使得病毒

药物关联预测结果更具有鲁棒性、更准确;
[0026]2、整合的病毒相似性以及整合的药物相似性都可以在每轮迭代期间根据标签矩阵自适应地改变,具有较好的可扩展性与健壮性,使本方法能获得较佳预测结果;
[0027]3、通过集成了拉普拉斯项融合了流形学习理论,属于半监督模型,能够高效利用阴性样本信息,降低了模型构建的难度,提升了预测性能。
附图说明
[0028]图1为本专利技术的总体流程图。
[0029]图2为本专利技术与几种已报道方法在同一数据集上五倍交叉验证的结果图。
具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行完整地描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于L1范数图的抗病毒药物筛选方法,其特征在于具体包括如下步骤:步骤一,输入已知的病毒

药物关联对,构建邻接矩阵;步骤二,使用邻接矩阵分别计算药物高斯距离相似性、病毒高斯距离相似性;步骤三,输入病毒基因组序列,使用多序列比对法计算病毒序列相似性;输入药物的化学结构的SMILES编码,使用谷本系数计算药物化学结构相似性矩阵;步骤四,使用快速核学习方法整合病毒基因组序列相似矩阵和病毒高斯距离相似矩阵、药物结构相似矩阵和药物高斯距离相似矩阵,得到整合病毒相似矩阵、整合药物相似矩阵;步骤五,分别从病毒视角和药物视角,结合稀疏约束与拉普拉斯半监督学习方法构建损失函数,从病毒视角构造的目标函数具体为:,其中S
v
为整合病毒相似性矩阵,Q
v
表示待求的病毒

药物关联概率矩阵,q
iv
...

【专利技术属性】
技术研发人员:汤永张益萌柴勇
申请(专利权)人:汤永
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1