基于非负矩阵的抗病毒药物筛选方法、系统及存储介质技术方案

技术编号:38948309 阅读:27 留言:0更新日期:2023-09-25 09:44
本发明专利技术提供了基于非负矩阵的抗病毒药物筛选方法、系统及存储介质,属于生物信息学、计算生物学与人工智能交叉技术领域,方法通过系统实现,方法包括:S1.构建病毒

【技术实现步骤摘要】
基于非负矩阵的抗病毒药物筛选方法、系统及存储介质


[0001]本专利技术涉及生物信息学、计算生物学与人工智能交叉的
,尤其是涉及基于非负矩阵的抗病毒药物筛选方法、系统及存储介质。

技术介绍

[0002]新药的研发具有技术含量高、过程复杂的特点。因此,药物重定位是一种事半功倍的方法。对于那些已经通过序列鉴定发现与现有病毒同源性较高的新发病毒,通过使用储备的适用于该属病毒的鸡尾酒疗法进行治疗。在新发病毒时,通过计算模型来辅助筛选抗病毒药物,我们可以在短时间内为医药领域提供备选库,进而大大加速抗病毒新药的研发过程。
[0003]抗病毒药物筛选方法已有报道,其中一类是基于结构的虚拟筛选方法,如使用动力学模拟技术,通过分子动力学模拟计算潜在药物和靶标间的结合能力,但存在模拟过程复杂、对使用者经验要求高等不足。国防科技大学天河超算团队提出了基于自由能微扰

绝对结合自由能方法的新冠药物虚拟筛选技术,但这种方法对算力要求较高,需要借助超级计算机平台,且耗时以周计算。

技术实现思路

[0004]本专利技术提供基于非负矩阵的抗病毒药物筛选方法、系统及存储介质,可以根据病毒

药物关联、病毒基因组序列和药物化学结构数据,准确高效地筛选出抗病毒药物。
[0005]本说明书实施例的第一方面公开了基于非负矩阵的抗病毒药物筛选方法,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用图正则化非负矩阵分解,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
[0006]在本说明书公开的实施例中,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;
若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd。
[0007]在本说明书公开的实施例中,在S2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;以上γ

d
和γ

v
都是常数。
[0008]在本说明书公开的实施例中,在S3中:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数(即Jaccard相似度)计算药物化学结构相似矩阵。
[0009]在本说明书公开的实施例中,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵:;
[0010]同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
[0011]在本说明书公开的实施例中,在S5中:基于病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用图正则化非负矩阵分解方法,构造损失函数。
[0012]基于图正则化非负矩阵分解方法构造的损失函数,具体如下:;式中第1项是重构损失项,表示重构误差大小,其中‖
·

2,1
代表L
2,1
范数,定义为,其中u
i
是矩阵U(大小为n行s列)的第i行;A为已知病毒

药物关联矩阵,矩阵F和G分别表示待求的基矩阵和系数矩阵;第2和第3项是图正则化项,刻画了数据的几何结构信息,其中Tr(
·
)表示矩阵的迹;第4项是判别约束项,使矩阵G近似正交获得判别信息,其中I为单位矩阵;第5项是L1稀疏约束项,作用是防止过拟合;式中α1、α2、β和γ表示正则化系数;L
v
表示病毒整合相似矩阵S
v
的图拉普拉斯矩阵,L
d
表示药物整合相似矩阵S
d
的图拉普拉斯矩阵,计算方法为L
v
=D
v

S
v
和L
d
=D
d

S
d
,其中D
v
是对角矩阵,其对角元素是病毒整合相似矩阵S
v
的列之和,D
d
是对角矩阵,其对角元素是药物整合相似矩阵S
d
的列之和;所述S6的具体实现方法为:使用拉格朗日乘子法,依据Karush

Kuhn

Tucker(KKT)条件分别固定矩阵F和G中的一个,求导数令之为0再反解,得矩阵F和G的迭代求解公式,具体如下:;其中Q为对角矩阵,对角线上的元素值,ε表示一个充分小常数,E为全1矩阵;基于上式更新非负矩阵F和G直到收敛,然后计算病毒

药物关联对预测分数矩阵S
pred
=FG
T

[0013]S7.根据病毒

药物关联对预测分数,筛选出目标病毒对应行各药物的得分,排序后得到最终预测结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于非负矩阵的抗病毒药物筛选方法,其特征在于,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用图正则化非负矩阵分解,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果;所述S1的具体实现方法为:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd;所述S2的具体实现方法为:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),nv为病毒数量;然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,IP(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;其中,nd为药物数量;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;其中,IP(v(j))为病毒v(j)的向量谱;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;
以上γ

d
和γ

v
都是常数;所述S3的具体实现方法为:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数计算药物化学结构相似矩阵;所述S4的具体实现方法为:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵S
v
:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵S
d
:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵;所述S5的具体实现方法为:基于图正则化非负矩阵分解方法构造的损失函数,具体如下:;式中第1项是重构损失项,表示重...

【专利技术属性】
技术研发人员:王珊李顺飞刘建超汤永刘丽华
申请(专利权)人:中国人民解放军总医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1