基于矩阵补全的抗病毒药物筛选方法、系统及存储介质技术方案

技术编号:37704375 阅读:18 留言:0更新日期:2023-06-01 23:52
本发明专利技术提供了基于矩阵补全的抗病毒药物筛选方法、系统及存储介质,属于生物信息学、计算生物学与人工智能交叉技术领域,方法通过系统实现,方法包括:S1.构建病毒

【技术实现步骤摘要】
基于矩阵补全的抗病毒药物筛选方法、系统及存储介质


[0001]本专利技术涉及生物信息学、计算生物学与人工智能交叉的
,尤其是涉及基于矩阵补全的抗病毒药物筛选方法、系统及存储介质。

技术介绍

[0002]按常规方法研发药物可能需要耗时十多年、耗资数十亿美元,在短时间内开发出一种有效抗病毒药物是极为困难的。考虑到已成熟的药品,其有效性、安全性和毒性都是经过测试的,于是“老药新用”,从已经应用的药品中寻找有效方案是应对突发疫情的一种高效解决方法。
[0003]抗病毒药物筛选方法已有报道,其中一类是基于结构的虚拟筛选方法,如使用动力学模拟技术,计算潜在药物和靶标间的结合能力,通过分子动力学模拟计算药物的吸收、分布、代谢、排泄和毒性等。此类方法通常存在模拟过程复杂、对使用者经验要求高等不足。国防科技大学天河超算团队提出了基于自由能微扰

绝对结合自由能方法的新冠药物虚拟筛选技术,但这种基于自由能的大规模筛选,对算力要求较高,需要借助超级计算机平台,且耗时以周计算。

技术实现思路

[0004]本专利技术提供基于矩阵补全的抗病毒药物筛选方法、系统及存储介质,可以根据病毒

药物关联数据,准确高效地预测抗病毒相关药物。
[0005]本说明书实施例的第一方面公开了基于矩阵补全的抗病毒药物筛选方法,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用非负矩阵分解的矩阵补全方法,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
[0006]在本说明书公开的实施例中,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;
若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd。
[0007]在本说明书公开的实施例中,在S2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;以上γ

d
和γ

v
都是常数。
[0008]在本说明书公开的实施例中,在S3中:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数(Tanimoto Coefficient,即Jaccard相似度)计算药物化学结构相似矩阵。
[0009]在本说明书公开的实施例中,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵:
;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
[0010]在本说明书公开的实施例中,在S5中:使用非负矩阵分解的矩阵补全方法构造的损失函数如下:;;式中部分是重建损失项,其中A∈R
nv
×
nd
是已知的病毒

药物关联的邻接矩阵,nv和nd分别为病毒的数量和药物的数量;矩阵I为全1矩阵,C表示矩阵A待补全部分,W和H为待求解的基矩阵和系数矩阵,部分是F范数项,约束矩阵C防止过拟合;其余部分是流形约束项,(WH)
i
和(WH)
j
分别代表WH的第i和j行,(WH)
p
和(WH)
q
分别代表WH的第p和q列;S
v
(i,j)表示病毒整合相似矩阵的第(i,j)个元素,S
d
(p,q)表示病毒整合相似矩阵的第(p,q)个元素;λ
c
、λ
v
和λ
d
是正则化参数。
[0011]在本说明书公开的实施例中,在S6中:求解所述构造损失函数时,分别固定其中一个变量,然后求导数令之为0再反解,得矩阵P、Q、C、W和H的迭代求解公式,具体如下:P=HH
T
;Q=WH;C
*
=(I

A)

C;;;;
其中

表示两个矩阵的Hadamard乘积;,,D
d
或D
v
为对角矩阵,其元素为矩阵S
d
或S
v
按列求和再对角化;更新以上矩阵直到收敛。
[0012]本专利技术实施例的第二方面公开了基于矩阵补全的抗病毒药物筛选系统,包括:邻接矩阵构建模块,用于构建病毒

药物关联的邻接矩阵;高斯距离相似矩阵计算模块,用于基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块,用于基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;整合相似矩阵计算模块,用于基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于矩阵补全的抗病毒药物筛选方法,其特征在于,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用非负矩阵分解的矩阵补全方法,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。2.根据权利要求1所述的基于矩阵补全的抗病毒药物筛选方法,其特征在于,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd。3.根据权利要求1所述的基于矩阵补全的抗病毒药物筛选方法,其特征在于,在S2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),nv为病毒数量;然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,IP(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;其中,nd为药物数量;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;以上γ

d
和γ

v
都是常数;IP(v(j))为病毒v(j)的向量谱。4.根据权利要求1所述的基于矩阵补全的抗病毒药物筛选方法,其特征在于,在S3中:
基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数计算药物化学结构相似矩阵。5.根据权利要求1所述的基于矩阵补全的抗病毒药物筛选方法,其特征在于,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵S
v
:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵S
d
:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。6.根据权利要求1所述的基于矩阵补全的抗病毒药物筛选方法,其特征在于,在S5中:使用非负矩阵分解的矩阵补全方法构造的损失函数如下:;;式中部分是重建损失项,

表示两个矩阵的Hadamard乘积;其中A∈R
nv
×
nd
是已知的病毒

药物关联的...

【专利技术属性】
技术研发人员:王珊汤永李顺飞刘建超刘丽华
申请(专利权)人:中国人民解放军总医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1