基于联合投影的抗病毒药物筛选方法、系统及存储介质技术方案

技术编号:37673639 阅读:26 留言:0更新日期:2023-05-26 04:36
本发明专利技术提供了基于联合投影的抗病毒药物筛选方法、系统及存储介质,属于生物信息学、计算生物学与人工智能交叉技术领域,方法通过系统实现,方法包括如下步骤:S1.构建病毒

【技术实现步骤摘要】
基于联合投影的抗病毒药物筛选方法、系统及存储介质


[0001]本专利技术涉及生物信息学、计算生物学与人工智能交叉
,尤其是涉及基于联合投影的抗病毒药物筛选方法、系统及存储介质。

技术介绍

[0002]有研究指出,一项有效的临床新药开发基本上需要数十亿美元,平均大约需要9

12年才能成功推向市场。于是药物再利用(也称为药物重新定位),即利用现有药物寻找治疗新适应症药物成为提高新药研发生产力的一种有前景的解决方案。实验室中的探索性实验往往既昂贵又耗时,使用建模计算方法能在短时间内以较高准确性获得潜在药物候选,使用这些优选过的对象再进行“湿实验”验证,就能显著减少工作量、加速研发进程。
[0003]已有病毒相关药物筛选的研究结果,如使用分子动力学模拟、自由能计算模拟病毒入侵过程和靶点结合状况,进而推断优选药物,也有通过基于结构信息、制作点突变来识别可能有效的药物,这些方法往往存在耗时长或过于依赖人工干预的不足,另外新发现的病毒一般可用信息较为匮乏,则此类模型的预测性能也较不理想。

技术实现思路

[0004]本专利技术提供基于联合投影的抗病毒药物筛选方法、系统及存储介质,能根据病毒

药物关联对、病毒基因组序列和药物化学结构数据,准确高效地预测抗病毒相关药物。
[0005]本说明书实施例的第一方面公开了基于联合投影的抗病毒药物筛选方法,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用稀疏正则化联合投影方法,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
[0006]在本说明书公开的实施例中,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵Y;若为已知关联对,则对应位置为1,否则为0;
所述邻接矩阵Y的行数为病毒数量nv,列数为药物数量nd。
[0007]在本说明书公开的实施例中,在S2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,IP(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;IP(v(j))为病毒v(j)的向量谱;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;以上γ

d
和γ

v
都是常数。
[0008]在本说明书公开的实施例中,在S3中:基于病毒基因组序列,使用多序列比对方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数计算药物化学结构相似矩阵。
[0009]在本说明书公开的实施例中,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中Y为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵:
;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
[0010]在本说明书公开的实施例中,在S5中:使用稀疏正则化联合投影方法构造的损失函数如下:;式中为流形正则化项;W1∈R
d1
×
nd
和W2∈R
d2
×
nv
是待求系数矩阵;P∈R
d1
×
d2
是投影矩阵;J(W1,W2,P)表示将等号右侧部分的值记为J,且J随变量W1、W2和P而变化;Y∈R
nv
×
nd
是已知的病毒

药物关联矩阵,nv和nd分别表示病毒数量和药物数量;矩阵A和B是病毒整合相似矩阵S
v
∈R
nv
×
nv
和药物整合相似矩阵S
d
∈R
nd
×
nd
分解得到的低秩矩阵,即S
v
≈AA
T
,S
d
≈BB
T
,A∈R
nv
×
d1
和B∈R
nd
×
d2
表示病毒与药物的潜在特征,d1和d2分别表示矩阵S
v
和S
d
的秩;λ1、λ2、λ3和α是正则化参数;||
·
||
F
表示Frobenius范数,||
·
||
*
表示核范数,||
·
||
2,1
表示L2,1范数;L1∈R
n
×
n
和L2∈R
m
×
m
是图归一化拉普拉斯矩阵,计算方法为:;;其中D
v

Rnv
×
nv
和D
d
∈R
nd
×
nd
是对角矩阵,其元素值的计算方式为:。
[0011]在本说明书公开的实施例中,在S6中:求解所述构造损失函数时,将矩阵J分别对矩阵W1和W2求导,再令其等于0,可求得矩阵W1和W2的计算公式为:;;
其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于联合投影的抗病毒药物筛选方法,其特征在于,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.基于所述病毒

药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用稀疏正则化联合投影方法,构造损失函数;S6.求解所述损失函数,得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。2.根据权利要求1所述的基于联合投影的抗病毒药物筛选方法,其特征在于,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵Y;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵Y的行数为病毒数量nv,列数为药物数量nd。3.根据权利要求1所述的基于联合投影的抗病毒药物筛选方法,其特征在于,在S2中:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),nv为病毒数量,然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,IP(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),nd为药物数量,计算病毒v(i)和v(j)之间的高斯距离相似性:;IP(v(j))为病毒v(j)的向量谱;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:
;以上γ

d
和γ

v
都是常数。4.根据权利要求1所述的基于联合投影的抗病毒药物筛选方法,其特征在于,在S3中:基于病毒基因组序列,使用多序列比对法计算病毒基因序列相似矩阵;基于药物化学结构,得到药物MACCS指纹,采用谷本系数计算药物化学结构相似矩阵。5.根据权利要求1所述的基于联合投影的抗病毒药物筛选方法,其特征在于,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中Y为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵S
v
:;同理,按照上述可获得药物结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵S
d
:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。6.根据权利要求1所述的基于联合投影的抗病毒药物筛选方法,其特征在于,在S5中:使用稀疏正则化联合投影方法构造损失函数如下:;式中为流形正则化项;W1∈R
d1
×
nd
和W2∈R
d2
×
nv
是待求系数矩阵;P∈R
d1
×
d2
是投影矩阵;J(W1,W2,P)表示将等号右侧部分的值记为J,且J随变量W1、W2和P而变化;Y∈R
nv
×
nd
是已知的病毒

药物关联矩阵,nv和nd分别表示病毒数量和药物数量;矩阵A和B是病毒整合相似矩阵S
v
∈R
nv
×
nv
和药物整合相似矩阵S
d
∈R
nd
×
nd
分解得到的低秩矩阵,即S
v
≈AA
T
,S
d
≈BB
T
,A∈R
nv
×
d1
和B∈R
nd
×
d2
表示病毒与药物的潜在特征,d1和d2分别表示矩阵S
v
和S
d
的秩;λ1、λ2、λ3和α是正则化参数;||
·
||
F
表示
...

【专利技术属性】
技术研发人员:汤永王珊李顺飞刘建超刘丽华
申请(专利权)人:中国人民解放军总医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1