基于超图学习的抗病毒药物筛选方法、系统及存储介质技术方案

技术编号:38614245 阅读:16 留言:0更新日期:2023-08-26 23:41
本发明专利技术提供了基于超图学习的抗病毒药物筛选方法、系统及存储介质,属于生物信息学、计算生物学与人工智能交叉技术领域,方法包括:S1.构建病毒

【技术实现步骤摘要】
基于超图学习的抗病毒药物筛选方法、系统及存储介质


[0001]本专利技术涉及生物信息学、计算生物学与人工智能交叉的
,尤其涉及基于超图学习的抗病毒药物筛选方法、系统及存储介质。

技术介绍

[0002]从头开发抗病毒的新药是一个时间长、风险大且成本高的过程。因此,若能重复使用现有药物治疗病毒性疾病,可以大幅缩短时间、降低成本,基于计算的药物重定位方法为药物筛选提供了新的思路。目前已报道方法大致可以分为两类,具体为基于结构的对接实验筛选方法和基于深度学习的预测方法,但前者存在着对结构信息依赖强,后者存在可解释性不佳的缺陷。随着人工智能技术逐步发展,相关的数据挖掘方法能够整合利用已公开的生物医学数据库的信息,高效、准确地完成药物重定位筛选任务。

技术实现思路

[0003]本专利技术提供基于超图学习的抗病毒药物筛选方法、系统及存储介质,可以根据病毒

药物关联、病毒基因组序列和药物化学结构数据,准确高效地筛选出抗病毒药物。
[0004]本说明书实施例的第一方面公开了基于超图学习的抗病毒药物筛选方法,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.使用频谱偏移法处理所述病毒整合相似矩阵和药物整合相似矩阵,得到病毒核矩阵和药物核矩阵;S6.基于所述病毒核矩阵和药物核矩阵,使用基于超图学习的对偶最小二乘法构造损失函数,迭代求解得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果;在本说明书公开的实施例中,在S1中:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd。
[0005]在本说明书公开的实施例中,在S2中:
若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:;以上γ

d
和γ

v
都是常数。
[0006]在本说明书公开的实施例中,在S3中:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数(即Jaccard相似度)计算药物化学结构相似矩阵。
[0007]在本说明书公开的实施例中,在S4中:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵:;
同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
[0008]在本说明书公开的实施例中,在S5中:使用频谱偏移法处理病毒整合相似矩阵和药物整合相似矩阵,得到病毒核矩阵K
*v
和药物核矩阵K
*d
;具体计算方法为按分解对应整合相似度矩阵S,其中U是正交矩阵,Λ是实特征值的对角矩阵,Λ = diag(λ1, λ2,
ꢀ…
, λ
n
),λ
min
(S)是输入矩阵S的最小特征值。采用频谱偏移法处理病毒整合相似度矩阵S
v
矩阵以及药物整合相似性S
d
矩阵,目的是在不改变任何两个样本之间的相似性的前提下,加强S
v
和S
d
矩阵自相似性。分解对应整合相似度矩阵S,其中U是正交矩阵,Λ是实特征值的对角矩阵,Λ = diag(λ1, λ2,
ꢀ…
, λ
n
),λ
min
(S)是输入矩阵S的最小特征值。采用频谱偏移法处理病毒整合相似度矩阵S
v
矩阵以及药物整合相似性S
d
矩阵,目的是在不改变任何两个样本之间的相似性的前提下,加强S
v
和S
d
矩阵自相似性。分解对应整合相似度矩阵S,其中U是正交矩阵,Λ是实特征值的对角矩阵,Λ = diag(λ1, λ2,
ꢀ…
, λ
n
),λ
min
(S)是输入矩阵S的最小特征值。采用频谱偏移法处理病毒整合相似度矩阵S
v
矩阵以及药物整合相似性S
d
矩阵,目的是在不改变任何两个样本之间的相似性的前提下,加强S
v
和S
d
矩阵自相似性。
[0009]在本说明书公开的实施例中,在S6中:使用基于超图学习的对偶最小二乘法构造损失函数,迭代求解得到病毒

药物预测得分矩阵;首先使用基于超图学习的对偶最小二乘法构造目标函数如下:;式中第1项是重构误差项,衡量了预测得分矩阵与原关联矩阵间的差距,第2、3项是超图正则化项,保留了高阶关联信息,第4项是L2(Tikhonov)正则化项,保持系数矩阵光滑防止过拟合;其中A为病毒

药物关联对的邻接矩阵(已知);K
*v
∈R
nv
×
nv
和K
*d
∈R
nd
×
nd
分别是所述病毒、药物的核矩阵(通过S5步中的频谱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于超图学习的抗病毒药物筛选方法,其特征在于,包括如下步骤:S1.构建病毒

药物关联的邻接矩阵;S2.基于所述病毒

药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;S3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;S4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;S5.使用频谱偏移法处理所述病毒整合相似矩阵和药物整合相似矩阵,分别得到病毒核矩阵和药物核矩阵;S6.基于所述病毒核矩阵和药物核矩阵,使用基于超图学习的对偶最小二乘法构造损失函数,迭代求解得到病毒

药物预测得分矩阵;S7.基于所述病毒

药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果;所述S1的具体实现方法为:输入已知的病毒

药物关联对,构建病毒

药物关联的邻接矩阵A;若为已知关联对,则对应位置为1,否则为0;所述邻接矩阵A的行数为病毒数量nv,列数为药物数量nd;所述S2的具体实现方法为:若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1
×
nv大小的0或1构成的向量,记之为药物d(i)的向量谱IP(d(i)),nv为病毒数量;然后计算药物d(i)和d(j)之间的高斯距离相似性:;上式中,IP(d(j))为药物d(j)的向量谱;参数γ
d
用于控制核带宽,通过归一化新带宽参数γ

d
获得:;其中,nd为药物数量;以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1
×
nd大小的0或1构成的向量,记之为病毒v(i)的向量谱IP(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:;其中,IP(v(j))为病毒v(j)的向量谱;参数γ
v
用于控制核带宽,通过归一化新带宽参数γ

v
获得:
;以上γ

d
和γ

v
都是常数;所述S3的具体实现方法为:基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;基于药物的化学结构,得到药物MACCS指纹,采用谷本系数计算药物化学结构相似矩阵;所述S4的具体实现方法为:所述快速核学习方法的半正定规划式为:;式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中A为病毒

药物关联邻接矩阵,S
jv
(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μ
v
为正则化参数,λ
v
∈R1×2为待求解的系数,通过λ
v
得到病毒整合相似矩阵S
v
:;同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λ
d
∈R1×2,然后计算药物整合相似矩阵S
d
:;其中S
jd
(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵;所述S5的具体实现方法为:使用频谱偏移法处理病毒整合相似矩阵和药物整合相似矩阵,得到病毒核矩阵K
*v
和药物核矩阵K
*d
,具体计算方法为按分解所述整合相似度矩阵S,其中U是正交矩阵,Λ是实特征值的对角矩阵,Λ = diag(λ1, λ2,
ꢀ…
, λ
n
),λ
min
(S)是输入矩阵S的最小特征值;所述S6的具体实现方法为:首先使用基于超图学习的对偶最小二乘法构造目标函数如下:
;式中第1项是重构误差项,衡量了预测得分矩阵与原关联矩阵间的差距,第2、3项是超图正则化项,保留了高阶...

【专利技术属性】
技术研发人员:汤永王珊李顺飞刘建超刘丽华高笠雄
申请(专利权)人:中国人民解放军总医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1