【技术实现步骤摘要】
基于子树权重拓扑指标预测抗HIV病毒活性的方法
[0001]本专利技术涉及抗
HIV
活性预测的
,特别是一种基于子树权重拓扑指标预测抗
HIV
病毒活性的方法
。
技术介绍
[0002]图的一个拓扑指标是一个映射
f
,该映射将图集合映射到实数集合
。
该指标相当于定义在图上的一个数值描述符,通常情况下是一个图不变量,即同构意义下的两个图,他们对应该拓扑指标的值是相等的
。
拓扑指标能反映图的很多结构特性,近年来,国内外众多学者使用拓扑指标进行抗
HIV
活性的预测研究,
2001
年,
Gupta
等人提出了离心邻接指标,利用该指标进行抗
HIV
预测,准确率达
90
%以上
。2009
年,
Dureja
等人融合了
Wiener
指标
、
分子连通度指标
、
增强离心连通拓扑化学指标等三个指标,预测了二甲基氨基吡啶
‑2‑
酮的抗
HIV
活性,预测准确度达到
81
%
‑
85
%之间
。2017
年,
Tian
等人基于堆叠自编码器进行抗
HIV
活性预测,实验发现该方法与人工神经网络
(ANN)、
支持向量机
(
【技术保护点】
【技术特征摘要】
1.
基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,包括以下步骤:
(1)
将化合物的原子采用对应的化学符号标记为顶点权重,原子与原子之间相连的键价数标记为边权重,然后将顶点权重和边权重映射到
n
阶广义邻接矩阵,
n
>1;
(2)
构造基于
n
阶广义邻接矩阵的子树权重信息无丢失行列变换规则,对化合物的图
G
进行树
、
单圈图结构
、
双圈图结构的识别,并计算图
G
的子树权重指标;
(3)
通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活性进行预测
。2.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(3)
中,将
Wiener
指标
、Harary
指标和
Schultz
指标中的至少一种与子树权重指标相结合,通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活性进行预测
。3.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,当图
G
的结构为树时,树
T
:=
G
,树的子树权重指标的计算方法如下:步骤
3.1
:初始化树
T
的子树权重指标为
SW
:=0;步骤
3.2
:对于
n
阶广义邻接矩阵
A(T)
的任意的主对角线元素
a
i
,
i
,若第
i
行和第
i
列元素除去
a
i
,
i
后只有一个元素
a
i
,
j
或
a
k
,
i
大于0,可知
a
i
,
i
为叶子顶点,
a
j
,
j
或
a
k
,
k
为父亲顶点,采用公式
(4)
更新
a
j
,
j
的值
a
j
,
j
=
a
j
,
j
(1+a
i
,
i
a
i
,
j
)
或
a
k
,
k
=
a
k
,
k
(1+a
i
,
i
a
k
,
i
)
,
j≠i≠k
,
0≤j
<
n
,
0≤i
<
n
,
0≤k
<
n
,公式
(4)
如下:其中,对任意
v
s
∈V(T
′
)
,
g
′
(e)
=
g(e)(e∈E(T
′
))
,
V(T)
为树
T
的顶点集,
E(T)
为树
T
的边集,
T
=
(V(T)
,
E(T)
;
f
,
g)
为
n(n
>
1)
个顶点的加权树,
e
=
(u
,
v)
为对应的悬挂边,加权树
T
′
=
(V(T
′
)
,
E(T
′
)
;
f
′
,
g
′
)
,
u
,
v
为树
T
的顶点,
V(T)\{u}
为去除顶点
u
的顶点集,
E(T)\{e}
为去除边
e
的边集,
f
为顶点生成函数,
g
为边生成函数;步骤
3.3
:采用公式
(5)
更新子树权重指标
SW
:=
SW+a
i
,
i
,并删除矩阵
A(T)
的第
i
行与第
i
列,公式
(5)
如下:
F(G
;
f
,
g)
=
F(G
′
;
f
′
,
g
′
)+f(u)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
其中,
F(G
;
f
,
g)
为图
G
的子树权重指标;步骤
3.4
:重复步骤
3.2
和步骤
3.3
直至矩阵
A(T)
不再变化,若是矩阵
A(T)
为1阶矩阵,则图
G
是树,更新子树权重指标
SW
:=
SW+a0,0,就可以得到树的子树权重指标;若矩阵
A(T)
的阶大于2,则图
G
不是树,如果余下对角线元素的度都为2,图
G
为单圈图结构
。4.
根据权利要求3所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,单圈图的子树权重指标的计算方法如下:步骤
4.1
:假定单圈图边集
(v1,
v2)
,
(v2,
v3)
,
...
,
(v
n
‑1,
v
n
)
,
(v
n
,
v1)
分别对应矩阵
A(G)
中的元素
a0,1,
a1,2,
…
,
a
n
‑2,
n
‑1,
a0,
n
‑1,以单圈图顶点在矩阵中的邻接关系构造顺序数组
CA
=
[0
,1,
…
,
n
‑
1]
,这里的数值为对角线元素的位置下标;步骤
4.2
:根据步骤
4.1
的数组,可知不含边
(v
n
,
v1)
的树结构的子树权重指标
步骤
4.3
:同样的,根据步骤
4.1
的数组,可知不含边
(v1,
v2)
但含边
(v
n
,
v1)
的树结构的子树权重指标,即步骤
4.4
:重复步骤
4.3
,分别计算不含边
(v2,
v3)
,但含边
(v
n
,
v1)
,
(v1,
v2)
的树结构的子树权重指标,
...
,计算不含边
(v
n
‑1,
v
n
)
,但含边
(v
n
,
v1)
,
(v1,
v2)
,
...
,
(v
n
‑2,
v
n
‑1)
的树结构的子树权重指标,再结合步骤
4.2
以及公式
(6)
,得到基于广义邻接矩阵的单圈图的子树权重指标,公式
(6)
如下:其中,
F(U
n
;
f
,
g)
为单圈图的子树权重指标,
F(U
n
\(v1,
v2)
;
f
,
g)
为单圈图不含边
(v1,
v2)
的子树权重指标,
F(U
n
\(v
j
,
v
j+1
)
;
f
,
g
;
(v
i
,
v
i+1
))
为单圈图不含边
(v
j
,
v
j+1
)
但含边
(v
i
,
v
i+1
)
的子树权重指标
。5.
根据权利要求4所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,当图
G
不是树结构的时候,可以根据广义邻接矩阵中对角线元素的度来识别三种双圈图结构,方法如下:对于广义邻接矩阵
A(G)
,存在一个主对角线元素
a
i
,
i
,其第
i
行和第
i
列元素除去
a
i
,
i
后共有...
【专利技术属性】
技术研发人员:杨雨,靳棒棒,马爽,惠志昊,张国平,李波,吕海莲,赵伟艇,李辉利,彭伟国,
申请(专利权)人:平顶山学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。