基于子树权重拓扑指标预测抗制造技术

技术编号：39805383 阅读：6 留言：0更新日期：2023-12-22 02:39

本发明专利技术提出一种基于子树权重拓扑指标预测抗

全部详细技术资料下载

【技术实现步骤摘要】
基于子树权重拓扑指标预测抗HIV病毒活性的方法

[0001]本专利技术涉及抗
HIV
活性预测的
，特别是一种基于子树权重拓扑指标预测抗
HIV
病毒活性的方法
。

技术介绍

[0002]图的一个拓扑指标是一个映射
f
，该映射将图集合映射到实数集合
。
该指标相当于定义在图上的一个数值描述符，通常情况下是一个图不变量，即同构意义下的两个图，他们对应该拓扑指标的值是相等的
。
拓扑指标能反映图的很多结构特性，近年来，国内外众多学者使用拓扑指标进行抗
HIV
活性的预测研究，
2001
年，
Gupta
等人提出了离心邻接指标，利用该指标进行抗
HIV
预测，准确率达
90
％以上
。2009
年，
Dureja
等人融合了
Wiener
指标
、
分子连通度指标
、
增强离心连通拓扑化学指标等三个指标，预测了二甲基氨基吡啶
‑2‑
酮的抗
HIV
活性，预测准确度达到
81
％
‑
85
％之间
。2017
年，
Tian
等人基于堆叠自编码器进行抗
HIV
活性预测，实验发现该方法与人工神经网络
(ANN)、
支持向量机
(

【技术保护点】

【技术特征摘要】
1.
基于子树权重拓扑指标预测抗
HIV
病毒活性的方法，其特征在于，包括以下步骤：
(1)
将化合物的原子采用对应的化学符号标记为顶点权重，原子与原子之间相连的键价数标记为边权重，然后将顶点权重和边权重映射到
n
阶广义邻接矩阵，
n
＞1；
(2)
构造基于
n
阶广义邻接矩阵的子树权重信息无丢失行列变换规则，对化合物的图
G
进行树
、
单圈图结构
、
双圈图结构的识别，并计算图
G
的子树权重指标；
(3)
通过机器学习经典监督学习算法构建模型，对化合物的抗
HIV
病毒活性进行预测
。2.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法，其特征在于，步骤
(3)
中，将
Wiener
指标
、Harary
指标和
Schultz
指标中的至少一种与子树权重指标相结合，通过机器学习经典监督学习算法构建模型，对化合物的抗
HIV
病毒活性进行预测
。3.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法，其特征在于，步骤
(2)
中，当图
G
的结构为树时，树
T
：＝
G
，树的子树权重指标的计算方法如下：步骤
3.1
：初始化树
T
的子树权重指标为
SW
：＝0；步骤
3.2
：对于
n
阶广义邻接矩阵
A(T)
的任意的主对角线元素
a
i
，
i
，若第
i
行和第
i
列元素除去
a
i
，
i
后只有一个元素
a
i
，
j
或
a
k
，
i
大于0，可知
a
i
，
i
为叶子顶点，
a
j
，
j
或
a
k
，
k
为父亲顶点，采用公式
(4)
更新
a
j
，
j
的值
a
j
，
j
＝
a
j
，
j
(1+a
i
，
i
a
i
，
j
)
或
a
k
，
k
＝
a
k
，
k
(1+a
i
，
i
a
k
，
i
)
，
j≠i≠k
，
0≤j
＜
n
，
0≤i
＜
n
，
0≤k
＜
n
，公式
(4)
如下：其中，对任意
v
s
∈V(T
′
)
，
g
′
(e)
＝
g(e)(e∈E(T
′
))
，
V(T)
为树
T
的顶点集，
E(T)
为树
T
的边集，
T
＝
(V(T)
，
E(T)
；
f
，
g)
为
n(n
＞
1)
个顶点的加权树，
e
＝
(u
，
v)
为对应的悬挂边，加权树
T
′
＝
(V(T
′
)
，
E(T
′
)
；
f
′
，
g
′
)
，
u
，
v
为树
T
的顶点，
V(T)\{u}
为去除顶点
u
的顶点集，
E(T)\{e}
为去除边
e
的边集，
f
为顶点生成函数，
g
为边生成函数；步骤
3.3
：采用公式
(5)
更新子树权重指标
SW
：＝
SW+a
i
，
i
，并删除矩阵
A(T)
的第
i
行与第
i
列，公式
(5)
如下：
F(G
；
f
，
g)
＝
F(G
′
；
f
′
，
g
′
)+f(u)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
其中，
F(G
；
f
，
g)
为图
G
的子树权重指标；步骤
3.4
：重复步骤
3.2
和步骤
3.3
直至矩阵
A(T)
不再变化，若是矩阵
A(T)
为1阶矩阵，则图
G
是树，更新子树权重指标
SW
：＝
SW+a0，0，就可以得到树的子树权重指标；若矩阵
A(T)
的阶大于2，则图
G
不是树，如果余下对角线元素的度都为2，图
G
为单圈图结构
。4.
根据权利要求3所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法，其特征在于，步骤
(2)
中，单圈图的子树权重指标的计算方法如下：步骤
4.1
：假定单圈图边集
(v1，
v2)
，
(v2，
v3)
，
...
，
(v
n
‑1，
v
n
)
，
(v
n
，
v1)
分别对应矩阵
A(G)
中的元素
a0，1，
a1，2，
…
，
a
n
‑2，
n
‑1，
a0，
n
‑1，以单圈图顶点在矩阵中的邻接关系构造顺序数组
CA
＝
[0
，1，
…
，
n
‑
1]
，这里的数值为对角线元素的位置下标；步骤
4.2
：根据步骤
4.1
的数组，可知不含边
(v
n
，
v1)
的树结构的子树权重指标
步骤
4.3
：同样的，根据步骤
4.1
的数组，可知不含边
(v1，
v2)
但含边
(v
n
，
v1)
的树结构的子树权重指标，即步骤
4.4
：重复步骤
4.3
，分别计算不含边
(v2，
v3)
，但含边
(v
n
，
v1)
，
(v1，
v2)
的树结构的子树权重指标，
...
，计算不含边
(v
n
‑1，
v
n
)
，但含边
(v
n
，
v1)
，
(v1，
v2)
，
...
，
(v
n
‑2，
v
n
‑1)
的树结构的子树权重指标，再结合步骤
4.2
以及公式
(6)
，得到基于广义邻接矩阵的单圈图的子树权重指标，公式
(6)
如下：其中，
F(U
n
；
f
，
g)
为单圈图的子树权重指标，
F(U
n
\(v1，
v2)
；
f
，
g)
为单圈图不含边
(v1，
v2)
的子树权重指标，
F(U
n
\(v
j
，
v
j+1
)
；
f
，
g
；
(v
i
，
v
i+1
))
为单圈图不含边
(v
j
，
v
j+1
)
但含边
(v
i
，
v
i+1
)
的子树权重指标
。5.
根据权利要求4所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法，其特征在于，步骤
(2)
中，当图
G
不是树结构的时候，可以根据广义邻接矩阵中对角线元素的度来识别三种双圈图结构，方法如下：对于广义邻接矩阵
A(G)
，存在一个主对角线元素
a
i
，
i
，其第
i
行和第
i
列元素除去
a
i
，
i
后共有...

【专利技术属性】
技术研发人员：杨雨，靳棒棒，马爽，惠志昊，张国平，李波，吕海莲，赵伟艇，李辉利，彭伟国，
申请(专利权)人：平顶山学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人