当前位置: 首页 > 专利查询>平顶山学院专利>正文

基于子树权重拓扑指标预测抗制造技术

技术编号:39805383 阅读:6 留言:0更新日期:2023-12-22 02:39
本发明专利技术提出一种基于子树权重拓扑指标预测抗

【技术实现步骤摘要】
基于子树权重拓扑指标预测抗HIV病毒活性的方法


[0001]本专利技术涉及抗
HIV
活性预测的
,特别是一种基于子树权重拓扑指标预测抗
HIV
病毒活性的方法


技术介绍

[0002]图的一个拓扑指标是一个映射
f
,该映射将图集合映射到实数集合

该指标相当于定义在图上的一个数值描述符,通常情况下是一个图不变量,即同构意义下的两个图,他们对应该拓扑指标的值是相等的

拓扑指标能反映图的很多结构特性,近年来,国内外众多学者使用拓扑指标进行抗
HIV
活性的预测研究,
2001
年,
Gupta
等人提出了离心邻接指标,利用该指标进行抗
HIV
预测,准确率达
90
%以上
。2009
年,
Dureja
等人融合了
Wiener
指标

分子连通度指标

增强离心连通拓扑化学指标等三个指标,预测了二甲基氨基吡啶
‑2‑
酮的抗
HIV
活性,预测准确度达到
81


85
%之间
。2017
年,
Tian
等人基于堆叠自编码器进行抗
HIV
活性预测,实验发现该方法与人工神经网络
(ANN)、
支持向量机
(SVM)
相比,具有非常好的性能

[0003]作为基于结构和计数的拓扑指标,图的子树数指标
(
图的所有非空的子树的个数
)

BC
子树数指标
(
任意两片叶子间的距离均为偶数的子树个数
)
可用来分析混合网络局部可靠性
(
网络的节点或边遭受攻击时,仍然能够保持连通的性能
)

RNA
和蛋白质结构预测及基因发现,预测化合物的物理化学特性

此外,已有研究表明子树数指标和
Wiener
指标
、Randi

c
指标和
Harary
指标关系密切,而后三个指标与化合物的沸点

色谱保留时间

生成热焓

表面积以及水溶解度密切相关

[0004]目前的抗
HIV
活性预测大多采用距离型的拓扑指标,比如
Wiener
指标

离心率联通指标,还未见利用结构型的拓扑指标来进行抗
HIV
活性预测的研究


技术实现思路

[0005]本专利技术提出一种基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,单个指标子树权重指标的预测准确度为
90.95
%~
94.71
%,子树权重指标参与的多个指标预测准确度为
93.99
%~
99.67
%,该指标具有良好的特征区分能力,可以为新药研发提供新的度量

[0006]本专利技术的技术方案是这样实现的:基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,包括以下步骤:
[0007](1)
将化合物的原子采用对应的化学符号标记为顶点权重,原子与原子之间相连的键价数标记为边权重,然后将顶点权重和边权重映射到
n
阶广义邻接矩阵,
n
>1;
[0008](2)
构造基于
n
阶广义邻接矩阵的子树权重信息无丢失行列变换规则,对化合物的图
G
进行树

单圈图结构

双圈图结构的识别,并计算图
G
的子树权重指标;
[0009](3)
通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活性进行预测

[0010]进一步地,步骤
(3)
中,将
Wiener
指标
、Harary
指标和
Schultz
指标中的至少一种与子树权重指标相结合,通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活
性进行预测

[0011]进一步地,步骤
(2)
中,当图
G
的结构为树时,树
T
:=
G
,树的子树权重指标的计算方法如下:
[0012]步骤
3.1
:初始化树厂的子树权重指标为
SW
:=0;
[0013]步骤
3.2
:对于
n
阶广义邻接矩阵
A(T)
的任意的主对角线元素
a
i

i
,若第
i
行和第
i
列元素除去
a
i

i
后只有一个元素
a
i

j

a
k

i
大于0,可知
a
i

i
为叶子顶点,
a
j

j

a
k

k
为父亲顶点,采用公式
(4)
更新
a
j

j
的值
a
j

j

a
j

j
(1+a
i

i
a
i

j
)

a
k

k

a
k

k
(1+a
i

i
a
k

i
)

j≠i≠k

0≤j

n

0≤i

n

0≤k

n
,公式
(4)
如下:
[0014]V(T

)

V(T)\{u}

E(T

)

E(T)\{e}
,且
[0015][0016]其中,对任意
v...

【技术保护点】

【技术特征摘要】
1.
基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,包括以下步骤:
(1)
将化合物的原子采用对应的化学符号标记为顶点权重,原子与原子之间相连的键价数标记为边权重,然后将顶点权重和边权重映射到
n
阶广义邻接矩阵,
n
>1;
(2)
构造基于
n
阶广义邻接矩阵的子树权重信息无丢失行列变换规则,对化合物的图
G
进行树

单圈图结构

双圈图结构的识别,并计算图
G
的子树权重指标;
(3)
通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活性进行预测
。2.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(3)
中,将
Wiener
指标
、Harary
指标和
Schultz
指标中的至少一种与子树权重指标相结合,通过机器学习经典监督学习算法构建模型,对化合物的抗
HIV
病毒活性进行预测
。3.
根据权利要求1所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,当图
G
的结构为树时,树
T
:=
G
,树的子树权重指标的计算方法如下:步骤
3.1
:初始化树
T
的子树权重指标为
SW
:=0;步骤
3.2
:对于
n
阶广义邻接矩阵
A(T)
的任意的主对角线元素
a
i

i
,若第
i
行和第
i
列元素除去
a
i

i
后只有一个元素
a
i

j

a
k

i
大于0,可知
a
i

i
为叶子顶点,
a
j

j

a
k

k
为父亲顶点,采用公式
(4)
更新
a
j

j
的值
a
j

j

a
j

j
(1+a
i

i
a
i

j
)

a
k

k

a
k

k
(1+a
i

i
a
k

i
)

j≠i≠k

0≤j

n

0≤i

n

0≤k

n
,公式
(4)
如下:其中,对任意
v
s
∈V(T

)

g

(e)

g(e)(e∈E(T

))

V(T)
为树
T
的顶点集,
E(T)
为树
T
的边集,
T

(V(T)

E(T)

f

g)

n(n

1)
个顶点的加权树,
e

(u

v)
为对应的悬挂边,加权树
T


(V(T

)

E(T

)

f


g

)

u

v
为树
T
的顶点,
V(T)\{u}
为去除顶点
u
的顶点集,
E(T)\{e}
为去除边
e
的边集,
f
为顶点生成函数,
g
为边生成函数;步骤
3.3
:采用公式
(5)
更新子树权重指标
SW
:=
SW+a
i

i
,并删除矩阵
A(T)
的第
i
行与第
i
列,公式
(5)
如下:
F(G

f

g)

F(G


f


g

)+f(u)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
其中,
F(G

f

g)
为图
G
的子树权重指标;步骤
3.4
:重复步骤
3.2
和步骤
3.3
直至矩阵
A(T)
不再变化,若是矩阵
A(T)
为1阶矩阵,则图
G
是树,更新子树权重指标
SW
:=
SW+a0,0,就可以得到树的子树权重指标;若矩阵
A(T)
的阶大于2,则图
G
不是树,如果余下对角线元素的度都为2,图
G
为单圈图结构
。4.
根据权利要求3所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,单圈图的子树权重指标的计算方法如下:步骤
4.1
:假定单圈图边集
(v1,
v2)

(v2,
v3)

...

(v
n
‑1,
v
n
)

(v
n

v1)
分别对应矩阵
A(G)
中的元素
a0,1,
a1,2,


a
n
‑2,
n
‑1,
a0,
n
‑1,以单圈图顶点在矩阵中的邻接关系构造顺序数组
CA

[0
,1,


n

1]
,这里的数值为对角线元素的位置下标;步骤
4.2
:根据步骤
4.1
的数组,可知不含边
(v
n

v1)
的树结构的子树权重指标
步骤
4.3
:同样的,根据步骤
4.1
的数组,可知不含边
(v1,
v2)
但含边
(v
n

v1)
的树结构的子树权重指标,即步骤
4.4
:重复步骤
4.3
,分别计算不含边
(v2,
v3)
,但含边
(v
n

v1)

(v1,
v2)
的树结构的子树权重指标,
...
,计算不含边
(v
n
‑1,
v
n
)
,但含边
(v
n

v1)

(v1,
v2)

...

(v
n
‑2,
v
n
‑1)
的树结构的子树权重指标,再结合步骤
4.2
以及公式
(6)
,得到基于广义邻接矩阵的单圈图的子树权重指标,公式
(6)
如下:其中,
F(U
n

f

g)
为单圈图的子树权重指标,
F(U
n
\(v1,
v2)

f

g)
为单圈图不含边
(v1,
v2)
的子树权重指标,
F(U
n
\(v
j

v
j+1
)

f

g

(v
i

v
i+1
))
为单圈图不含边
(v
j

v
j+1
)
但含边
(v
i

v
i+1
)
的子树权重指标
。5.
根据权利要求4所述的基于子树权重拓扑指标预测抗
HIV
病毒活性的方法,其特征在于,步骤
(2)
中,当图
G
不是树结构的时候,可以根据广义邻接矩阵中对角线元素的度来识别三种双圈图结构,方法如下:对于广义邻接矩阵
A(G)
,存在一个主对角线元素
a
i

i
,其第
i
行和第
i
列元素除去
a
i

i
后共有...

【专利技术属性】
技术研发人员:杨雨靳棒棒马爽惠志昊张国平李波吕海莲赵伟艇李辉利彭伟国
申请(专利权)人:平顶山学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1