【技术实现步骤摘要】
一种基于图卷积网络的抗癌肽分类方法、系统和存储介质
[0001]本专利技术属于生物信息学
,具体涉及一种基于图卷积网络的抗癌肽分类方法、系统和存储介质。
技术介绍
[0002]在药物合成的异构信息网络中,具有蛋白活性的多肽是源于蛋白质的多功能化合物,可作为药物治疗相关疾病。多肽是一种长度由10
‑
50个氨基酸组成的具有生物活性的蛋白质。其分子结构复杂,是由几个或几十个氨基酸通过肽键连接组成的分子聚合物。从单个氨基酸链的转动、构象变化到构象重排,蛋白质构象赋予了它特有的生物学功能。近年来,针对蛋白质研究具有生物活性的多肽在药物设计领域应用越来越广泛。某些多肽已被证实具有广泛的生物学特性,包括抗癌肽(ACPs,Anti
‑
cancer peptides)、神经肽(NPs,Neuropeptides)、抗真菌肽(AFPs,Antifungal peptide)、抗血管生成肽(AAPs,Anti
‑
angiogenic peptide)和抗菌肽(ABPs,Antibacte ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于图卷积网络的抗癌肽分类方法,其特征在于,包括以下步骤:S1,获取抗癌肽的训练数据集和测试数据集;S2,将抗癌肽序列构造成以氨基酸节点为顶点的图结构网络并进行编码,获得图结构数据;S3,构建图卷积坍缩池化和残差网络模型,将所述图结构数据输入模型训练;以及,S4,应用训练好的所述模型进行抗癌肽的分类。2.根据权利要求1所述的基于图卷积网络的抗癌肽分类方法,其特征在于,S2所述图结构网络的属性数据包括抗癌肽链特征、图标签和邻接矩阵A
n
×
n
,所述抗癌肽链特征包括氨基酸节点类型、氨基酸节点距离和氨基酸节点的物理化学含义。3.根据权利要求2所述的基于图卷积网络的抗癌肽分类方法,其特征在于,S2所述编码的方式包括采用One
‑
hot编码表示氨基酸节点类型,采用Node2vec编码表示氨基酸节点距离和采用基于物理化学特性分类的编码表示氨基酸节点自身的物理化学特性。4.根据权利要求1所述的基于图卷积网络的抗癌肽分类方法,其特征在于,S3所述图卷积坍缩池化和残差网络模型包括堆叠图卷积网络模块G(X)、图坍缩池化模块D(X)和残差网络模块R(X),其中X为图结构数据,所述抗癌肽链特征F(X)=L(G(X)||D(X)||R(X)),其中,||表示对特征向量的连接操作。5.根据权利要求4所述的基于图卷积网络的抗癌肽分类方法,其特征在于,所述堆叠图卷积网络模块中单层网络的公式表示为其中,H
(l)
∈R
N
×
M
,N是图上节点的个数,每个节点都用一个M维特征向量表示,H
(l)
为第l层的输入特征,H
(l+1)
为输出特征,A表示邻接矩阵,表示带有自环的邻接矩阵,表示带有自环的邻接矩阵,表示带有自环的邻接矩阵,是邻接矩阵的度,W
(l)
为第l层可训练的参数,σ为相关的激活函数。6.根据权利要求4所述的基于图卷积网络的抗癌肽分类方法,其特征在于,所述图坍缩池化模块中图坍缩算子S的计算公式为S
技术研发人员:邱鲤鲤,吴清锋,刘佳桐,周昌乐,阮群生,
申请(专利权)人:厦门大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。