【技术实现步骤摘要】
一种基于多视图分类模型的蛋白质活性预测装置
本专利技术属于生物信息学领域,具体涉及一种基于多视图分类模型的蛋白质活性预测装置。
技术介绍
图由一系列的节点和连变组成。作为一种非欧几里得形数据,图分析被应用到节点分类、链路预测、聚类和图分类等研究方向。图神经网络(Graphneuralnetworks)是一种基于图域分析的深度学习方法,它靠图中节点之间的信息传递来捕捉图中的依赖关系,进而得到每个节点的特征。其生成的节点特征可以用作任何可微分预测层的输入,以端到端的方式训练整个模型。对GNN的研究中,一些侧重于节点级的特征学习(参照文献1:HamiltonWL,YingR,LeskovecJ.InductiveRepresentationLearningonLargeGraphs[J].2017.;即大网络的归纳表示学习),而另一些则侧重于图级的特征(参照文献2:HenaffM,BrunaJ,LecunY.DeepConvolutionalNetworksonGraph-StructuredData[J].Compute ...
【技术保护点】
1.一种基于多视图分类模型的蛋白质活性预测装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机存储器中存有训练好多视图分类模型,所述多视图分类模型包括池化单元、图卷积单元和全连接单元;/n所述计算机处理器执行所述计算机程序时实现以下步骤:/n将蛋白质结构的原子作为节点,原子之间的化学键作为连边,构建表示蛋白质结构的原始蛋白质图;/n利用池化单元对原始蛋白质图进行池化操作,获得不同维度的多个视图;/n利用训练好的图卷积单元分别对多个视图和原始蛋白质图进行图卷积操作,获得多个特征向量;/n对多个特征向量 ...
【技术特征摘要】
1.一种基于多视图分类模型的蛋白质活性预测装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机存储器中存有训练好多视图分类模型,所述多视图分类模型包括池化单元、图卷积单元和全连接单元;
所述计算机处理器执行所述计算机程序时实现以下步骤:
将蛋白质结构的原子作为节点,原子之间的化学键作为连边,构建表示蛋白质结构的原始蛋白质图;
利用池化单元对原始蛋白质图进行池化操作,获得不同维度的多个视图;
利用训练好的图卷积单元分别对多个视图和原始蛋白质图进行图卷积操作,获得多个特征向量;
对多个特征向量进行级联获得融合特征向量,利用训练好的全连接单元对融合特征向量进行全连接操作,输出蛋白质活性预测结果。
2.如权利要求1所述的基于多视图分类模型的蛋白质活性预测装置,其特征在于,原始蛋白质图G由(A,H)表示,其中A表示邻接矩阵,H表示节点特征。
3.如权利要求2所述的基于多视图分类模型的蛋白质活性预测装置,其特征在于,所述对原始蛋白质图进行池化操作,获得不同维度的多个视图包括:
将节点特征H乘以权重W得到节点的初始分配矩阵S,对初始分配矩阵S中每一列使用softmax函数归一化得到池化分配矩阵S′,具体过程如下:
S=HW
其中,sij为分配矩阵中的元素,sij表示上一层视图中节点i在经过池化后被聚合为下一层视图中的节点j的概率;
根据聚合前对应的邻接矩阵A和节点特征H与池化分配矩阵S′计算得到的下一层视图的邻...
【专利技术属性】
技术研发人员:陈晋音,李玉玮,林翔,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。