【技术实现步骤摘要】
一种基于几何图神经网络的蛋白质信号肽的预测方法及装置
本专利技术涉及生物信息和深度学习领域,尤其涉及一种基于几何图神经网络的蛋白质信号肽的预测方法及装置。
技术介绍
在生物体内,大部分的蛋白质不是以单体的形式行使功能,而是以相互作用的形式行使不同的生物功能。其中,蛋白质相互作用(Protein-ProteinInteraction,PPI)是指由两个或两个以上的分子蛋白通过共价键的形式形成蛋白质复合体的过程。蛋白质相互作用在大多数生化功能中承担着重要的角色。例如,信号分子由蛋白质相互作用,将细胞外的信号传入细胞内部,而信号传递是许多功能发挥的基础。对于蛋白质相互作用,从本质上来讲,其是通过蛋白质上部分残基的相互结合来实现的,这些残基被称为蛋白质相互作用位点(Protein-ProteinInteractionSites,PPIS)。信号肽位于分泌蛋白的N端,当蛋白跨膜转移位置时被切掉。信号肽的特征是包括一个正电荷区域、一个疏水性区域和不带电荷但具有极性的区域。信号肽切割位点的-3和-1位为小而中性氨基酸。信号肽作为一 ...
【技术保护点】
1.一种基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,包括如下步骤:/n获取数据集中的蛋白质序列,提取其中信号肽的字符序列;/n对所述信号肽进行特征提取,得到所述信号肽的序列进化特征、物理化学特征、结构特征、统计特征;/n将进化特征、物理化学特征、结构特征、统计特征进行融合,得到多维向量;/n根据所述字符序列和所述多维向量构建信号肽的特征图;/n将所述特征图作为几何图神经网络模型的输入,训练所述几何图神经网络直至其误差低于阈值,保存所述几何图神经网络模型并将其用于预测待预测氨基酸序列中是否含有信号肽片段。/n
【技术特征摘要】
1.一种基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,包括如下步骤:
获取数据集中的蛋白质序列,提取其中信号肽的字符序列;
对所述信号肽进行特征提取,得到所述信号肽的序列进化特征、物理化学特征、结构特征、统计特征;
将进化特征、物理化学特征、结构特征、统计特征进行融合,得到多维向量;
根据所述字符序列和所述多维向量构建信号肽的特征图;
将所述特征图作为几何图神经网络模型的输入,训练所述几何图神经网络直至其误差低于阈值,保存所述几何图神经网络模型并将其用于预测待预测氨基酸序列中是否含有信号肽片段。
2.根据权利要求1所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述信号肽的字符序列表示为:
;
其中,X表示信号肽的字符序列,λ表示氨基酸残基序列所包含的排列信息和/或物理化学信息的种类数。
3.根据权利要求1所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述序列进化特征、结构特征、统计特征分别为PSSM特征、PSAIA特征、HMM特征。
4.根据权利要求1所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述几何图神经网络包括低聚合层、高聚合层、非线性变换层,
所述低聚合层用于聚合节点在一种关系下的邻居信息;
所述高聚合层用于聚合所述低聚合层的邻居信息;
所述非线性变化层用于拼接所述低聚合层与所述高聚合层所述的邻居信息。
5.根据权利要求4所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述几何图神经网络模型的表示为:
其中,表示虚拟节点的特征,p表示低聚合层的聚合函数,表示节点u的特征;v表示低聚合层中的任一节点,表示节点v的邻居结构或邻居集合,u表示某种关系下
节点v的邻居节点,zv表示节点v映射到隐藏空间的向量,zu节点u映射到隐藏空间的向量,i
表示节点v的任意一个邻居,g表示节点v在所述特征图的邻居集合,s表示节点v在隐藏...
【专利技术属性】
技术研发人员:华权高,舒芹,赵愿安,
申请(专利权)人:武汉金开瑞生物工程有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。