一种蛋白质氨基酸关联矩阵预测方法技术

技术编号:20871269 阅读:47 留言:0更新日期:2019-04-17 10:20
一种蛋白质氨基酸关联矩阵预测方法,包括:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行预测。

【技术实现步骤摘要】
一种蛋白质氨基酸关联矩阵预测方法
本专利技术涉及蛋白质生物学
,具体涉及一种基于深度学习的蛋白质氨基酸关联矩阵预测方法。
技术介绍
蛋白质分子的空间结构对于理解蛋白质的功能有着特别重要的作用。为了从分子层面了解蛋白质的作用机制,通常需要测定一个蛋白质的三维结构。使用生物学实验例如采用X射线或者核磁共振技术来直接测定一个蛋白质的结构通常需要投入很大的人力物力。因此,给求解蛋白质三维结构提供其他的额外信息变得非常重要。其中,蛋白质的氨基酸关联图被认为在蛋白质结构求解中具有重要的作用,单独提供精确的氨基酸关联图预测结果已经可以得到一个可以接受的蛋白质三维结构模型。其中长程的氨基酸相互作用(这两个相互作用的残基之间的序列间隔大于等于24)的标记对于求解蛋白质结构来说具有更大的用处,这种相互作用的预测也是更有难度的,它要求模型具有建模远距离残基之间关系的能力。
技术实现思路
本专利技术的目的是提供一种基于深度学习的蛋白质氨基酸关联矩阵预测方法,用以解决现有的蛋白质的结构测定成本较大的问题。本专利技术的实施例之一,一种蛋白质氨基酸关联矩阵预测方法,该预测方法包括以下步骤:S1、组建蛋白质氨基酸本文档来自技高网...

【技术保护点】
1.一种蛋白质氨基酸关联矩阵预测方法,其特征在于,该预测方法包括以下步骤:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行...

【技术特征摘要】
1.一种蛋白质氨基酸关联矩阵预测方法,其特征在于,该预测方法包括以下步骤:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行预测。2.根据权利要求1所述的蛋白质氨基酸关联图预测方法,其特征在于,步骤S1中所述组建蛋白质氨基酸关联图预测训练数据集的具体方法是:S11、使用PISCES工具,从全部的PDB数据库中筛选出用作最终训练的序列列表;S12、根据序列的id和链符号,从PDB数据库中下载这些序列的fasta格式的文件用于后续生成特征的输入,下载这些序列的pdb文件用于后续生成标签文件和权重掩模文件的输入。3.根据权利要求2所述的蛋白质氨基酸关联图预测方法,其特征在于,所述步骤S2具体包括以下步骤:S21、生成序列特征,首先输入氨基酸序列通过BLAST+软件套装中的psiblast软件在nr数据库上的比对生成PSSM特征和比对文件,同时输入序列通过SCRATCH软件生成二级结构和溶液可及性特征。然后将比对文件处理成MSA文件,接着将该MSA文件分别作为输入通过PSICOV软件、freecontact软件和CCMpred软件生成PSICOV特征、Evfold特征和CCMpred特征;S22、拼接序列特征,将PSSM特征、二级结构特征和溶液可及性特征在非序列长度维上进行拼接,然后使用两个残基对应的一维特征相接生成该残基对特征的方法将一维的特征转化为二维的。接着将该生成的二维特征和P...

【专利技术属性】
技术研发人员:沈红斌徐佳燕冯世豪杨静
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1