【技术实现步骤摘要】
一种深度神经网络框架预测蛋白质磷酸化的方法
[0001]本专利技术涉及蛋白质磷酸化的预测方法,尤其涉及一种深度神经网络框架预测蛋白质磷酸化的方法
技术介绍
[0002]蛋白质是生命体的基础和重要组成部分,而蛋白质翻译后修饰(PTM)是调控蛋白质功能的一种主要方式,与生物的生命活动息息相关,因此深入研究蛋白质翻译后修饰对理解认知蛋白质具有重要的意义。随着生物技术的发展,人们所得到的蛋白质序列数量变的极为庞大,如何从海量的蛋白质序列中找到蛋白质翻译后修饰位点,对蛋白质的研究和药物开发至关重要。
[0003]传统的方法主要是通过截取蛋白质中特定的肽段,利用实验的方法来确定翻译后修饰位点,如基于高通量质谱等技术的实验。随着越来越多的蛋白质序列被发现,传统方法耗时耗力,已经不能满足需求了,因此很多研究人员和专家学者探索蛋白质序列的表示方法,基于生物信息学的方法来进行蛋白质翻译后修饰位点的预测,相比传统的实验方法,极大地提高了预测的效率。
[0004]Wang D,Liu D,Yuchi J,et al.在Nucleic ...
【技术保护点】
【技术特征摘要】
1.一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述深度神经网络框架预测蛋白质磷酸化的方法包括以下步骤:(1)搭建集成深度神经网络框架:由ACNet和多尺度CapsNet两种网络集成得到深度神将网络框架;(2)数据集的选取:磷酸化数据集PhosphoData1训练集、多个独立测试集;(3)使用信息增益方法优化过的融合特征作为网络输入特征;(4)使用步骤(1)搭建的集成深度神经网络框架在数据集上预测模型;(5)模型参数设置;(6)将待测蛋白质序列输入模型,预测出该蛋白是否有磷酸化位点及其位置。2.根据权利要求1所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述磷酸化数据集PhosphoData1训练集中筛选的5000个样本;多个独立测试集分别为PhosphoData1的测试集、Phospho.ELM、PhosphoData2的测试集和PhosphoData3。3.根据权利要求2所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述的训练集和测试集中蛋白质残基长度为27,且任何两种蛋白质残基的相似性都小于50%。4.根据权利要求1所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述融合特征包含位置特异性计分矩阵(PSSM)、氨基酸的理化性质、RECM转换矩阵和RECM构成特征。5.根据权利要求4所述一种深度神经网络框架预测蛋白质磷酸化的方法,其特征在于,所述位置特异性计分矩阵(PSSM)是通过HHblits程序在uniprot_s...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。