【技术实现步骤摘要】
一种实验数据辅助的自适应策略蛋白质结构预测方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种实验数据辅助的自适应策略蛋白质结构预测方法。
技术介绍
蛋白质结构预测是结构生物信息学的主要研究内容,也是分子生物学中心法则尚未解决的一个重大基础性科学研究课题。随着计算机硬件和软件技术的快速发展,为从头预测方法的发展提供了结实的基础平台条件。2018年12月初,在墨西哥坎昆举行的全球蛋白质结构预测竞赛(CASP13)中,谷歌旗下的DeepMind团队研发的AlphaFold获得总分第一名。AlphaFold使得蛋白质结构预测这一前沿性基础研究问题从科学的殿堂进入民众的视野,成为目前一个“热议”的方向。该工作同时也表明了计算机技术、信息技术以及生命科学领域的深度交叉融合,将会有效的驱动和加速科学的新发现。然而,从头预测方法目前还面临着诸多困难和挑战。从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化方法是目前制约蛋白质结构从头预测精度关键的因素之一。优化算法应 ...
【技术保护点】
1.一种实验数据辅助的自适应策略蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:/n1)给定目标蛋白的序列信息;/n2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;/n3)根据目标蛋白序列从CASP网站下载SAXS实验数据,其中包括小角度X散射实验测定得到的蛋白质的散射向量q
【技术特征摘要】
1.一种实验数据辅助的自适应策略蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)给定目标蛋白的序列信息;
2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;
3)根据目标蛋白序列从CASP网站下载SAXS实验数据,其中包括小角度X散射实验测定得到的蛋白质的散射向量qexp,谱强度Iexp(q),实验误差eexp(q);
4)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,学习周期LP,第一种变异策略在第g代被选择的概率第二种变异策略在第g代被选择的概率第三种变异策略在第g代被选择的概率g表示当前的代数,第k种策略在第g代成功次数k={1,2,3},置迭代代数g=0;
5)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};
6)对种群中的个体Ci进行如下操作:
6.1)将Ci设为目标个体Ctarget,生成随机数pSelect,其中pSelect∈(0,1);
6.2)若则从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的9片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为1;
6.3)若则先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,Ctarget≠Ca≠Cb≠Cbest,分别从Ca和Cb中随机选择一个位置不同的3片段,分别替换Cbest对应位置的片段生成变异构象Cmutant,并把k置为2;
6.4)若则从种群中随机选出两个互不相同的个体Ca和Cb,Ctarget≠Ca≠Cb,分别从Ca、C...
【专利技术属性】
技术研发人员:张贵军,彭春祥,刘俊,周晓根,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。