基于能量的原子结构与电子密度图多目标优化拟合预测方法技术

技术编号:26422563 阅读:55 留言:0更新日期:2020-11-20 14:19
一种基于能量的原子结构与电子密度图多目标优化拟合预测方法,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。本发明专利技术能够解决仅通过最小化单个能量函数而导致的潜在偏差问题。

【技术实现步骤摘要】
基于能量的原子结构与电子密度图多目标优化拟合预测方法
本专利技术涉及的是一种生物信息领域的技术,具体是一种基于全局和局部能量的原子结构与电子密度图多目标优化拟合预测方法。
技术介绍
高分辨率的蛋白质结构对于解蛋白质的功能和相关疾病的机制非常重要。X射线晶体学,核磁共振(NMR)和低温电子显微镜(Cryo-EM)等几种方法已用于获得大分子结构。近年来,由于低温电磁成像技术革命性发展,导致大量的低温电磁密度图出现,但是这些密度图通常具有相对较低的分辨率(例如)。尽管大多数电镜衍生的密度图分辨率不够高,但它们通常可以提供分子拓扑结构的描述,因此可以应用于原子结构的优化。这种基于密度图约束的优化的方法已经成为蛋白质结构预测领域的流行方向。优化建模过程通常包括三个步骤,即:(1)原子结构预测;(2)拟合原子结构到电子密度图中;(3)根据电子密度图来优化原子结构。拟合原子结构到电子密度图是优化原子结构的基础,其对于随后的优化过程有减小搜索空间的作用。尤其对于低等或中等分辨率密度图,搜索空间是一项较难的课题。为获得高分辨率的蛋白质结构,需要先进的计算技术来弥本文档来自技高网...

【技术保护点】
1.一种基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征在于,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。/n

【技术特征摘要】
1.一种基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征在于,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。


2.根据权利要求1所述的基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征是,所述的组建预测结构和电子密度图的基准数据集,具体包括:
S11、首先从PDB数据库中提取含有电子密度图的全部的PDB,然后将的1809个PDB结构分裂为37952单链的PDB结构;
S12、利用CD-HIT删除冗余度在90%以上的序列,剩余2488个样本,剔除掉2488个样本中过短或序列不连续的样本后,剩余1186个样本;
S13、在1186个样本中随机选取292个对应的序列作为初始样本,利用I-TASSER预测出对应的原子结构;
S14、利用292个目标的天然PDB结构,使用EMAN2和Xmipp模拟出对应的无噪声密度图和噪声密度图,与步骤S13中预测的结构组成本方法的基准数据集。


3.根据权利要求1所述的基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征是,所述的初始模型,利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型,其具体生成方式为:从电子密度图的头文件中读取电子密度图的格点和原点信息,将预测的原子结构移到电子密度图的中心,然后对电子密度图做随机的旋转,生成N个不同位置的初始模型。


4.根据权利要求1所述的基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征是,所述的多目标粒子群优化算法,具体包括:
步骤1:首先将I-TASSER预测的模型变换至密度图中心,然后随机旋转以生成N个不同位置的初始结构;在MOPSO优化中,每个位置的结构都被视为一个粒子;由二维向量C=[t,r]表示为第i个粒子;t和r分别表示刚体的平移量和旋转矩阵,其分别属于和[-90°,90°];
步骤2:在每次的模拟迭代中,通过刚体平移和旋转来更新每个模型的位置;在每个模拟中,根据构象坐标计算三个能量函数作为目标函数,再将具有至少两个能量函数递减的非支配解放入Pareto集;
步骤3:将对Pareto集的所有模型进行排序,然后选择最优构象作为最终结构。


5.根据权利要求4所述的基于能量优化的原子结构与电子密度图多目标优化拟合预测方法,其特征是,所述的三个能量函数包括对拟合质量的全局状态和局部结构的评估,其定义分别为:
①代表由原子结构转化的密度图ρc(y)和实验密度图ρo(y)之间的相关性能量函数,其在整个结构上对拟合状态做评估,具体为:其中:和为转化密度图和实验密度图上网格点所含数值的平均值;RB(l)为所有格点的集合;CC是一个全局得分,其对密度图的形状非常敏感;
②局部...

【专利技术属性】
技术研发人员:张彪沈红斌
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1