一种基于模板的多域蛋白结构组装方法技术

技术编号:16233440 阅读:55 留言:0更新日期:2017-09-19 14:50
一种基于模板的多域蛋白结构组装方法,首先,根据各域蛋白的结构,利用蛋白质结构比对工具TM‑align一次对各域蛋白进行比对,从多域蛋白数据库中找出最佳模板;然后,利用Kabsch方法获取旋转平移矩阵,将各域蛋白重叠到模板上,并对各域蛋白进行平移旋转操作,使其之间的距离等于最小允许距离;其次,通过对组装结构进行随机的平移和旋转进行调整,并利用域蛋白之间的冲突因子、相互作用的原子数量,以及组装结构相对模板的移动幅度来衡量组装结构的质量;在组装过程中,依次组装相邻的域蛋白,并将已组装完的结构固定,当所有结构组装完成后,输出最后组装结果。本发明专利技术提供一种预测精度较高的基于模板的多域蛋白结构组装方法。

A template based method for assembling multi domain protein structures

A method of assembling, multi domain protein structure based on template firstly, according to the structure of the protein, one of the domain proteins were compared using the protein structure comparison tool TM align, to find out the best template from the multi domain protein database; then, to obtain the translation and rotation matrix by Kabsch method, the overlapping domain protein to the template, and rotate the pan operation of each domain protein, which is equal to the distance between the minimum allowable distance; secondly, based on the assembly structure of random translational and rotational adjustment, and the number of atoms of protein domain conflicts between factors, interaction, and assembling template to measure the relative range of structure the assembly quality of the structure; in the assembly process, domain proteins are assembled adjacent, and the structure has assembled a fixed end, when all the assembled structure Outputs the final assembly result. The present invention provides a template based multi domain protein structure assembly method.

【技术实现步骤摘要】
一种基于模板的多域蛋白结构组装方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种基于模板的多域蛋白结构组装方法。
技术介绍
大规模蛋白通常由多个独立折叠的域蛋白组成,多域蛋白结构的确定能够有力的推进生物研究进展。域蛋白通常具有紧凑的三维结构和特定的生物功能,同样的域蛋白可能有着不同的结够。另外,很多多域蛋白的单域三维结构已经通过X-射线衍射、核磁共振以及计算机等预测被确定。因此,根据单域蛋白的结构得到其对应的多域蛋白的结构是一个重要步骤,同时确定全长蛋白结构以及了解其生物功能的一个必要环节。目前,从单域蛋白出发预测多域蛋白的结构有两类常用的方法。第一类通过固定单域蛋白的结构,然后对齐组装。第二类通过枚举连接域蛋白质之间的构象的结构来组装整个多域蛋白的结构。其中,第一类方法可以看作为蛋白之间的对接问题,一些对接方法也可以用作多域蛋白结构的组装;与第一类方法不同,第二类方法可以看作域蛋白之间相对较短的氨基酸序列的结构从头预测问题,由于只改变连接域蛋白之间的构象的结构,其采样空间很小。然而,由于上述方法缺少模板引导,从而在组装中无法确定域蛋白的组装方向,进而导本文档来自技高网...
一种基于模板的多域蛋白结构组装方法

【技术保护点】
一种基于模板的多域蛋白结构组装方法,其特征在于:所述多域蛋白结构组装包括以下步骤:1)输入各单域蛋白的三维结构和其对应的多域蛋白的序列信息;2)设置最大迭代次数Imax,冲突距离阈值dclash,相互作用阈值dcontact,相互作用的原子数量常数n0;3)针对PDB库中每一个多域蛋白执行如下操作,从而确定组装模板:3.1)根据蛋白质结构比对工具TM‑align找出第一个蛋白最佳比对位置,并记录其模板比对得分TM‑score1;3.2)从第一个域蛋白比对的最后一个的残基位置开始,利用TM‑align找出第二个域蛋白的最佳比对位置,并及记录TM‑score2;3.3)重复步骤3.2)依次找到其它...

【技术特征摘要】
1.一种基于模板的多域蛋白结构组装方法,其特征在于:所述多域蛋白结构组装包括以下步骤:1)输入各单域蛋白的三维结构和其对应的多域蛋白的序列信息;2)设置最大迭代次数Imax,冲突距离阈值dclash,相互作用阈值dcontact,相互作用的原子数量常数n0;3)针对PDB库中每一个多域蛋白执行如下操作,从而确定组装模板:3.1)根据蛋白质结构比对工具TM-align找出第一个蛋白最佳比对位置,并记录其模板比对得分TM-score1;3.2)从第一个域蛋白比对的最后一个的残基位置开始,利用TM-align找出第二个域蛋白的最佳比对位置,并及记录TM-score2;3.3)重复步骤3.2)依次找到其它域蛋白的最佳比对位置,并记录TM-socre3,TM-socre4,…,TM-socreN,N为域蛋白的总数量;3.4)计算该模板的得分其中scorei表示第t个模板的得分,TM-scorei表示第i个域蛋白的比对得分,Li为第i个域蛋白的序列长度;3.5)通过步骤3.1)-3.4)计算得到每一个模板的得分后,选取得分最高的蛋白作为模板;4)通过如下方法将各域蛋白重叠到模板上,过程如下:4.1)将查询蛋白的Cα原子与模板的Cα一一比对,然后根据Kabsch方法求得旋转矩阵和平移向量(t1,t2,t3),ust,s=1,2,3,t=1,2,3表示旋转矩阵的第s行的第t个元素,ts表示第s个平移向量;4.2)针对查询蛋白的每一个Cα原子作旋转平移其中,表示第n个域蛋白的第m个Cα原子的第s维坐标;5)固定第n个域蛋白的位置,根据如下公式将第n+1个域蛋白平移,使其连接点之间的均方根偏差RMSD为其中,ln维第n个域蛋白的长度,为第n个域蛋白的最后一个Cα原子的第s维坐标,为第n+1个域蛋白的第一个Cα原子的第s维坐标,dn,n+1为第n个域蛋白的最后一个Cα原子和第n+1个域蛋白的第一个Cα原子之间的欧氏距离;6)计算当前蛋白与模板之间的Cα原子的均方根偏差ERMSD;7)计算第n个域蛋白的Cα原子和第n+1个域蛋白中Cα原子两两之间的欧氏距离,并统计距离小于dclash的数量nclash,并记录对应的距离计算域之间的冲突得分8)统计步骤7中距...

【专利技术属性】
技术研发人员:张贵军周晓根郝小虎王柳静
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1