System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种蛋白质功能域的预测方法技术_技高网
当前位置: 首页 > 专利查询>合肥学院专利>正文

一种蛋白质功能域的预测方法技术

技术编号:40182069 阅读:8 留言:0更新日期:2024-01-26 23:47
本发明专利技术公开了一种蛋白质功能域的预测方法,属于生物信息技术领域,包括以下步骤:步骤S1、蛋白质的获取和预处理;步骤S2、Cluspro刚性对接结果数据分析和筛选;步骤S3、使用Rosetta进行柔性对接预处理;步骤S4、Rosetta柔性对接结果数据分析和筛选;步骤S5、LigPlot可视化分析和预测结果验证;步骤S6、预测蛋白质功能域和氨基酸序列;本发明专利技术使用Cluspro和Rosetta分别进行刚性对接和柔性对接,在保证能量分析数据的可靠性基础上,减少了预测蛋白质功能域的时间资源成本,并且可以随时调整柔性对接的初始构象,避免刚性对接结果数据出现的误差在后续柔性对接中传播。

【技术实现步骤摘要】

本专利技术属于生物信息,具体涉及一种蛋白质功能域的预测方法


技术介绍

1、确定蛋白质功能域的重要性不言而喻。蛋白质是生命的基本构建块,其功能在很大程度上由其结构决定。蛋白质的功能域是具有特定功能的结构模块,如结合其他分子、催化反应等。通过准确识别功能域,我们能够洞察蛋白质的生物学作用,从而理解细胞活动的基本机制。进一步,蛋白质功能域的研究有助于预测蛋白质的结构和相互作用,为药物设计、疾病研究等领域提供基础。

2、目前在蛋白质-蛋白质对接预测蛋白质功能域的分析工具中,最常用的是cluspro和rosetta,cluspro主要是对蛋白质的刚性对接进行预测蛋白质相互作用的结构,rosetta主要是对蛋白质的柔性对接进行预测蛋白质相互作用的结构,之后再对基于刚性或柔性对接预测的结构进行作用位点附近的残基和区域能量分析,最后预测两蛋白质之间发生相互作用的功能域。

3、由于cluspro有着易于使用和对接速度快等优点,其被使用在蛋白质相互作用的预测方面最为广泛。但cluspro仅局限于蛋白质的刚性对接,导致其具有对接结果信息量少、适用范围有限、构象变化考虑不全面、精度限制等缺点。而rosetta作为最常用的柔性对接工具,其预测结果具有分辨率高、灵活性高、适用范围广等优点,但rosetta是一种全原子级别的模拟方法,其计算复杂度非常高,需要大量的计算资源和时间,特别是在处理大规模蛋白质复合物时。除此之外,若使用rosetta一站式进行刚性和柔性对接,会导致在刚性对接结果数据出现的误差会在后续模拟中传播,影响预测结果的准确性,且重复预测的时间资源成本非常大。

4、因此,找到一种能够在基于rosetta的柔性对接结果数据准确度的基础之上,还能保证刚性对接结果数据的误差不会在后续的模拟中传播,且能以更低的时间资源成本完成对蛋白质功能域的预测方法是目前亟需解决的问题。


技术实现思路

1、本专利技术的目的在于提供一种蛋白质功能域的预测方法,以解决如何在保证预测精确度的前提下,防止前后模拟的误差传播,且能以更少的时间资源成本完成蛋白质功能域预测的问题。

2、本专利技术的目的可以通过以下技术方案实现:

3、一种蛋白质功能域的预测方法,具体包括以下步骤:

4、步骤s1、蛋白质的获取和预处理

5、获取待筛选蛋白质和相互作用蛋白质的晶体结构pdb文件,然后将pdb文件导入discoverystudio中,截取待筛选蛋白质中需要预测功能域的片段并对该片段和相互作用蛋白质进行预处理,以提高后续分析和计算过程中得到结果的准确性,对应得到受体蛋白和配体蛋白;

6、步骤s2、刚性对接结果数据分析和筛选

7、将受体蛋白和配体蛋白的数据文件导入cluspro中,使用cluspro中的dock模块进行刚性对接和能量分析,dock模块通过能量分析会将受体蛋白按照生物合理性由高到低依次将各个构象以聚类进行排列,得到刚性对接结果数据;在刚性对接结果数据中选择生物合理性最高的聚类编号(即第一个聚类)作为初始构象;通过对刚性对接和能量分析和刚性对接结果数据的筛选,很大程度上避免了刚性对接结果数据的误差会在后续柔性对接中传播的问题;

8、步骤s3、柔性对接预处理

9、将初始构象的数据导入rosetta中,使用docking_prepack_protocol模块对初始构象进行柔性对接预处理,为受体蛋白与配体蛋白的柔性对接准备结构,得到预处理初始构象的数据;

10、步骤s4、柔性对接结果数据分析和筛选

11、使用rosetta中的flexible docking模块对预处理初始构象的数据进行柔性对接和能量分析,在能量分析过程中,flexible docking模块中的score功能自动对不同构象之间的稳定性和相互作用强度进行能量评分,得到柔性对接结果数据,根据柔性对接结果数据中总能量评分的高低,选择总能量评分最低的构象作为最优构象;

12、步骤s5、ligplot可视化分析和验证

13、将最优构象的数据导入ligplot中对各氨基酸残基的成键信息进行可视化分析,得到发生相互作用的关键氨基酸残基和其序号,再将最优构象的数据导入rosetta中,使用rosetta中的interface_analyzer模块和interface_energy模块进行结果验证,得到受体蛋白和配体蛋白发生相互作用的整体结合能、关键氨基酸残基配对释放能和整体界面能,以证明预测结果的稳态和数据可靠性;整体结合能是指两个蛋白质分子在结合形成复合物时释放的能量,也可以理解为这两个蛋白质结合后的稳定程度,数值越低越稳定;整体界面能是指两个蛋白质分子结合时,相互作用的界面所释放的能量,数值越低说明这个界面上的相互作用越强,也就意味着这个界面上的相互作用对于蛋白质的结合非常重要;

14、步骤s6、预测蛋白质功能域和氨基酸序列

15、将最优构象的数据再次导入ligplot中进行可视化分析,得到参与受体蛋白和配体蛋白相互作用的关键氨基酸残基和区域,然后确定受体蛋白功能域的预测结果,最终得到受体蛋白功能域的氨基酸序列。

16、进一步地,所述待筛选蛋白质和相互作用蛋白质的晶体结构pdb文件通过ncbiprotein数据库获取,所述ncbi protein数据库的网址为https://www.ncbi.nlm.nih.gov/protein。

17、进一步地,步骤s1中所述预处理包括以下步骤:

18、使用discovery studio先删除蛋白质结构中的水分子,然后对蛋白质进行去除蛋白多构象、补充非完整的氨基酸残基、为蛋白加氢处理;具体地,在discovery studio的smallmolecules视窗中选中water(水分子)删除,然后切换至macromolecules视窗,展开prepare protein模块并点击该模块中的clean protein功能,即完成对蛋白质的预处理。

19、进一步地,所述docking_prepack_protocol模块的调用指令为docking_prepack_protocol.linuxgccrelease-docking:partners[a_b]-docking::sc_min-sname1.pdb;其中,“-docking:partners[a_b]”表示指定要进行柔性对接的两个蛋白,a为受体蛋白的名称,b为配体蛋白的名称;“-docking::sc_min”表示对两个蛋白进行侧链最小化处理,以优化氨基酸侧链的构象,使得蛋白质分子在对接过程中更适合进行构象搜索;“-sname1.pdb”表示导入初始构象的数据文件,name1.pdb为初始构象的数据文件的文件名。

20、进一步地,所述flexible docking模块的调用指令为docking_protocol.linuxgccrelease-docking:part本文档来自技高网...

【技术保护点】

1.一种蛋白质功能域的预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述待筛选蛋白质和相互作用蛋白质的晶体结构PDB文件通过NCBI Protein数据库获取。

3.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,步骤S1中所述预处理包括以下步骤:

4.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述docking_prepack_protocol模块的调用指令为docking_prepack_protocol.linuxgccrelease-docking:partners[A_B]-docking::sc_min-s name1.pdb。

5.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述FlexibleDocking模块的调用指令为docking_protocol.linuxgccrelease-docking:partners[A_B]-docking:sc_min-docking_local_refine-sname2.pdb-nstruct 1000。

6.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述Interface_analyzer模块的调用指令为InterfaceAnalyzer.linuxgccrelease-s name3.pdb@options。

7.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述Interface_energy模块的调用指令为interface_energy.linuxgccrelease-s name3.pdb-face1FACE1-face2 FACE2-score:hbond_bb_per_residue_energy。

...

【技术特征摘要】

1.一种蛋白质功能域的预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述待筛选蛋白质和相互作用蛋白质的晶体结构pdb文件通过ncbi protein数据库获取。

3.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,步骤s1中所述预处理包括以下步骤:

4.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述docking_prepack_protocol模块的调用指令为docking_prepack_protocol.linuxgccrelease-docking:partners[a_b]-docking::sc_min-s name1.pdb。

5.根据权利要求1所述的一种蛋白质功能域的预测方法,其特征在于,所述flexibledocking模块的调用指令为doc...

【专利技术属性】
技术研发人员:洪磊张本旭吴克太光平
申请(专利权)人:合肥学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1