【技术实现步骤摘要】
一种基于树搜索和片段组装的蛋白质结构预测方法
本专利技术涉及计算机应用领域,生物信息学,最优化理论,分子生物学等,特别涉及一种蛋白质三维结构预测方法,属于将现代智能优化方法应用到蛋白质三维结构预测。
技术介绍
生物信息学通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。是当前研究的一个热点。生物信息学研究成果已经被广泛应用于序列比对,蛋白质比对,基因识别分析,分子进化,序列重叠群装配,遗传密码,药物设计,生物系统,蛋白质结构预测等。其中蛋白质结构预测是生物信息学领域的一个重要的分支。著名的诺贝尔化学奖获得者Anfinsen通过对核糖核酸酶A的经典研究表明去折叠的蛋白质在体外可以自发的进行再折叠,仅仅是序列本身已经包括了蛋白质正确折叠的所有信息,并提出蛋白质折叠的热力学假说,这一理论认为结构同源的蛋白质可以通过不同的折叠途径形成相似的天然构象,蛋白质的一级结构决定了其三维结构,即蛋白质的氨基酸序列决定了蛋白质的三维空间结构,从热力学分析,蛋白质的天然构型对应着其物理能量最小的状态。随着2000年基因组工作草图的完成,基因组的工作重 ...
【技术保护点】
一种基于树搜索和片段组装的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:A1、获取蛋白质的pdb格式的文件并清洗出所需数据;A2、生成片段库;A3、选取力场模型,力场模型表示形式如下:Eprotein=Winter repEinter rep+Winter atrEinter atr+WsolvationEsolvation+Wbb/sc hbEbb/sc hb+Wbb/bb hbEbb/bb hb+Wsc/sc hbEsc/sc hb+WpairEpair+WdunbrackEdunbrack+WramaErama+WreferenceEreference ...
【技术特征摘要】
1.一种基于树搜索和片段组装的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:A1、获取蛋白质的pdb格式的文件并清洗出所需数据;A2、生成片段库;A3、选取力场模型,力场模型表示形式如下:Eprotein=WinterrepEinterrep+WinteratrEinteratr+WsolvationEsolvation+Wbb/schbEbb/schb+Wbb/bbhbEbb/bbhb+Wsc/schbEsc/schb+WpairEpair+WdunbrackEdunbrack+WramaErama+WreferenceEreference(1)式中,Eprotein表示蛋白质的总能量,Einterrep表示范德华排斥力作用,Winterrep为Einterrep在整体的权重,Einteratr表示范德华吸引力作用,Winteratr为Einteratr在整体的权重,Esolvation为Lazarids和Karplus描述的隐含的溶解作用,Wsolvation为Esolvation在整体的权重,Ebb/schb、Ebb/bbhb、Esc/schb为依赖方向的氢键能量,Wbb/schb、Wbb/bbhb、Wsc/schb分别为其能量在整体的权重,Epair为残基对静电作用,Wpair为Epair在整体的权重,Edunbrack为氨基酸基于旋转异构体库的内部的能量,Wdunbrack为Edunbrack在整体的权重,Erama为参考特定位置的Ramachandrin骨链扭力,Wrama为Erama在整体的权重,Ereference为未折叠态的蛋白质的参考能量,Wreference为Ereference在整体的权重,Rosetta的能量函数就是将所有的能量项通过各自的权重线性相加;用于计算能量层的权重W(l)的公式:
【专利技术属性】
技术研发人员:张贵军,陈铭,秦传庆,郝小虎,周晓根,梅珊,李章维,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。