一种分析识别蛋白质特异性药物结合口袋的方法技术

技术编号:21609103 阅读:56 留言:0更新日期:2019-07-13 19:28
本发明专利技术公开了一种分析识别蛋白质特异性药物结合口袋的方法,属于特异性药物研发领域。本发明专利技术方法第一步建立所研究的一类蛋白的非冗余结构数据库;第二步根据蛋白结构,识别非冗余结构数据库中所有蛋白的结合口袋;第三步通过LD和SD对所有结合口袋进行重合性分析,找出在组水平上的保守性结合口袋;再对所有组的组保守性结合口袋进行重合性分析,从而找出在组水平上保守但在所研究的一类蛋白水平上表现特异性的结合口袋;第四步分析计算蛋白质分子网络中的接近中心性来进一步判断第三步中识别的特异性结合口袋成为药物结合靶点的潜在性。本发明专利技术方法解决了目前无法有效预测特异性靶向药物结合位点的问题,对特异性靶向新药的开发有重要的作用。

A method for analysis and identification of protein-specific drug-binding pockets

【技术实现步骤摘要】
一种分析识别蛋白质特异性药物结合口袋的方法
本专利技术属于特异性药物研发领域,特别涉及一种分析识别蛋白质特异性药物结合口袋的方法。
技术介绍
蛋白是组成人体一切细胞、组织的重要成分,是生命活动的主要承担者。蛋白活性的失调会引发很多疾病,例如蛋白激酶活性的失调会引发癌症、牛皮癣和慢性神经退行性等疾病。因此需要针对这些蛋白,设计药物以恢复蛋白的活性,从而达到治疗的效果。药物设计有两个至关重要的问题,第一是药效问题,第二个是副作用问题。现有的大多数药物都结合蛋白的保守性结合位点,即保守性结合口袋,例如现有的大多数激酶蛋白药物,都是结合保守的ATP口袋,通过抑制ATP的结合来降低激酶的活性。但是,保守性结合口袋的序列和结构特征在一类蛋白中十分保守,靶向保守性结合口袋的药物会同时抑制多个蛋白的生物学活性,有较多的副作用。因此,如何分析识别蛋白质特异性药物结合口袋,为蛋白质药物设计提供特异性信息,降低药物的副作用是近年来药物设计研究的瓶颈问题。近几年,随着蛋白结构的增多,给系统分析蛋白特异性药物结合口袋提供了机会。因此,亟需一种分析识别蛋白质特异性药物结合口袋的新方法。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种分析识别蛋白质特异性药物结合口袋的方法,对帮助药物设计并降低药物副作用有重要意义。为解决上述问题,本专利技术采用如下技术方案:一种分析识别蛋白质特异性药物结合口袋的方法,包括如下步骤:(1)构建一类蛋白的非冗余结构数据库该步骤根据所研究的一类蛋白的UniProtID,在PDB(ProteinDataBank)结构数据库中获得其X衍射晶体结构。在PDB结构数据库中,如果一个蛋白有多个X衍射晶体结构,则选择分辨率最高(即分辨率值最小)的X衍射晶体结构,从而使每个蛋白只有一个X衍射晶体结构。然后去除分辨率低的蛋白X衍射晶体结构,得到一类蛋白的非冗余结构数据库。(2)识别蛋白结合口袋该步骤主要为识别蛋白的结合口袋。首先,用多序列比对方法(MAFFT)将非冗余结构数据库中的蛋白根据序列同源性分组(如果已有研究将这类蛋白分组,可不用再分组),在每组蛋白中随机选取一个蛋白的X衍射晶体结构作为模板。随后将每组蛋白中的其他蛋白结构与模板蛋白结构进行结构比对(例如可以用软件PyMOL中的方法进行结构比对)并重新保存每个蛋白结构的坐标。然后优化所有蛋白的晶体结构,即将蛋白所有的重原子补齐。最后识别所有蛋白的结合口袋,建立结合口袋数据库,记录结合口袋的位置和结构信息。(3)分析识别特异性结合口袋该步骤主要根据结合口袋的位置特征和形状特征,对结合口袋进行分类,识别特异性结合口袋。在分析结合口袋的位置特征时,本专利技术认为相似的口袋其位置必须相近,用位置距离(LocationDistance,LD)量化口袋位置的相似性,公式如下:其中x1、y1、z1和x2、y2、z2分别是两个口袋的几何中心坐标;当两个口袋的LD小于某个截断值,则两个口袋位置相近。在计算结合口袋的结构特征时,本专利技术认为相似的口袋应具有相似的形状,用形状距离(ShapeDistance,SD)量化口袋形状的相似性,公式如下:其中V1、S1、D1和V2、S2、D2分别是两个口袋的体积、表面积和深度;当两个口袋的SD小于某个截断值,则两个口袋形状相似。本专利技术中,对于一组蛋白,如果其中某些蛋白都有一个口袋与模板蛋白的一个口袋的位置相近且形状相似,则称这类口袋为重合口袋。如果某一类重合口袋的个数大于这组蛋白个数的80%,则认为这个口袋在这组蛋白中是保守的,并称这类结合口袋为组保守性结合口袋。然后利用LD和SD分析所有蛋白组的组保守性结合口袋的重合性,如果有一个蛋白组的组保守性结合口袋都与其他蛋白组的一个组保守性结合口袋重合,则认为在所研究的一类蛋白中,这个组保守性结合口袋是保守的,简称为保守性结合口袋。否则,认为在所研究的一类蛋白中,这个组保守性结合口袋是特异性的,简称为特异性结合口袋。优选地,步骤(1)中,去除分辨率低的蛋白X衍射晶体结构为去除分辨率值大于的蛋白X衍射晶体结构。优选地,步骤(2)中,使用SWISS-MODEL工具优化所有蛋白的晶体结构;使用DoGSiteScorer识别所有蛋白的结合口袋。优选地,步骤(3)中,结合口袋的位置特征和形状特征的聚类截断参数分别为和2.5。进一步优选地,所述的分析识别蛋白质特异性药物结合口袋的方法还包括下述步骤:量化特异性结合口袋成为药物结合口袋的潜在性:该步骤首先将给定的蛋白分子结构转化为蛋白质分子网络模型。网络模型中的节点为蛋白质分子结构中的残基。如果序列上两个非连续的残基重原子之间的最短距离小于特定截断值,则形成网络模型的边,所述的特定截断值优选的然后计算蛋白质分子网络中的网络性质,主要为计算接近中心性:接近中心性(ClosenessCentrality)反映了在网络中某一节点与其他节点之间的接近程度,可以从整体结构层次判断特异性口袋的变构机制,公式为:其中C(x)节点x的接近中心性(ClosenessCentrality)值,n是网络中节点的个数,式中∑d(x,y)是节点x和任何其他节点y之间的最短路径之和。其中,网络之间的最短路径可以用Floyd-Warshall算法计算。根据接近中心性公式可知,一个节点与其他节点的最短路径之和越小,则这个节点的接近中心性越大,这表明蛋白质网络的接近中心性反映了在网络中某一节点与其他节点之间的接近程度,即在整体网络(整个蛋白结构)层次量化了这个节点(残基)对网络的形成(蛋白结构的稳定性)、网络中信息的传递(变构)的重要性。接近中心性大的节点,即与其他节点的最短路径之和小的节点,可以看成网络形成的关键节点、网络中信息传递的枢纽,因此残基的接近中心性越大,表明这个残基对蛋白结构的稳定、变构越重要。定义结合口袋的接近中心性为结合口袋中所有残基接近中心性的平均值,因此通过计算结合口袋的接近中心性大小可以从整体结构层次判断特异性口袋的变构性。结合口袋的接近中心性越大,说明药物靶向这个结合口袋后,引起蛋白质变构性越大,从而使蛋白的功能和活性发生越显著的变化,即这个结合口袋是潜在药物结合口袋的潜在性(可能性)越大。与现有技术相比,本专利技术方法解决了目前无法有效预测特异性靶向药物结合位点的瓶颈问题。另外,本专利技术中使用的网络模型方法可以有效揭示特异性靶向药物结合口袋的作用机理,有利于加快特异性药物的研发。附图说明图1是本专利技术实施例中涉及的人类激酶蛋白分组图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术的各个特性所涉及到的特征只要彼此之间未构成冲突就可以相互组合。本专利技术提供了一种分析识别蛋白特异性靶向药物结合口袋的方法,具体包括以下步骤:(1)构建一类蛋白的非冗余结构数据库该步骤根据所研究的一类蛋白(比如人类蛋白激酶)的UniProtID,在PDB(ProteinDataBank)结构数据库中获得其X衍射晶体结构。在PDB结构数据库中,如果一个蛋白有多个X衍射晶体结构,则选择分辨率最高(即分辨率值最小)的X衍射晶体结构,从而使每个蛋白只有一个X衍射晶本文档来自技高网...

【技术保护点】
1.一种分析识别蛋白质特异性药物结合口袋的方法,其特征在于:包括如下步骤:(1)构建一类蛋白的非冗余结构数据库根据所研究的一类蛋白的UniProt ID,在PDB结构数据库中获得其X衍射晶体结构;在PDB结构数据库中,如果一个蛋白有多个X衍射晶体结构,则选择分辨率最高的X衍射晶体结构,从而使每个蛋白只有一个X衍射晶体结构;然后去除分辨率低的蛋白X衍射晶体结构,得到一类蛋白的非冗余结构数据库;(2)识别蛋白结合口袋首先,用多序列比对方法将非冗余结构数据库中的蛋白根据序列同源性分组,在每组蛋白中随机选取一个蛋白的X衍射晶体结构作为模板;随后将每组蛋白中的其他蛋白结构与模板蛋白结构进行结构比对并重新保存每个蛋白结构的坐标;然后优化所有蛋白的晶体结构;最后识别所有蛋白的结合口袋,建立结合口袋数据库,记录结合口袋的位置和结构信息;(3)分析识别特异性结合口袋根据结合口袋的位置特征和形状特征,对结合口袋进行分类,识别特异性结合口袋;用位置距离LD量化口袋位置的相似性,公式如下:

【技术特征摘要】
1.一种分析识别蛋白质特异性药物结合口袋的方法,其特征在于:包括如下步骤:(1)构建一类蛋白的非冗余结构数据库根据所研究的一类蛋白的UniProtID,在PDB结构数据库中获得其X衍射晶体结构;在PDB结构数据库中,如果一个蛋白有多个X衍射晶体结构,则选择分辨率最高的X衍射晶体结构,从而使每个蛋白只有一个X衍射晶体结构;然后去除分辨率低的蛋白X衍射晶体结构,得到一类蛋白的非冗余结构数据库;(2)识别蛋白结合口袋首先,用多序列比对方法将非冗余结构数据库中的蛋白根据序列同源性分组,在每组蛋白中随机选取一个蛋白的X衍射晶体结构作为模板;随后将每组蛋白中的其他蛋白结构与模板蛋白结构进行结构比对并重新保存每个蛋白结构的坐标;然后优化所有蛋白的晶体结构;最后识别所有蛋白的结合口袋,建立结合口袋数据库,记录结合口袋的位置和结构信息;(3)分析识别特异性结合口袋根据结合口袋的位置特征和形状特征,对结合口袋进行分类,识别特异性结合口袋;用位置距离LD量化口袋位置的相似性,公式如下:其中x1、y1、z1和x2、y2、z2分别是两个口袋的几何中心坐标;当两个口袋的LD小于某个截断值,则两个口袋位置相近;用形状距离SD量化口袋形状的相似性,公式如下:其中V1、S1、D1和V2、S2、D2分别是两个口袋的体积、表面积和深度;当两个口袋的SD小于某个截断值,则两个口袋形状相似;对于一组蛋白,如果其中某些蛋白都有一个口袋与模板蛋白的一个口袋的位置相近且形状相似,则称这类口袋为重合口袋;如果某一类重合口袋的个数大于这组蛋白个数的80%,则认为这个口袋在这组蛋白中是保守的,并称这类结合口袋为组保守性结合口袋;然后利用LD和SD分析所有蛋白组的组保守性结合口袋的重合性,如果有一个蛋白组的组保守性结合口袋都与其他蛋白组的一个组保守性结合口袋重合,则认为在所研究的一类蛋白中,这个组保守...

【专利技术属性】
技术研发人员:赵蕴杰王慧雯贾亚曾辰
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1