【技术实现步骤摘要】
一种蛋白质口袋的联配评估方法及系统
本专利技术涉及生物信息
,具体涉及一种蛋白质口袋的联配评估方法及系统。
技术介绍
蛋白质与小分子配体的相互作用存在于各种生物过程中,包括酶催化、转运和信号传导途径,在这些生物过程中分子间的相互作用是生物功能的核心,或者说分子间的相互作用调节着生物过程。在任何这些情况下,与配体的相互作用都是蛋白质生物学功能的一个特征性事件,而了解蛋白质结合配体的类型和姿势是理解该功能分子机制的重要线索。开发药物分子是蛋白质-配体相互作用的直接应用。在蛋白质工程中,设计一种结合特定配体并催化酶促反应的酶是重要目标之一。过去,大量与配体结合的蛋白质结构已经被测定出来,这些蛋白结构存储在PDB(蛋白质结构数据库)中,通过与这些蛋白质的结构比较,可以计算预测查询蛋白的结合配体。如果查询蛋白的结合位点未知,则可以通过鉴定蛋白表面的几何空腔来预测。配体结合口袋是受体的配体结合区域中的氨基酸残基所形成的一种凹陷结构。其形状与配体的互补性越大,则受体与配体的亲和力也就越大。已经开发了各种方法来比较口袋并测量它 ...
【技术保护点】
1.一种蛋白质口袋的联配评估方法,其特征在于,包括以下步骤:/nS1:确定口袋表面/n对两个蛋白质的表面进行识别,确定口袋表面;/nS2:口袋表面小片化/n将需要联配的两个口袋的表面分成不同的局部重叠的小片;/nS3:计算相似性/n利用三维Zernike描述子描述小片的表面物理化学特征;根据目标小片中心与其他小片中心之间的测地线距离,用邻域小片数的直方图描述小片在口袋中的近似位置;并计算每对小片中心的相对测地线距离;根据这几种特征计算小片之间的相似性;/nS4:识别小片间对应关系/n利用步骤S3中的相似性计算结果,再使用拍卖算法对两个口袋中小片之间对应关系进行识别并且给出两 ...
【技术特征摘要】
20200818 CN 20201083360691.一种蛋白质口袋的联配评估方法,其特征在于,包括以下步骤:
S1:确定口袋表面
对两个蛋白质的表面进行识别,确定口袋表面;
S2:口袋表面小片化
将需要联配的两个口袋的表面分成不同的局部重叠的小片;
S3:计算相似性
利用三维Zernike描述子描述小片的表面物理化学特征;根据目标小片中心与其他小片中心之间的测地线距离,用邻域小片数的直方图描述小片在口袋中的近似位置;并计算每对小片中心的相对测地线距离;根据这几种特征计算小片之间的相似性;
S4:识别小片间对应关系
利用步骤S3中的相似性计算结果,再使用拍卖算法对两个口袋中小片之间对应关系进行识别并且给出两个口袋整体的各种相似性打分;
S5:联配两个口袋
基于对应小片中心坐标,获得旋转矩阵和平移矩阵,再根据旋转矩阵和平移矩阵将两个口袋叠合,根据叠合后残基的距离,确定两个口袋中残基的对应关系;
S6:对联配进行评估
建立支持向量分类模型,根据步骤S4中获得的相似性得分来评估两个口袋联配的匹配度。
2.根据权利要求1所述的一种蛋白质口袋的联配评估方法,其特征在于:在所述步骤S3中,小片的表面物理化学特征包括形状、疏水性、静电势和凸凹度。
3.根据权利要求2所述的一种蛋白质口袋的联配评估方法,其特征在于:在所述步骤S3中,利用三维Zernike描述子描述小片的表面物理化学特征的过程如下:
S31:获得蛋白质表面形状的三维网格表示后,如果格点与蛋白表面原子重叠,则将其赋值为1,否则为0,为表示小片表面的物理化学性质,计算相应的值并将其映射到网格上,此时网格上点的值即相应的物理化学性质的值,物理化学性质的值所映射的三维网格为三维函数,使用Zernike-Canterakis基组,将三维函数级数展开:
其中:
式中序参数n=15,对应72个不变量;为基函数,Rnl和分别是径向函数和球谐函数;
S32:计算3DZD,Fnl作为向量Ωnl的范数,Fnl如下:
向量Fnl的欧式距离用于评估两个3DZD之间的相似性,两个小片的表面相似性即pd3DZD,是小片表面物理化学特征的3DZD相似性的加权平均值,四种物理化学特征的权重分别为0.1793,0.0724,0.0707和0.6776。
4.根据权利要求3所述的一种蛋白质口袋的联配评估方法,其特征在于:在所述步骤S3中,两个小片的位置相似性通过其直方图的L2范数进行量化。
5.根据权利要求4所述的一种蛋白质口袋的联配评估方法,其特征在于:在所述步骤S3中,给定优化过程中两个口袋的临时小片对应关系,新小片对的GRPD是每个新小片与每个口袋中现有小片之间测地线距离的平均差:
其中,分别表示口袋A和口袋B中的一对小片中心,mA,B是口袋A和口袋B之间相应小片的临时列表,|mA,B|是相应小片的数量,G2是两个小片中心之间的测地线距离。
6.根据权利要求5所述的一种蛋白质口袋的联配评估方法,其特征在于:在所述步骤S4中,对两个口袋中小片之间对应关系进行识别的过程如下:
S41:将pd3DZD和APPS这两项结合起来,再加一个权重因子w1:
MScore(A,B,mA,B)=w1pd3DZD(A,B,mA,B)+(1.0-w1)APPS(A,B,mA,B)
其中,MScore(匹配分数)表示口袋A和口袋B中相应小片的相似性;
S42:将MScore与GRPD通过参数w2线性组合起来以获得总得分(TSc...
【专利技术属性】
技术研发人员:祝小雷,程寅初,王红,赵世豪,刘宇峰,
申请(专利权)人:安徽农业大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。