一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及应用技术方案

技术编号:37844532 阅读:15 留言:0更新日期:2023-06-14 22:27
本发明专利技术公开了一种基于蛋白结构指纹的蛋白口袋匹配方法,包括:生成目标靶点对应的蛋白质口袋结构指纹;建立蛋白结构指纹及碎片数据库;基于目标靶点的蛋白质口袋结构指纹与蛋白结构指纹及碎片数据库中的蛋白口袋集合的相似度计算;基于相似度数值的大小进行蛋白质口袋匹配。还公开了对应的系统和应用,提出了基于蛋白结构,氨基酸尺度的哈希指纹生成方法,解决蛋白口袋相似度计算问题及基于口袋的苗头化合物发现和骨架跃迁工作,克服传统基于序列或者全蛋白结构的蛋白相似度计算方法与功能关联性较弱的局限性,以更接近功能的蛋白质口袋尺度计算蛋白相似度来构建蛋白底层联系,提高新型药物设计和开发的效率,缩短研发周期,具有较高的实用价值。具有较高的实用价值。具有较高的实用价值。

【技术实现步骤摘要】
一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及应用


[0001]本专利技术属于生物基因
,尤其涉及一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及应用。

技术介绍

[0002]在基于结构的药物发现和设计中,一个重要部分是寻找或者设计与目标靶点有较强相互作用的小分子,它能通过和目标蛋白的结合,影响目标蛋白的功能,最终起到治疗效果。但在通常情况下,和已知的与目标靶点有相互作用的小分子数量非常有限,特别是对于FIC蛋白来说,可能完全没有已知的活性化合物。这就要求通过构建更底层的联系,将和目标蛋白相关的其他蛋白的信息利用起来,构建一个具有泛化能力的模型,将收集到的其他蛋白与小分子的相互作用的结果用于帮助针对新的目标靶点蛋白做分子药物优化和设计。现有技术通常是基于蛋白序列相似度来构建蛋白间的联系,但是蛋白序列和功能之间联系远不如蛋白结构和他的功能来的紧密,具体表现在一些研究中的结论:很多不同序列的蛋白具有相似的三维结构和功能;在一些情况下,序列类似的蛋白,却有显著不同的蛋白

小分子相互作用模式。现有的基于结构的相似度比较方法将蛋白视作一个整体,来计算特征,但通常与小分子有相互作用的是蛋白的子结构(通常叫做蛋白口袋,Protein Pocket)。有些蛋白的序列不相似,且整体结构不相似,但是却具有相似的蛋白口袋。使用现有的相似度计算方法,很难将这些蛋白构建底层联系,导致无法充分利用已有数据,模型泛化能力不强。
[0003]因此,上述的现有技术确实有待提出更佳解决方案的必要性。

技术实现思路

[0004]本专利技术的目的是提供一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及其应用,通过构建蛋白结构指纹,来寻找与目标蛋白结合口袋类似的蛋白口袋,增强模型筛选与目标蛋白有结合能力的分子的能力。具体的,通过构建氨基酸尺度的指纹,计算每个氨基酸的结构指纹,通过池化蛋白口袋的指纹匹配,找到类似口袋,达到匹配相似蛋白口袋,构建蛋白结构底层联系,发现新的苗头化合物或者用于骨架跃迁的可替换分子碎片的目的,特别是可以根据这些匹配口袋中结晶的分子碎片应用于FIC蛋白的苗头化合物发现及骨架跃迁中。
[0005]本专利技术一方面提供了一种基于蛋白结构指纹的蛋白口袋匹配方法,包括:
[0006]S1,生成目标靶点对应的蛋白质口袋结构指纹;
[0007]S2,建立蛋白结构指纹及碎片数据库;
[0008]S3,基于目标靶点的蛋白质口袋结构指纹与蛋白结构指纹及碎片数据库中的蛋白口袋集合的相似度计算;
[0009]S4,基于相似度数值的大小进行蛋白质口袋匹配。
[0010]优选的,所述S1包括:
[0011]S11,确定目标靶点对应的蛋白质口袋中每个氨基酸的口袋氨基酸结构指纹;
[0012]S12,基于口袋氨基酸结构指纹获取蛋白质口袋结构指纹,包括:将蛋白质口袋中的所有口袋氨基酸结构指纹进行池化获取蛋白质口袋结构指纹。
[0013]优选的,所述S11确定口袋氨基酸结构指纹的方法包括:
[0014](1)设置氨基酸邻居的阈值距离;
[0015](2)基于所述阈值距离、每个氨基酸的三阶邻居特征和哈希算法计算所述口袋氨基酸指纹;
[0016]所述哈希算法包括两种方式:
[0017]第一种是,利用感知哈希算法,针对氨基酸不同的特征,通过比较图像相似度实现近似氨基酸的自动识别,通过感知哈希算法提取每张待测图片的哈希码,并与已标注过的氨基酸哈希码进行对比,找出相似度最高的哈希码所代表的标签作为口袋氨基酸结构指纹;
[0018]第二种是,建立经验哈希表,利用哈希表数量L,哈希表的位数k和全局比对向量数Q确定某一氨基酸的哈希码作为口袋氨基酸结构指纹。
[0019]优选的,所述S2包括:
[0020]S21,获取蛋白

分子共晶结构数据库,并提取蛋白

分子共晶结构数据库中的所有蛋白口袋;
[0021]S22,对于每个蛋白口袋p,取多个半径为n的球并提取球内小分子碎片m,其中n为根据相似度计算要求而设定的第一可变阈值;若所有小分子碎片m均未包含指定分子片段,则舍弃对应的蛋白口袋,否则保留对应的蛋白口袋,最终获得蛋白口袋集合P={p1,p2,

p
l
.}以及对应的分子片段集合M={m1,m2,

m
l
.},其中l为数据库蛋白口袋数量或有效分子片段数量和。
[0022]优选的,所述S3的所述相似度计算的方式包括:
[0023]针对目标靶点的蛋白质口袋结构指纹,相似度计算如下所示,
[0024]Similarity=Jaccard(FP
q
,FP
t
)
ꢀꢀꢀ
(1)
[0025]其中,FP
q
,FP
t
分别为待查询的蛋白质口袋指纹及蛋白结构指纹及碎片数据库中的蛋白质口袋指纹,相似度的计算由雅卡尔(Jaccard)向量距离定义。
[0026]优选的,所述S4包括:
[0027]S41,将l个相似度数值从大到小进行排序;
[0028]S42,按照相似度数值从大到小的规则依次在蛋白结构指纹及碎片数据库中获取与相似度数值对应的x个蛋白口袋及对应的小分子片段集合作为匹配集C;其中,x为根据应用定义的第二可变阈值。
[0029]本专利技术的第二方面提供一种基于蛋白结构指纹的蛋白口袋匹配系统,包括:
[0030]蛋白质口袋结构指纹生成模块(101),用于生成目标靶点对应的蛋白质口袋结构指纹;
[0031]数据库建立模块(102),用于建立蛋白结构指纹及碎片数据库;
[0032]相似度计算模块(103),用于基于目标靶点的蛋白质口袋结构指纹与蛋白结构指纹及碎片数据库中的蛋白口袋集合的相似度计算;
[0033]蛋白质口袋匹配模块(104),用于基于相似度数值的大小进行蛋白质口袋匹配。
[0034]本专利技术的第三方面在于提供一种基于蛋白结构指纹的蛋白口袋匹配方法在基于FIC蛋白的苗头化合物发现中的应用。
[0035]本专利技术的第四方面在于提供一种基于蛋白结构指纹的蛋白口袋匹配方法在用于骨架跃迁的可替换分子碎片发现中的应用。
[0036]本专利技术的第四方面在于提供一种基于蛋白结构指纹的蛋白口袋匹配方法在分子药物中的应用。
[0037]本专利技术提供的系统、方法以及应用,具有如下有益的技术效果:
[0038]本专利技术创新性地提出了基于蛋白结构,氨基酸尺度的哈希指纹生成方法,并以此解决了蛋白口袋相似度计算问题及基于口袋的苗头化合物发现和骨架跃迁工作。克服了传统基于序列或者全蛋白结构的蛋白相似度计算方法与功能关联性较弱的局限性。以更接近功能的蛋白质口袋尺度计算蛋白相似度来构建蛋白底层联系,提高了新型药物设计和开发的效率,缩短研发周期,具有较高的实用价值。
附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,包括:S1,生成目标靶点对应的蛋白质口袋结构指纹;S2,建立蛋白结构指纹及碎片数据库;S3,基于目标靶点的蛋白质口袋结构指纹与蛋白结构指纹及碎片数据库中的蛋白口袋集合的相似度计算;S4,基于相似度数值的大小进行蛋白质口袋匹配。2.根据权利要求1所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S1包括:S11,确定目标靶点对应的蛋白质口袋中每个氨基酸的口袋氨基酸结构指纹;S12,基于口袋氨基酸结构指纹获取蛋白质口袋结构指纹,包括:将蛋白质口袋中的所有口袋氨基酸结构指纹进行池化获取蛋白质口袋结构指纹。3.根据权利要求2所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S11确定口袋氨基酸结构指纹的方法包括:(1)设置氨基酸邻居的阈值距离;(2)基于所述阈值距离、每个氨基酸的三阶邻居特征和哈希算法计算所述口袋氨基酸指纹;所述哈希算法包括两种方式:第一种是,利用感知哈希算法,针对氨基酸不同的特征,通过比较图像相似度实现近似氨基酸的自动识别,通过感知哈希算法提取每张待测图片的哈希码,并与已标注过的氨基酸哈希码进行对比,找出相似度最高的哈希码所代表的标签作为口袋氨基酸结构指纹;第二种是,建立经验哈希表,利用哈希表数量L,哈希表的位数k和全局比对向量数Q确定某一氨基酸的哈希码作为口袋氨基酸结构指纹。4.根据权利要求3所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S2包括:S21,获取蛋白

分子共晶结构数据库,并提取蛋白

分子共晶结构数据库中的所有蛋白口袋;S22,对于每个蛋白口袋p,取多个半径为n的球并提取球内小分子碎片m,其中n为根据相似度计算要求而设定的第一可变阈值;若所有小分子碎片m均未包含指定分子片段,则舍弃对应的蛋白口袋,否则保留对应的蛋白口袋,最终获得蛋白口袋集合P={p1,p2,

p
l
.}以及对应的分子片段集合M={m1,m2,

...

【专利技术属性】
技术研发人员:陆威郑双佳张继贤
申请(专利权)人:星希尔生物科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1