【技术实现步骤摘要】
一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及应用
[0001]本专利技术属于生物基因
,尤其涉及一种基于蛋白结构指纹的蛋白口袋匹配方法、系统及应用。
技术介绍
[0002]在基于结构的药物发现和设计中,一个重要部分是寻找或者设计与目标靶点有较强相互作用的小分子,它能通过和目标蛋白的结合,影响目标蛋白的功能,最终起到治疗效果。但在通常情况下,和已知的与目标靶点有相互作用的小分子数量非常有限,特别是对于FIC蛋白来说,可能完全没有已知的活性化合物。这就要求通过构建更底层的联系,将和目标蛋白相关的其他蛋白的信息利用起来,构建一个具有泛化能力的模型,将收集到的其他蛋白与小分子的相互作用的结果用于帮助针对新的目标靶点蛋白做分子药物优化和设计。现有技术通常是基于蛋白序列相似度来构建蛋白间的联系,但是蛋白序列和功能之间联系远不如蛋白结构和他的功能来的紧密,具体表现在一些研究中的结论:很多不同序列的蛋白具有相似的三维结构和功能;在一些情况下,序列类似的蛋白,却有显著不同的蛋白
‑
小分子相互作用模式。现有的基于结构的 ...
【技术保护点】
【技术特征摘要】
1.一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,包括:S1,生成目标靶点对应的蛋白质口袋结构指纹;S2,建立蛋白结构指纹及碎片数据库;S3,基于目标靶点的蛋白质口袋结构指纹与蛋白结构指纹及碎片数据库中的蛋白口袋集合的相似度计算;S4,基于相似度数值的大小进行蛋白质口袋匹配。2.根据权利要求1所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S1包括:S11,确定目标靶点对应的蛋白质口袋中每个氨基酸的口袋氨基酸结构指纹;S12,基于口袋氨基酸结构指纹获取蛋白质口袋结构指纹,包括:将蛋白质口袋中的所有口袋氨基酸结构指纹进行池化获取蛋白质口袋结构指纹。3.根据权利要求2所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S11确定口袋氨基酸结构指纹的方法包括:(1)设置氨基酸邻居的阈值距离;(2)基于所述阈值距离、每个氨基酸的三阶邻居特征和哈希算法计算所述口袋氨基酸指纹;所述哈希算法包括两种方式:第一种是,利用感知哈希算法,针对氨基酸不同的特征,通过比较图像相似度实现近似氨基酸的自动识别,通过感知哈希算法提取每张待测图片的哈希码,并与已标注过的氨基酸哈希码进行对比,找出相似度最高的哈希码所代表的标签作为口袋氨基酸结构指纹;第二种是,建立经验哈希表,利用哈希表数量L,哈希表的位数k和全局比对向量数Q确定某一氨基酸的哈希码作为口袋氨基酸结构指纹。4.根据权利要求3所述的一种基于蛋白结构指纹的蛋白口袋匹配方法,其特征在于,所述S2包括:S21,获取蛋白
‑
分子共晶结构数据库,并提取蛋白
‑
分子共晶结构数据库中的所有蛋白口袋;S22,对于每个蛋白口袋p,取多个半径为n的球并提取球内小分子碎片m,其中n为根据相似度计算要求而设定的第一可变阈值;若所有小分子碎片m均未包含指定分子片段,则舍弃对应的蛋白口袋,否则保留对应的蛋白口袋,最终获得蛋白口袋集合P={p1,p2,
…
p
l
.}以及对应的分子片段集合M={m1,m2,
…
...
【专利技术属性】
技术研发人员:陆威,郑双佳,张继贤,
申请(专利权)人:星希尔生物科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。