GPCR的热稳定性突变预测模型的构建方法、预测方法及装置制造方法及图纸

技术编号:34564331 阅读:25 留言:0更新日期:2022-08-17 12:53
本申请涉及一种GPCR的热稳定性突变预测模型的构建方法、预测方法及装置。该构建方法包括:获取预训练模型;获取样本GPCR的同源序列,根据同源序列对预训练模型进行自监督训练,获得进化微调模型;获取样本GPCR的突变热稳定性样本数据,并根据突变热稳定性样本数据对进化微调模型进行监督训练,获得预测模型。本申请的方案,能够构建出预测模型,更高效准确地预测GPCR的哪些位点突变具有贡献稳定性的可能性,达到省时省力及降低研发费用的效果。果。果。

【技术实现步骤摘要】
GPCR的热稳定性突变预测模型的构建方法、预测方法及装置


[0001]本申请涉及G蛋白偶联受体突变
,尤其涉及一种GPCR的热稳定性突变预测模型的构建方法、预测方法及装置。

技术介绍

[0002]G蛋白偶联受体(GPCRs)家族是人类基因组编码的最为重要的受体家族之一,在人体的主要器官组织系统中普遍表达,其立体结构中都有七个跨膜α螺旋,且其肽链的C端和连接第5和第6个跨膜螺旋的胞内环上都有结合位点,它们的主要功能是通过与G蛋白相互作用将细胞外的信息传递到细胞内。GPCRs参与了大量人类疾病、生理和药理活动,是目前研究较多的药物靶点。研究GPCRs的结构稳定性和其结构解析技术对研制新药至关重要,但由于其结构柔性比较大、构象多变、异源表达折叠错误等,解析有些GPCRs的结构还存在一定的困难,GPCR的热稳定性突变位点预测愈发重要。
[0003]相关技术中,一般常采用两种GPCR突变体热稳定性改造方法,其中一种改造方法是系统性的ALA扫描GPCR突变方法,该方法一般是将GPCR的7个TM区域氨基酸逐个突变为ALA(若TM区域内的原氨基酸为ALA,则将原氨基酸突变为Leu),而后通过实验测试热稳定性。另一种改造方法是定向蛋白进化方法,该方法一般是设计突变库,而后施加筛选压力,最后得到热稳定优化的突变体。然而,目前这些方法仅能探索部分突变空间,耗时耗力且需要投入大量的研发费用。
[0004]因此,如何缩减GPCR在热稳定性位点突变的实验尝试过程,以达到省时省力及降低研发费用的目的,是目前需要解决的问题。<br/>
技术实现思路

[0005]为解决或部分解决相关技术中存在的问题,本申请提供一种GPCR的热稳定性突变预测模型的构建方法、GPCR的热稳定性突变预测方法及其装置,能够构建出预测模型,更高效准确地预测GPCR的哪些位点突变具有贡献稳定性的可能性,达到省时省力及降低研发费用的效果。
[0006]本申请第一方面提供一种GPCR的热稳定性突变预测模型的构建方法,其包括:
[0007]获取预训练模型;
[0008]获取样本GPCR的同源序列,根据所述同源序列对所述预训练模型进行自监督训练,获得进化微调模型;
[0009]获取所述样本GPCR的突变热稳定性样本数据,并根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型。
[0010]在一实施方式中,所述获取样本GPCR的同源序列,包括:
[0011]根据样本GPCR的蛋白序列在预设数据库中进行序列比对,获取所述样本GPCR的同源序列。
[0012]在一实施方式中,所述根据样本GPCR的蛋白序列在预设数据库中进行序列比对,
包括:
[0013]根据样本GPCR的蛋白序列在第一个蛋白质数据库中进行序列比对,得到第一组多序列比对结果;其中:
[0014]当第一组多序列比对结果中的有效序列的个数大于或等于预设个数阈值时,输出有效序列作为所述样本GPCR的同源序列;
[0015]当第一组多序列比对结果中的有效序列的个数小于预设个数阈值时,依序根据样本GPCR的蛋白序列在第P个蛋白质数据库中进行序列比对,并将比对结果与前P

1组多序列比对结果组合,得到第P组多序列比对结果,直至第P组多序列比对结果中的有效序列的个数大于或等于预设个数阈值,结束序列比对,输出有效序列作为所述样本GPCR的同源序列,其中,P为大于1的自然数。
[0016]在一实施方式中,所述获取所述样本GPCR的突变热稳定性样本数据,包括:
[0017]分别获取样本GPCR经丙氨酸扫描突变后的第一加热前后活性变化量及对应的野生型样本GPCR的第二加热前后活性变化量;
[0018]将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据。
[0019]在一实施方式中,所述将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据,包括:
[0020]分别将所述第一加热前后活性变化量与所述第二加热前后活性变化量的K个预设倍率阈值进行比较,分别获得在每个预设倍率阈值下确定的正样本数据和负样本数据组成的训练数据,所述K为大于或等于2的正整数;
[0021]所述根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型,包括:
[0022]利用每个预设倍率阈值下的训练数据分别对所述进化微调模型进行监督训练,获得K个候选预测模型。
[0023]在一实施方式中,所述方法还包括:
[0024]利用预设评价指标分别对K个候选预测模型进行评分,获得每个候选预测模型的评分结果;
[0025]选取评分结果满足预设条件的候选预测模型作为预测模型。
[0026]在一实施方式中,所述根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型,包括:
[0027]根据M组随机参数设置所述进化微调模型,获得M个对应的进化微调子模型;其中,所述M为大于或等于2的正整数;
[0028]将样本GPCR的突变热稳定性样本数据作为训练数据分别对M个进化微调子模型进行训练,获得对应的M个训练好的微调子模型,并利用M个所述微调子模型构建预测模型。
[0029]在一实施方式中,若所述样本GPCR有N种,所述N为大于或等于2的正整数;
[0030]所述将样本GPCR的突变热稳定性样本数据作为训练数据分别对M个进化微调子模型进行训练,获得对应的M个训练好的微调子模型,并利用M个所述微调子模型构建预测模型,包括:
[0031]将N种样本GPCR的突变热稳定性样本数据按照N折交叉验证法进行划分,获得N组训练数据,其中,每组训练数据包括(N

1)种样本GPCR的突变热稳定性样本数据组成的训练集和剩余的1种样本GPCR的突变热稳定性样本数据组成的验证集;
[0032]将同一组训练数据分别对M个进化微调子模型进行监督训练,获得对应的M个训练好的微调子模型,并利用M个所述微调子模型构建得到对应的1个预测子模型,以得到N个预测子模型;
[0033]利用N个所述预测子模型构建预测模型。
[0034]本申请第二方面提供一种GPCR的热稳定性突变预测方法,其包括:
[0035]获取目标GPCR的蛋白质序列;
[0036]根据所述的GPCR的热稳定性突变预测模型的构建方法构建的预测模型,预测所述目标GPCR的蛋白质序列中的热稳定性突变位点。
[0037]本申请第三方面提供一种GPCR的热稳定性突变预测模型的构建装置,其包括:
[0038]预训练模块,用于获取预训练模型;
[0039]同源序列获取模块,用于获取样本GPCR的同源序列;
[0040]进化模块,用于根据所述同源序列对所述预训练模型进行自监本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种GPCR的热稳定性突变预测模型的构建方法,其特征在于,包括:获取预训练模型;获取样本GPCR的同源序列,根据所述同源序列对所述预训练模型进行自监督训练,获得进化微调模型;获取所述样本GPCR的突变热稳定性样本数据,并根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型。2.根据权利要求1所述的方法,其特征在于,所述获取样本GPCR的同源序列,包括:根据样本GPCR的蛋白序列在预设数据库中进行序列比对,获取所述样本GPCR的同源序列。3.根据权利要求2所述的方法,其特征在于,所述根据样本GPCR的蛋白序列在预设数据库中进行序列比对,包括:根据样本GPCR的蛋白序列在第一个蛋白质数据库中进行序列比对,得到第一组多序列比对结果;其中:当第一组多序列比对结果中的有效序列的个数大于或等于预设个数阈值时,输出有效序列作为所述样本GPCR的同源序列;当第一组多序列比对结果中的有效序列的个数小于预设个数阈值时,依序根据样本GPCR的蛋白序列在第P个蛋白质数据库中进行序列比对,并将比对结果与前P

1组多序列比对结果组合,得到第P组多序列比对结果,直至第P组多序列比对结果中的有效序列的个数大于或等于预设个数阈值,结束序列比对,输出有效序列作为所述样本GPCR的同源序列,其中,P为大于1的自然数。4.根据权利要求1所述的方法,其特征在于,所述获取所述样本GPCR的突变热稳定性样本数据,包括:分别获取样本GPCR经丙氨酸扫描突变后的第一加热前后活性变化量及对应的野生型样本GPCR的第二加热前后活性变化量;将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据。5.根据权利要求4所述的方法,其特征在于,所述将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据,包括:分别将所述第一加热前后活性变化量与所述第二加热前后活性变化量的K个预设倍率阈值进行比较,分别获得在每个预设倍率阈值下确定的正样本数据和负样本数据组成的训练数据,所述K为大于或等于2的正整数;所述根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型,包括:利用每个预设倍率阈值下的训练数据分别对所述进化微调模型进行监督训练,获得K个候选预测模型。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:利用预设评价指标分别对K个候选预测模型进行评分,获得每个候选预测模型的评分结果;
选取评分结果满足预设条件的候选预测模型作为预测模型。7.根据权利要求1所述的方法,其特征在于,所述根据所述突...

【专利技术属性】
技术研发人员:翟珂王天元黄健吴炜坤
申请(专利权)人:北京晶泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1