【技术实现步骤摘要】
GPCR的热稳定性突变预测模型的构建方法、预测方法及装置
[0001]本申请涉及G蛋白偶联受体突变
,尤其涉及一种GPCR的热稳定性突变预测模型的构建方法、预测方法及装置。
技术介绍
[0002]G蛋白偶联受体(GPCRs)家族是人类基因组编码的最为重要的受体家族之一,在人体的主要器官组织系统中普遍表达,其立体结构中都有七个跨膜α螺旋,且其肽链的C端和连接第5和第6个跨膜螺旋的胞内环上都有结合位点,它们的主要功能是通过与G蛋白相互作用将细胞外的信息传递到细胞内。GPCRs参与了大量人类疾病、生理和药理活动,是目前研究较多的药物靶点。研究GPCRs的结构稳定性和其结构解析技术对研制新药至关重要,但由于其结构柔性比较大、构象多变、异源表达折叠错误等,解析有些GPCRs的结构还存在一定的困难,GPCR的热稳定性突变位点预测愈发重要。
[0003]相关技术中,一般常采用两种GPCR突变体热稳定性改造方法,其中一种改造方法是系统性的ALA扫描GPCR突变方法,该方法一般是将GPCR的7个TM区域氨基酸逐个突变为ALA(若TM区域内的原氨基酸为ALA,则将原氨基酸突变为Leu),而后通过实验测试热稳定性。另一种改造方法是定向蛋白进化方法,该方法一般是设计突变库,而后施加筛选压力,最后得到热稳定优化的突变体。然而,目前这些方法仅能探索部分突变空间,耗时耗力且需要投入大量的研发费用。
[0004]因此,如何缩减GPCR在热稳定性位点突变的实验尝试过程,以达到省时省力及降低研发费用的目的,是目前需要解决的问题。< ...
【技术保护点】
【技术特征摘要】
1.一种GPCR的热稳定性突变预测模型的构建方法,其特征在于,包括:获取预训练模型;获取样本GPCR的同源序列,根据所述同源序列对所述预训练模型进行自监督训练,获得进化微调模型;获取所述样本GPCR的突变热稳定性样本数据,并根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型。2.根据权利要求1所述的方法,其特征在于,所述获取样本GPCR的同源序列,包括:根据样本GPCR的蛋白序列在预设数据库中进行序列比对,获取所述样本GPCR的同源序列。3.根据权利要求2所述的方法,其特征在于,所述根据样本GPCR的蛋白序列在预设数据库中进行序列比对,包括:根据样本GPCR的蛋白序列在第一个蛋白质数据库中进行序列比对,得到第一组多序列比对结果;其中:当第一组多序列比对结果中的有效序列的个数大于或等于预设个数阈值时,输出有效序列作为所述样本GPCR的同源序列;当第一组多序列比对结果中的有效序列的个数小于预设个数阈值时,依序根据样本GPCR的蛋白序列在第P个蛋白质数据库中进行序列比对,并将比对结果与前P
‑
1组多序列比对结果组合,得到第P组多序列比对结果,直至第P组多序列比对结果中的有效序列的个数大于或等于预设个数阈值,结束序列比对,输出有效序列作为所述样本GPCR的同源序列,其中,P为大于1的自然数。4.根据权利要求1所述的方法,其特征在于,所述获取所述样本GPCR的突变热稳定性样本数据,包括:分别获取样本GPCR经丙氨酸扫描突变后的第一加热前后活性变化量及对应的野生型样本GPCR的第二加热前后活性变化量;将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据。5.根据权利要求4所述的方法,其特征在于,所述将所述第一加热前后活性变化量与所述第二加热前后活性变化量的预设倍率阈值进行比较,确定所述样本GPCR对应的正样本数据和负样本数据,包括:分别将所述第一加热前后活性变化量与所述第二加热前后活性变化量的K个预设倍率阈值进行比较,分别获得在每个预设倍率阈值下确定的正样本数据和负样本数据组成的训练数据,所述K为大于或等于2的正整数;所述根据所述突变热稳定性样本数据对所述进化微调模型进行监督训练,获得预测模型,包括:利用每个预设倍率阈值下的训练数据分别对所述进化微调模型进行监督训练,获得K个候选预测模型。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:利用预设评价指标分别对K个候选预测模型进行评分,获得每个候选预测模型的评分结果;
选取评分结果满足预设条件的候选预测模型作为预测模型。7.根据权利要求1所述的方法,其特征在于,所述根据所述突...
【专利技术属性】
技术研发人员:翟珂,王天元,黄健,吴炜坤,
申请(专利权)人:北京晶泰科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。