一种泛素化降解目标蛋白质的预测方法技术

技术编号:21161737 阅读:21 留言:0更新日期:2019-05-22 08:29
本发明专利技术涉及一种泛素化降解目标蛋白质的预测方法,包括以步骤:A1、采用卷积神经网络方法预测蛋白亚基的相互作用;A2、构建泛素标记体系空间三维结构;A3、预测泛素化降解的目标蛋白质,先下载目标蛋白三维结构文件,使用同源建模的方法补全目标蛋白三维结构,利用上述的卷积神经网络方法预测目标蛋白与E3泛素标记体系的相互作用;然后,采用分子动力学方法优化E3泛素标记体系与目标蛋白相互作用的整体空间三维结构,根据体系的稳定性判断目标蛋白是否可能被该E3泛素标记体系标记,并通过泛素‑蛋白酶体降解。

A Prediction Method for Ubiquitous Degradation of Target Proteins

The invention relates to a prediction method for ubiquitinated degradation target protein, which includes steps: A1, prediction of protein subunit interaction by convolution neural network method; A2, construction of three-dimensional structure of ubiquitin labeling system; A3, prediction of ubiquitinated degradation target protein, downloading the three-dimensional structure file of target protein first, completing the three-dimensional structure of target protein by homology modeling method. Structures. The convolution neural network method was used to predict the interaction between target protein and E3 ubiquitin labeling system. Then, molecular dynamics method was used to optimize the overall three-dimensional structure of the interaction between E3 ubiquitin labeling system and target protein, and the stability of the system was used to determine whether the target protein could be labeled by the E3 Ubiquitin labeling system, and the ubiquitin proteasome was lowered. Solution.

【技术实现步骤摘要】
一种泛素化降解目标蛋白质的预测方法
本专利技术涉及一种泛素化降解目标蛋白质的预测方法。
技术介绍
使用药物治疗疾病的策略包括抗体、siRNA和小分子以阻断致病蛋白的活性。抗体具有非常有效的特异性,但在细胞渗透性方面仍然很困难。通过使用siRNA抑制基因表达是不错的选择,但其递送的困难和脱靶效应问题阻碍了其应用。化学小分子被广泛筛选并合成,用以结合特定蛋白质,旨在抑制蛋白质的功能。然而,当经常使用小分子药物时会发生耐药性,在某些特殊情况下,抑制剂甚至会导致蛋白质的积累。此外,对于某些蛋白质如Ras,其在肿瘤发生过程中具有关键突变,以及表面缺乏成药空腔,导致无法开发其小分子抑制剂。基于以上问题,药物开发者提出了诱导致病蛋白质降解的新策略,该策略使得人们可以设计小分子降解以前被认为“不可成药”的蛋白,还可以克服抗体和siRNA的渗透和递送性等问题,其中的技术之一是PROTAC,通过设计嵌合体分子降解目标蛋白质。PROTAC是利用泛素化-蛋白酶途径诱导目标蛋白质在细胞中降解的策略。泛素-蛋白酶体途径是细胞内蛋白质降解的主要途径,参与细胞内80%以上蛋白质的降解。其由泛素、泛素活化酶E1、泛素结合酶E2、泛素连接酶E3、蛋白酶体及其底物构成。该途径降解蛋白质的过程分两个阶段:(1)泛素化目标蛋白质:泛素分子由ATP提供能量,被E1激活转移到E2,然后经E3与目标蛋白质结合;(2)降解目标蛋白质:被泛素化的目标蛋白质被蛋白酶体识别,并被其降解为多肽。许多研究表明,降解比抑制致癌蛋白质的抗癌活性更好。迄今为止,PROTAC技术可用于降解多种蛋白质只有不到40种,包括转录因子,骨架蛋白,酶和调节蛋白等,而人体的蛋白保守估计有超过2万种。在泛素化-蛋白酶途径中,最重要的是泛素连接酶E3标记目标蛋白质泛素的系统。目前,已知的E3有600多种,可以分为四大类:1、HECT,2、RING-finger,3、U-box,4、PHD-finger。RING-fingerE3连接酶是最大的家族,含有VHL、CRBN和SCF(Skp1-Cullin-F-box)等连接酶。由于E3连接酶标记目标蛋白质的过程非常复杂,涉及的蛋白亚基机构非常多,且目前只有VHL和CRBN部分的结构被解析,故E3如何标记致病蛋白质的完整过程还不清楚。基于已知的VHL和CRBN的Cullin体系,可以降解哪些目标蛋白质,这是药物化学家非常想了解的事情。但,目前只能先设计出PROTAC分子,然后用试验来证明该蛋白是否能被VHL和CRBN的Cullin体系降解。并且,现有的PROTACs设计方法仅能基于已有的E3和目标蛋白抑制剂,通过增加中间的Linker来实现目标蛋白的降解。目前,仅有CRBN、VHL与BRD4的三维复合物结构被解析。其它已知被VHL和CRBN降解的目标蛋白与PROTACs和E3的复合物体系结构并未知晓。这就是药物化学家的难题,如何预测三元复合物的正确三维空间结构,再基于此进行合理的药物设计。基于药物化学家的需求,本专利技术的目的在于提供一种泛素化降解目标蛋白质的预测方法,以促进基于结构的降解致病蛋白的PROTAC、多肽、单体小分子、嵌合分子和抗体耦联分子的新药开发。
技术实现思路
本专利技术供了一种泛素化降解目标蛋白质的预测方法。一种泛素化降解目标蛋白质的预测方法,包括如下步骤:A1、采用卷积神经网络方法预测蛋白亚基的相互作用,包括以下步骤:Step1:从PDB蛋白质数据库中收集蛋白-蛋白复合体的空间三维结构;Step2:依据所述具有空间结构分辨率的蛋白-蛋白复合物作为模型,计算蛋白-蛋白相互作用界面上氨基酸残基的类型和频次,生成蛋白-蛋白相互作用氨基酸残基的数据库;Ste:3:利用卷积神经网络提取所述相互作用氨基酸残基的特征,随机分为80%的训练集和20%的测试集,将训练集用于训练模型的识别训练,然后利用测试集对所述训练模型进行蛋白-蛋白相互作用方式的识别预测。在其中一个实施例中,从所述蛋白-蛋白相互作用晶体复合物中选取结构的标准为:具有空间三维结构分辨率≤3埃的蛋白-蛋白复合体结构。A2、构建E3泛素标记体系空间三维结构,包括以下步骤:Step1:对文献进行检索,确定并获得构成E3泛素化标记体系的亚基和蛋白;Step2:采用分段同源模建的方法补全E3泛素化标记体系组成蛋白的结构缺失;Step3:采用分子动力学方法,在生理环境中产生不同E3泛素化标记体系组成蛋白的三维空间结构;Step4:利用上述的卷积神经网络方法预测E3泛素标记体系各组成部分亚基的蛋白空间三维结构相互作用;Step5:采用分子动力学方法在体液环境中整体优化E3泛素标记体系;A3、预测泛素化降解的目标蛋白质。下载目标蛋白三维结构文件,使用同源建模的方法补全目标蛋白三维结构。利用上述的卷积神经网络方法预测目标蛋白与E3泛素标记体系的相互作用。然后,采用分子动力学方法优化E3泛素标记体系与目标蛋白相互作用的整体空间三维结构。根据体系的稳定性判断目标蛋白是否可能被该E3泛素标记体系标记,并通过泛素-蛋白酶体降解。本专利技术的有益效果是:与传统蛋白结晶试验所产生的泛素连接酶E3、目标蛋白和PROTAC三元复合物的三维结构相比,本专利技术的三元复合物预测方法可以在更短时间、更低花费的获得更多三元复合物的三维空间结构,并且弥补了蛋白结晶试验无法获得的一些三元复合物晶体结构。使得药物化学家可以直接根据预测的结构进行基于空间结构的药物设计,实现“不可成药”蛋白的可药性,使得基于结构改造PROTAC成为可能,让缩短和改造PROTAC的Linker成为可能,大大提高了PROTAC双功能嵌合分子的PK/PD改造性。附图说明图1为实施方式的泛素化降解目标蛋白的预测方法流程示意图。图2为实施例1的E3泛素标记体系与目标蛋白质纤维化蛋白Smad3相互作用方式的三维空间结构模型。具体实施方式为了便于理解本专利技术,下面对本专利技术进行更全面的描述。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容的理解更加透彻全面。除非另有定义,本文所使用的所有技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。参照图1,一种泛素化降解目标蛋白质的预测方法,其中包含以下步骤:A1、采用卷积神经网络方法预测蛋白亚基的相互作用,包括以下步骤:Step1:从PDB蛋白质数据库中选取空间三维结构分辨率≤3埃的蛋白-蛋白复合物三维结构并下载pdb或cif文件,然后使用python编程截取pdb或cif文件中包含蛋白质原子三维坐标的数据,保存成一个新的pbd或cif文件;Step2:使用python编程计算上一步得到的蛋白-蛋白复合物三维结构中蛋白-蛋白相互作用界面上的氨基酸残基的类型和频次,从而生成蛋白-蛋白相互作用氨基酸残基的数据库;Step3:利用卷积神经网络提取所述相互作用的氨基酸残基的特征,随机分为80%的训练集和20%的测试集,将训练集用于训练模型的识别训练,然后利用测试集对所述训练模型进行蛋白-蛋白相互作用方式的识别预测。具体地,使用卷积层和池化层从相互作用的氨基酸本文档来自技高网
...

【技术保护点】
1.一种泛素化降解目标蛋白质的预测方法,其特征在于,包括如下步骤:A1、采用卷积神经网络方法预测蛋白‑蛋白相互作用,包括以下步骤:Step1:从PDB蛋白质数据库中收集蛋白‑蛋白复合体的空间三维结构;Step2:依据所述具有空间结构分辨率的蛋白‑蛋白复合物作为模型,计算蛋白‑蛋白相互作用界面上氨基酸残基的类型和频次,生成蛋白‑蛋白相互作用氨基酸残基的数据库;Ste:3:利用卷积神经网络提取所述相互作用氨基酸残基的特征,随机分为80%的训练集和20%的测试集,将训练集用于训练模型的识别训练,然后利用测试集对所述训练模型进行蛋白‑蛋白相互作用方式的识别预测;在其中一个实施例中,从所述蛋白‑蛋白相互作用晶体复合物中选取结构的标准为:具有空间三维结构分辨率≤3埃的蛋白‑蛋白复合体结构;A2、构建泛素标记体系空间三维结构,包括以下步骤:Step1:对文献进行检索,确定并获得构成泛素化标记体系的亚基和蛋白;Step2:采用分段同源模建的方法补全泛素化标记体系组成蛋白的结构缺失;Step3:采用分子动力学方法,在生理环境中产生不同泛素化标记体系组成蛋白的三维空间结构;Step4:利用上述的卷积神经网络方法预测泛素标记体系各组成部分蛋白空间三维结构的相互作用;Step5:采用分子动力学方法在体液环境中整体优化泛素标记体系;A3、预测泛素标记体系降解的目标蛋白;下载目标蛋白三维结构文件,使用同源建模的方法补全目标蛋白三维结构;利用上述的卷积神经网络方法预测目标蛋白与泛素标记体系的相互作用;然后,采用分子动力学方法优化泛素标记体系与目标蛋白相互作用的整体空间三维结构;根据体系的稳定性判断目标蛋白是否可能被该泛素标记体系标记,并通过泛素‑蛋白酶体降解。...

【技术特征摘要】
1.一种泛素化降解目标蛋白质的预测方法,其特征在于,包括如下步骤:A1、采用卷积神经网络方法预测蛋白-蛋白相互作用,包括以下步骤:Step1:从PDB蛋白质数据库中收集蛋白-蛋白复合体的空间三维结构;Step2:依据所述具有空间结构分辨率的蛋白-蛋白复合物作为模型,计算蛋白-蛋白相互作用界面上氨基酸残基的类型和频次,生成蛋白-蛋白相互作用氨基酸残基的数据库;Ste:3:利用卷积神经网络提取所述相互作用氨基酸残基的特征,随机分为80%的训练集和20%的测试集,将训练集用于训练模型的识别训练,然后利用测试集对所述训练模型进行蛋白-蛋白相互作用方式的识别预测;在其中一个实施例中,从所述蛋白-蛋白相互作用晶体复合物中选取结构的标准为:具有空间三维结构分辨率≤3埃的蛋白-蛋白复合体结构;A2、构建泛素标记体系空间三维结构,包括以下步骤:Step1:对文献进行检索,确定并获得构成泛素化标记体系的亚基和...

【专利技术属性】
技术研发人员:蔡鑫胡伟王力强
申请(专利权)人:成都分迪科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1