转录因子蛋白在DNA上的运动过程分析方法和装置制造方法及图纸

技术编号:33462977 阅读:43 留言:0更新日期:2022-05-19 00:43
本发明专利技术提供了一种转录因子蛋白在DNA上的运动过程分析方法和装置。所述方法包括获取WRKY结构域蛋白在DNA双链上运动的全原子MD模拟轨迹作为初始路径;从初始路径中均匀提取出若干帧的WRKY结构域蛋白与DNA的构象作为第一构象;计算均方根距离以及旋转角度,利用K

【技术实现步骤摘要】
转录因子蛋白在DNA上的运动过程分析方法和装置


[0001]本专利技术一般涉及分子动力学和生物计算领域,并且更具体地,涉及一种转录因子蛋白在DNA上的运动过程分析方法和装置。

技术介绍

[0002]转录因子蛋白在DNA上的一维滑动对于转录因子在遗传调控中定位目标DNA位点的便利扩散至关重要。转录因子往往需要交替性地在DNA的非特异性序列上进行一维随机行走扩散(1D diffusion),以便有效地搜索特异性DNA识别位点;而寻找靶位点的速率和准确性也直接影响了基因表达的效率和精准度。
[0003]虽然转录因子蛋白的上述扩散模型已经比较明晰,但扩散过程中的精细分子动力学尚不甚明了,尤其是发生在微秒和毫秒之间的蛋白在DNA碱基或纳米尺度上的运动,在目前的实验测量精度上还难以直接观测。

技术实现思路

[0004]根据本专利技术的实施例,提供了一种转录因子蛋白在DNA上的运动过程分析方案。本方案通过建立马尔科夫态模型,为生物分子最基本的构象变化确定一个缩小的动力学网络模型,可以提供在实验或者直接模拟中无法得出的有效物理机制。...

【技术保护点】

【技术特征摘要】
1.一种转录因子蛋白在DNA上的运动过程分析方法,其特征在于,包括:获取WRKY结构域蛋白在DNA双链上运动的全原子MD模拟轨迹作为初始路径;从所述初始路径中均匀提取出若干帧的WRKY结构域蛋白与DNA的构象作为第一构象;计算蛋白质骨架α碳原子的均方根距离以及蛋白质围绕DNA的旋转角度,利用K

means算法对所述第一构象进行聚类,得到一次聚类结果,并从所述一次聚类结果中每个聚类对应的中心构象出发,进行第一轮MD模拟,得到第二构象;利用K

centers算法对所述第二构象进行聚类,得到二次聚类结果,并从所述二次聚类结果中每个聚类对应的中心构象出发,在广泛空间中进行第二轮MD模拟,得到第三构象;利用所述第三构象构建马尔可夫态模型,对所述第二轮MD模拟轨迹进行分析。2.根据权利要求1所述的方法,其特征在于,所述计算蛋白质骨架α碳原子的均方根距离以及蛋白质围绕DNA的旋转角度,包括:将初始晶体结构中的DNA双链的长轴设置为X轴,将整个DNA分子的质心设置为空间坐标的原点;以DNA双链的中间靠近蛋白质的若干碱基对为基准,将所述第一构象与初始晶体结构进行对齐操作;计算对齐后的蛋白质骨架α碳原子的均方根距离;以蛋白质质心到原点连线的向量投影至YZ平面;所述YZ平面为垂直与X轴且过原点的平面;设置初始晶体结构初始角度为0,计算对齐操作后的第一构象与初始晶体结构的向量投影之间的角度,作为蛋白质围绕DNA的旋转角度。3.根据权利要求1所述的方法,其特征在于,所述第一轮MD模拟,得到第二构象,包括:在parmbsc1力场下,为所述一次聚类结果中每个聚类对应的中心结构建立对应的全原子模拟系统;在NPT系综设置时间步长以及随机初始速度,对所述全原子模拟系统进行MD模拟,得到第一轮MD模拟轨迹;删除所述第一轮MD模拟轨迹中每个模拟轨迹初始一段时间段内的构象,将剩余的模拟轨迹中的全部构象,作为第二构象。4.根据权利要求1所述的方法,其特征在于,所述利用K

centers算法对所述第二构象进行聚类,包括:选择蛋白质和DNA之间存在形成氢键和盐桥可能性的若干个距离对作为聚类的输入参数,利用K

centers算法,对所述第二构象进行聚类。5.根据权利要求1所述的方法,其特征在于,所述在广泛空间中进行第二轮MD模拟,得到第三构象,包括:选择所述二次聚类结果中每个聚类对应的中心构象的全原子模拟系统作为第二轮MD模拟的初始系统;在NPT系综设置时间步长和随机初始速度,对所述第二轮MD模拟的初始系统进行MD模拟,得到第二轮MD模拟轨迹;删除所述第二轮MD模拟轨迹中每个模拟轨迹初始一段时间段内的构象,将剩余的模拟轨迹中的全部构象作为第三构象。
6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:鄂超伍庭晨谢潇贾慧彤
申请(专利权)人:北京帝测科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1