【技术实现步骤摘要】
基于像素图表征和CNN的可解释性分子动力学轨迹分析方法
[0001]本专利技术涉及机器学习和分子动力学模拟
,具体的说,是一种基于像素图表征和CNN的可解释性分子动力学轨迹分析方法。
技术介绍
[0002]分子动力学模拟(MD)是随着计算机技术的发展而兴起的一项用于模拟生物分子运动变化的技术,解释实验中观察到的现象为其提供理论依据,同时也可以对难以完成的实验进行指导和预测。近年来,随着系统规模以及可达到的模拟时间尺度的显著增加,MD模拟可以产生大量的原始数据,以人工方式对这些数据进行分析是非常困难的,并且还有可能产生一定的人为偏差。对MD模拟轨迹的分析通常涉及处理大量高维数据以搜索重要特征,这种问题可以用机器学习(ML)方法来解决,越来越多的数据以及有限的处理分析时间和资源使ML方法在各个领域逐渐兴起。但是,ML在MD轨迹分析领域存在的问题主要体现在以下几个方面:
[0003]1)在数据表征方面,描述符的计算会带来计算成本和信息损失;
[0004]2)在模型选择方面,所使用的机器学习模型大多比较简单,如 ...
【技术保护点】
【技术特征摘要】
1.一种基于像素图表征和CNN的可解释性分子动力学轨迹分析方法,其特征在于,包括:步骤S100、获取两条不同类别的MD轨迹数据集,MD轨迹数据集包括MD轨迹以及该MD轨迹的拓扑结构,将两条MD轨迹的原子和残基对应,并删除MD轨迹中的H原子;步骤S200、读取处理后的MD轨迹数据集,选取MD轨迹中的任意一帧作为参考帧,将MD轨迹数据集中的每一个构象叠加在参考帧上,实现MD轨迹空间上的偏差消除;步骤S300、对偏差消除后的MD数据集进行像素图表征,得到两组带有标签的像素图数据集;步骤S400、将像素图数据集按时间顺序分为N组,进行随机的五折划分,再进行拼接,得到最终的五折交叉验证数据集;步骤S500、构造卷积神经网络CNN模型,对五折交叉验证数据集进行模型训练和测试;步骤S600、构造解释器,对CNN模型进行切片,在每一个局部做线性拟合,并对每一个局部做线性模型的解释,得到对CNN模型的近似解释以及影响CNN模型分类决策的像素点,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。