BP神经网络预测二肽模型多极展开属性计算方法技术

技术编号:11614165 阅读:124 留言:0更新日期:2015-06-17 14:06
本发明专利技术涉及基于BP神经网络预测二肽模型多极展开属性计算方法,包括以下步骤:通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离;选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络,得到BP神经网络的物理化学参数;并通过剩余的二肽构象作为测试集验证BP神经网络的预测结果。本发明专利技术通过BP神经网络预测代替量子力学计算Gaussian软件进行的量子力学计算。在基于力场信息的分子力学模拟的基础上,本发明专利技术可以快速的针对不同构象给出二肽的能量,多极距等物理化学参数等信息。在可接受的误差范围内,极大地减少了计算的时间和计算量,大大地提高了动力学模拟过程中的精度。

【技术实现步骤摘要】
BP神经网络预测二肽模型多极展开属性计算方法
本专利技术属于量子力学与分子力学计算相结合,计算方法和人工智能领域,具体涉及一种通过BP神经网络预测二肽模型多极展开属性的计算方法。
技术介绍
分子模拟(MolecularSimulation)是二十世纪后期发展起的一种基于计算机的模拟方法。随着量子力学理论的完善、经验力场的更新换代以及计算机硬件发展所推动的计算速度和容量提升,分子模拟的理论和方法得到了飞速的发展,并已经在众多学科及应用领域发挥着关键作用。从模拟的原理进行区分,分子模拟可以分为两大类:理论计算的量子力学模拟QM(QuantumMechanics)和经验计算的分子力学模拟MM(MolecularMechanics)。量子力学主要是指利用计算机技术进行的量子力学模拟和计算,即计算的量子力学,它可以精确地表达电子的运动,能够得到依赖于电子分布的性质。因为大分子体系在原子分辨率下包含数以千记甚至是万记的原子,所以对其进行动力学模拟是非常具有挑战性的工作。QM巨大的计算量使得得到精确解变的非常耗时。分子力学模拟则是建立在经验力场(Forcefield)的基础之上,是不同原子力场类型的定义及不同价键和非键能量表达形式的集合体。与量子力学相比,分子力学忽略了电子运动,可以大大节约计算时间,因而可用于计算包含上万个粒子数目的体系。从本质上说,分子力学是对真实势能函数的近似拟合。由于忽略了电子的运动,分子力学无法获得那些取决于分子中电子分布的性质。分子动力学模拟已经被广泛地应用于模拟生物分子体系。而进行分子动力学模拟必须使用描述原子之间相互作用势的分子力场。目前,大多数使用的分子力场采用的是以固定点电荷模型来描述静电相互作用。尽管量子力学与分子力学混合(QM/MM)的方法已经被使用了很长的一段时间,但是由于它本身固有的点电荷模型以及单向极化作用,在很多情况下应用依旧存在着很大的局限性。目前,被广泛应用于生命科学领域中几种主要力场力场1:AMBERAMBER(AssistedModelBuildingwithEnergyRefinement)力场是在生物大分子的模拟计算领域有着广泛应用的一个分子力场。主要适用于比较小的蛋白质,核酸,多醣等分子。最初AMBER力场是专门为了计算蛋白质和核酸体系而开发的,计算其力场参数的数据均来自实验值。在AMBER力场中,-CH2-和-CH3作为联合原子出现,并考虑氢键的相互作用。AMBER力场的势能函数形势较为简单,所需参数不多,计算量也比较小,这是这个力场的一大特色,但是总体来讲,AMBER力场的优势在于对生物大分子的计算,其对小分子体系的计算结果常常不能令人满意,也在一定程度上限制了这个力场的扩展性。力场2:CHARMCHARM(ChemistryatHarvardMacromolecularMechanics)力场参数除了来自计算结果与实验值的比对外,还引用了大量的量子力学计算的结果。此力场可应用于研究许多分子系统,包括小的有机分子、溶液、聚合物,生化分子等。CHARM力场能够进行能量优化MD和MC模拟,并且可以应用周期边界条件,但它不支持氢键的计算。所以,几乎除了有机金属分子外,通常皆可得到与实验值相近的数值。力场3:OPLSOPLS(OptimizedPotentialsforLiquidSimulations)是一个模拟有机分子和多肽的分子力场。它有组合原子模型(OPLS_UA)和全原子模型(OPLS_AA)两种。它的键伸缩和弯曲参数是由AMBER力场修改得到的。该力场致力于计算气态有机分子的构象能和纯有机液体的水合自由能及其它热力学性质。力场4:AMOEBAAMOEBA(AtomicMultipoleOptimizedEnergeticforBiomolecularSimulation)是可极化分子力场,其是基于多极距离以及考虑了诱导偶极效应的一个力场,此力场已经被提出了很多年,并广泛应用于生物科学领域。对于同一个需要计算的体系中氨基酸中的二肽模型的不同构象,现有的大多数力场以各自的同一套参数对原子的物理化学参数进行描述。它们不考虑原子之间的极化效应,这与现实的情况具有一定的差异。AMOEBA考虑这一现象,但依旧是对各种构象物理化学参数的一种综合,达不到针对特定构象有其特定物理化学参数用以描述原子状态的程度。
技术实现思路
为了克服现有力场的各种不足,本专利技术提出了一种基于BP神经网络预测二肽模型多极展开属性的计算方法,本专利技术采用的技术方案是:基于BP神经网络预测二肽模型多极展开属性计算方法,包括以下步骤:通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离;选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络,得到BP神经网络的物理化学参数;并通过剩余的二肽构象作为测试集验证BP神经网络的预测结果。所述物理化学参数包括能量、电荷、偶极距、四极距。所述通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离包括以下步骤:从数据库中选择二肽构象模型,并通过Gaussian软件优化得到二肽构象,经量子力学计算得到二肽构象的能量、电荷、偶极距、四极距;通过二肽构象中各原子的位置得到各原子之间的相互距离。所述选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络包括以下步骤:将二肽构象的能量、电荷、偶极距、四极距作为BP神经网络的输出,将各原子之间的相互距离作为BP神经网络的输入;随机选择数据库中的部分数据作为训练集数据用于训练BP神经网络。所述通过剩余的二肽构象作为测试集验证BP神经网络的预测结果包括以下步骤:从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能验证神经网络的预测结果;从数据库中选择剩余的二肽构象模型,通过二肽构象与水分子之间的相互作用能验证神经网络的预测结果;随机生成若干对二肽构象,通过随机生成的二肽构象之间的相互作用能验证神经网络的预测结果;随机生成若干对二肽构象,通过随机生成的二肽构象与水分子之间的相互作用能验证神经网络的预测结果。所述从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能验证神经网络的预测结果包括以下步骤:从数据库中选择剩余的二肽构象模型,得到两个二肽构象之间的相对位置,并通过量子力学计算软件Gaussian得到两个二肽构象之间的相互作用能A;根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到两个二肽构象之间的相互作用能B;将相互作用能A作为真值,通过统计分析误差验证预测结果。所述从数据库中选择剩余的二肽构象模型,通过二肽构象与水分子之间的相互作用能验证神经网络的预测结果包括以下步骤:从数据库中选择剩余的二肽构象模型,得到二肽构象与水分子的相对位置,并通过量子力学计算软件Gaussian得到二肽构象与水分子之间的相互作用能C;根据所得的BP神经网络的物理化学参数、通过分子力学软件Tinker得到二肽构象与水分子之间的相互作用能D;将相互作用能C作为真值,通过统计分析误差验证预测结果。所述随机生成若干对二肽构象,通过随机生成的二肽构象之间的相互作用能验证神经网络的预本文档来自技高网
...
BP神经网络预测二肽模型多极展开属性计算方法

【技术保护点】
基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于包括以下步骤:通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离;选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络,得到BP神经网络的物理化学参数;并通过剩余的二肽构象作为测试集验证BP神经网络的预测结果。

【技术特征摘要】
1.基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于包括以下步骤:通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离;选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络,得到BP神经网络的物理化学参数;并通过剩余的二肽构象作为测试集验证BP神经网络的预测结果;所述通过剩余的二肽构象作为测试集验证BP神经网络的预测结果包括以下步骤:从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能验证神经网络的预测结果;从数据库中选择剩余的二肽构象模型,通过二肽构象与水分子之间的相互作用能验证神经网络的预测结果;随机生成若干对二肽构象,通过随机生成的二肽构象之间的相互作用能验证神经网络的预测结果;随机生成若干对二肽构象,通过随机生成的二肽构象与水分子之间的相互作用能验证神经网络的预测结果。2.根据权利要求1所述的基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于:所述物理化学参数包括能量、电荷、偶极距、四极距。3.根据权利要求1所述的基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于:所述通过量子力学计算软件Gaussian优化不同二肽构象的结构,并计算其物理化学参数及原子间相互距离包括以下步骤:从数据库中选择二肽构象模型,并通过Gaussian软件优化得到二肽构象,经量子力学计算得到二肽构象的能量、电荷、偶极距、四极距;通过二肽构象中各原子的位置得到各原子之间的相互距离。4.根据权利要求1所述的基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于:所述选择部分二肽构象的原子的物理化学参数以及原子间相互距离训练BP神经网络包括以下步骤:将二肽构象的能量、电荷、偶极距、四极距作为BP神经网络的输出,将各原子之间的相互距离作为BP神经网络的输入;随机选择数据库中的部分数据作为训练集数据用于训练BP神经网络。5.根据权利要求1所述的基于BP神经网络预测二肽模型多极展开属性计算方法,其特征在于所述从数据库中选择剩余的二肽构象模型,通过两个二肽构象之间的相互作用能...

【专利技术属性】
技术研发人员:李国辉李焱彭向达张鼎林
申请(专利权)人:中国科学院大连化学物理研究所
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1