基于人工智能的生物大分子量子力学特性计算方法及系统技术方案

技术编号:35486782 阅读:15 留言:0更新日期:2022-11-05 16:40
本发明专利技术涉及一种基于人工智能的生物大分子量子力学特性计算方法及系统,通过将生物大分子以基本组成单元为基础进行化学键切割,得到多种分块结构,进行构象采样得到若干分块构象,选择量子力学方法对分块构象量化计算,得到各分块构象的量化计算结果和构象量化数据集,建立不同分块结构的特征工程,并搭建相应的初始模型,并将构象量化数据集作为训练集,将量化计算结果作为标签对初始模型进行训练,得到不同分块结构的势能面预测模型;将不同分块结构的势能面预测模型与力场参数进行整合,得到生物大分子体系的势能面预测模型,对待测生物大分子进行量子力学特性计算。本发明专利技术能够提高生物大分子体系的量子力学特性的计算精度和计算效率。度和计算效率。度和计算效率。

【技术实现步骤摘要】
基于人工智能的生物大分子量子力学特性计算方法及系统


[0001]本专利技术涉及人工智能和生物医药
,特别是涉及一种基于人工智能的生物大分子量子力学特性计算方法及系统。

技术介绍

[0002]生物医药、食品保健、工业生产等领域的发展都离不开生物技术的发展。生物医药研究是人民生命健康和国民经济稳定的基础支撑,被公认为21世纪最有前途的产业之一。随着生物技术的发展和产业化需求的不断升级,生物医药等科学研究的生物体系越来越大,越来越复杂,现有实验手段和计算方法已经无法满足生物体系研究的精度、效率和成本要求。生物体系的实验研究包括结构解析、活性测试、性能表征等复杂过程,通常需要冷冻电镜、细胞房、蛋白纯化仪、以及液相色谱仪等生物化学、分子生物学研究设备,对人力、物力和财力的要求非常高,而且存在巨大的风险。随着计算机领域的不断发展,计算生物学和生物信息学也取得了巨大进步,在生物体系高效计算、结构改造等方面发挥了重要作用,而且有助于从基础理论层面对实验现象和生物体系性能功能做出机制解析。然而,目前多数基于力场和经验的计算方法无法达到和实验接近的计算结果。量子力学方法作为计算领域的黄金标准,理论上能够达到最高精度,但是这类方法计算复杂度极高,计算量巨大,无法直接应用于结构复杂的生物大分子体系能量和性质计算,严重限制了生物医药等领域中药物、酶蛋白等分子筛选和改造的发展。
[0003]近年来,人工智能技术的快速发展已经成为各领域不可忽视的技术手段。其中包含了模型、策略和算法三要素的机器学习方法能够在大数据中挖掘背后隐藏的物理化学信息和结构

性质功能机制,极大提高计算效率。虽然机器学习方法在化学、材料科学以及生物信息学领域获得了广泛的应用,但是机器学习方法在生物大分子体系中的应用仍然存在巨大挑战。首先机器学习模型通常只针对单一体系和单一性质,无法实现跨体系(比如不同蛋白质,RNA和DNA分子)和多性质(能量、稳定性、生物活性等)的预测。其次机器学习方法一般具有黑盒子特性,无法给出物理化学机制的解析。最后,机器学习模型的质量主要依赖于数据集的数量和质量,而量子力学方法的高计算复杂度使得生物大分子体系的高质量量化数据难以获取,从而无法实现构建可靠的机器学习模型,在量子力学方法精度水平上研究生物大分子体系。
[0004]如何以人工智能技术为基础,实现生物大分子体系不同任务(能量、原子力以及性质功能)在量子力学精度下的高效计算和作用机制解析,是计算生物学领域亟待进一步解决的重大难题。

技术实现思路

[0005]本专利技术的目的是提供一种基于人工智能的生物大分子量子力学特性计算方法及系统,能够提高生物大分子体系的量子力学特性的计算精度和计算效率。
[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]本专利技术提供了一种基于人工智能的生物大分子量子力学特性计算方法,所述方法包括:
[0008]获取生物大分子,并将所述生物大分子以基本组成单元为基础进行化学键切割,得到多种分块结构;所述生物大分子包括蛋白质、RNA、DNA中的任意一种;
[0009]对各所述分块结构进行构象采样,得到若干分块构象,并选择量子力学方法对所有分块构象进行量化计算,得到每个分块构象对应的量化计算结果,并确定不同分块结构的构象量化数据集;所述量化计算结果包括能量和原子力;
[0010]基于不同分块结构的构象量化数据集,建立不同分块结构的特征工程;
[0011]基于不同分块结构的特征工程,分别搭建相应的初始模型,并将所述构象量化数据集作为训练集,将所述量化计算结果作为标签,对所述初始模型进行训练,得到不同分块结构的势能面预测模型;
[0012]将不同分块结构的所述势能面预测模型与基础力场参数进行整合,得到生物大分子体系的势能面预测模型;
[0013]通过所述生物大分子体系的势能面预测模型对待测生物大分子进行量子力学特性计算。
[0014]可选地,在所述将所述生物大分子以基本组成单元为基础进行化学键切割时,在分块结构的两端添加共轭帽末端基团,以平衡和恢复分块结构的局部化学环境。
[0015]可选地,所述对各所述分块结构进行构象采样,得到若干分块构象,并选择对应量子力学方法对所有分块构象进行量化计算,得到每个构象结构对应的量化计算结果,并确定不同分块结构的构象量化数据集,具体包括:
[0016]采用Amber软件对各所述分块结构进行交换副本动力学模拟,同时在模拟过程中对各所述分块结构的骨架原子进行手性限制;
[0017]基于设定步长,完成对各分块结构设定时间的动力学模拟,得到各分块结构的动力学模拟动态轨迹;
[0018]按照设定间隔,从所述动力学模拟动态轨迹中抓取设定数量的构象,分别得到不同分块构象的三维坐标信息;
[0019]基于不同分块构象的三维坐标信息,采用量子力学方法对各所述分块构象进行量化计算,得到每个分块构象对应的量化计算结果;
[0020]根据每个构象结构对应的量化计算结果以及不同分块构象的三维坐标信息,通过数据整合得到不同分块结构的构象量化数据集。
[0021]可选地,所述通过所述生物大分子体系的势能面预测模型对待测生物大分子进行量子力学特性计算,具体包括:
[0022]通过将不同分块结构的势能面模型预测结果累加,并减去分块结构之间重叠部分的势能面预测结果,再加上通过基础力场参数计算的远程相互作用结果,得到待测生物大分子的量子力学特性计算结果。
[0023]可选地,当所述生物大分子为蛋白质时,所述基础力场为protein.fb15、protein.ff14SB或protein.f19SB;
[0024]当所述生物大分子为RNA质时,所述基础力场为RNA.OL3或RNA.ROC;
[0025]当所述生物大分子为DNA时,所述基础力场为DNA.BSC1或DNA.OL15。
[0026]为实现上述目的,本专利技术还提供了如下方案:
[0027]一种基于人工智能的生物大分子量子力学特性计算系统,所述系统包括:
[0028]分块结构获取单元,用于获取生物大分子,并将所述生物大分子以基本组成单元为基础进行化学键切割,得到多种分块结构;所述生物大分子包括蛋白质、RNA、DNA中的任意一种;
[0029]构象量化数据集确定单元,用于对各所述分块结构进行构象采样,得到若干分块构象,并选择量子力学方法对所有分块构象进行量化计算,得到每个分块构象对应的量化计算结果,并确定不同分块结构的构象量化数据集;所述量化计算结果包括能量和原子力;
[0030]特征工程建立单元,用于基于不同分块结构的构象量化数据集,建立不同分块结构的特征工程;
[0031]不同分块结构的势能面预测模型构建单元,用于基于不同分块结构的特征工程,分别搭建相应的初始模型,并将所述构象量化数据集作为训练集,将所述量化计算结果作为标签,对所述初始模型进行训练,得到不同分块结构的势能面预测模型;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的生物大分子量子力学特性计算方法,其特征在于,所述方法包括:获取生物大分子,并将所述生物大分子以基本组成单元为基础进行化学键切割,得到多种分块结构;所述生物大分子包括蛋白质、RNA、DNA中的任意一种;对各所述分块结构进行构象采样,得到若干分块构象,并选择量子力学方法对所有分块构象进行量化计算,得到每个分块构象对应的量化计算结果,并确定不同分块结构的构象量化数据集;所述量化计算结果包括能量和原子力;基于不同分块结构的构象量化数据集,建立不同分块结构的特征工程;基于不同分块结构的特征工程,分别搭建相应的初始模型,并将所述构象量化数据集作为训练集,将所述量化计算结果作为标签,对所述初始模型进行训练,得到不同分块结构的势能面预测模型;将不同分块结构的所述势能面预测模型与基础力场参数进行整合,得到生物大分子体系的势能面预测模型;通过所述生物大分子体系的势能面预测模型对待测生物大分子进行量子力学特性计算。2.根据权利要求1所述的基于人工智能的生物大分子量子力学特性计算方法,其特征在于,在所述将所述生物大分子以基本组成单元为基础进行化学键切割时,在分块结构的两端添加共轭帽末端基团,以平衡和恢复分块结构的局部化学环境。3.根据权利要求1所述的基于人工智能的生物大分子量子力学特性计算方法,其特征在于,所述对各所述分块结构进行构象采样,得到若干分块构象,并选择对应量子力学方法对所有分块构象进行量化计算,得到每个构象结构对应的量化计算结果,并确定不同分块结构的构象量化数据集,具体包括:采用Amber软件对各所述分块结构进行交换副本动力学模拟,同时在模拟过程中对各所述分块结构的骨架原子进行手性限制;基于设定步长,完成对各分块结构设定时间的动力学模拟,得到各分块结构的动力学模拟动态轨迹;按照设定间隔,从所述动力学模拟动态轨迹中抓取设定数量的构象,分别得到不同分块构象的三维坐标信息;基于不同分块构象的三维坐标信息,采用量子力学方法对各所述分块构象进行量化计算,得到每个分块构象对应的量化计算结果;根据每个构象结构对应的量化计算结果以及不同分块构象的三维坐标信息,通过数据整合得到不同分块结构的构象量化数据集。4.根据权利要求1所述的基于人工智能的生物大分子量子力学特性计算方法,其特征在于,所述通过所述生物大分子体系的势能面预测模型对待测生物大分子进行量子力学特性计算,具体包括:通过将不同分块结构的势能面模型预测结果累加,并减去分块结构之间重叠部分的势能面预测结果,再加上通过基础力场参数计算的远程相互作用结果,得到待测生物大分子的量子力学特性计算结果。5.根据权利要求1所述的基于人工智能的生物大分子量子力学特性计算方法,其特征
在于,当所述生物...

【专利技术属性】
技术研发人员:李金金韩彦强汪志龙
申请(专利权)人:上海茵肽信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1