一种分子光谱人工智能预测方法、系统、介质和设备技术方案

技术编号:38596439 阅读:21 留言:0更新日期:2023-08-26 23:32
本公开提供了一种分子光谱人工智能预测方法、系统、介质和设备,涉及人工智能预测技术领域提取分子结构数据,优化分子的几何结构,建立分子性质和分子光谱数据库;获取数据库中的原子坐标和原子类型,提取分子的各类标量、矢量、张量性质和光谱信息;构造初始原子特征和原子环境特征,利用消息传递函数和更新函数,将原子环境特征与等变向量相互作用,使用E(3)点群,通过张量积、不可约表示保证分子性质的等变,通过梯度追踪,实现对矢量、张量的解析,得到矢量、张量的导数信息,实现对各类分子光谱的预测。光谱的预测。光谱的预测。

【技术实现步骤摘要】
一种分子光谱人工智能预测方法、系统、介质和设备


[0001]本公开涉及人工智能预测
,具体涉及一种分子光谱人工智能预测方法、系统、介质和设备。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]分子光谱能够提供分子或者材料的“指纹信息”,实现分子的痕迹测量和构型识别,被广泛地应用在物理、生物、医药、环境、材料以及化工等领域。利用分子光谱识别分子结构式或者探究分子精细构型,主要有两种途径:光谱数据库检索方法和理论模拟试错方法。光谱数据库检索方法通过计算目标光谱与数据库中所有光谱的相似度,确定目标光谱所对应的分子结构。然而,光谱数据库检索方法存在着建设成本昂贵、覆盖率低等缺点,导致不包含在数据库内的分子无法得到识别。另外一方面,基于理论模拟的试错方法,可以通过“搭建模型

理论模拟

比对光谱

调整模型
→…”
的循环自洽过程,识别未知分子结构式或者探究分子的精细分子构型。试错方法严重依赖科研工作者的经验和直觉,并且涉及昂贵的电子结构计算和复杂的光谱模拟,导致效率低下。
[0004]随着大数据时代的到来,算力的显著提升和算法的逐步成熟,使得以数据驱动创新的研究手段,成为继实验、理论和模拟之后的第四种研究范式。自2011年起,深度学习——机器学习中一种基于对数据进行表征学习的算法,在计算机视觉、语音识别、自然语言处理与生物信息学等重要的信息
,取得了惊人的进展。但是,专利技术人发现,现有的人工智能方法依然存在对仪器和技术人员要求高、周期相对较长以及理论模拟过程繁琐等瓶颈问题。

技术实现思路

[0005]本公开为了解决上述问题,提出了一种分子光谱人工智能预测方法、系统、介质和设备,利用E(3)等变消息传递神经网络模型(DetaNet),进行快速的、准确、完备的分子性质预测和分子光谱模拟。
[0006]根据一些实施例,本公开采用如下技术方案:
[0007]一种分子光谱人工智能预测方法,包括:
[0008]提取分子结构数据,优化分子的几何结构,建立分子性质和分子光谱数据库;
[0009]获取数据库中的原子坐标和原子类型,提取分子的各类标量、矢量、张量性质和光谱信息;
[0010]构造初始原子特征和原子环境特征,利用消息传递函数和更新函数,将原子环境特征与等变向量相互作用,使用E(3)点群,通过张量积、不可约表示保证分子性质的等变,通过梯度追踪,实现对矢量、张量的解析,得到矢量、张量的导数信息,实现对各类分子光谱的预测。
[0011]根据一些实施例,本公开采用如下技术方案:
[0012]一种分子光谱人工智能预测系统,包括:
[0013]分子提取模块,提取分子结构数据,优化分子的几何结构,建立分子性质和分子光谱数据库;
[0014]特征提取模块,获取数据库中的原子坐标和原子类型,提取分子的各类标量、矢量、张量性质和光谱信息;
[0015]预测模块,构造初始原子特征和原子环境特征,利用消息传递函数和更新函数,将原子环境特征与等变向量相互作用,使用E(3)点群,通过张量积、不可约表示保证分子性质的等变,通过梯度追踪,实现对矢量、张量的解析,
[0016]得到矢量、张量的导数信息,实现对各类分子光谱的预测。
[0017]根据一些实施例,本公开采用如下技术方案:
[0018]一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种分子光谱人工智能预测方法。
[0019]根据一些实施例,本公开采用如下技术方案:
[0020]一种终端设备,其特征在于,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种分子光谱人工智能预测方法。
[0021]与现有技术相比,本公开的有益效果为:
[0022]本公开的方法与现有的实验测量和理论计算技术相比,开发的基于E(3)等变消息传递神经网络的分子光谱人工智能预测方法(DetaNet)有助于研究者准确、高效地预测分子的红外、拉曼、紫外可见吸收、核磁共振光谱,降低时间成本、人力成本和测试成本,有望应用于物理、化学、材料、医疗、卫生、生物、制药、航天、军工等领域。
附图说明
[0023]构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
[0024]图1为本公开实施例的的系统架构图。
[0025]图2本公开实施例的方法流程图和功能模块图。
具体实施方式:
[0026]下面结合附图与实施例对本公开作进一步说明。
[0027]应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属
的普通技术人员通常理解的相同含义。
[0028]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0029]实施例1
[0030]本公开的一种实施例中提供了一种分子光谱人工智能预测方法,包括:
[0031]步骤一:提取分子结构数据,优化分子的几何结构,建立分子性质和分子光谱数据库;
[0032]步骤二:获取数据库中的原子坐标和原子类型,提取分子的各类标量、矢量、张量性质和光谱信息;
[0033]步骤三:构造初始原子特征和原子环境特征,利用消息传递函数和更新函数,将原子环境特征与等变向量相互作用,使用E(3)点群,通过张量积、不可约表示保证分子性质的等变,通过梯度追踪,实现对矢量、张量的解析,得到矢量、张量的导数信息,实现对各类分子光谱的预测。
[0034]建立分子性质和分子光谱数据库。针对目前QM9数据库缺乏分子高阶张量性质和分子光谱的缺点,本公开利用高通量的密度泛函理论计算,建立包含分子性质和分子光谱的数据库。具体包括:
[0035]首先,提取QM9数据库中13万个分子的结构文件,利用Gaussian16软件包,采用B3LYP/def

TZVP泛函基组,优化分子的几何结构。
[0036]其次,通过振动分析和含时微扰计算等得到红外光谱、拉曼光谱、UV

Vis光谱;通过Dalton程序包的响应场理论计算分子的非线性光学性质,得到分子的多光子吸收光谱;通过Demon

Stobe程序,计算分子的基态能量和完全芯态空穴能量,得到分子的X射线光谱。
[0037]以数据集为基础,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分子光谱人工智能预测方法,其特征在于,包括:提取分子结构数据,优化分子的几何结构,建立分子性质和分子光谱数据库;获取数据库中的原子坐标和原子类型,提取分子的各类标量、矢量、张量性质和光谱信息;构造初始原子特征和原子环境特征,利用消息传递函数和更新函数,将原子环境特征与等变向量相互作用,使用E(3)点群,通过张量积、不可约表示保证分子性质的等变,通过梯度追踪,实现对矢量、张量的解析,得到矢量、张量的导数信息,实现对各类分子光谱的预测。2.如权利要求1所述的一种分子光谱人工智能预测方法,其特征在于,提取分子的各类标量、矢量、张量性质包括:分子的能量、电荷以及轨道能级标量性质,偶极矩、偶极矩导数、跃迁偶极矩以及振子强度矢量性质;极化率、极化率导数、多极矩以及Hessian矩阵张量性质。3.如权利要求1所述的一种分子光谱人工智能预测方法,其特征在于,所述构造初始原子特征包括:使用NucleusOne

hot向量编译原子类型,使用布尔序列向量编译原子轨道电荷,经过可学习的线性层,将NucleusOne

hot向量与布尔向量相加,构造原子特征。4.如权利要求1所述的一种分子光谱人工智能预测方法,其特征在于,所述构造原子环境特征包括:针对每个原子,将截止半径以内的近临原子特征和距离特征,通过线性层拟合,卷积到每个原子,形成原子环境特征。5.如权利要求1所述的一种分子光谱人工智能预测方法,其特征在于,实现对各类分子光谱的预测包括训练跃迁偶极矩得到UV

Vis光谱;训练偶极矩对简正坐标的导数得到红外光谱;训练极化率对简正坐标的导数得到拉曼光谱;训练化学位移和屏蔽张量得到NMR光谱;训练超极化率模型得到多光子吸收光谱;训练分子完全芯态...

【专利技术属性】
技术研发人员:胡伟邹子涵张玉瑾
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1