面向先导化合物合成与筛选的三维分子结构仿真方法技术

技术编号:38809223 阅读:15 留言:0更新日期:2023-09-15 19:48
一种面向先导化合物合成与筛选的三维分子结构仿真方法,将分子的三维空间结构建模为三维图结构,选取三维图的中心原子节点及其邻居节点的编码输入含参数的量子参数电路中,基于量子机器学习技术从图结构中得到完整的分子表示;再将分子表示进行分子性质预测和/或解决三维分子几何生成问题,对药物生成中的先导化合物进行筛选和预合成,实现仿真。本发明专利技术能够带来参数化量子电路最主要的性能提升,即参数量的大幅度下降,借用指数级别的希尔伯特空间对编码的特征进行映射,使能够仅用很少的参数就完成学习的同时避免量子层析带来的巨大开销,高效获得实数域的分子表征。高效获得实数域的分子表征。高效获得实数域的分子表征。

【技术实现步骤摘要】
面向先导化合物合成与筛选的三维分子结构仿真方法


[0001]本专利技术涉及的是一种计算机分子仿真领域的技术,具体是一种面向先导化合物合成与筛选的三维分子结构仿真方法。

技术介绍

[0002]目前已有的分子结构表征方案多为经典图方法,分子由于其结构原因,能够很自然地被建模为一个图。随着深度学习的发展,图神经网络的发展给予一个处理图数据的极佳工具。借由图神经网络,使得特征信息能够在图上传递,从而获取完整的图表征。具有相同数量种类原子的分子如具有不同的三维空间构型,则两者性质可能完全不同,因此复杂的信息量对现有的预测方法的信息编码计算量要求较大,无法满足当前工业需要。

技术实现思路

[0003]本专利技术针对现有图学习技术无法满足不同空间结构下分子性质不同的问题,以及现有的神经网络对于分子结构中坐标信息识别方面的不足,提出一种面向先导化合物合成与筛选的三维分子结构仿真方法,从三维坐标提取特征,基于量子参数电路的三维分子结构表征模型,面相药物设计过程中的先导化合物的筛选与合成。
[0004]本专利技术是通过以下技术方案实现的:
[0005]本专利技术涉及一种面向先导化合物合成与筛选的三维分子结构仿真方法,将分子的三维空间结构建模为三维图结构,选取三维图的中心原子节点及其邻居节点的编码输入含参数的量子参数电路中,基于量子机器学习技术从图结构中得到完整的分子表示;再将分子表示进行分子性质预测和/或解决三维分子几何生成问题,对药物生成中的先导化合物进行筛选和预合成,实现仿真。
[0006]本专利技术涉及一种实现上述方法的系统,包括:位于量子计算机端的量子比特编码单元、三维特征学习单元、原子表征提取单元以及位于经典计算机端的后处理单元,其中:量子比特编码单元根据原子的三维空间相对位置信息以及原子种类信息,进行角度编码,得到蕴含相应信息的量子比特;三维特征学习单元基于量子线路,对编码后的量子比特进行酉变换,在高维希尔伯特空间中获取相应原子的量子态表征;原子表征提取单元根据量子线路的运行得到的量子末态,进行泡利Z测量,得到实数向量的原子表征;后处理单元根据仿真需求对原子表征进行分子性质预测和/或生成三维分子的几何结构,用于对药物生成中的先导化合物进行筛选和预合成。技术效果
[0007]本专利技术通过量子图表征学习算法对空间坐标展现出更好地表征能力,相比现有技术仅用少量的量子比特就能逐步吃下整张图,从而避免过多量子比特数带来的影响。同时少量的量子比特数也使得量子计算模型中的参数量非常少,这样的学习模式相较于传统机器学习在训练中有很大的优势。
附图说明
[0008]图1为本专利技术流程图;
[0009]图2为量子三维嵌入式学习参数电路示意图。
具体实施方式
[0010]如图1所示,为本实施例涉及一种面向先导化合物合成与筛选的三维分子结构仿真方法,包括:
[0011]步骤1、将分子的三维空间结构建模为三维图结构,该分子上的每个原子对应三维图中的节点,原子与原子之间的键对应图中的连边,整个分子包含的原子个数图中的节点数;
[0012]步骤2、选取三维图的中心原子节点及其邻居节点的编码输入含参数的量子参数电路中,通过更新参数电路中的参数,基于量子机器学习技术从图结构中的每一个节点提取出一个特征,从而学习得到完整的分子表示。
[0013]所述的编码是指:使用两个量子比特编码当前原子。
[0014]所述的编码,具体包括:
[0015]①
将与待编码原子距离在特定阈值内的节点选为邻居节点,邻居节点的位置信息和性质通过选取的中心节点的相对距离以及原子种类表征,即四元组其中:a为邻居节点的原子种类,d为邻居节点到中心节点的距离,θ为旋转角,为扭转角。
[0016]②
选取Rx和Ry两个旋转门,在一个量子比特上编码两维的数据,具体为:用两个量子比特编码步骤

中四元组的一个原子,即将两个旋转角θ和编码到量子比特1上,然后将距离d和种类a编码到比特2上。
[0017]需要注意这里为将一个任意实数转化为一个旋转角度,选择将d转化为d/d
max
*2π,a转化为a/a
num
*2π,其中:d
max
为整个数据集中每个原子最大的度,a
num
为整个数据集中原子的种类,a是一个1到a
num
的整数。
[0018]所述的两个量子比特的表达式为:所述的两个量子比特的表达式为:其中:U
x
与U
y
分别为含参数的绕x轴和y轴的旋转门对应的酉阵,i指的是中心节点,j指代当前邻居节点。
[0019]③
将每个原子所对应的两个量子比特都张量积为一个新的量子态作为量子参数电路的输入,具体为:其中:|Ψ>为一个量子态,上标0为整个线路的初始量子态,下标1到2n为第1个比特到第2n个比特对应的量子态,n为原子数量,共2n个量子比特以编码n个原子。
[0020]所述的量子参数电路,通过以下方式构建得到:
[0021]i)确认需要量子比特的个数:对于每个需要学习的节点,都需要这个节点和它在阈值范围内的邻居节点,每个节点需要两个量子比特,所以最终总的量子比特数取决于节点的邻域有多大。根据分子化学特性可知,随着原子之间距离的增加,两个原子之间的相互作用力也在迅速减小,所以所需要考虑的邻域相对较小。每个原子的邻域中如果有5个左右的原子,那么所需要的量子比特数对应10个左右,如此少的比特给能够尝试在现有的量子
计算机上运行相应算法的可能。所以在设计含参数的量子参数电路时,选取硬件高效的量子参数电路,这个参数电路已经被多个现存的量子计算机验证能够在真实环境中运行,例如来自中科大团队的66比特祖冲之二号。
[0022]ii)含参数的量子参数电路采取多个层构成,通过重复构建完整的可训练的参数电路,如图2所示,每个层内的量子门的排布均相同,具体包括:含参数的旋转门构成的第一模块和由两比特门构成的第二模块,其中:第一模块的参数能够替代经典神经网络中的参数,对特征进行学习,第二模块使用CNOT门使所有的量子比特两两纠缠,使不同量子比特间的信息可以进行交互,同时扩大特征所处的空间。
[0023]所述的含参数的旋转门是指:每个量子比特上分别有两个旋转门Rz和Ry。
[0024]所述的学习是指:计算参数电路的每一层中的θ
z
和θ
y
的梯度,并且通过回传的方式在每一次迭代中优化整个参数点路。
[0025]所述的梯度其中:将每一个θ
i
变换为θ
i
+π/2和θ
i

π/2分别计算。
[0026]如果将整个参数电路的酉阵形式写出,那么从第1层到第L层的酉阵形式为其中:U
ent
是纠缠层,由CNOT门构成,U
l
(θ)是第l层中的可训练层,Rz和Ry为旋转门,为第l本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向先导化合物合成与筛选的三维分子结构仿真方法,其特征在于,将分子的三维空间结构建模为三维图结构,选取三维图的中心原子节点及其邻居节点的编码输入含参数的量子参数电路中,基于量子机器学习技术从图结构中得到完整的分子表示;再将分子表示进行分子性质预测和/或解决三维分子几何生成问题,对药物生成中的先导化合物进行筛选和预合成,实现仿真。2.根据权利要求1所述的面向先导化合物合成与筛选的三维分子结构仿真方法,其特征是,具体包括:步骤1、将分子的三维空间结构建模为三维图结构,该分子上的每个原子对应三维图中的节点,原子与原子之间的键对应图中的连边,整个分子包含的原子个数图中的节点数;步骤2、选取三维图的中心原子节点及其邻居节点的编码输入含参数的量子参数电路中,通过更新参数电路中的参数,基于量子机器学习技术从图结构中的每一个节点提取出一个特征,从而学习得到完整的分子表示;步骤3、将步骤2得到的分子表示进行分子性质预测和/或解决三维分子几何生成问题,对药物生成中的先导化合物进行筛选和预合成,实现仿真;所述的编码是指:使用两个量子比特编码当前原子。3.根据权利要求1或2所述的面向先导化合物合成与筛选的三维分子结构仿真方法,其特征是,所述的编码,具体包括:

将与待编码原子距离在特定阈值内的节点选为邻居节点,邻居节点的位置信息和性质通过选取的中心节点的相对距离以及原子种类表征,即四元组其中:a为邻居节点的原子种类,d为邻居节点到中心节点的距离,θ为旋转角,为扭转角;

选取Rx和Ry两个旋转门,在一个量子比特上编码两维的数据,具体为:用两个量子比特编码步骤

中四元组的一个原子,即将两个旋转角θ和编码到量子比特1上,然后将距离d和种类a编码到比特2上;

将每个原子所对应的两个量子比特都张量积为一个新的量子态作为量子参数电路的输入,具体为:其中:|Ψ>为一个量子态,上标0为整个线路的初始量子态,下标1到2n为第1个比特到第2n个比特对应的量子态,n为原子数量,共2n个量子比特以编码n个原子;所述的两个量子比特的表达式为:所述的两个量子比特的表达式为:其中:U
x
与U
y
分别为含参数的绕x轴和y轴的旋转门对应的酉阵,i指的是中心节点,j指代当前邻居节点。4.根据权利要求3所述的面向先导化合物合成与筛选的三维分子结构仿真方法,其特征是,将d转化为d/d
max
*2π,a转化为a/a
num
*2π,其中:d
max
为整个数据集中每个原子最大的度,a
num
为整个数据集中原子的种类,a是一个1到a
num
的整数。5.根据权利要求1或2所述的面向先导化合物合成与筛选的三维分子结构仿真方法,其特征是,所述的量子参数电路,通过以下方式构建得到:i)确认需要量子比特的个数:对于每个需要学习的节点需要两个量子比特,总的量子比特数取决于节点的邻域;
ii)含参数的量子参数电路采取多个层构成,重复构建每个层内的量子门的排布均相同的参数电路,具体包括:含参数的旋转门构成的第一模块和由两比特门构成的第二模块,其中:第一模块的参数能够替代经典神经网...

【专利技术属性】
技术研发人员:严格严骏驰
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1