基于量子GNN的结合能预测方法技术

技术编号:34771119 阅读:26 留言:0更新日期:2022-08-31 19:32
本发明专利技术提供一种基于量子GNN的结合能预测方法,属于量子计算与生物医药技术领域。因为该方法将经典的GNN中的GIN与卷积模块通过量子线路优化模型,具体通过量子

【技术实现步骤摘要】
基于量子GNN的结合能预测方法


[0001]本专利技术涉及量子计算与生物医药
,具体涉及一种基于量子GNN的结合能预测方法。

技术介绍

[0002]相较于实验,计算机辅助药物设计能加速药物发展进程,同时节省时间和成本,药物筛选是计算机辅助药物设计最重要的任务之一,对于新药的发现和老药新用都很有意义。药物和靶标间的结合需要具有专一性和稳定性,才能更好地发挥药效,这要求药物和靶标间的相互作用的准确描述。我们用“结合能”来表示这种相互作用,它反映了各部分结合的紧密程度。通过对结合能的预测来筛选出更专一稳定的药物,来推进药物设计的进程。
[0003]相比采用普通数据序列编码的算法,GNN(图神经网络)算法可以有效避免分子空间结构丢失的问题,捕获分子结构特征,提升模型预测性能。基于经典GNN的算法是人工智能领域的研究热点,被应用在多种应用场景,如生物医药、材料、神经科学等,然而这些模型的运行都需要消耗大量的计算资源。在过去算法运行的计算资源主要由电子集成电路制造的芯片提供,而随着电子遂穿效应对制程接近纳米极限后的制约,算力很难再持续提升。量子计算芯片是对电子芯片计算方式的补充,然而经典的GNN算法在量子芯片上的运行无法按照其在电子芯片上的方式进行处理。
[0004]虽然结合能预测问题基于GNN模型取得了不错的性能,但是算法中GNN模块和卷积模块运算具有高度并行性并消耗大量计算资源。
[0005]本专利技术基于量子GNN和量子卷积来处理结合能预测问题,从而使得量子芯片和电子芯片能够协同工作用于药物靶点结合能预测的模型。

技术实现思路

[0006]本专利技术是为了解决上述问题而进行的,目的在于提供一种基于量子GNN的结合能预测方法。
[0007]本专利技术提供一种基于量子GNN的结合能预测方法,具有这样的特征,包括:
[0008]分别对药物分子及蛋白质序列进行编码得到对应的第一量子态与第二量子态;
[0009]第一量子态在量子图同构神经网络中进行幺正变换,测量得到对应的第一特征向量;
[0010]第二量子态在量子卷积网络中进行幺正变换,测量得到对应的第二特征向量;
[0011]将第一特征向量与第二特征向量拼接后输出结合能。
[0012]本专利技术提供的方法,还具有这样的特征:
[0013]其中,第一量子态与第二量子态通过振幅编码得到。
[0014]本专利技术提供的方法,还具有这样的特征,还包括:
[0015]将SMILES格式的药物分子预处理得到节点特征向量、边特征向量及邻接矩阵。
[0016]本专利技术提供的方法,还具有这样的特征:
[0017]其中,节点特征向量包括药物分子的如下表征:
[0018]原子序号、手性、度、电荷、原子连接的氢原子个数、原子的激活电子、原子杂化方式、是否为芳香原子或是否在环中的任意一种或多种。
[0019]本专利技术提供的方法,还具有这样的特征:
[0020]其中,边特征向量包括如下表征:
[0021]键的类型和/或是否在环中。
[0022]本专利技术提供的方法,还具有这样的特征,还包括:
[0023]将包含上述表征的节点特征向量与边特征向量聚合得到聚合节点特征向量。
[0024]本专利技术提供的方法,还具有这样的特征,
[0025]其中,量子图同构神经网络包括量子线路,该量子线路用于重新映射聚合节点特征向量。
[0026]本专利技术提供的方法,还具有这样的特征,
[0027]其中,量子线路包括旋转门和/或受控非门。
[0028]本专利技术提供的方法,还具有这样的特征:
[0029]其中,量子卷积网络包括量子线路,量子线路用于提取蛋白质序列的特征向量。
[0030]本专利技术提供的方法,还具有这样的特征,还包括:
[0031]对药物分子及蛋白质序列进行Embedding操作。
[0032]专利技术的作用与效果
[0033]根据本专利技术所涉及的基于量子GNN的结合能预测方法,因为该方法将经典的GNN中的GIN与卷积模块通过量子线路优化模型,具体通过量子

经典混合的GIN中的量子MLP将药物分子聚合后的节点特征向量重新映射得到第一特征向量,再将蛋白质序列通过量子卷积网络提取得出蛋白质分子的特征向量,最后将二者的特征向量拼接后得到预测的结合能。所以,利用量子的高度并行特性,本专利技术提供的方法可以大大减少训练的参数、节省计算资源、提高数据的表达能力,从而使得量子芯片和电子芯片能够协同工作用于药物靶点结合能预测的模型。
附图说明
[0034]图1是本专利技术的实施例中基于量子GNN的结合能预测方法的总流程图。
[0035]图2是本专利技术的实施例中药物分子处理得到第一特征向量的过程示意图。
[0036]图3是本专利技术实施例的量子图同构神经网络中量子MLP的结构示意图。
[0037]图4是本专利技术的实施例中量子卷积网络的结构示意图。
具体实施方式
[0038]为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本专利技术提供的基于量子GNN的结合能预测方法作具体阐述。
[0039]<实施例>
[0040]参见图1,本实施例提供的基于量子GNN的结合能预测方法包括如下步骤:
[0041]步骤S1,分别对药物分子及蛋白质序列进行编码得到对应的第一量子态与第二量子态。
[0042]步骤S2,第一量子态在量子图同构神经网络中进行幺正变换,测量得到对应的第一特征向量。
[0043]步骤S3,第二量子态在量子卷积网络中进行幺正变换,测量得到对应的第二特征向量。
[0044]步骤S4,将第一特征向量与第二特征向量拼接后输出结合能。
[0045]进一步地,参见图2与图3,对本实施例中药物分子输出对应的药物分子对应的第一特征向量作详细描述。
[0046]具体地,本实施例中的药物分子为SMILES格式,将该药物分子通过现有的编码方式处理生成可以应用于GIN(图同构神经网络)的图数据格式(如:可以通过Rdkit工具生成):节点特征、边特征、邻接矩阵。
[0047]图2示例性地列出某一药物分子编码处理后的图数据,其中,数字1、2、3、4、5、6表示节点编号,每个节点编号与之靠近的圆圈(节点)相对应,每个节点的数学形式为节点特征向量,每个节点特征向量均包含该节点的如下表征:原子序号、手性、度、电荷、原子连接的氢原子个数、原子的激活电子、原子杂化方式、是否为芳香原子或是否在环中的任意一种或多种。本实施例中的每一个节点特征向量均包括上述9种表征,在其他实施例中,可根据具体的实际需要增添或删减节点的其他表征。另外还需要将上述节点特征向量通过Embedding操作进行降维。
[0048]图2中,相邻两个节点之间的连线为边,并对应相邻两个节点之间的边特征向量,边特征向量表示相邻两个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于量子GNN的结合能预测方法,其特征在于,包括:分别对药物分子及蛋白质序列进行编码得到对应的第一量子态与第二量子态;所述第一量子态在量子图同构神经网络中进行幺正变换,测量得到对应的第一特征向量;所述第二量子态在量子卷积网络中进行幺正变换,测量得到对应的第二特征向量;将所述第一特征向量与所述第二特征向量拼接后输出结合能。2.根据权利要求1所述的方法,其特征在于:其中,所述第一量子态与所述第二量子态通过振幅编码得到。3.根据权利要求1所述的方法,其特征在于,还包括:将SMILES格式的所述药物分子预处理得到节点特征向量、边特征向量及邻接矩阵。4.根据权利要求3所述的方法,其特征在于:其中,所述节点特征向量包括所述药物分子的如下表征:原子序号、手性、度、电荷、原子连接的氢原子个数、原子的激活电子、原子杂化方式、是否为...

【专利技术属性】
技术研发人员:石帅
申请(专利权)人:上海图灵智算量子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1