基于量子漫步的图分类方法技术

技术编号:32436880 阅读:13 留言:0更新日期:2022-02-26 07:55
本发明专利技术针对图数据分析预测难度大,分类精度低等问题,提出了基于量子漫步技术的图分类方法,通过利用量子漫步振幅对图数据中的特定子结构进行特征提取计算,从而实现了高效的同构子结构匹配,完成图的相似性度量。本发明专利技术具体包括一个基于量子漫步方法的图核构造方法,首先针对每个图运行多步的离散时间量子漫步,通基于快速量子漫步振幅计算的邻域对子结构匹配完成图核的构建,并最终结合最终结合基于核的支持向量机通过训练得到图分类器。本发明专利技术能够针对真实世界中图结构数据进行高效地分析,可针对未知新数据进行类别的精确判断。可针对未知新数据进行类别的精确判断。可针对未知新数据进行类别的精确判断。

【技术实现步骤摘要】
基于量子漫步的图分类方法


[0001]本专利技术涉及一种基于量子漫步的图分类方法,主要利用新型量子计算的方式针对图数据实现高精准度的智能学习和分析预测。

技术介绍

[0002]图是信息处理领域中一种重要的数据结构,它可以清晰地表达真实世界中个体与个体间的连接关系,在社交网络、生物医学、机器视觉以及程序分析等诸多领域均有广泛应用。图分类问题是指通过结构分析对图进行类别判断的研究。该问题在实际应用中具有重要价值。例如,在化学研究领域,利用分子结构的拓扑特征对比,研究者能够对未知分子的化学特性做出预测。再如,在程序设计领域,通过代码关联关系的对比分析,程序员可以对程序异常的原因进行初步的判断。
[0003]直接进行图结构的对比实质上可归结为NP-hard的子图同构问题,因此目前常用的图分类方法首先将图进行空间映射,再利用传统的监督学习方法进行分类。根据映射方法不同,主要研究方向可分为图编辑距离方法、图神经网络方法以及图核方法等。本专利主要关注的图核方法是将图之间的相似性映射到高维希尔伯特空间中的内积,继而采用支持向量机或主成分分析等手段实现图的分类。然而现有的基于图核的分类方法均是对基于子图同构的精确分类方法的近似,它们均在计算复杂性和分类精度方面进行了相应的折衷。尽管目前已出现了很多成熟的图核,但是仍存在着一些问题:1)由于无法构建子结构之间的相对位置信息,使得基于这些图核进行分类时分类精度受到影响。2)由于图属性在实际中较难获取,使得这些图核对图相似性的表示能力不够。3)这些图核无法区分一些相似但非同构的图,如余谱图和正则图等。
[0004]1993年Y.Aharonov等首次提出量子漫步的概念,后续逐步演化为连续量子漫步和离散量子漫步两种模型。离散量子漫步更接近于经典随机漫步,在每一次漫步中结点仅能向邻域进行振幅传播。通过与经典随机漫步的对比,人们逐渐挖掘出量子漫步的高效计算能力和干涉探索能力,并将其引入到图分析领域中。
[0005]当前针对图分类问题存在的分类精度低的问题,量子漫步技术能够有效地解决这些问题。本专利技术所提出的方法就是利用量子漫步技术针对图分类问题提供一种新的图核分类手段。

技术实现思路

[0006]本专利技术提出了新型的卷积图核,其基于改进的离散量子漫步实现了针对同构子结构的检测,从而实现对图相似性的度量,并达到图分类的目的。
[0007]首先,在离散量子漫步的演化过程中,图的局部特征可以通过量子振幅的传播来获得。本专利技术提出了一种邻域对子结构,基于该子结构进行图特征提取。如示例图1(a)所示,从结点a到结点b一共有5个长度为3的通路,把这些通路组合成新的结构,如示例图1(b)所示。这个结构可以看作是a和b之间3阶子树的交集。在本专利技术中,我们把这个结构叫做邻
域对子结构,从结点a到结点b的3阶邻域对子结构用表示。同时,这5个长度为3的通路都是由2步离散量子漫步组成的,如示例图1(b)所示。相干相消使得这里由两个漫步通路的振幅为0(图1(b)中红色虚线);两个振幅为负(蓝色点划线),一个振幅为正(黑色实线)。由于这些量子漫步之间存在量子干涉,在中所有这些量子漫步振幅的叠加是1/9,如图1(c)所示。因此,我们可以在两幅图之间寻找具有相同量子叠加振幅的邻域对子结构来进行子图匹配。与基于通路和基于子树的核方法相比较,由于量子干涉的存在,这种方法是子图匹配同构的更加准确的近似,尤其是对于信息量较少的无属性图。
[0008]为了方便计算邻域对子结构的量子叠加振幅,本专利将传统离散量子漫步中的迁移振幅进行叠加表示,因此,进行一步漫步后两点之间的转移振幅可以由下式计算
[0009][0010]其中U
im,nj
表示一步从边(i,m)到边(n,j)的量子漫步。
[0011]采用相似的方式,我们可以定义t步DTQW后的t步转移矩阵M
(t)

[0012][0013]为了快速地计算叠加振幅,本专利提出一种迭代计算方法,该方法可不用计算迁移矩阵U的幂次方,从而大大降低计算时间。迭代计算方法如下:
[0014]假设有一个包含N个结点的图。A是图的邻接矩阵,d
n
是结点n的度。定义对角矩阵矩阵Q=DA。那么,迁移矩阵M
(t)
可以用下式进行迭代计算。
[0015][0016]基于上述工作,本专利设计了一种量子漫步图核,命名为N2QWK,具体计算方法如下:
[0017](1)对于两幅图G
A
和G
B
,分别对其进行T步离散时间量子漫步,分别求得{M
(t)
|1≤t≤T}
A
和{M
(t)
|1≤t≤T}
B

[0018](2)在每一步t完成后,我们将构造一个子核K
t
(G
A
,G
B
),它是通过计算经过t步离散量子漫步之后的所有t阶同构相邻子结构的匹配数。这个子核的定义如下:
[0019][0020]其中Δ是一个Dirac函数,定义如下:
[0021][0022](3)基于上述子核,本专利技术设计图核N2QWK定义为
[0023][0024]这样,图核的输出就是对两幅图的相似度度量结果。
[0025](4)针对数据集中的图数据两两进行计算,得到核矩阵,并输入到基于核的SVM中进行训练,从而构成一个针对图的分类器。
附图说明
[0026]图1:(a)包含4个结点的示例图;(b)结点a到结点b的5个长度为3的通路组成的3阶领域对子结构(f)所有(5个)长度为3的量子漫步的叠加转移振幅;
[0027]图2:长度为t的离散时间量子漫步。从结点i到结点j有t步点到点离散量子漫步。结点n的下一步是结点j,结点n的上一步是结点a;
[0028]图3:图核N2QWK的计算流程图。
具体实施方式
[0029]以下将详细说明本专利的实施方式,并给出采用本专利专利技术后的实验结果。藉此对本专利如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
[0030]针对一个具有K个图的数据集{G1,G2,...,G
K
},我们需要对其进行分析并训练得到一个图分类器。整个实施过程如下所示:
[0031](1)首先针对数据集中的每个图,我们都将运行T步的离散时间量子漫步,并记录下每一步t之后计算得到的矩阵M
(t)
,针对该矩阵利用histogram函数统计了矩阵M
(t)
中的数据出现的频率表并将其作为该图的该维度特征在完成该步计算操作之后,每一个图都将有一个T维的特征向量。
[0032](2)针对数据集中的每一个图对,我们依据公式(4)针对其第t维的特征计算两个图t阶子核K
t
(G
i
,G
j
)。为了计算该子核,我们针对采用排序和对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于量子漫步的图分类方法,其特征在于利用量子漫步的迁移矩阵提取图的结构特性,从而实现精确的子图匹配,完成对图相似性的度量。具体计算方法如下所示:(1)首先针对数据集中的每个图,我们都将运行T步的离散时间量子漫步,并记录下每一步t之后计算得到的矩阵,针对该矩阵利用直方图函数统计了矩阵中的数据出现的频率表并将其作为该图的该维度特征。在完成该步计算操作之后,每一个图都将有一个T维的特征向量。(2)在每一步t完成后,我们将构造一个子核K
t
(G
A
,G
B
),它是通过计算经过t步离散量子漫步之后的所有t阶同构相邻子结构的匹配数。这个子核的定义如下:其中Δ是一个Dirac函数,定义如下:其中和分别为两幅图进行t步离散时间量子漫步后得到的矩阵中的对应元素。(3)基于上述子核,本发明设计图核N2QWK定义为这样,图核的输出就是对两幅图的相似度度量结果。(4)针对数据集中的图数据两两进行计算,得到核矩阵,并输入到基于核的SVM中进行训练,从而构成一个针对图的分类器。2.根据权利要求1所述的基于量子漫步的图分类方法,其特征在于,...

【专利技术属性】
技术研发人员:张毅王璐璐吴振东
申请(专利权)人:中芯未来北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1