可变图神经网络模型的动态流式图顶点分类方法及系统技术方案

技术编号：40841664 阅读：6 留言：0更新日期：2024-04-01 15:08

本发明专利技术公开了基于轻量级可变图神经网络模型的动态流式图顶点分类方法，首先，构建图神经网络预训练模型，在初始时间窗口内，应用到达的动态流图进行训练，生成初始顶点的类型标签，并获取训练好的模型参数；然后，在下一个时间窗口内，应用前一时间窗口的模型参数和顶点分类结果，对模型进行重构，并获取新增顶点局部影响的子图，作为重构模型的输入图数据，对新增顶点标注类型标签，并获取重构模型的参数；依次对后续时间窗口内的新增顶点进行分类，直至没有新增动态流图，分类结束。利用图神经网络预训练模型解决流图顶点无类型的冷启动问题，并通过复用和重构该模型对后续到达的流图顶点在线快速分类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于物联网动态流图顶点分类领域，具体涉及一种可变图神经网络模型的动态流式图顶点分类方法及系统。

技术介绍

1、随着物联网、5g和工业4.0的发展，多个应用领域，如海洋观测系统和和电子商务平台等，不断产生且以“流”的方式持续到达的海量关联数据，即规模逐渐增大的流图大数据。分析和挖掘这些流图大数据的潜在价值在众多领域有着广泛的应用和收益，甚至关系到人身财产安全。

2、例如，在海洋观测系统中，各类浮标和海底传感器不断检测区域海洋状态，根据不同区域间传感器的联系，分析数据间的相似性，判断某一区域的数据特征代表的是鱼群分布或是海洋暖流等，这对海洋渔业和海洋航行等有重要的帮助；在社交网络中，如facebook，常常有人注册虚假账号进行恶意攻击或窃取他人信息，如果不将这类账号标记为恶意用户，将会持续危害社交网络中的信息安全，只有及时检测且标记出恶意用户，才能保证社交网络的安全和稳定，提高用户体验。

3、在上述场景中，无论是海洋观测，还是在线恶意用户检测，本质上都是对动态流图中持续到达的新增顶点分类。

4、由此可知，动态流图的顶点分类有着广泛的应用市场，直接影响人们的经济和社会活动，甚至对国家发展战略都有着重要意义。

5、当前的动态流图顶点分类算法主要分为基于图拍照的方法、基于多个历史时段的方法和基于时间窗口的方法等。基于图快照的算法将每个时刻的动态图看作一个个静态图，然后使用静态图顶点分类的方法，如lp、svm等，完成顶点分类任务。

6、但这类方法只是独立处理一个个静态图，

7、基于滑动时间窗口的动态图顶点分类方法将动态图处理过程划分为持续的多个时间窗口，充分复用已有分类结果且关注新增顶点，进一步提高流图顶点分类的质量。但该类方法面对动态图的规模发生变化时，已构建的固定结构的模型将很难直接复用，还需要重新训练，这依然制约着流图顶点分类的效率。可见，动态流图顶点分类还存在着值得优化的必要性。

技术实现思路

1、本专利技术所要解决的技术问题是：提供一种可变图神经网络模型的动态流式图顶点分类方法及系统，解决了现有技术中大规模动态流图分类重新训练数据量大，效率低的问题。

2、本专利技术为解决上述技术问题采用以下技术方案：

3、基于轻量级可变图神经网络模型的动态流式图顶点分类方法，

4、首先，构建图神经网络预训练模型，在初始时间窗口内，应用到达的动态流图进行训练，生成初始顶点的类型标签，并获取训练好的模型参数；

5、然后，在下一个时间窗口内，应用前一时间窗口的模型参数和顶点分类结果，对模型进行重构，并获取新增顶点局部影响的子图，作为重构模型的输入图数据，对新增顶点标注类型标签，并获取重构模型的参数；

6、依次对后续时间窗口内的新增顶点进行分类，直至没有新增动态流图，分类结束。

7、应用图神经网络预训练模型生成初始顶点的类型标签包括如下步骤：

8、步骤1、接收到达初始时间窗口的动态流图；

9、步骤2、应用基于对比学习的预训练方式优化所述图神经网络预训练模型，得到最优模型参数下的顶点特征；

10、步骤3、将获取的顶点特征与标准类型进行相似度比较，对动态流图顶点进行相应类型标注，获取初始窗口内带着类型的种子顶点集。

11、所述新增顶点局部影响的子图包括新增顶点和已得到的带有类型标签的部分顶点。

12、在后续时间窗口内重构模型及获取模型参数的具体步骤如下：

13、步骤a、对于当前时间窗口，复用上一个时间窗口内的图神经网络模型进行顶点特征提取，并使用归一化函数构造输出层，更新出图神经网络分类模型；

14、步骤b、计算顶点类型的概率分布；

15、步骤c、判断当前时间窗口内是否有新增顶点到达，如果有，找到受新增顶点影响的子图，并将其作为模型输入的图数据；

16、步骤d、将受新增顶点影响的子图输入到更新的图神经网络分类模型，判断顶点类型的概率分布与真实模型的交叉熵损失值；

17、步骤e、反复迭代训练对模型进行微调优化，直至交叉熵损失值小于预先设定的模型训练收敛的阈值；

18、步骤f、获取当前时间窗口内轻量级重构模型的最优参数，以及新增顶点的类型，得到带有类型的新增顶点集合。

19、所述顶点类型的概率分布采用如下公式计算：

20、pt＝softmax(htoptimal_wt-1)，其中，ht为顶点特征，optimal_wt-1为上一时间窗口的最优模型参数。

21、对于当前时间窗口内的新增顶点，采用萤火虫的光强变化原理，找到受新增顶点影响的子图。

22、基于轻量级可变图神经网络模型的动态流式图顶点分类系统，包括图神经网络预训练模型，用于在初始时间窗口内，将到达的动态流图生成初始顶点的类型标签，并获取训练好的模型参数；

23、半监督训练模型，用于在初始时间窗口后的所有时间窗口内，获取受新增顶点影响的子图，结合上一时间窗口内的模型参数，重构模型，获取重构模型的最优参数；

24、分类模型，用于将带有类型标签的所有顶点集合进行分类。

25、所述半监督训练模型，一方面复用上一时间窗口的带有类型标签的顶点，另一方面，对当前时间窗口内的新增顶点(新增的无标签顶点)进行处理后作为输入数据，通过反复迭代对模型进行微调优化，得到带有类型的新增顶点集合。

26、所述半监督训练模型通过梯度下降算法不断更新模型参数进行迭代训练，待损失函数值收敛或达到设置的最大迭代次数，模型训练过程结束。

27、计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时用于执行所述方法的全部或部分步骤。

28、与现有技术相比，本专利技术具有以下有益效果：

29、1、在初始时间窗口内构建基于graphsage的图神经网络预训练模型，并使用对比学习方式训练该模型，解决了持续到达的流图顶点无类型标签问题，得到种子顶点，为后续时间窗口做数据准备。

30、2、创新地鉴萤火虫的光强变化原理，找到受新增顶点影响的子图作为图神经网络模型的输入数据，避免了每次处理都使用全局信息，减小了训练规模，加快了模型优化过程。

31、3、充分利用上一个时间窗口内得到的分类结果和模型，增量地对后续时间窗口内的新增顶点分类，体现了本专利技术方法的高复用性和动态性。

32、4、为动态流图顶点分类提供一种快速高效的可行方案，利用图神经网络预训练模型解决流图顶点无类型的冷启动问题，并通过复用和重构该本文档来自技高网...

【技术保护点】

1.基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：

2.根据权利要求1所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：应用图神经网络预训练模型生成初始顶点的类型标签包括如下步骤：

3.根据权利要求1所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：所述新增顶点局部影响的子图包括新增顶点和已得到的带有类型标签的部分顶点。

4.根据权利要求3所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：在后续时间窗口内重构模型及获取模型参数的具体步骤如下：

5.根据权利要求4所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：所述顶点类型的概率分布采用如下公式计算：

6.根据权利要求1所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：对于当前时间窗口内的新增顶点，采用萤火虫的光强变化原理，找到受新增顶点影响的子图。

7.基于轻量级可变图神经网络模型的动态流式图顶点分类系统，其特征在于：包括图神经网

8.根据权利要求7所述的基于轻量级可变图神经网络模型的动态流式图顶点分类系统，其特征在于：所述半监督训练模型，一方面复用上一时间窗口的带有类型标签的顶点，另一方面，对当前时间窗口内的新增顶点进行处理后作为输入数据，通过反复迭代对模型进行微调优化，得到带有类型的新增顶点集合。

9.根据权利要求8所述的基于轻量级可变图神经网络模型的动态流式图顶点分类系统，其特征在于：所述半监督训练模型通过梯度下降算法不断更新模型参数进行迭代训练，待损失函数值收敛或达到设置的最大迭代次数，模型训练过程结束。

10.计算机存储介质，其特征在于：所述计算机存储介质存储有计算机指令，所述计算机指令被调用时用于执行权利要求1至6中任一项所述方法的全部或部分步骤。

...

【技术特征摘要】

1.基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：

5.根据权利要求4所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：所述顶点类型的概率分布采用如下公式计算：

6.根据权利要求1所述的基于轻量级可变图神经网络模型的动态流式图顶点分类方法，其特征在于：对于当前时间窗口内的新增顶点，采用萤火虫的光强变化原理，找到受新增顶点...

【专利技术属性】
技术研发人员：曾国荪，孙志鹏，丁春玲，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人