基于图神经网络的交互式社区搜索方法及装置制造方法及图纸

技术编号：28871805 阅读：19 留言：0更新日期：2021-06-15 23:04

本发明专利技术公开了一种基于图神经网络的交互式社区搜索方法及装置，依据用户的查询节点和标记节点构造给定候选子图G

全部详细技术资料下载

【技术实现步骤摘要】
基于图神经网络的交互式社区搜索方法及装置
本专利技术属于信息
，尤其涉及一种基于图神经网络的交互式社区搜索方法及装置。
技术介绍
社区搜索是网络分析的重要工具，在线上社交网络中搜索一个包含给定查询节点的社区，在推荐、团队组织等方面有着广泛的应用。它的目标是寻找包含查询节点的密集连通子图。发现的社区可以作为一个有效的候选集，用于如商品/朋友推荐、非法组织发现等应用。虽然这个问题已经得到了很好的研究，但目前的方法在应用于现实社会网络时仍面临挑战。首先，几乎所有这些方法都假设数据已经被抓取过，它们只对收集到的数据进行分析。但是，我们不能将数据抓取和社区搜索清晰地分开。每天在网络上都会出现大量新活跃账户和信息，如果不控制收集政策，网络爬虫会发现大量的无关紧要的数据，带来不必要的存储、网络传输、计算等资源消耗。其次，现有的方法大部分利用规则度量社区成员，有些社区结构关系较为紧密，现有的社区搜索模型(例如文献XinHuang,HongCheng,LuQin,WentaoTian,andJeffreyXuYu.2014.Queryingk-trusscommunityinlargeanddynamicgraphs.InSIGMOD.1311–1322、文献MauroSozioandAristidesGionis.2010.Thecommunity-searchproblemandhowtoplanasuccessfulcocktailparty.InSIGKDD.939–948与文献H.WangY.LuW.C...

【技术保护点】
1.一种基于图神经网络的交互式社区搜索方法，其步骤包括：/n1)通过用户的查询节点和标记节点，从在线社交网络中构造给定候选子图G

【技术特征摘要】
1.一种基于图神经网络的交互式社区搜索方法，其步骤包括：
1)通过用户的查询节点和标记节点，从在线社交网络中构造给定候选子图GS；
2)通过给定候选子图GS的各节点构建邻接矩阵A，依据给定候选子图各样本正节点u的内容特征及预训练好的嵌入集D，构建内容特征矩阵FM，并通过交叉熵与排序损失相结合的方式作为损失函数，构造图神经网络模型M＝(A，FM，W)，其中A为邻接矩阵，W为参数矩阵；
3)对图神经网络模型M进行收敛，得到各节点的图神经网络分数，并依据图神经网络分数，更新给定候选子图GS；
4)依据更新后的给定候选子图及设定社区大小k，通过保证社区连通且社区中节点分数尽可能大，选取大小为k的最终目标社区。

2.如权利要求1所述的方法，其特征在于，构造给定候选子图GS的方法包括：局部边缘增强的广度优先搜索策略或广度优先搜索。

3.如权利要求2所述的方法，其特征在于，依据局部边缘增强的广度优先搜索策略，通过以下步骤构造给定候选子图：
1)每轮迭代前，查找先前候选子图GB，其中若未查找先前候选子图GB，则先前候选子图GB为空；
2)依据先前候选子图GB＝(VB，EB，FB)与正样本集合Sp，计算节点集合VS＝Sp∪VB、边集合ES＝EB及节点内容特征集合FS＝FB，其中，VB、EB与FB分别为先前候选子图GB的节点集合、边集合与节点内容特征集合，样本节点集合S包括：正样本集合Sp和标记负节点集合Sn，正样本集合Sp包括标记正节点集合和查询节点；
3)对节点集合VS中每一节点u，获得与节点u连边的节点集合N及节点u的新发布信息，将节点u的新发布信息特征加入节点内容特征集合FS中，更新节点内容特征集合FS，并继续更新节点集合VS与边集合ES，其中若节点u∈Sp且节点v∈N，则节点集合VS←VS+{v}及边集合ES←ES+{(u，v)}；若节点且v∈N∧v∈VS，则节点集合VS不变，边集合ES←ES+{(u，v)}；
4)根据更新后的节点集合VS、边集合ES与节点内容特征集合FS，构造给定候选子图GS＝(VS，ES，FS)，其中将当前候选子图GS保存以用于下次迭代。

4.如权利要求1所述的方法，其特征在于，损失函数Lossa＝Lossc+λLossr，其中交叉熵损失函数排名损失函数λ为权重参数，S为样本节点集合，uS.y为节点uS的标记结果，P[uS]为节点uS的图神经网络分数，R为用户标记的一组排序节点对，(uR，vR)∈R代表u获得比v更高的图神经网络分数，v为社区网络的一节点，m∈[0，1]是允许排序误差的容忍度。

5.如权利要求1所述的方法，其特征在于，构造图神经网络模型M的方法包括：利用图卷积神经网络G...

【专利技术属性】
技术研发人员：高军，陈嘉尊，王佳，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人