一种图注意力机制的社交网络影响力最大化方法及系统技术方案

技术编号:37125428 阅读:21 留言:0更新日期:2023-04-01 05:21
本发明专利技术涉及一种图注意力机制的社交网络影响力最大化方法及系统,包括如下步骤:S1:收集社交网络数据并构建社交网络的图序列数据;其中图序列数据包括:图邻接矩阵数据和节点表示特征数据;S2:基于图注意力网络和Node2Vec结合算法对图序列数据进行特征提取;S3:启发式地对特征提取后的图序列数据进行候选种子的挑选,并采用贪心算法从候选种子中选出传播度增益最大的节点作为最终的种子节点,从而构成传播度增益最大的种子节点集。本发明专利技术提供的社交网络影响力最大化方法及系统,采用图注意力网络对社交网络图结构进行学习,有效的学习更复杂的图拓扑结构,在社交网络中实现了影响力最大化,具有较好的可用性。具有较好的可用性。具有较好的可用性。

【技术实现步骤摘要】
一种图注意力机制的社交网络影响力最大化方法及系统


[0001]本专利技术涉及社交网络信息传播研究领域,具体涉及一种图注意力机制的社交网络影响力最大化方法及系统。

技术介绍

[0002]随着 5G 时代的到来和新媒体技术的不断发展,在线社交网络愈发的普及,在过去的几年里,在线社交网络作为虚拟社区扮演着重要的角色,玩家通过各种日常个人活动(如交流和内容分享)联系在一起,他们通过一种口口相传的机制,成为最有效、最庞大的传播平台,使得信息能在短时间内影响大量人群。影响力最大化作为信息扩散研究中的一个关键算法问题,由于其潜在的商业价值,近年来得到了广泛的研究。它的目标是通过在社交网络中选取k个用户作为种子节点,然后通过这些用户传播信息去影响其他用户,在信息传播的过程中,使受到影响的用户数量最大。影响力最大化有许多著名应用,如病毒式营销、个性化推荐、级联检测和信息监控。
[0003]目前,社交网络中解决影响力最大化问题的近似算法主要有多种算法。例如,Kemp等人在独立级联模型和线性阈值模型上证明了影响力最大化问题是一个NP难的问题,提出贪心算法来计算种子节点集的影响结果能够达到最优解。但是算法存在不足之处,其不足之处在于:(1)该算法使用蒙特卡洛模拟去近似估计网络中每个节点的影响力增益,为保证准确性而导致蒙特卡洛模拟的次数很高(一般设置为10000次);(2)当选择一个节点之后,后续仍需要对每一个节点重新计算影响力增益,使得计算量非常大,从而造成在庞大的社交网络数据集中,难以快速高效找出具有最大影响力的种子节点集。Cheng等人在2013年提出了一种静态贪心算法StaticGreedy,文中证明算法的每一轮迭代中只需要少量的蒙特卡洛模拟就能够保证得到一定的近似解,于是算法会随机保存一组在首次迭代过程中使用蒙特卡洛模拟产生的信息传播图,在后续的迭代中使用该组随机图来估计节点的影响力增益。尽管能够避免贪心算法中大量不必要计算,大幅度提高计算效率,但是在大型网络中选择少量种子节点仍然需要很长的时间。
[0004]因此,许多启发式算法被相继提出,研究者利用网络的结构特征和信息传播模型的一些特性来寻找高影响力的节点,提出了一些启发式的算法。Wang 等人基于独立级联模型提出了MIA算法,该算法假设节点只能影响到周围局部树形结构中的邻居,同时影响传播路径只考虑概率最大的一条,这样简化了节点影响力传播的计算。但是造成了影响力范围覆盖较大的问题,造成整体上影响力传播范围较小。
[0005]上述研究中虽然对影响力最大化问题进行了探讨,但仍缺乏有效、准确的解决方案,目前传统的影响力最大化方法存在着只能利用网络中浅层拓扑结构的缺陷,同时还存在影响力覆盖范围重叠的问题。因此,有必要对现有社交网络中解决影响力最大化问题的方法进行改进。

技术实现思路

[0006]针对现有技术的不足,本专利技术提供了一种图注意力机制的社交网络影响力最大化方法及系统,采用图注意力网络的多层的注意力机制对社交网络图结构进行学习,有效的学习更复杂的图拓扑结构,选择出最具有影响力的种子节点,在社交网络中实现了影响力最大化,具有较好的可用性。
[0007]为了实现本专利技术的目的,本专利技术提供一种图注意力机制的社交网络影响力最大化方法,包括如下步骤:S1:收集社交网络数据并构建社交网络的图序列数据;其中图序列数据包括:图邻接矩阵数据和节点表示特征数据;S2:基于图注意力网络和Node2Vec结合算法对图序列数据进行特征提取;S3:启发式地对特征提取后的图序列数据进行候选种子的挑选,并采用贪心算法从候选种子中选出传播度增益最大的节点作为最终的种子节点,从而构成传播度增益最大的种子节点集。
[0008]优选的,所述步骤S2的具体步骤包括:通过Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理,基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理并计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量。
[0009]优选的,所述步骤S2中通过Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理的具体步骤还包括:基于Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理,并利用skip

gram算法来最大化中心节点和左右窗口长度w内的上下文节点共同出现的概率,其计算公式为:其中,为节点的一个潜在的节点表示特征;通过公式取对数方法来最小化最终的目标损失函数,并通过随机梯度下降算法对目标损失函数进行优化收敛得出节点表示特征,其目标损失函数计算公式为:。
[0010]优选的,所述步骤S2中基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理的具体步骤包括:基于图注意力网络,将H={h1,h2……
h
n
}作为节点的输入特征,并计算两个节点之间的注意力系数,其计算公式为:其中,表示一个权重矩阵,用来对节点特征进行线性变换,表示一种共享的
注意力机制,表示出节点对节点的重要性程度;在通过激活函数对注意力系数进行归一化处理,其计算公式为:其中,α表示计算注意力的单层神经网络的权重,表示矩阵中的转置操作,表示对两个矩阵的连接操作。
[0011]优选的,所述步骤S2中基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理并计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量的具体步骤还包括:基于图注意力网络,采用多头注意力机制的k个注意力层计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量,其中多头注意力机制的计算公式为:其中,表示连接操作,表示通过第个注意力层计算得到的注意力系数,表示第个对节点特征进行线性变换的可学习参数。
[0012]优选的,所述步骤S2中基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理并计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量的具体步骤还包括:最后一层图注意力网络层的计算方法为:对k个特征进行平均值的计算并通过非线性激活函数进行非线性变换,其最后一层的节点计算公式为:。
[0013]优选的,所述步骤S2中启发式地对特征提取后的图序列数据进行候选种子的挑选的具体步骤包括:将网络用户的一阶邻居和二阶邻居的np个节点的特征向量作为每个节点的相关向量,并利用向量的欧几里得范数来计算两个节点之间的相似性,并选出相似度最大的r*np节点作为强相关节点,其中,r为强相关关节点系数,r∈(0,1],通过计算每个节点在其它节点的强相关节点集中出现的次数来得出节点频率,根据得出的节点频率进行排序,并选择出现次数最多的ck节点作为候选种子的节点,ck分别为候选种子节点相关系数和种子节点的数目;其相似度通过欧几里得范数公式计算:
其中,,分别代表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图注意力机制的社交网络影响力最大化方法,其特征在于,包括如下步骤:S1:收集社交网络数据并构建社交网络的图序列数据;其中图序列数据包括:图邻接矩阵数据和节点表示特征数据;S2:基于图注意力网络和Node2Vec结合算法对图序列数据进行特征提取;S3:启发式地对特征提取后的图序列数据进行候选种子的挑选,并采用贪心算法从候选种子中选出传播度增益最大的节点作为最终的种子节点,从而构成传播度增益最大的种子节点集。2.如权利要求1所述的社交网络影响力最大化方法,其特征在于,所述步骤S2的具体步骤包括:通过Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理,基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理并计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量。3.如权利要求2所述的社交网络影响力最大化方法,其特征在于,所述步骤S2中通过Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理的具体步骤还包括:基于Node2Vec对节点表示特征X
i
进行采样的随机游走序列和负采样操作处理,并利用skip

gram算法来最大化中心节点和左右窗口长度w内的上下文节点共同出现的概率,其计算公式为:其中,为节点的一个潜在的节点表示特征;通过公式取对数方法来最小化最终的目标损失函数,并通过随机梯度下降算法对目标损失函数进行优化收敛得出节点表示特征,其目标损失函数计算公式为:。4.如权利要求2所述的社交网络影响力最大化方法,其特征在于,所述步骤S2中基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理的具体步骤包括:基于图注意力网络,将H={h1,h2……
h
n
}作为节点的输入特征,并计算两个节点之间的注意力系数,其计算公式为:其中,表示一个权重矩阵,用来对节点特征进行线性变换,表示一种共享的注意力机制,表示出节点对节点的重要性程度;在通过激活函数对注意力系数进行归一化处理,其计算公式为:
其中,α表示计算注意力的单层神经网络的权重,表示矩阵中的转置操作,表示对两个矩阵的连接操作。5.如权利要求2所述的社交网络影响力最大化方法,其特征在于,所述步骤S2中基于图注意力网络的图注意力网络层对处理后的节点表示特征X
i
再进行处理并计算节点特征输出,将K个输出的节点特征向量拼接起来即为最终的节点特征向量的具体步骤还包括:基于...

【专利技术属性】
技术研发人员:李远鑫王振宇韩柳李萍梁朝恺钟伟杰
申请(专利权)人:中邮消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1