【技术实现步骤摘要】
基于变分解耦合方式对符号有向网络的表达学习方法
本专利技术涉及社交网络领域,具体地,涉及一种基于变分解耦合方式对符号有向网络的表达学习方法,尤其是涉及一种结合贝叶斯方法和图卷积方法,基于变分解耦合,以一种解耦合的方式学习网络中节点的表达,用于社交网络中用户间关系的预测以及用户推荐。
技术介绍
图作为一种非规则的,非欧式空间的数据类型,广泛存在于现实生活中。例如,基因图谱,社交网络,知识图谱等。故而图(网络)数据中节点的表达学习成为近年来的研究热点。网络节点表达是网络分析中的基础任务,良好的节点表达有利于许多其他数据挖掘的任务,例如节点间边的预测,节点的分类,社区检测等。现实中的有些社交网络的边既存在方向,又存在正负。如Epinions和Slashdot网站。这种网络称为符号有向网络。有研究证明,负向的边包含额外的信息,该信息有利于其他任务的建模解决。网络中的边的方向代表了两个节点间不对称信息。这种非对称信息对某些非对称任务如用户推荐有着重要作用。例如社交网络中的知名用户往往不会关注普通用户,但是普通用户更倾向于关注知名用户。如何编码符号有向网络中的丰富信息主要有两 ...
【技术保护点】
1.一种基于变分解耦合方式对符号有向网络的表达学习方法,其特征在于,包括以下步骤:符号有向网络数据收集步骤:读取社交网站的符号有向网络数据,所述符号有向网络数据主要包括节点间边正负和方向的网络数据;符号有向网络分离步骤:令符号有向网络数据根据符号进行分离,得到正无向图、负无向图,所述正无向图用邻接矩阵A+表示,所述负无向图用邻接矩阵A‑表示;变分解耦合编码器步骤:令邻接矩阵A+、A‑输入至变分解耦合编码器,进行节点编码后的向量表达学习,记为学习后向量表达;结构解码器步骤:基于符号有向网络中节点间的关系构建结构解码器,令学习后向量表达依照目标损失函数进行修正,得到目标优化损失 ...
【技术特征摘要】
1.一种基于变分解耦合方式对符号有向网络的表达学习方法,其特征在于,包括以下步骤:符号有向网络数据收集步骤:读取社交网站的符号有向网络数据,所述符号有向网络数据主要包括节点间边正负和方向的网络数据;符号有向网络分离步骤:令符号有向网络数据根据符号进行分离,得到正无向图、负无向图,所述正无向图用邻接矩阵A+表示,所述负无向图用邻接矩阵A-表示;变分解耦合编码器步骤:令邻接矩阵A+、A-输入至变分解耦合编码器,进行节点编码后的向量表达学习,记为学习后向量表达;结构解码器步骤:基于符号有向网络中节点间的关系构建结构解码器,令学习后向量表达依照目标损失函数进行修正,得到目标优化损失函数作为优化后向量表达;数据挖掘任务应用步骤:令优化后向量表达应用于设定的数据挖掘任务。2.根据权利要求1所述的基于变分解耦合方式对符号有向网络的表达学习方法,其特征在于,变分解耦合编码器步骤包括:建立概率密度表达步骤:所述节点的向量表达解耦合成源节点表达Zs和目标节点表达Zt,令符号有向边D,建立如下的概率密度表达:p(D)=p(D|Zs,Zt)p(Zs|θs)p(Zt|θt)(1)式中,p(A|B)是条件概率公式,表示在事件B已经发生条件下事件A的发生概率;D表示观测到的符号有向边集合;p(D)表示D的概率密度表达;p(D|Zs,Zt)表示根据Zs,Zt重构出有向边D的概率;θs为源节点表达参数;θt为目标节点表达参数;Zs表示源节点表达;Zt表示目标节点表达;p(Zs|θs)表示根据θs得出源节点表达Zs的编码学习的概率;p(Zt|θt)表示根据θs得出目标节点表达Zt的编码学习的概率;建立变分图卷积表示步骤:令源节点表达Zs解耦合成正无向图中的表达和负无向图中的表达对于Zs在正无向图中的表达和Zs在负无向图中的表达用如下所示的两层变分图卷积网络表示:式中,q(A|B)是变分分布q的条件概率公式,表示事件B发生条件下事件A发生的概率分布;表示源节点在正无向图中的向量表达;表示源节点在负无向图中的向量表达;A+是正无向图的邻接矩阵,A-为负无向图的邻接矩阵;令X∈RN×F,X为节点的特征输入值,若节点无特征输入值,则设定X=IN,其中IN为大小为N的单位矩阵,N表示矩阵R的行数,F表示矩阵R的列数,R表示特征输入矩阵;下标i=1,2,…表示网络中节点编号;下标s表示源节点;上标p表示正无向图;上标n表示负无向图;表示第i个节点作为源节点在正无向图中的向量表达;表示第i个节点作为源节点在负无向图中的向量表达;和服从如下的高斯分布:变分网络分布参数由下式定义:式中,D+、D-分别是对角化的A+、A-的度矩阵;N(A|B)表示均值是A,方差为B的高斯分布;表示第i个节点作为源节点在正无向图中的变分分布参数的均值向量;表示第i个节点作为源节点在负无向图中的变分分布参数的均值向量;表示第i个节点作为源节点在正无向图中的变分分布参数的标准差向量;表示第i个节点作为源节点在负无向图中的变分分布参数的标准差向量;GCN表示图卷积网络;分别表示变分网络分布参数的图卷积网络;和分别为对称归一化后的邻接矩阵;h(·)=max(0,·)为非线性激活函数ReLU;和是的神经网络参数,和是的神经网络参数;表示源节点学习变分分布中的μ在正无向图中的神经网络参数,上标0表示第1层网络;表示源节点学习变分分布中的μ在负无向图中的神经网络参数,上标0表示第1层网络;F表示节点输入特征X的维度数;表示源节点学习变分分布中的μ在正无向图中的神经网络参数,上标1表示第2层网络;表示源节点学习变分分布中的μ在负无向图中的神经网络参数,上标1表示第2层网络;和是的神经网络参数,和是的神经网络参数;表示源节点学习变分分布中的σ在正无向图中的神经网络参数,上标0表示第1层网络;表示源节点学习变分分布中的σ在负无向图中的神经网络参数,上标0表示第1层网络;表示源节点学习变分分布中的σ在正无向图中的神经网络参数,上标1表示第2层网络;表示源节点学习变分分布中的σ在负无向图中的神经网络参数,上标1表示第2层网络;d1表示第一层GCN网络的隐空间维度;d表示第二层GCN网络的隐空间维度;建立变分解耦合编码器的KL散度步骤:源节点表达Zs的变分解耦合编码器的KL散度Ls由下式表示:目标节点表达Zt的变分解耦合编码器的KL散度Lt由下式表示:KL[A||B]是描述两个分布A,B的差异大小的度量方式,公式如下:x表示分布的随机变量;X表示原始图数据的特征表达输入;源节点表达Zs解耦合成正无向图中的表达和负无向图中的表达目标节点表达Zt解耦合成正无向图中的表达和负无向图中的表达3.根据权利要求1所述的基于变分解耦...
【专利技术属性】
技术研发人员:张娅,陈旭,姚江超,李茂森,王延峰,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。