【技术实现步骤摘要】
一种具有社团结构的网络表示学习方法及装置
本专利技术涉及计算机
,具体涉及一种具有社团结构的网络表示学习方法及装置。
技术介绍
许多复杂系统可以抽象成网络结构,而网络结构通常由图来表示,即由一组节点和一组连边组成。对于小规模网络,我们可以在它上面快速执行许多复杂任务,例如社团挖掘和多标签分类。然而,对于大规模网络(例如具有数十亿个顶点的网络),在它上面执行这些复杂任务是一个挑战。为了解决这个问题,我们必须找到另外一种简洁而有效的网络表示形式。网络嵌入就是解决该问题的一种有效策略,即学习网络中顶点的低维向量表示。对于每个顶点,我们将它们在网络中的结构特征映射到低维空间向量,然后再将这些向量应用于网络中的复杂任务。在过去的几年中,有人提出了许多刻画网络局部结构的网络嵌入方法。DeepWalk方法通过使用截断的随机游走策略来刻画网络顶点的邻域结构。Node2vec方法证明DeepWalk并不能捕获网络中连接模式的多样性。它提出了一种偏向随机行走策略,该策略结合了BFS和DFS思想来探索顶点邻域信息。LINE方法主要应 ...
【技术保护点】
1.一种具有社团结构的网络表示学习方法,其特征在于,包括以下步骤:/n步骤1:数据收集与处理阶段:使用一种密度函数,通过在网络G上使用随机游走策略,获得顶点序列样本S={s
【技术特征摘要】
1.一种具有社团结构的网络表示学习方法,其特征在于,包括以下步骤:
步骤1:数据收集与处理阶段:使用一种密度函数,通过在网络G上使用随机游走策略,获得顶点序列样本S={s1,s2,...,sn};
步骤2:数据表示学习阶段:优化Skip-gram模型,使用Skip-gram模型来训练顶点序列样本S={s1,s2,...,sn},得到每个顶点序列的向量表示;
步骤3:数据计算阶段:对每个顶点序列的向量表示进行相似度计算,获得社团划分相似度。
2.根据权利要求1所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤1中,顶点序列样本S={s1,s2,...,sn}中顶点序列表示为s={v1,v2...,v|s|}。
3.根据权利要求2所述的一种具有社团结构的网络表示学习方法,其特征在于,
所述步骤1中的密度函数定义为:
其中和分别是顶点序列s中所有顶点的内部度之和与外部度之和,而α是分辨率参数,用于控制社团的大小;
所述密度函数还具有密度增益Δfvs,所述密度增益Δfvs应满足如下公式:
△fs=fs+{v}-fs
其中符号s+{v}表示将顶点v移到s后得到的新顶点序列。
4.根据权利要求3所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤1中获得顶点序列样本的具体步骤为:
步骤11:从集合N′(v|s|)中随机选择一个顶点v|s|+1;
步骤12:根据公式△fs=fs+{v}-fs计算Δfsv|s|+1;
步骤13:如果Δfsv|s|+1<0,则从集合N′(v|s|)中删除v...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。