【技术实现步骤摘要】
基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法
本专利技术涉及计算机
,特别是涉及一种基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法。
技术介绍
在社交网络分析的问题中,网络表示学习是一个非常重要的问题。其目标是为网络中每个节点学习一个稠密、连续和低维的向量作为其特征表示。现有工作已经证明,学习到的特征对于各种重要的社交网络数据挖掘任务都有所帮助,比如信息传播、节点分类、链路预测和网络可视化等。网络表示学习的一个最基本要求是在所学习特征空间中体现原有的网络结构。早期的一些研究工作,主要保持原来存在链接关系的节点在特征空间中的相似性,现在,更多的研究工作集中于:在特征空间内,保证原有网络结构中未观测到,但存在合理近邻关系的节点之间的相似性。为了利用网络结构中的标注信息,近些年来半监督网络表示学习引起了研究者的广泛关注,基本思想是同时优化一个利用网络结构信息的网络结构嵌入模型和一个利用标注信息的分类模型。由于同时考虑到了网络的结构信息和标注信息,学到的特征一般具有很强的辨别性,也往往能达到当下最好的效果。现有的半监督网络表示学习的工作大多 ...
【技术保护点】
一种基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法,其特征在于,包括:获取社交网络数据,网络中存在已标注的节点和未知类别的节点;对网络结构信息进行建模;对网络类内相似性进行建模;对网络类间差异性进行建模;构造网络表示学习的目标函数;根据优化问题求解算法求得目标函数的解,得到学习到的特征结果。
【技术特征摘要】
1.一种基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法,其特征在于,包括:获取社交网络数据,网络中存在已标注的节点和未知类别的节点;对网络结构信息进行建模;对网络类内相似性进行建模;对网络类间差异性进行建模;构造网络表示学习的目标函数;根据优化问题求解算法求得目标函数的解,得到学习到的特征结果。2.根据权利要求1所述的基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法,其特征在于,所述社交网络表示为:是大小为n的节点集合,节点间的边集为是节点种类的集合,网络中存在的已标注的节点类别,构成集合在标注数据平衡的情况下,在完全非平衡的情况下,3.根据权利要求1所述的基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法,其特征在于,所述对网络结构信息进行建模包括:将随机游走的节点序列记为一组路径ω={υ1,...,υ|ω|},υi表示一个节点,所有路径构成路径集合Ω;路径ω={υ1,...,υ|ω|}的概率Pr(υj|υi)为:式中:ui代表学习得到的节点υi的特征,点乘为两个向量的内积;目标为最大化如下似然概率:对特定的矩阵M进行矩阵分解,矩阵M的每个元素为:式中,A为概率转移矩阵,ei则是一个n维向量,该向量第i个元素为1,其他元素均为0,此时,Mij表示的是从节点...
【专利技术属性】
技术研发人员:王朝坤,叶晓俊,王铮,王彬彬,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。