【技术实现步骤摘要】
一种基于元路径的异质社交网络用户锚链接识别方法
本专利技术属于社交网络实体锚链接识别
,具体涉及一种基于元路径的异质社交网络用户锚链接识别方法。
技术介绍
21世纪以来,互联网技术的发展日新月异,越来越多的人可以成为社交网络的参与者。据统计,到2019年,全球社交网络行业的用户数量已经达到28.2亿,占网民总人数的70.4%。在国外,人们通常使用Twitter和Facebook进行交流;在国内,人们喜欢使用微博浏览各类热点新闻,同时使用QQ和微信进行基于好友之间的实时交流活动。在线社交网络源于人与人之间各种日常交流,是真实世界的活动映射到网络的一个个快照,同一个用户往往参与多个社交网络。随着参与社交网络的用户数量的不断增加,跨网络的锚链接用户(对齐用户)的识别问题具有很多重要的现实意义。社交网络的异质性、多个社交网络间的差异性、缺少大量锚链接关系已知的标签用户和一对一的限制给锚链接用户识别问题带来了挑战。如何利用社交网络中与用户相关的庞杂数据来构建异质社交网络用户锚链接识别模型成为社区发现、推荐系统和多网络融合的先验研 ...
【技术保护点】
1.一种基于元路径的异质社交网络用户锚链接识别方法,其特征在于,包括以下步骤:/n步骤1:输入异质社交网络S1和S2;/n步骤2:根据元路径
【技术特征摘要】
1.一种基于元路径的异质社交网络用户锚链接识别方法,其特征在于,包括以下步骤:
步骤1:输入异质社交网络S1和S2;
步骤2:根据元路径所表示的用户间的一阶链接关系,分别在两个网络S1和S2内判断用户和用户间是否存在一阶链接关系,并用矩阵M(1)和M(2)表示,矩阵的行和列分别对应一个网络内中的用户,矩阵元素1表示两个网内用户存在一阶链接关系,矩阵元素0表示两个网内用户不存在一阶链接关系;
步骤3:根据和这三条元路径所表示的二阶链接关系,分别获取两个网络S1和S2内用户和用户间满足以上三种格式的元路径的总数量和
其中,u1i和u1j为异质社交网络S1中两个用户;u2i和u2j为异质社交网络S2中两个用户;
步骤4:计算异质社交网络S1的二阶链接关系矩阵B(1)和异质社交网络S2的二阶链接关系矩阵B(2);矩阵B(1)的元素和矩阵B(2)的元素为:
其中,和分别表示异质社交网络S1中用户u1i和u1j的度;和分别表示异质社交网络S2中用户u2i和u2j的度;
步骤5:用矩阵B(1)修正矩阵M(1),用矩阵B(2)修正矩阵M(2),得到最终的用户与用户间完整的好友关系邻接矩阵M(1)和M(2);
如果M(1)中元素为1则跳过;如果M(1)中元素为0,则检查B(1)中对应位置的元素是否不小于0.5;如果B(1)中对应位置的元素不小于0.5,则将M(1)中的元素0改为1;否则,M(1)中元素保持不变;
如果M(2)中元素为1则跳过;如果M(2)中元素为0,则检查B(2)中对应位置的元素是否不小于0.5;如果B(2)中对应位置的元素不小于0.5,则将M(2)中的元素0改为1;否则,M(2)中元素保持不变;
步骤6:根据元路径所表示的用户和位置的签到关系,分别在两个网络内判断用户和位置间是否存在通过文本连接的签到关系,并用矩阵N(1)和N(2)表示,矩阵的行和列对应用户和位置,对应元素表示是否存在签到关系,如果对应的用户和位置存在签到关系,则对应元素为1,否则为0;
步骤7:获取用户锚链接识别目标函数F(X,Y);
其中,X表示用户锚链接关系映射矩阵;Y表示用户位置关系映射矩阵;表示矩阵的弗罗贝尼乌斯范数的平方;||||1矩阵的L1范数;V为网间用户属性特征相似度矩阵,矩阵元素Vm,n为:
其中,为异质社交网络S1中的用户ui和S2中的用户uj的用户名相似度,为用户ui的用户名,为用户uj的用户名;为异质社交网络S1中的用户ui和S2中的用户uj的在线活动时间模式相似度,为用户ui的在线活动时间向量,为用户uj的在线活动时间向量;为异质社交网络S1中的用户ui和S2中的用户uj的文本内容相似度,为用户ui文本内容的词频向量,为用户uj文本内容的词频向量;
步骤8:计算用户锚链接识别目标函数F(X,Y)为最小值时的矩阵X,得到用户锚链接关系映射矩阵X;矩阵X中元素为1代表对应的两个用户存在锚链接关系,元素为0表示对应的两个用户间不存在锚链接关系。
2.根据权利要求1所述的一种基于元路径的异质社交网络用户锚链接识别方法,其特征在于:所述的步骤8中计算用户锚链接识别目标函数F(X,Y)的最小值的方法为:采用交替投影梯度下降的方法,先固定Y,将目标函数对X求偏导,更新矩阵X中的元素;再固定X,将目标函数对Y求偏导,更新矩阵Y中的元素;在每一轮对X和Y更新之后,对矩阵X和Y中的元素进行修正;如果矩阵中的元素大于1,则将该元素投影为1;如果矩阵中的元素小于0,则将该元素投影为0;其他情况则保持不变;设置交替投影梯度下降的最大迭代次数,在不超过最大迭代次数的情况下,不断更新矩阵X和Y,直到目标函数达到最小值时,输出用户锚链接关系映射矩阵X;
3.根据权利要求1或2所述的一种基于元路径的异质社交网络用户锚链接识别方法,其特征在于:所述的步骤7中异质社交网络S1中的用户ui和S2中的用户uj的用户名相似度的计算方法为:
其中,g为用户ui和用户uj的用户名上匹配的字符数,h等于匹配的字符中出现换位数的一半;为用户ui的用户名长度;为用户uj的用户名长度;l为...
【专利技术属性】
技术研发人员:杨武,王巍,玄世昌,苘大鹏,吕继光,刘娟,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。