【技术实现步骤摘要】
融合用户特征和嵌入学习的跨社交网络用户身份关联方法
本专利技术涉及社交网络的用户关系挖掘领域。尤其是涉及一种融合用户特征和嵌入学习的跨社交网络用户身份关联方法。
技术介绍
自媒体时代越来越多的用户开始习惯在社交网络(SocialMediaNetwork,SMN)上实现日常的互动和信息的获取。现今,社交网络个数已达上百个,且种类繁多,典型的如校园类的人人网、开心网,学习类的知乎网等,综合类的如MySpace、Twitter和Facebook等。人们为了享受不同网站提供的服务往往需要注册为该网站的用户。普通用户拥有多个不同社交网站的帐号是较普遍的情况。用户可以在Foursquare上用手机与别人分享地理位置信息进行交流,也可以在MySpace上交友、分享个人信息并进行即时通讯。每个用户若在不同的社交网络注册,将在不同的社交网站包含其个人信息(如年龄,工作单位,毕业院校等等),以及发表的文本内容,发布的视频、图像等多媒体信息,以及在自己感兴趣内容下的评论、转发等。对这些信息进行整合、分析,将构成用户完整的个人画像。现有的社交网络与社交网络之间由于功能不同,因此往往是相互独立的,而且针对同一用户在不同网络上的注册信息缺乏有效的管理平台进行统一管理。为了分析某用户甚至群体用户在社交网络上的行为,获取用户的完整图像(profile),需要整合用户在不同社交网络上的数据,其突破口在于跨社交平台的用户身份匹配,即识别用户在多个社交网络上的帐号。跨社交平台的身份匹配对商业上的信息服务推送、好友推荐以及网络安全治理有极其重要的意 ...
【技术保护点】
1.融合用户特征和嵌入学习的跨社交网络用户身份关联方法,其特征在于包括如下步骤:/n步骤1.给定社交网络SMN
【技术特征摘要】
1.融合用户特征和嵌入学习的跨社交网络用户身份关联方法,其特征在于包括如下步骤:
步骤1.给定社交网络SMNA和社交网络SMNB,并通过人工标注获取少量种子用户对集合MPprior;
步骤2.利用用户的连接关系使用网络嵌入方法学习得到社交网络SMNA和社交网络SMNB中每个节点的结构嵌入向量,利用种子用户对集合MPprior训练多层感知机模型,作为两个社交网络间节点的结构嵌入向量空间的映射函数;
步骤3.从种子用户对集合MPprior中随机选取一对种子用户c,利用该对种子用户c从两个社交网络中选取候选配对用户对集合;
步骤4.针对候选配对用户对集合中的每对候选配对用户对,利用用户名、毕业院校和地理位置以及个人简介的特征,通过Levenshtein距离和简单字符串匹配得到候选配对用户对的用户属性匹配度;
步骤5.针对候选配对用户对集合中的每对候选配对用户对,根据训练好的多层感知机模型,将社交网络SMNA用户的嵌入特征空间映射到社交网络SMNB用户的嵌入特征空间,再计算社交网络SMNA用户的映射向量与社交网络SMNB用户的嵌入向量之间的欧式距离作为两用户的朋友匹配度;
步骤6.利用用户属性匹配度和朋友匹配度的匹配准则得到匹配用户对,并将匹配用户对加入到匹配用户对集合MP中;
步骤7.将步骤3中选取的一对种子用户c从种子用户对集合MPprior中删除,并将匹配用户对加入种子用户对集合MPprior,返回步骤3,直到种子用户对集合MPprior为空。
2.根据权利要求1所述的融合用户特征和嵌入学习的跨社交网络用户身份关联方法,其特征在于步骤1具体实现如下:
1-1.给定的社交网络SMNA和社交网络SMNB,分别表示为SMNA={UA,EA},SMNB={UB,EB};UA表示社交网络SMNA的用户实体集合,EA为社交网络SMNA的用户关系,UB表示社交网络SMNB的用户实体集合,EB为社交网络SMNB的用户关系,UAi代表用户实体集合UA中的第i个用户,UBj代表用户实体集合UB中的第j个用户;若用户UAi和用户UBj在现实生活中属于同一个体,则(UAi,UBj)∈MP,MP为匹配用户对集合;
1-2.通过人工标注段获取少量种子用户对集合MPprior,其中种子用户对集合MPprior是已知的匹配用户对。
3.根据权利要求2所述的融合用户特征和嵌入学习的跨社交网络用户身份关联方法,其特征在于步骤2的具体实现过程如下:
2-1.针对社交网络SMNA中用户的连接关系对社交网络SMNA进行嵌入学习;给定节点UAj和节点UAi的嵌入向量分别为zAj和zAi,按照下式计算社交网络SMNA中节点UAj和节点UAi间存在边(UAi,UAj)的概率为:
基于此,社交网络SMNA嵌入学习的目标函数:
其中,σ(x)代表sigmoid函数,EA为社交网络SMNA中用户关系;
2-2.针对社交网络SMNB中用户的连接关系对社交网络SMNB进行嵌入学习;给定节点UBi和UBj的嵌入向量分别为zBi和zBj,按照下式计算社交网络SMNB中节点UBi和UBj间存在边的概率为:
基于此,社交网络SMNB嵌入学习的目标函数为:
其中,EB为社交网络SMNB中边的用户关系;;
2-3.综合两个网络的目标函数得到网络嵌入学习的最终目标函数:
为了学习到嵌入向量,需要对最终目标函数O进行最小化;采用随机梯度下降法分别对O1和O2进行最小化求解;同时采用负采样方法...
【专利技术属性】
技术研发人员:王李冬,安康,张慧熙,胡克用,叶霞,刘军,
申请(专利权)人:杭州师范大学钱江学院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。