【技术实现步骤摘要】
一种跨社交网络用户身份匹配的方法
[0001]本专利技术涉及一种跨社交网络用户身份匹配的方法。
技术介绍
[0002]近年来,随着信息技术的发展,人们已逐步进入互联网时代。在线社交网络作为一种在线的网络服务形式,为人们提供了除了现实生活之外的新型社交渠道,也代表了一种新的信息传播和交互的方式。社交网络的多样化使每一个互联网用户在不同的社交平台中留下了用户行为信息的蛛丝马迹,各大社交网络平台中隐藏着价值巨大的用户行为数据。但目前即使在大数据平台数据分析的支撑下,大多数社交网络分析研究也都是针对单一社交平台展开的,同一平台下的数据具有用户群体范围局限性和行为内容局限性,各个社交网络平台之间缺乏信息共享机制。
[0003]跨社交网络用户身份匹配是指对多个在线社交网络平台的用户账号进行匹配,以识别现实世界中不同账号下的自然人用户身份。跨社交网络的信息挖掘研究有利于人们科学地认识到在线社交网络平台中社交关系的内在规律,将对复杂网络科学的发展起到积极的促进作用。目前,例如链接预测、信息传播、社区检测等方面的研究工作,在单一复杂网 ...
【技术保护点】
【技术特征摘要】
1.一种跨社交网络用户身份匹配的方法,其特征在于,包括以下步骤:步骤S1,利用两个社交网络数据对已知用户名数据进行匹配,将每一对匹配的用户名数据用空格连接起来,得到正样本对,再打乱所述两个社交网络数据对所对应的用户名顺序,随机抽取数据并得到负样本对,所述正样本对数量和所述负样本对数量相等,构成用户名样本对数据集;步骤S2,利用字母表对所述用户名样本对数据集中的每一个用户名样本对进行向量化表示,得到所述样本对训练数据集;步骤S3,构建用户身份匹配网络模型;步骤S4,将所述样本对训练数据集输入到所述用户身份匹配网络模型,利用交叉熵损失函数loss(x,class)进行监督训练,当训练次数满足结束条件,得到训练完成的用户身份匹配网络模型;步骤S5,将两个待测用户名数据进行配对,得到待测样本对数据;步骤S6,将所述待测样本对数据输入到所述训练完成的用户身份匹配网络模型,得到用户名匹配结果,其中,所述用户身份匹配网络模型为卷积神经网络模型,包括输入层、隐含层和输出层,所述输出层包括softmax分类器和多个全连接层,每两个所述全连接层之间有dropout层。2.根据权利要求1所述的一种跨社交网络用户身份匹配的方法,其特征在于:其中,所述交叉熵损失函数loss(x,class)的具体表达式为:式中,x[class]表示样本的标签,x[j]表示所述样本对数据j的匹配结果为正的概率。3.根据权利要求1所述的一种跨社交网络用户身份匹配的方法,其特征在于:其中,所述隐含层包括多个卷积层,多个池化层,所述输出层包括三个所述全连接层,两个所述dropout层分别在所述三个全连接层的两两之间。4.根据权利要求3所述的一种跨社交网络用户身份匹配的方法,其特征在于:其中,所述卷积层的计算公式为:式中,M
ij
表示输入层...
【专利技术属性】
技术研发人员:张毅超,杨钥,刘甜甜,关佶红,李文根,周水庚,
申请(专利权)人:复旦大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。