【技术实现步骤摘要】
一种跨平台的社交网络用户身份识别方法
本专利技术属于数据挖掘领域,更具体讲,是一种跨平台的社交网络用户身份识别方法。
技术介绍
随着社交网络的飞速发展,一个实体用户一般拥有多个社交网络平台上的网络账户,把这些网络账户所对应的实体用户识别出来具有重要的意义,比如在商业应用、网络安全、推荐系统等方面,所以近年来很多学者在此方面做了很多的工作。在现有的跨平台的社交网络身份识别技术中,采用基于排名的交叉匹配方法(RCM)实现了跨平台的社交网络用户身份识别,但是RCM方法缺少对用户行为分析和赋予用户属性合理的权值,从而导致了最终的识别结果准确率不高,因为用户行为数据往往更能反映出用户的真实个性,同时用户的不同维度所扮演的权重不一样,但是在现有的跨平台的社交网络身份识别技术中,很少会考虑用户属性权重的问题,或者是采用后验经验法对用户的不同维度赋予权重,这样也导致了最终的识别结果准确率不高。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供种跨平台的社交网络用户身份识别方法,该方法将用户档案数据和用户行为数据相结合,在用户行为数据的分析上,提出了一种基于频繁模式的文本相似 ...
【技术保护点】
1.一种跨平台的社交网络用户身份识别方法,其特征在于,包括以下步骤:(1)从社交网站账户数据中抽取出使用所述社交网站账户的各用户档案数据和用户行为数据;(2)将用户档案数据和用户行为数据分别按照不同的特征属性划分成不同的维度,在不同的维度下分别采用相应的相似度计算方法计算两个平台下各个维度的相似度,并基于不同的维度下的相似度构建用户档案数据相似度向量和用户行为数据相似度向量,将用户档案数据相似度向量和用户行为数据相似度向量一起组成用户相似度向量;(3)基于信息熵的后验概率权值分配方法为用户的不同维度赋予相应的权重;(4)基于步骤(2)的用户相似度向量和步骤(3)为用户的不同 ...
【技术特征摘要】
1.一种跨平台的社交网络用户身份识别方法,其特征在于,包括以下步骤:(1)从社交网站账户数据中抽取出使用所述社交网站账户的各用户档案数据和用户行为数据;(2)将用户档案数据和用户行为数据分别按照不同的特征属性划分成不同的维度,在不同的维度下分别采用相应的相似度计算方法计算两个平台下各个维度的相似度,并基于不同的维度下的相似度构建用户档案数据相似度向量和用户行为数据相似度向量,将用户档案数据相似度向量和用户行为数据相似度向量一起组成用户相似度向量;(3)基于信息熵的后验概率权值分配方法为用户的不同维度赋予相应的权重;(4)基于步骤(2)的用户相似度向量和步骤(3)为用户的不同维度赋予的权重构造用户评分公式,以稳定婚姻匹配算法进行匹配评分,将最终评分与评分阈值进行比较,从而得出最终识别结果。2.根据权利要求1所述的跨平台的社交网络用户身份识别方法,其特征在于,所述步骤(2)具体包括:将用户档案数据按照不同特征属性划分成不同维度,在不同的维度下分别采用相应的相似度计算方法计算两个平台下各个维度的相似度,并将不同维度下的相似度与其相应的阈值进行比较,如果大于阈值则返回“1”,小于阈值则返回“0”,从而构成用户档案数据相似度向量;将用户行为数据分别按照用户博文数据,博文特殊符号数据,博文状态时间数据划分成不同维度,在不同维度下分别构建频繁项集、特殊符号向量和时间戳向量,并根据构建的频繁项集、特殊符号向量和时间戳向量分别采用相应的相似度计算方法计算两个平台下的博文数据相似度、特殊符号相似度和时间戳相似度;将博文数据相似度、特殊符号相似度和时间戳相似度分别与其相应的阈值进行比较,如果大于阈值则返回“1”,小于阈值则返回“0”,从而构成用户档案数据相似度向量;所述用户档案数据相似度向量和用户行为数据相似度向量构成用户相似度向量。3.根据权利要求2所述的跨平台的社交网络用户身份识别方法,其特征在于,所述用户档案数据在不同维度下分别采用相应的相似度计算方法计算两个平台下各个维度的相似度包括:Dice系数计算,其计算公式为:其中,a、b分别表示两个字符串集合;余弦相似度计算,即把两个字符串量化成词向量,其计算公式...
【专利技术属性】
技术研发人员:马强,张琦,郑龙水,何燕玲,邢玲,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。