【技术实现步骤摘要】
一种针对时序社交数据的Sybil账号检测方法
本专利技术涉及互联网社交
,特别是涉及一种针对时序社交数据的Sybil账号检测方法。
技术介绍
社交网络是社会学家在20世纪60年代提出的新兴概念,是面对面社交关系的延伸。随着网络技术和移动设备的发展,在线社交网络(OSN)也呈现爆炸式发展,并逐步成为人们日常生活、工作以及娱乐的重要平台。在线社交网络不仅能够为用户提供个人资料的建立、扩展和维护等功能,还能够支持兴趣共享、朋友互动以及情感分享等服务。Facebook作为第一个真正的社交网络,于2004年根据实际用户关系推出了全方位的社交服务。随着Web2.0技术的发展,越来越多的社交网络开始崭露头角,如国外的Twitter、LinkedIn、Instagram,国内的微信、新浪微博等。快速发展的在线社交网络在给人们带来便利的同时,其巨大的用户量也引起了攻击者的注意。这些攻击者通过创建大量Sybil账号或者盗用正常账号在社交平台中发布广告,从而引导舆论走向、欺骗正常用户、影响用户正常权益、威胁账户安全以及降低用户体验等 ...
【技术保护点】
1.一种针对时序社交数据的Sybil账号检测方法,其特征在于,包括如下步骤:/n步骤1:获取用户的时序社交数据,所述时序社交数据包括用户属性文件、推文、转发推文、点赞推文、评论推文以及相应的时间;/n步骤2:清洗时序社交数据得到用户的交互数据和用户资料,所述交互数据包括转推数、评论数、点赞数、提及数以及发推时间,并根据所述交互数据形成训练集和测试集;/n步骤3:提取训练集和测试集数据的交互特征;/n步骤4:将训练集中的所有用户的特征组合成特征矩阵F,运用K-mean方法对训练集用户特征数据进行训练,形成分类模型;/n步骤5:选取测试集用户,计算测试集用户与其他用户的Wass ...
【技术特征摘要】
1.一种针对时序社交数据的Sybil账号检测方法,其特征在于,包括如下步骤:
步骤1:获取用户的时序社交数据,所述时序社交数据包括用户属性文件、推文、转发推文、点赞推文、评论推文以及相应的时间;
步骤2:清洗时序社交数据得到用户的交互数据和用户资料,所述交互数据包括转推数、评论数、点赞数、提及数以及发推时间,并根据所述交互数据形成训练集和测试集;
步骤3:提取训练集和测试集数据的交互特征;
步骤4:将训练集中的所有用户的特征组合成特征矩阵F,运用K-mean方法对训练集用户特征数据进行训练,形成分类模型;
步骤5:选取测试集用户,计算测试集用户与其他用户的Wasserstein距离,并计算所述Wasserstein距离的均值、标准差以及用户交互特征的最大值作为用户的特征向量;将得到的用户特征向量作为分类模型的输入,判断用户是否为Sybil用户。
2.根据权利要求1所述的针对时序社交数据的Sybil账号检测方法,其特征在于,所述交互特征包括同一社交用户不同时段内交互特征、不同社交用户交互序列之间特征差异、生成社交用户的时序特征。
3.根据权利要求1所述的针对时序社交数据的Sybil账号检测方法,其特征在于,步骤3的具体过程如下:
步骤3.1:依据社交交互数据,按时间段将每个用户的交...
【专利技术属性】
技术研发人员:姚鑫,鲁洋阳,刘佳琦,陈志刚,赵明,
申请(专利权)人:中南大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。