当前位置: 首页 > 专利查询>中南大学专利>正文

一种针对时序社交数据的Sybil账号检测方法技术

技术编号:24458770 阅读:30 留言:0更新日期:2020-06-10 16:21
本发明专利技术公开一种针对时序社交数据的Sybil账号检测方法,首先通过收集、分析真实社交数据发现Sybil用户和正常用户的社交行为差别。其次,本发明专利技术提出了基于求和和基于熵的同一社交用户不同时段的交互特征表示法;通过计算不同社交用户的Wasserstein距离,提出了Wasserstein距离平均值、标准差以及交互特征序列最大值相结合的用户特征表示法。再者,为了预测社交用户是否为Sybil用户,本发明专利技术提出运用K‑mean方法作为预测模型并用真实训练集训练模型。最后,面对新用户,本发明专利技术首先形式化定义用户社交特征,并用训练好的模型预测其属于哪一类用户。

A Sybil account detection method for temporal social data

【技术实现步骤摘要】
一种针对时序社交数据的Sybil账号检测方法
本专利技术涉及互联网社交
,特别是涉及一种针对时序社交数据的Sybil账号检测方法。
技术介绍
社交网络是社会学家在20世纪60年代提出的新兴概念,是面对面社交关系的延伸。随着网络技术和移动设备的发展,在线社交网络(OSN)也呈现爆炸式发展,并逐步成为人们日常生活、工作以及娱乐的重要平台。在线社交网络不仅能够为用户提供个人资料的建立、扩展和维护等功能,还能够支持兴趣共享、朋友互动以及情感分享等服务。Facebook作为第一个真正的社交网络,于2004年根据实际用户关系推出了全方位的社交服务。随着Web2.0技术的发展,越来越多的社交网络开始崭露头角,如国外的Twitter、LinkedIn、Instagram,国内的微信、新浪微博等。快速发展的在线社交网络在给人们带来便利的同时,其巨大的用户量也引起了攻击者的注意。这些攻击者通过创建大量Sybil账号或者盗用正常账号在社交平台中发布广告,从而引导舆论走向、欺骗正常用户、影响用户正常权益、威胁账户安全以及降低用户体验等,如:发布虚假URL本文档来自技高网...

【技术保护点】
1.一种针对时序社交数据的Sybil账号检测方法,其特征在于,包括如下步骤:/n步骤1:获取用户的时序社交数据,所述时序社交数据包括用户属性文件、推文、转发推文、点赞推文、评论推文以及相应的时间;/n步骤2:清洗时序社交数据得到用户的交互数据和用户资料,所述交互数据包括转推数、评论数、点赞数、提及数以及发推时间,并根据所述交互数据形成训练集和测试集;/n步骤3:提取训练集和测试集数据的交互特征;/n步骤4:将训练集中的所有用户的特征组合成特征矩阵F,运用K-mean方法对训练集用户特征数据进行训练,形成分类模型;/n步骤5:选取测试集用户,计算测试集用户与其他用户的Wasserstein距离,...

【技术特征摘要】
1.一种针对时序社交数据的Sybil账号检测方法,其特征在于,包括如下步骤:
步骤1:获取用户的时序社交数据,所述时序社交数据包括用户属性文件、推文、转发推文、点赞推文、评论推文以及相应的时间;
步骤2:清洗时序社交数据得到用户的交互数据和用户资料,所述交互数据包括转推数、评论数、点赞数、提及数以及发推时间,并根据所述交互数据形成训练集和测试集;
步骤3:提取训练集和测试集数据的交互特征;
步骤4:将训练集中的所有用户的特征组合成特征矩阵F,运用K-mean方法对训练集用户特征数据进行训练,形成分类模型;
步骤5:选取测试集用户,计算测试集用户与其他用户的Wasserstein距离,并计算所述Wasserstein距离的均值、标准差以及用户交互特征的最大值作为用户的特征向量;将得到的用户特征向量作为分类模型的输入,判断用户是否为Sybil用户。


2.根据权利要求1所述的针对时序社交数据的Sybil账号检测方法,其特征在于,所述交互特征包括同一社交用户不同时段内交互特征、不同社交用户交互序列之间特征差异、生成社交用户的时序特征。


3.根据权利要求1所述的针对时序社交数据的Sybil账号检测方法,其特征在于,步骤3的具体过程如下:
步骤3.1:依据社交交互数据,按时间段将每个用户的交...

【专利技术属性】
技术研发人员:姚鑫鲁洋阳刘佳琦陈志刚赵明
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1