面向多社交网络平台的机器人检测方法技术

技术编号:34483124 阅读:51 留言:0更新日期:2022-08-10 09:00
本发明专利技术公开了一种面向多社交网络平台的机器人检测方法,包括:获取社交网络平台的用户账号数据,将账号ID作为用户的唯一标识符,提取用户特征,朋友特征,网络特征,内容特征,情感特征,时序特征;构建高维的原始矩阵,通过显著性分析,得到低维的特征矩阵;采用聚类算法或分类算法实现划分,识别出正常用户账号与机器人账号。本发明专利技术还公开了一种面向多社交网络平台的机器人检测装置、电子设备及存储介质。本发明专利技术对境内外多个社交网络平台账号数据进行研究,通过特征表示、特征显著性分析、聚类或分类等算法进行社交机器人检测,识别出社交网络中的社交机器人账号,从而预警大规模社交机器人异常行为,进而维护社交网络安全。进而维护社交网络安全。进而维护社交网络安全。

【技术实现步骤摘要】
面向多社交网络平台的机器人检测方法


[0001]本专利技术涉及计算机
更具体地说,本专利技术涉及一种面向多社交网络平台的机器人检测方法。

技术介绍

[0002]各类社交网络平台(Twitter、Facebook、微博等)的兴起为人们提供了沟通和交流的新渠道,但在这种非面对面的线上社交环境中,社交账号背后可能不是真实的人,而是社交机器人。社交机器人的泛滥在一定程度上改变传播格局,社交机器人的恶意使用对社交媒体用户的信息安全形成了严重威胁,甚至对网络空间信息安全和意识安全产生重大影响。进行社交机器人检测,识别出社交网络中的社交机器人账号对维护网络安全和用户交互中的公平信任具有重要意义。

技术实现思路

[0003]本专利技术提供一种面向多社交网络平台的机器人检测方法,其对境内外多个社交网络平台账号数据进行研究,通过特征表示、特征显著性分析、聚类或分类等算法进行社交机器人检测,识别出社交网络中的社交机器人账号,从而预警大规模社交机器人异常行为,进而维护社交网络安全。
[0004]为了实现根据本专利技术的这些目的和其它优点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.面向多社交网络平台的机器人检测方法,其特征在于,包括:获取社交网络平台的用户账号数据,将账号ID作为用户的唯一标识符,进行数据预处理并提取基于用户身份信息的用户特征,基于用户关注数和粉丝数的朋友特征,基于用户帖文内容的网络特征、内容特征和情感特征,基于用户帖文时间的时序特征;对所有账号ID的所述用户特征、朋友特征、网络特征、内容特征、情感特征、时序特征构建高维的原始矩阵,通过显著性分析将高维变量降维为低维变量,得到低维的特征矩阵;选择部分用户账号进行人工打标,并对社交机器人账号添加标签,对于没有标签的数据集,采用聚类算法实现划分,对于含有标签的数据集,采用分类算法实现划分,识别出正常用户账号与机器人账号。2.如权利要求1所述的面向多社交网络平台的机器人检测方法,其特征在于,社交网络平台包括Twitter、Facebook、微博。3.如权利要求1所述的面向多社交网络平台的机器人检测方法,其特征在于,用户账号数据包括账号ID、昵称、简介、性别、等级、邮政编码、关注数、粉丝数、帖文内容与时间。4.如权利要求3所述的面向多社交网络平台的机器人检测方法,其特征在于,进行数据预处理并提取用户特征包括:基于昵称、简介,分别提取长度特征、数字特征、中英文特征以及特殊符号与单词特征,基于性别、等级、邮政编码,分别映射为数字形式,得到多个子维度的特征数字串;进行数据预处理并提取朋友特征包括:基于关注数、粉丝数,提取关注数与粉丝数比值的粉丝关注比特征,分别映射为数字形式,得到多个子维度的特征数字串;进行数据预处理并提取网络特征包括:基于用户预定数量的帖文内容的“提及”和“话题”,提取平均频率特征,分别映射为数字形式,得到多个子维度的特征数字串;进行数据预处理并提取内容特征包括:基于用户预定数量的帖文内容,进行分词、词性识别、词性词频统计,提取平均词性词频特征,分别映射为数字形式,得到多个子维度的特征数字串;进行数据预处理并提取情感特征包括:基于用户预定数量的帖文内容,进行分词、通过情感词频统计的情感识别、计算情感得分、判断情感倾向,提取平均情感倾向特征,分别映射为数字形式,得...

【专利技术属性】
技术研发人员:张旭刘春阳张翔宇
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1