基于相似子图匹配的在线马甲检测方法技术

技术编号：22565681 阅读：20 留言：0更新日期：2019-11-16 12:16

本发明专利技术提出一种基于相似子图匹配的在线马甲检测方法，包括以下步骤：利用训练数据训练分类算法，建立检测模型；根据所有被封禁账号的社交活动，构建交互网络图和兴趣网络图；将对于待检测账号，根据其社交活动，构建交互网络图和兴趣网络图；将该待检测账号与所有被封禁账号分别进行配对，组成账号对；根据相似子图匹配方法，计算每个账号对的交互网络相似度和兴趣网络相似度；将交互网络相似度和兴趣网络相似度组成特征矩阵，输入到检测模型，判断该待检测账号和封禁账号之间是否匹配，如果匹配，则该待检测账号判定为马甲账号，否则判定为正常账号。

Online vest detection method based on similar subgraph matching

The invention proposes an online vest detection method based on similar subgraph matching, which comprises the following steps: using training data to train classification algorithm, establishing detection model; building interaction network diagram and interest network diagram according to social activities of all banned accounts; building interaction network diagram and interest network diagram according to social activities of accounts to be detected; building interaction network diagram and interest network diagram according to social activities of accounts to be detected; and Test account and all blocked accounts are matched separately to form account pairs; according to the similar subgraph matching method, calculate the interaction network similarity and interest network similarity of each account pair; form the feature matrix of interaction network similarity and interest network similarity, input it into the detection model, and judge whether the account to be tested matches the blocked account, if so, then The account to be tested is determined as vest account, otherwise it is determined as normal account.

全部详细技术资料下载

【技术实现步骤摘要】
基于相似子图匹配的在线马甲检测方法
本专利技术涉及一种基于相似子图匹配的马甲检测方法，属于计算机领域。
技术介绍
在线社交网络扩大了人们的交友圈，并且在我们的日常生活中，已经成为一个非常重要的部分。随着社交网络平台和其他在线交互平台的日益普及，身份盗窃、网络欺诈等网络犯罪越来越普遍，社交网络的用户对网络社区造成负面影响的可能性不断增加。在社交网络中，人们能够实时分享他们的想法和喜好，同时分享与传播的便利性往往会带来社交网络安全威胁，而网络空间中的匿名和虚假身份的存在，导致网络犯罪行为更加难以被及时察觉。社交网络平台和社交应用程序的多样性以及便利性，以及网络空间中存在的空间和时间的距离而带来的安全性，进一步助长了这类犯罪行为。这些网络威胁基于社交网络平台的脆弱性而迅速扩散，如身份盗窃，身份模拟等行为。有些恶意用户会通过社交网络制造一些网络空间的安全问题，例如，垃圾评论、欺诈、网络欺凌、恶意言论、歧视，这些恶意行为会导致这些用户被封禁。为了绕过封禁机制，他们中的一些人会注册一个或者多个新的账号以便于继续发布和传播垃圾信息，这些账号称为马甲，这是由于很多社交平台的注册机制管理不严格，很容易产生新的账号。在本文中，广泛地定义一个马甲为一个用户账号，这个账号被一个个人(或者马甲操纵者)控制，这个人还控制了至少一个其他账号。并且，用马甲组或者马甲对的概念表示所有的由同一个马甲操纵者控制的账号(参照S.Kumar,J.Cheng,J.Leskovec,etal,“Anarmyofme:Sockpuppetsinonline...

【技术保护点】
1.一种基于相似子图匹配的在线马甲检测方法，包括以下步骤：/n利用训练数据训练分类算法，建立检测模型；/n构建所有被封禁账号的交互网络图和兴趣网络图；/n构建待检测账号的交互网络图和兴趣网络图；/n将待检测账号与所有被封禁账号分别进行配对，组成账号对；/n根据相似子图匹配方法，计算每个账号对的交互网络相似度和兴趣网络相似度；/n将交互网络相似度和兴趣网络相似度组成特征矩阵，输入到一检测模型中，由该检测模型判断待检测账号和封禁账号之间是否匹配，如果匹配，则判定该待检测账号为马甲账号，否则判定为正常账号。/n

【技术特征摘要】
1.一种基于相似子图匹配的在线马甲检测方法，包括以下步骤：
利用训练数据训练分类算法，建立检测模型；
构建所有被封禁账号的交互网络图和兴趣网络图；
构建待检测账号的交互网络图和兴趣网络图；
将待检测账号与所有被封禁账号分别进行配对，组成账号对；
根据相似子图匹配方法，计算每个账号对的交互网络相似度和兴趣网络相似度；
将交互网络相似度和兴趣网络相似度组成特征矩阵，输入到一检测模型中，由该检测模型判断待检测账号和封禁账号之间是否匹配，如果匹配，则判定该待检测账号为马甲账号，否则判定为正常账号。

2.如权利要求1所述的方法，其特征在于，交互网络图为根据账号之间的交互关系建立的带标签的有向加权图Gu＝(V,E,W)，其中V表示交互网络中的一个账号节点集合，E表示账号节点与账号节点之间的交互关系即边的集合，W表示边的权重集合。

3.如权利要求1所述的方法，其特征在于，交互网络相似度的计算公式如下：

其中，u,v分别表示两个账号作为各自交互网络图的中心节点，H(u,v)表示两个账号之间的交互网络相似度，X表示这两个账号的交互网络中相同节点的集合，Φ(*)表示两个节点之间的亲密程度，通过两个节点之间的路径和权重计算得到，Vu和Vv分别表示两个中心节点的交互网络图中的所有节点集合。

4.如权利要求3所述的方法，其特征在于，Φ(*)的计算公式如下：

其中，u,v分别表示两个账号作为各自交互网络图的中心节点，W表示边的权重集合，P表示u,v两节点之间的最短路径。

5.如权利要求4所述的方法，其特征在于，权重集合W的计算公式为：

【专利技术属性】
技术研发人员：周薇，王景丽，李嘉诚，韩冀中，虎嵩林，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人