The invention provides an automatic identification method and system for network navy. The steps of the method include: 1) collecting message information of authentication account in social network and comment information under each message; 2) monitoring whether each comment information under each message has been deleted, and if the comment information is read, the history of corresponding account has been deleted; 3) if the history of the above account has been deleted. If the number of comments satisfies the preset conditions, the account will be the online navy. This method and system not only eliminates manual labeling and model training, but also can quickly and effectively identify the network Navy in social networks. That is, when the number of comments deleted from an account meets the preset conditions, the account is determined to be the network navy. At the same time, the method and system are suitable for multiple social networks, and can run across platforms.
【技术实现步骤摘要】
一种网络水军的自动识别方法及系统
本专利技术涉及社交网络的网络水军识别领域,尤其涉及一种网络水军的自动识别方法及系统,以实现更加自动、精确地识别社交网络中的网络水军。
技术介绍
随着社交网络相关应用的快速发展,人们越来越多地将活动转移到社交网络中。社交网络通常包括国外的Facebook、Google+、Twitter等和国内的新浪微博、腾讯微博、人人网等。但是目前社交网络存在大量的网络水军,社交网络的网络水军通常对网络信息传播推波助澜,或是恶意抨击一些社交网络账号。他们由政治利益、商业利益驱动,为达到如影响网络民意、扰乱网络环境等不正当目的,通过操纵软件机器人或水军账号在互联网中制造、传播虚假意见和垃圾信息。这些行为严重影响了社交网络用户体验,并且还带来了严重的安全问题。现有的社交网络中网络水军识别方法主要是使用社交网络的消息内容。比较简单的基于内容的网络水军检测方法(K.Lee,J.Caverlee,andS.Webb.Uncoveringsocialspammers:socialhoneypots+machinelearning.InProceedingsofSIGIR,2010)是将其作为一个监督学习问题。这些方法从社交网络的消息内容中提取有效的文本特征来建立一个分类器。给定一个新用户,分类器输出一个分类标签,以判断该新用户是否是网络水军。然而,这些方法通常需要大量的标注数据(这些数据通常都是人工标注),因而耗时耗力。并且人工标注的数据集规模较小,这就为社交网络中网络水军的检测带来了巨大的挑战。
技术实现思路
由于以往的社交网络的网络水军识别方法大多将其 ...
【技术保护点】
1.一种网络水军的自动识别方法,其步骤包括:1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;3)若上述账号的历史被删评论数满足预设条件,则该账号为网络水军。
【技术特征摘要】
1.一种网络水军的自动识别方法,其步骤包括:1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;3)若上述账号的历史被删评论数满足预设条件,则该账号为网络水军。2.如权利要求1所述的方法,其特征在于,步骤1)包括以下步骤:1-1)社交网络用户模拟登录;1-2)获取社交网络中认证账号列表,并采集每个认证账号的消息信息;1-3)获取消息列表,并采集每条消息下的评论信息。3.如权利要求1所述的方法,其特征在于,步骤1)中所述认证账号是指被社交网络官方认证的的账号;且认证账号的类型包括政府机构账号、国际组织账号、新闻媒体账号、个人账号。4.如权利要求1所述的方法,其特征在于,步骤1)中所述消息信息包括但不限于消息url、消息内容、消息发布时间、消息评论数、消息转发数、消息点赞数;所述评论信息包括但不限于评论url、评论内容、评论时间、评论用户。5.如权利要求1所述的方法,其特征在于,步骤1)中所述消息信息的发布时间若超出一个月,则删除该消息信息。6.如权利要求1所述的方法,其特征在于,步骤2)具体为:获取每条消...
【专利技术属性】
技术研发人员:梁棋,沙灜,李锐,邱泳钦,王斌,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。