一种网络水军账户识别方法及系统技术方案

技术编号:18290030 阅读:120 留言:0更新日期:2018-06-24 04:57
本发明专利技术公开了一种网络水军账户识别方法及系统。该方法包括:获取每个用户的相关指标;根据所述每个用户的相关指标确定每个用户的位置向量;对所述每个用户的相关指标分配权重,得到若干个权重向量;根据所述位置向量以及所述权重向量的点积确定适应度函数;利用适应度函数计算爆炸半径;根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;利用适应度函数计算所述火花的适应度;判断所述适应度是否大于适应度阈值,若是,确定所述火花对应的用户为水军账户。采用本发明专利技术所提供的识别方法及系统能够提高对网络水军账户的识别效率及搜索效率。

【技术实现步骤摘要】
一种网络水军账户识别方法及系统
本专利技术涉及网络水军账户识别领域,特别是涉及一种网络水军账户识别方法及系统。
技术介绍
随着互联网技术的快速发展,各种各样的网络社交平台相继出现,人们的日常生活交往也越来越依靠于网络,但是日益增长的网络数据也给网络监管带来了很大的挑战,大量网络营销号利用虚拟的网络环境制造公众话题,引导舆论方向,以此来提高网友对某个人或者某件事的关注度,并从中谋取利益。网络水军的发帖形式表现为,在某一个时间段里大量账号同时发布相同或相近的内容,或者在他人帖子下面重复发布某商品广告以及链接,这些水帖不仅使网络环境显得杂乱无章,更严重的是大量带有引导性的舆论水帖可能会使网友对某件事做出错误的判断,甚至影响一些低龄网友形成正确的三观。已有的通过机器学习来识别网络水军的方法,首先将样本帖划分为多个子集,然后针对这些子集分别训练出分类器,再使用这组分类器来识别出水军贴。但是在训练样本中水军帖所占的比例对分类器的结果有很大影响,而且水军在不同的时间段或者针对不同的话题的发帖内容也不一样,需要针对各种情况训练不同的分类器,工作量太大。为了减小工作量,现有技术中对于水军账户的识别通常采用基于粒子群算法的网络水军识别方法识别水军账户,但是粒子群算法随着迭代的进行,微粒都朝着个体极值和全局极值的方向聚集,在后期会变得较为集中,甚至会出现多次迭代后极值未发生变化的情况,群体多样性降低;群体多样性不足,使算法容易陷入局部极值,从而引起早熟早收敛,无法收敛到全局最优点,进而导致搜索水军账户不彻底,识别效率及搜索效率低的问题。
技术实现思路
本专利技术的目的是提供一种网络水军账户识别方法及系统,以解决网络水军账户识别效率及搜索效率低的问题。为实现上述目的,本专利技术提供了如下方案:一种网络水军账户识别方法,包括:获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;根据所述每个用户的相关指标确定每个用户的位置向量;对所述每个用户的相关指标分配权重,得到若干个权重向量;根据所述位置向量以及所述权重向量的点积确定适应度函数;利用适应度函数计算爆炸半径;根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;利用适应度函数计算所述火花的适应度;判断所述适应度是否大于适应度阈值,得到第一判断结果;若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。可选的,所述利用适应度函数计算爆炸半径,具体包括:根据公式计算所述爆炸半径;其中,Ai为所述爆炸半径,为爆炸半径预设值,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。可选的,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。可选的,所述利用公式得到爆炸火花之后,还包括:修正所述爆炸火花的数量。可选的,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:根据公式和公式对所述初始烟花炸点进行爆炸处理,得到高斯火花;其中,rand(-1,1)~U(-1,1),Gaussion(-1,1)~N(0,1)。可选的,在所述根据所述爆炸半径,采用烟花算法确定火花之后,还包括:判断所述火花是否超出可行域阈值,得到第二判断结果;若所述第二判断结果表示为所述火花超出可行域阈值,根据火花映射规则确定下一个烟花炸点;若所述第二判断结果表示为所述火花未超出可行域阈值,根据选择策略确定下一个烟花炸点。一种网络水军账户识别系统,包括:相关指标获取模块,用于获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;位置向量确定模块,用于根据所述每个用户的相关指标确定每个用户的位置向量;权重向量确定模块,用于对所述每个用户的相关指标分配权重,得到若干个权重向量;适应度函数确定模块,用于根据所述位置向量以及所述权重向量的点积确定适应度函数;爆炸半径计算模块,用于利用适应度函数计算爆炸半径;火花确定模块,用于根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;火花适应度计算模块,用于利用适应度函数计算所述火花的适应度;第一判断模块,用于判断所述适应度是否大于适应度阈值,得到第一判断结果;水军账户确定模块,用于若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。可选的,所述利爆炸半径计算模块,具体包括:爆炸半径计算单元,用于根据公式计算所述爆炸半径;其中,Ai为所述爆炸半径,为爆炸半径预设值,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。可选的,所述火花确定模块,具体包括:初始烟花炸点确定单元,用于根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;爆炸火花确定单元,用于根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。可选的,所述爆炸火花确定单元之后,还包括:爆炸火花数量修正单元,用于修正所述爆炸火花的数量。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:烟花算法可以通过不同的爆炸半径产生距离烟花不同位置的火花,烟花算法在迭代过程中,种群中每个烟花个体在一次迭代过程中会产生多个个体,而粒子群优化算法通常只产生一个个体,烟花算法的这种爆炸机制使得其对于烟花附近的区域的搜索更加彻底,因此,提高了对网络水军账户的识别效率及搜索效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例所提供的网络水军账户识别方法流程图;图2为本专利技术另一种实施例所提供的网络水军账户识别方法流程图;图3为本专利技术实施例所提供的网络水军账户识别系统结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的是提供一种网络水军账户识别方法及系统,能够提高对网络水军账户的识别效率及搜索效率。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例所提供的网络水军账户识别方法流程图,如图1所示,一种网络水军账户识别方法,包括:步骤101:获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量。步骤102:根据所述每个用户的相关指标确定每个用户的位置向量。步骤103:对所述每个用户的相关指标分配权重,得到若干个权重向量。步骤104:根据所述位置向量以及所述权重向量的点积确定本文档来自技高网...
一种网络水军账户识别方法及系统

【技术保护点】
1.一种网络水军账户识别方法,其特征在于,包括:获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;根据所述每个用户的相关指标确定每个用户的位置向量;对所述每个用户的相关指标分配权重,得到若干个权重向量;根据所述位置向量以及所述权重向量的点积确定适应度函数;利用适应度函数计算爆炸半径;根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;利用适应度函数计算所述火花的适应度;判断所述适应度是否大于适应度阈值,得到第一判断结果;若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。

【技术特征摘要】
1.一种网络水军账户识别方法,其特征在于,包括:获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;根据所述每个用户的相关指标确定每个用户的位置向量;对所述每个用户的相关指标分配权重,得到若干个权重向量;根据所述位置向量以及所述权重向量的点积确定适应度函数;利用适应度函数计算爆炸半径;根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;利用适应度函数计算所述火花的适应度;判断所述适应度是否大于适应度阈值,得到第一判断结果;若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。2.根据权利要求1所述的水军账户识别方法,其特征在于,所述利用适应度函数计算爆炸半径,具体包括:根据公式计算所述爆炸半径;其中,Ai为所述爆炸半径,为爆炸半径预设值,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。3.根据权利要求2所述的水军账户识别方法,其特征在于,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。4.根据权利要求3所述的水军账户识别方法,其特征在于,所述利用公式得到爆炸火花之后,还包括:修正所述爆炸火花的数量。5.根据权利要求2所述的水军账户识别方法,其特征在于,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:根据公式和公式对所述初始烟花炸点进行爆炸处理,得到高斯火花;其中,rand(-1,1)~U(-1,1),Gaussion(-1,1)~N(0,1),为爆炸火花,round(0,1)表示随机取0~1的任意值,Gaussion(-1,1)~N(0,1)表示服从均值为0,方差1的正态分布。6.根据权利要求1所述的水军账户识别方法,其特征在于,在所述根据所述爆炸半径,采用烟花算法确定...

【专利技术属性】
技术研发人员:王春枝吴盼叶志伟王毅超郑逍
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1