【技术实现步骤摘要】
水军群组检测方法及其装置
[0001]本申请涉及网络安全领域,更具体地说,涉及一种水军群组检测方法及其装置。
技术介绍
[0002]在电子商务交易中,在线商品评论对用户的购买决策有重要的影响。用户一般倾向于购买交易量大、正面评论较多的产品,而不是负面评论较多的产品。因此,为了冲交易量、抬高或降低某产品的信誉、赚取更多利润,很多商家往往会雇佣虚假评论者发布大量赞美自家商品或诋毁竞争对手商品的不实评论。水军群组,是指那些有组织地协同发布虚假评论的一群人。相比水军个体,水军群组影响力更大。这是因为,水军群组规模更大,能够有组织地进行造假活动,甚至能完全控制一个产品的舆论,进而误导买方的购买决策、导致电子商务信誉系统失真、影响电商平台中卖方之间的公平竞争、降低交易环境的可信度,最终影响电子商务企业甚至整个行业的可持续发展。因此,挖掘与发现水军群体具有重要的意义。
[0003]自Jindal和Liu首次提出虚假评论(虚假评论者)检测问题以来,越来越多的研究者开始关注该问题,并作出了很多相关研究,包括基于机器学习的算法,基于概率的算法,基于行为特征的算法,基于图的算法和基于规则的算法。近年来,水军群组的检测问题吸引了越来越多的关注。
[0004]现有的水军群组检测算法可分为基于频繁项挖掘(FIM)的算法和基于拓扑图的算法。基于FIM的算法假设同一水军群组的成员倾向于为同一产品或服务共同编写虚假评论,即所谓的共评论。他们利用频繁项挖掘技术(FIM)生成候选水军群组,然后构建模型对群组的可疑度进行排序,以发现真正的水 ...
【技术保护点】
【技术特征摘要】
1.一种水军群组检测方法,其特征在于,所述检测方法包括:获取网络中的评论数据信息,所述评论数据信息包括:评论产品、评论者、评论时间以及评论者对评论产品的评分;基于所述评论数据信息识别水军群组所攻击的目标产品;以及基于所识别出的目标产品生成候选水军群组。2.根据权利要求1所述的水军群组检测方法,其特征在于,基于所述评论数据信息识别水军群组所攻击的目标产品包括:基于所述评论者对评论产品的评分计算产品评分分布异常值和产品平均分分布异常值;以及通过所述产品评分分布异常值和产品平均分分布异常值计算水军群组所攻击的目标产品的可疑值,并将所述可疑值与设定的目标产品可疑值的阈值进行比较,根据比较结果识别水军群组所攻击的目标产品。3.根据权利要求1或2所述的水军群组检测方法,其特征在于,所述基于所识别出的目标产品生成候选水军群组包括:利用核密度估计方法获取所识别出的目标产品的评论爆发区,所述评论爆发区是所识别出的目标产品的评论在短时间内激增的区域;获取所述评论爆发区中的评论者,生成候选水军群组。4.根据权利要求3所述的水军群组检测方法,其特征在于,所述检测方法还包括:计算所述候选水军群组的群组造假值,将所述候选水军群组的群组尺寸与设定值进行比较,并且将所述群组造假值与设定的水军群组造假指标的阈值进行比较,根据比较结果输出候选水军群组,其中,所述群组造假值用于衡量水军群组造假程度,所述群组尺寸用于表示水军群组中评论者的数量。5.根据权利要求4所述的水军群组检测方法,其特征在于,在计算所述候选水军群组的群组造假值,将所述候选水军群组的群组尺寸与设定值进行比较,并且将所述群组造假值与设定的水军群组造假指标的阈值进行比较,根据比较结果输出候选水军群组之前,所述检测方法还包括:计算每个候选水军群组的每个评论者的个体造假值,并将所述个体造假值与设定的水军个体造假指标的阈值进行比较,根据比较结果剔除可疑度低的评论者,获得净化后的候选群组,其中,所述个体造假值用于衡量评论者造假程度。6.根据权利要求1所述的水军群组检测方法,其特征在于,通过如下公式计算水军群组所攻击的目标产品的可疑值S
TP
(p):S
TP
(p)=ωS
avg
(p)+(1-ω)S
ext
(p)其中,p表示水军群组所攻击的目标产品,S
avg
(p)为所述产品平均分分布异常值,S
ext
(p)为所述产品评分分布异常值,ω是用于平衡S
avg
(p)和S
ext
(p)权重因子,取值范围在0到1之间。7.根据权利要求4所述的水军群组检测方法,其特征在于,利用核密度估计方法获取所识别出的目标产品的评论爆发区包括:计算所识别出的目标产品的生命周期;利用核密度估计方法对所识别出的目标产品的评论和评论所对应的评论时间序列进
行建模;设置时间窗口尺寸,将所识别出的目标产品的生...
【专利技术属性】
技术研发人员:纪淑娟,张琪,李金鹏,许少华,伊磊,公茂果,
申请(专利权)人:山东科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。