【技术实现步骤摘要】
虚假流量识别方法及用户品牌价值的量化计算方法
本专利技术涉及互联网
,具体而言,涉及一种虚假流量识别方法及用户品牌价值的量化计算方法。
技术介绍
随着大数据时代的来临,海量的社交网络数据迎面而来。但是在这海量的数据中,有很多数据都是虚假的,它们是由网络机器人产生的,据报道,在2019年,网络上的流量有超过40%都是由网络机器人产生,虚假流量的存在有着其相关的产业,但是其存在已经给整个社交网络带来了很大的困扰,虚假流量的存在会扰乱正常的广告投放,若能够有效的识别网络中的虚假流量,则可以正确的衡量社交网络中用户的品牌价值,传统的寻找网络中高品牌价值用户的方法主要依赖用户之间的交互强度,以微博应用为例,某个用户发了一条微博,该微博的转发,点赞,以及评论量都非常多,传统的寻找高品牌价值用户的方法则认为该用户具有较高的品牌价值。但仅依赖于这些宏观的数据往往是不够精确的,因为在与该用户交互的许多用户中,可能存在一些虚假流量,而虚假流量对于广告主的产品是不会有购买兴趣的,对广告主来说,其面临的一个问题是在寻找宣传者的过程中,如何有效 ...
【技术保护点】
1.一种虚假流量识别方法,其特征在于,所述方法包括:/nS1、爬取整个社交网络中一时间段内用户间的交互数据;/nS2、根据该时间段内用户间的交互数据构建社交网络G(V,E),其中V代表网络中用户的集合,E代表网络中有向边的集合;/nS3、根据社交网络G(V,E)中用户间的交互数据,计算社交网络G(V,E)连边之间的权重;/nS4、根据社交网络G(V,E)连边之间的权重,计算用户对所有邻居节点的影响能力,以及用户被所有邻居节点影响的程度;/nS5、定义用户的影响力和易被影响特性,其中,影响力指的是社交网络G(V,E)中某用户影响其它用户的能力,易被影响特性指的是社交网络G(V ...
【技术特征摘要】
1.一种虚假流量识别方法,其特征在于,所述方法包括:
S1、爬取整个社交网络中一时间段内用户间的交互数据;
S2、根据该时间段内用户间的交互数据构建社交网络G(V,E),其中V代表网络中用户的集合,E代表网络中有向边的集合;
S3、根据社交网络G(V,E)中用户间的交互数据,计算社交网络G(V,E)连边之间的权重;
S4、根据社交网络G(V,E)连边之间的权重,计算用户对所有邻居节点的影响能力,以及用户被所有邻居节点影响的程度;
S5、定义用户的影响力和易被影响特性,其中,影响力指的是社交网络G(V,E)中某用户影响其它用户的能力,易被影响特性指的是社交网络G(V,E)中某用户易被其它用户影响的程度,根据社交网络G(V,E)的结构、用户对所有邻居节点的影响能力以及用户被所有邻居节点影响的程度,迭代计算出社交网络G(V,E)中所有用户的影响力和易被影响特性;
S6、确定第一筛选阈值和第二筛选阈值,将易被影响特性高于第一筛选阈值且影响力低于第二筛选阈值的用户标记为虚假用户,将虚假用户的交互流量识别为虚假流量。
2.根据权利要求1所述的虚假流量识别方法,其特征在于,所述步骤S1中,用户间的交互数据包括转发、点赞以及评论三种类型的交互数据。
3.根据权利要求2所述的虚假流量识别方法,其特征在于,所述步骤S2中,有向边的构造过程如下:设社交网络G(V,E)中具有用户j和用户i,则当存在从用户j到用户i的交互行为时,则有向边构建为(i,j)。
4.根据权利要求3所述的虚假流量识别方法,其特征在于,所述步骤S3中,社交网络G(V,E)连边之间的权重的计算方法如下:
对于有向边(i,j),设用户i发布了m条信息,从用户j到用户i的交互行为有n次,则权重
5.根据权利要求4所述的虚假流量识别方法,其特征在于,所述步骤...
【专利技术属性】
技术研发人员:吕琳媛,周方,马大路,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。