群控账号挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:28499010 阅读:26 留言:0更新日期:2021-05-19 22:38
本申请实施例公开了一种群控账号挖掘方法、装置、设备及存储介质,涉及网络直播技术领域,其包括:获取用户群在设定时间段内的第一观看数据,所述用户群中每个用户对应一个第一观看数据,每个所述第一观看数据包含相应用户在所述设定时间段内观看的主播身份数据;根据所述第一观看数据在所述用户群中查找出相似观看用户;根据所述相似观看用户在所述用户群中挖掘出相似观看用户群,并根据所述相似观看用户群确定属于群控账号的目标用户群。采用上述方法可以解决现有技术中群控账号挖掘过程安全性低、易被破解的技术问题。易被破解的技术问题。易被破解的技术问题。

【技术实现步骤摘要】
群控账号挖掘方法、装置、设备及存储介质


[0001]本申请实施例涉及网络直播
,尤其涉及一种群控账号挖掘方法、装置、设备及存储介质。

技术介绍

[0002]“人气”是直播行业的一个特定术语,其能够综合反映出主播的受欢迎程度和直播内容质量。人气可通过观众数、观看长度、开播长度、关注数、互动情况、弹幕数、礼物打赏等维度进行计算。其中,观众数是衡量人气的重要维度,推荐主播时各主播的排序可通过观众数决定。并且,很多直播平台通过观众数进行主播的工资结算。
[0003]一般而言,通过群控软件批量操作大量僵尸账号(即群控账号)可提升主播房间的人气。现有技术中,为了防止群控账号的出现,采用如下方法检测群控账号:1、设备环境聚集检测法,其通过对用户注册时使用的手机号和观看主播时使用的IP地址来确定是否存在群控账号,其中,群控账号中各手机号共用IP地址的情况较为突出;2、房间特征异常检测法,利用群控账号增加人气时,主播房间内礼物打赏、观众数、弹幕数等数据特征分布存在异常,比如正常情况下主播房间的观众数达到阈值时其礼物打赏会在一个分布区间里,而群控账号下主播房间的观众数达到阈值时其礼物打赏明显小于正常分布区间,此时,通过异常检测方式可以找到特征分布异常的主播。虽然,上述方法可检测出群控账号,但是,安全性较低,易被破解。比如使用动态IP池的方式避免手机号共用相同的IP地址,再如使用分布式云群控账号访问、切换送礼物账号等方式可以避免特征分布异常。
[0004]综合,如何安全、准确的挖掘出直播中的群控账号,成为了亟需解决的技术问题。

技术实现思路

[0005]本申请实施例提供了一种群控账号挖掘方法、装置、设备及存储介质,以解决现有技术中群控账号挖掘过程安全性低、易被破解的技术问题。
[0006]第一方面,本申请实施例提供了一种群控账号挖掘方法,包括:
[0007]获取用户群在设定时间段内的第一观看数据,所述用户群中每个用户对应一个第一观看数据,每个所述第一观看数据包含相应用户在所述设定时间段内观看的主播身份数据;
[0008]根据所述第一观看数据在所述用户群中查找出相似观看用户;
[0009]根据所述相似观看用户在所述用户群中挖掘出相似观看用户群,并根据所述相似观看用户群确定属于群控账号的目标用户群。
[0010]第二方面,本申请实施例还提供了一种群控账号挖掘装置,包括:
[0011]数据获取模块,用于获取用户群在设定时间段内的第一观看数据,所述用户群中每个用户对应一个第一观看数据,每个所述第一观看数据包含相应用户在所述设定时间段内观看的主播身份数据;
[0012]用户查找模块,用于根据所述第一观看数据在所述用户群中查找出相似观看用
户;
[0013]群控确定模块,用于根据所述相似观看用户在所述用户群中挖掘出相似观看用户群,并根据所述相似观看用户群确定属于群控账号的目标用户群。
[0014]第三方面,本申请实施例还提供了一种群控账号挖掘设备,包括:
[0015]一个或多个处理器;
[0016]存储器,用于存储一个或多个程序;
[0017]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的群控账号挖掘方法。
[0018]第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的群控账号挖掘方法。
[0019]上述群控账号挖掘方法、装置、设备及存储介质,通过获取用户群在设定时间段内的第一观看数据,并根据第一观看数据在用户群中查找出相似观看用户,进而根据相似观看用户挖掘出相似观看用户群,并根据相似观看用户群确定群控账号的技术手段,解决了现有技术中群控账号挖掘过程安全性低、易被破解的技术问题。即使群控账号使用动态IP池或者使用分布式云群控账号访问等方式,也可以结合各用户的观看主播情况有效筛选出相似观看用户,进而准确挖掘出用户群中的群控账号,提升了群控作弊成本,阻止了刷房行为,保证主播人气的真实性。
附图说明
[0020]图1为本申请实施例提供的一种群控账号挖掘方法的流程图;
[0021]图2为本申请实施例提供的哈希桶示意图;
[0022]图3为本申请实施例的另一种群控账号挖掘方法的流程图;
[0023]图4为本申请实施例提供的一种神经网络示意图;
[0024]图5为本申请实施例提供的一种群控账号挖掘装置的结构示意图;
[0025]图6为本申请实施例提供的一种群控账号挖掘设备的结构示意图。
具体实施方式
[0026]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0027]群控账号是指使用多台真实设备(如多部手机)或模拟多台真实设备,并在设备中安装脚本软件(群控软件)来控制设备中的应用软件(如直播应用软件),通过修改设备的软硬件信息来达到模拟人工使用应用软件的效果。群控账号具体通过自动化手段最大化模拟真实用户的操作请求。在直播领域中,通过群控账号可以为直播间达到吸粉、引流、刷广告等作弊目标。其中,通过群控账号模拟正常账号进入主播房间而给主播增加人气的方式称为刷房。
[0028]为了避免群控账号对正常直播的影响,本申请实施例提供一种群控账号挖掘方法,以安全、准确的挖掘出群控账号。具体的,群控账号挖掘方法可以由群控账号挖掘设备执行,该群控账号挖掘设备可以通过软件和/或硬件的方式实现,该群控账号挖掘设备可以
是两个或多个物理实体构成,也可以是一个物理实体构成。例如,群控账号挖掘设备可以是计算机、平板电脑等具有数据运算、分析能力的智能设备。
[0029]图1为本申请实施例提供的一种群控账号挖掘方法的流程图,参考图1,该群控账号挖掘方法具体包括:
[0030]步骤110、获取用户群在设定时间段内的第一观看数据,用户群中每个用户对应一个第一观看数据,每个第一观看数据包含相应用户在设定时间段内观看的主播身份数据。
[0031]实施例中,用户群是指利用直播应用软件观看直播的用户集合。观看数据是指用户观看直播过程中体现观看情况的数据。实施例中,观看数据至少包括用户观看的主播身份数据。其中,主播身份数据用于表明主播身份,不同主播具有不同的主播身份数据,其中,主播是指在直播应用平台注册过可进行直播的用户。可理解,观看数据还可包括每个主播的观看时长等内容。一个实施例中,用户群中的每个用户也存在对应的用户身份数据,不同用户具有不同的用户身份数据。当用户进入某一主播房间后,群控账号挖掘设备记录用户身份数据、主播身份数据以及观看时长等内容,并生成一条观看数据。当用户进入另一直播间后,群控账号挖掘设备再次记录用户身份数据、主播身份数据以及观看时间等内容,并生成另一条观看数据。进一步的,第一观看本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种群控账号挖掘方法,其特征在于,包括:获取用户群在设定时间段内的第一观看数据,所述用户群中每个用户对应一个第一观看数据,每个所述第一观看数据包含相应用户在所述设定时间段内观看的主播身份数据;根据所述第一观看数据在所述用户群中查找出相似观看用户;根据所述相似观看用户在所述用户群中挖掘出相似观看用户群,并根据所述相似观看用户群确定属于群控账号的目标用户群。2.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据在所述用户群中查找出相似观看用户之前,包括:将各所述第一观看数据对应的词汇表向量作为训练数据,以训练得到各所述词汇表向量对应的嵌入词向量,每个所述主播身份数据对应一个词汇表向量,所述词汇表向量的长度等于当前总主播数,所述嵌入词向量的长度小于所述词汇表向量的长度;根据所述第一观看数据对应的嵌入词向量得到相应的第二观看数据;所述根据所述第一观看数据在所述用户群中查找出相似观看用户包括:根据所述第二观看数据在所述用户群中查找出相似观看用户。3.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据在所述用户群中查找出相似观看用户包括:根据所述第一观看数据计算所述用户群中各用户间的观看相似度;根据所述观看相似度在所述用户群中查找出相似观看用户。4.根据权利要求3所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据计算所述用户群中各用户间的观看相似度包括:利用局部敏感哈希对各所述第一观看数据进行分桶;计算每个桶内各所述第一观看数据之间的观看相似度。5.根据权利要求4所述的群控账号挖掘方法,其特征在于,所述利用局部敏感哈希对各所述第一观看数据进行分桶包括:分别对各所述第一观看数据进行最小哈希计算,以得到对应的签名向量;将每个所述签名向量分成多个行条,并利用哈希函数将每个所述行条分别映射到对应的哈希桶中,所述哈希函数为至少一个;将映射到同一哈希桶内的行条所对应的第一观看数据归入同一桶中。6.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述相似观看用户在所述用户群中挖掘出相似观看用户群包括:将所述用户群中的每个用户作为一个用户节点,并将所述相似观看用户对应的用户节点通过边连接,以得到节点关系图;利用标签传播算法处理所述节点关系图,以确定相似观看用户群。7.根据权利要求6所述的群控账号挖掘方法,其特征在于,所述利用标签传播算法处理所述节点关系图,以确定相似观看用户群包括:为所述节点关系图中的每个用户节点分配相应的标签;在所述节点关系图中查找一用户节点,并根据所述用户节点的边连接关系查找出所述用户...

【专利技术属性】
技术研发人员:曹轲钟清华
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1