【技术实现步骤摘要】
群控账号挖掘方法、装置、设备及存储介质
[0001]本申请实施例涉及网络直播
,尤其涉及一种群控账号挖掘方法、装置、设备及存储介质。
技术介绍
[0002]“人气”是直播行业的一个特定术语,其能够综合反映出主播的受欢迎程度和直播内容质量。人气可通过观众数、观看长度、开播长度、关注数、互动情况、弹幕数、礼物打赏等维度进行计算。其中,观众数是衡量人气的重要维度,推荐主播时各主播的排序可通过观众数决定。并且,很多直播平台通过观众数进行主播的工资结算。
[0003]一般而言,通过群控软件批量操作大量僵尸账号(即群控账号)可提升主播房间的人气。现有技术中,为了防止群控账号的出现,采用如下方法检测群控账号:1、设备环境聚集检测法,其通过对用户注册时使用的手机号和观看主播时使用的IP地址来确定是否存在群控账号,其中,群控账号中各手机号共用IP地址的情况较为突出;2、房间特征异常检测法,利用群控账号增加人气时,主播房间内礼物打赏、观众数、弹幕数等数据特征分布存在异常,比如正常情况下主播房间的观众数达到阈值时其礼物打赏会在一个分 ...
【技术保护点】
【技术特征摘要】
1.一种群控账号挖掘方法,其特征在于,包括:获取用户群在设定时间段内的第一观看数据,所述用户群中每个用户对应一个第一观看数据,每个所述第一观看数据包含相应用户在所述设定时间段内观看的主播身份数据;根据所述第一观看数据在所述用户群中查找出相似观看用户;根据所述相似观看用户在所述用户群中挖掘出相似观看用户群,并根据所述相似观看用户群确定属于群控账号的目标用户群。2.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据在所述用户群中查找出相似观看用户之前,包括:将各所述第一观看数据对应的词汇表向量作为训练数据,以训练得到各所述词汇表向量对应的嵌入词向量,每个所述主播身份数据对应一个词汇表向量,所述词汇表向量的长度等于当前总主播数,所述嵌入词向量的长度小于所述词汇表向量的长度;根据所述第一观看数据对应的嵌入词向量得到相应的第二观看数据;所述根据所述第一观看数据在所述用户群中查找出相似观看用户包括:根据所述第二观看数据在所述用户群中查找出相似观看用户。3.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据在所述用户群中查找出相似观看用户包括:根据所述第一观看数据计算所述用户群中各用户间的观看相似度;根据所述观看相似度在所述用户群中查找出相似观看用户。4.根据权利要求3所述的群控账号挖掘方法,其特征在于,所述根据所述第一观看数据计算所述用户群中各用户间的观看相似度包括:利用局部敏感哈希对各所述第一观看数据进行分桶;计算每个桶内各所述第一观看数据之间的观看相似度。5.根据权利要求4所述的群控账号挖掘方法,其特征在于,所述利用局部敏感哈希对各所述第一观看数据进行分桶包括:分别对各所述第一观看数据进行最小哈希计算,以得到对应的签名向量;将每个所述签名向量分成多个行条,并利用哈希函数将每个所述行条分别映射到对应的哈希桶中,所述哈希函数为至少一个;将映射到同一哈希桶内的行条所对应的第一观看数据归入同一桶中。6.根据权利要求1所述的群控账号挖掘方法,其特征在于,所述根据所述相似观看用户在所述用户群中挖掘出相似观看用户群包括:将所述用户群中的每个用户作为一个用户节点,并将所述相似观看用户对应的用户节点通过边连接,以得到节点关系图;利用标签传播算法处理所述节点关系图,以确定相似观看用户群。7.根据权利要求6所述的群控账号挖掘方法,其特征在于,所述利用标签传播算法处理所述节点关系图,以确定相似观看用户群包括:为所述节点关系图中的每个用户节点分配相应的标签;在所述节点关系图中查找一用户节点,并根据所述用户节点的边连接关系查找出所述用户...
【专利技术属性】
技术研发人员:曹轲,钟清华,
申请(专利权)人:百果园技术新加坡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。