【技术实现步骤摘要】
机器弹幕用户识别方法、存储介质、电子设备及系统
本专利技术涉及大数据风控领域,具体涉及一种机器弹幕用户识别方法、存储介质、电子设备及系统。
技术介绍
在直播平台上,往往存在使用机器手段刷弹幕的舞弊行为,这种虚假的发弹幕行为严重影响了直播平台的正常秩序。而这些机器弹幕从内容上看和正常弹幕相比并没有什么异常,机器会模仿正常用户的弹幕文本,因此识别这些机器弹幕行为存在一定的难度。采用脚本由机器自动发送的弹幕文本为机器弹幕。一般识别异常发弹幕行为的方法是采用一些强规则,这些规则是通过一些较为明显的异常进行识别的,比如:多个设备公用一个账号发送弹幕,那么这个账号肯定是有较大作弊嫌疑的。采用强规则的方法虽然可以识别出一些风险用户,但是在实际操作的过程中,为了避免误杀会将规则设置的非常严格,因此强规则手段只能找到那些具有明显特征的作弊用户,而容易遗漏那些特征不明显的嫌疑用户,识别准确率较低。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的在于提供一种机器弹幕用户识别方法,通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。为达到以上目的, ...
【技术保护点】
1.一种机器弹幕用户识别方法,其特征在于,包括以下步骤:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量,计算公式为:
【技术特征摘要】
1.一种机器弹幕用户识别方法,其特征在于,包括以下步骤:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量,计算公式为:其中,wuv是用户u和用户v之间的相似度得分,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足对用户u的刷弹幕可疑程度Su进行计算,计算公式为:其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值;若NormSu≥η,则用户u为机器弹幕用户,其中η为设定的机器弹幕用户判断阈值。2.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:所述划分属性为机器弹幕用户发送弹幕时的相关特征。3.如权利要求2所述的一种机器弹幕用户识别方法,其特征在于:机器弹幕用户发送弹幕时的相关特征包括:弹幕内容为纯数字、用户名为纯数字、用户名为纯字母、用户名为数字和字母的组合以及弹幕内容文本。4.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:用户发送弹幕时的特征包括登陆地、登陆设备、弹幕文本长度和弹幕文本内容。5.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:弹幕发送相似性进行度量的两用户属于同一子空间。6.一种存储介质,该...
【专利技术属性】
技术研发人员:王璐,陈少杰,张文明,
申请(专利权)人:武汉斗鱼网络科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。