机器弹幕用户识别方法、存储介质、电子设备及系统技术方案

技术编号:22367076 阅读:35 留言:0更新日期:2019-10-23 05:39
本发明专利技术公开了一种机器弹幕用户识别方法、存储介质、电子设备及系统,涉及大数据风控领域,该方法包括基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量;对用户的刷弹幕可疑程度进行计算;对用户是否为机器弹幕用户进行判断。本发明专利技术通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。

User identification method, storage medium, electronic equipment and system of machine bullet curtain

【技术实现步骤摘要】
机器弹幕用户识别方法、存储介质、电子设备及系统
本专利技术涉及大数据风控领域,具体涉及一种机器弹幕用户识别方法、存储介质、电子设备及系统。
技术介绍
在直播平台上,往往存在使用机器手段刷弹幕的舞弊行为,这种虚假的发弹幕行为严重影响了直播平台的正常秩序。而这些机器弹幕从内容上看和正常弹幕相比并没有什么异常,机器会模仿正常用户的弹幕文本,因此识别这些机器弹幕行为存在一定的难度。采用脚本由机器自动发送的弹幕文本为机器弹幕。一般识别异常发弹幕行为的方法是采用一些强规则,这些规则是通过一些较为明显的异常进行识别的,比如:多个设备公用一个账号发送弹幕,那么这个账号肯定是有较大作弊嫌疑的。采用强规则的方法虽然可以识别出一些风险用户,但是在实际操作的过程中,为了避免误杀会将规则设置的非常严格,因此强规则手段只能找到那些具有明显特征的作弊用户,而容易遗漏那些特征不明显的嫌疑用户,识别准确率较低。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的在于提供一种机器弹幕用户识别方法,通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。为达到以上目的,本专利技术采取的技术方案是,包括:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量,计算公式为:其中,wuv是用户u和用户v之间的相似度得分,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足对用户u的刷弹幕可疑程度Su进行计算,计算公式为:其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值;若NormSu≥η,则用户u为机器弹幕用户,其中η为设定的机器弹幕判断阈值。在上述技术方案的基础上,所述划分属性为机器弹幕用户发送弹幕时的相关特征。在上述技术方案的基础上,机器弹幕用户发送弹幕时的相关特征包括:弹幕内容为纯数字、用户名为纯数字、用户名为纯字母、用户名为数字和字母的组合以及弹幕内容文本。在上述技术方案的基础上,用户发送弹幕时的特征包括登陆地、登陆设备、弹幕文本长度和弹幕文本内容。在上述技术方案的基础上,弹幕发送相似性进行度量的两用户属于同一子空间。本专利技术还提供一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的方法。本专利技术还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述的方法。本专利技术还提供一种机器弹幕用户识别系统,包括:划分模块,其用于基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;相似性计算模块,其用于对弹幕发送用户间的相似性进行度量,计算公式为:其中,wuv是用户u和用户v之间的相似度得分,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足可疑程度计算模块,其用于对用户u的刷弹幕可疑程度Su进行计算,计算公式为:其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值;判断模块,其用于当NormSu≥η时,则判断用户u为机器弹幕用户,其中η为设定的机器弹幕用户判断阈值。在上述技术方案的基础上,所述划分属性为机器弹幕用户发送弹幕时的相关特征。在上述技术方案的基础上,弹幕发送相似性进行度量的两用户属于同一子空间。与现有技术相比,本专利技术的优点在于:基于刷弹幕风控业务经验确定用户的划分属性,将相同划分属性的用户划分至同一子空间,然后对弹幕发送用户间的相似性进行度量,对用户的刷弹幕可疑程度进行计算并判断,通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。附图说明图1为本专利技术实施例中一种机器弹幕用户识别方法的流程图;图2为本专利技术实施例中一种电子设备的结构示意图。具体实施方式以下结合附图及实施例对本专利技术作进一步详细说明。参见图1所示,本专利技术实施例提供一种机器弹幕用户识别方法,基于子空间划分的方式对机器弹幕用户进行识别,因刷弹幕的非法用户的某些行为特征具有一定的聚集性,通过子空间划分可以通过关键属性对用户做一个初步的分组,然后根据用户之间的相似性确定嫌疑用户。本专利技术实施例的机器弹幕用户识别方法具体包括:S1:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间。划分属性为机器弹幕用户发送弹幕时的相关特征,机器弹幕用户发送弹幕时的相关特征包括:弹幕内容为纯数字、用户名为纯数字、用户名为纯字母、用户名为数字和字母的组合以及弹幕内容文本。根据直播平台以往对机器弹幕用户特征的收集形成划分属性,然后基于划分属性对平台的所有用户进行分组。S2:对弹幕发送用户间的相似性进行度量,计算公式为:其中,wuv是用户u和用户v之间的相似度得分,弹幕发送相似性进行度量的两用户属于同一子空间,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,用户发送弹幕时的特征包括登陆地、登陆设备、弹幕文本长度和弹幕文本内容等等,凡是与弹幕相关的特征均属于用户发送弹幕时的特征,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足S3:对用户u的刷弹幕可疑程度Su进行计算,计算公式为:其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值,用于找出属于E的u和v,方便对用户u的刷弹幕可疑程度Su进行计算,ξ的值根据实际情景灵活设定。S5:若NormSu≥η,则用户u为机器弹幕用户,否则,用户u不为机器弹幕用户,其中η为设定的机器弹幕用户判断阈值,η的值也是根据实际情景和实际工作经验灵活设定。本专利技术实施例的机器弹幕用户识别方法,基于刷弹幕风控业务经验确定用户的划分属性,将相同划分属性的用户划分至同一子空间,然后对弹幕发送用户间的相似性进行度量,对用户的刷弹幕可疑程度进行计算并判断,通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。另外,对应上述机器弹幕用户识别方法,本专利技术还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述各实施例所述的机器弹幕用户识别方本文档来自技高网...

【技术保护点】
1.一种机器弹幕用户识别方法,其特征在于,包括以下步骤:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量,计算公式为:

【技术特征摘要】
1.一种机器弹幕用户识别方法,其特征在于,包括以下步骤:基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量,计算公式为:其中,wuv是用户u和用户v之间的相似度得分,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足对用户u的刷弹幕可疑程度Su进行计算,计算公式为:其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值;若NormSu≥η,则用户u为机器弹幕用户,其中η为设定的机器弹幕用户判断阈值。2.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:所述划分属性为机器弹幕用户发送弹幕时的相关特征。3.如权利要求2所述的一种机器弹幕用户识别方法,其特征在于:机器弹幕用户发送弹幕时的相关特征包括:弹幕内容为纯数字、用户名为纯数字、用户名为纯字母、用户名为数字和字母的组合以及弹幕内容文本。4.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:用户发送弹幕时的特征包括登陆地、登陆设备、弹幕文本长度和弹幕文本内容。5.如权利要求1所述的一种机器弹幕用户识别方法,其特征在于:弹幕发送相似性进行度量的两用户属于同一子空间。6.一种存储介质,该...

【专利技术属性】
技术研发人员:王璐陈少杰张文明
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1