一种用于识别用户的方法、装置及计算机设备制造方法及图纸

技术编号:18260296 阅读:33 留言:0更新日期:2018-06-20 10:49
本发明专利技术实施例提供了一种用于识别用户的方法、装置及计算机设备,方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签;确定用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。

A method, device and computer device for identifying users

An embodiment of the invention provides a method, device and computer equipment for identifying users. The method includes: marking the different tags for the normal users and abnormal users in the user sample, determining the similar values between any two users in the user sample, and using the K nearest neighbor algorithm for all user samples in the user sample. Build a K nearest neighbor graph; determine the weight value of the edge of any two user in the K near graph based on the similarity between any two users in the user sample; determine that each remaining user in the K nearest neighbor graph is connected to the normal user according to the preset K value and the weight value of the edges made by any two users in the K nearest neighbor graph. The first weight and the second weights of the edges formed by each remaining user and the abnormal user are made, and the labels of each remaining user are determined according to the first weight and the second weights, and each user is identified according to the user's label.

【技术实现步骤摘要】
一种用于识别用户的方法、装置及计算机设备
本专利技术属于直播
,尤其涉及一种用于识别用户的方法、装置及计算机设备。
技术介绍
随着直播平台的发展,越来越多的用户在直播平台上发送弹幕消息。有些主播为了增加直播间的人气,会使用机器设备在直播间发送大量弹幕信息,严重影响了直播平台的秩序。一般来说机器弹幕从内容上大多数与正常弹幕信息并没有什么不同,机器会模仿正常用户的弹幕文本,因此无法识别出发送弹幕的异常用户,导致直播平台的秩序得不到保障。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供了一种用于识别用户的方法、装置及计算机设备,用于解决现有技术中无法识别出直播平台中发送弹幕的异常用户信息,导致直播平台秩序得不到保障的技术问题。本专利技术实施例提供一种用于识别用户的方法,应用在直播平台中,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。上述方案中,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:获取所述用户样本中每个用户在所述直播平台中的行为日志记录及用户等级;若所述用户的行为日志记录正常或用户等级为高等级用户时,则确定所述用户为正常用户;为所述正常用户标记第一标签。上述方案中,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:获取所述用户样本中每个用户在所述直播平台中的登陆账号以及所述登陆账号对应的设备标识ID;若所述登陆账号对应多个相同的设备ID,则确定所述登陆账号对应的用户为异常用户;为所述异常用户标记第二标签。上述方案中,所述根据每个用户行为发生的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆IP信息确定所述用户样本中任意两个用户之间的相似值,包括:根据公式确定任意用户u和用户v之间的相似值s(u,v);其中,当需要对发送弹幕信息的用户进行识别时,所述Ru为用户u在预设时间内发送弹幕的直播间数量、所述Rv为用户v在预设时间内发送弹幕的直播间数量;所述Iu为用户u用户在所述直播平台中的登陆IP信息、所述Iv为用户v用户在所述直播平台中的登陆IP信息;所述Du为用户u发送弹幕时使用的设备信息、所述Dv为用户v发送弹幕时使用的设备信息;所述wi(i=1,2,3,4)为权重系数,且所述xui为用户u的第i个与发送弹幕相关的特征指标,所述xvi为用户v的第i个与发送弹幕相关的特征指标;所述N为所述特征指标的数量。上述方案中,所述根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和,包括:根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边以及每个剩余用户与所述异常用户相连构成的K条边;根据任意两个用户在所述K近邻图中构成的边的权重值分别计算所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和。上述方案中,所述根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值,包括:根据公式确定任意两个用户在所述K近邻图中构成的边的权重值;其中,所述s(u,v)为任意用户u和用户v之间的相似值,所述a为预设的常数,a取值为(0,1)。上述方案中,所述根据所述第一权重和及所述第二权重和确定每个剩余用户的标签,包括:比较所述第一权重和及所述第二权重和,确定出最大的权重和;将所述每个剩余用户的标签与最大的权重和对应的用户的标签标记为一致。本专利技术实施例还提供一种用于识别用户的装置,所述装置包括:标记单元,用于为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;第一确定单元,用于根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;构建单元,用于利用K近邻算法为用户样本中的所有用户构建K近邻图;第二确定单元,用于根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;第三确定单元,用于根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;第四确定单元,用于根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;识别单元,用于根据用户的标签对每个用户进行识别。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。本专利技术还提供一种用于识别弹幕用户的计算机设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述任一所述的方法。本专利技术实施例提供了一种用于识别用户的方法、装置及计算机设备,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用本文档来自技高网...
一种用于识别用户的方法、装置及计算机设备

【技术保护点】
1.一种用于识别用户的方法,其特征在于,应用在直播平台中,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。

【技术特征摘要】
1.一种用于识别用户的方法,其特征在于,应用在直播平台中,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。2.如权利要求1所述的方法,其特征在于,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:获取所述用户样本中每个用户在所述直播平台中的行为日志记录及用户等级;若所述用户的行为日志记录正常或用户等级为高等级用户时,则确定所述用户为正常用户;为所述正常用户标记第一标签。3.如权利要求1所述的方法,其特征在于,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:获取所述用户样本中每个用户在所述直播平台中的登陆账号以及所述登陆账号对应的设备标识ID;若所述登陆账号对应多个相同的设备ID,则确定所述登陆账号对应的用户为异常用户;为所述异常用户标记第二标签。4.如权利要求1所述的方法,其特征在于,所述根据每个用户行为发生的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆IP信息确定所述用户样本中任意两个用户之间的相似值,包括:根据公式确定任意用户u和用户v之间的相似值s(u,v);其中,当需要对发送弹幕信息的用户进行识别时,所述Ru为用户u在预设时间内发送弹幕的直播间数量、所述Rv为用户v在预设时间内发送弹幕的直播间数量;所述Iu为用户u用户在所述直播平台中的登陆IP信息、所述Iv为用户v用户在所述直播平台中的登陆IP信息;所述Du为用户u发送弹幕时使用的设备信息、所述Dv为用户v发送弹幕时使用的设备信息;所述wi(i=1,2,3,4)为权重系数,且所述xui为用户u的第i个与发送弹幕相关的特征指标,所述xvi为用户v的第i个与发送弹幕相关的特征指标;所述N为所述特征指标的数量。5.如权利要求1所述的方法,其特征在于,所述根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和,包括:根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边以及每个剩余用户与所述异常用户相连构成的K条边;根据任意两个用户在所述K近邻图中...

【专利技术属性】
技术研发人员:王璐陈少杰张文明
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1