异常用户识别方法及装置、电子设备和存储介质制造方法及图纸

技术编号:30548525 阅读:16 留言:0更新日期:2021-10-30 13:28
本公开是关于一种异常用户识别方法及装置、电子设备以及计算机可读存储介质,涉及计算机技术领域,可以应用于根据用户行为识别异常用户的场景。该方法包括:获取用户行为日志文件,根据用户行为日志文件确定目标用户对应的多个用户行为记录;根据多个用户行为记录确定对应的行为序列数据;行为序列数据包括用户行为序列与行为时间间隔序列;根据用户行为序列与行为时间间隔序列确定行为异常值;获取目标用户的用户特征,并根据用户特征与行为异常值确定目标用户是否为异常用户。本公开可以根据用户的用户行为向量与行为时间间隔序列确定行为异常值,进而根据行为异常值与用户特征识别是否为异常用户,可以有效提高识别准确率。率。率。

【技术实现步骤摘要】
异常用户识别方法及装置、电子设备和存储介质


[0001]本公开涉及计算机
,具体而言,涉及一种异常用户识别方法、异常用户识别装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着直播行业的快速发展,直播内容的不断丰富,与直播相关的玩法也层出不穷,这不仅吸引了海量观众,同时也吸引了大量希望在此通过作弊手段盈利的黑灰产用户。这些黑灰产用户通过第三方工具可以达到在平台上批量获取收益的目的,虽然每个账号所获得的收益有限,但大量的黑灰产账号依旧会对平台造成严重损失,同时影响正常用户在直播平台上的使用体验。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开的目的在于提供一种异常用户识别方法、异常用户识别装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服现有的黑灰产用户人力耗费严重且识别准确率不高的问题。
[0005]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。
[0006]根据本公开的第一方面,提供一种异常用户识别方法,包括:获取用户行为日志文件,根据用户行为日志文件确定目标用户对应的多个用户行为记录;根据多个用户行为记录确定对应的行为序列数据;行为序列数据包括用户行为序列与行为时间间隔序列;根据用户行为序列与行为时间间隔序列确定行为异常值;获取目标用户的用户特征,并根据用户特征与行为异常值确定目标用户是否为异常用户。
[0007]在本公开的一种示例性实施方案中,获取预先设定的行为记录要素;行为记录要素包括行为要素与页面要素;根据用户行为日志文件中的行为要素与对应的页面要素生成用户行为记录。
[0008]在本公开的一种示例性实施方案中,根据多个用户行为记录确定对应的行为序列数据,包括:获取各用户行为记录的行为发生时间;根据行为发生时间对多个用户行为记录进行排序,以生成用户行为序列;确定两个相邻用户行为记录之间的时间间隔,根据时间间隔生成行为时间间隔序列。
[0009]在本公开的一种示例性实施方案中,根据用户行为序列与行为时间间隔序列确定行为异常值,包括:获取预先构建的异常行为确定模型;异常行为确定模型基于用户行为向量字典以及训练行为数据集训练生成;将用户行为序列对应的用户行为向量与行为时间间隔序列输入至异常行为确定模型,以得到行为异常值。
[0010]在本公开的一种示例性实施方案中,训练行为数据集包括用户行为训练集与行为
时间间隔训练集;异常行为确定模型通过下述步骤训练得到:基于用户行为日志文件确定历史用户行为序列;对历史用户行为序列进行向量转化处理,以根据生成的历史用户行为向量构建用户行为向量字典;根据用户行为日志文件确定用户行为训练集与行为时间间隔训练集;获取初始模型,基于用户行为向量字典、用户行为训练集与行为时间间隔训练集对初始模型进行训练,以得到异常行为确定模型。
[0011]在本公开的一种示例性实施方案中,异常行为确定模型包括第一长短期记忆层、第二长短期记忆层和连接层;将用户行为序列对应的用户行为向量与行为时间间隔序列输入至异常行为确定模型,以得到行为异常值,包括:将用户行为向量输入至第一长短期记忆层,得到由第一长短期记忆层的最后一个时间步输出的中间行为向量;将行为时间间隔序列输入至第二长短期记忆层,得到由第二长短期记忆层的最后一个时间步输出的中间时间间隔向量;通过连接层对中间行为向量与中间时间间隔向量进行拼接处理,以得到行为拼接向量;对行为拼接向量进行全连接处理,以得到行为异常值。
[0012]在本公开的一种示例性实施方案中,根据用户特征与行为异常值确定目标用户是否为异常用户,包括:获取预先构建的异常用户识别模型;将用户特征与行为异常值输入至异常用户识别模型,以确定目标用户是否为异常用户。
[0013]在本公开的一种示例性实施方案中,异常用户识别模型的模型结构为树形结构,将用户特征与行为异常值输入至异常用户识别模型,以确定目标用户是否为异常用户,包括:根据用户特征与行为异常值生成用户总体特征,将用户总体特征作为树形结构的特征根结点;用户总体特征包括多个特征要素;基于特征根结点对多个特征要素进行特征分裂处理,得到树形结构的叶子结点;根据叶子结点的分类结果确定目标用户是否为异常用户。
[0014]在本公开的一种示例性实施方案中,用户特征是基于目标用户的用户基本信息以及目标用户在目标应用程序中的交互行为所生成的特征。
[0015]根据本公开的第二方面,提供一种异常用户识别装置,包括:行为记录确定模块,用于获取用户行为日志文件,根据用户行为日志文件确定目标用户对应的多个用户行为记录;序列数据确定模块,用于根据多个用户行为记录确定对应的行为序列数据;行为序列数据包括用户行为序列与行为时间间隔序列;异常值确定模块,用于根据用户行为序列与行为时间间隔序列确定行为异常值;异常用户识别模块,用于获取目标用户的用户特征,并根据用户特征与行为异常值确定目标用户是否为异常用户。
[0016]在本公开的一种示例性实施方案中,行为记录确定模块包括行为数据确定单元,用于获取预先设定的行为记录要素;行为记录要素包括行为要素与页面要素;根据用户行为日志文件中的行为要素与对应的页面要素生成用户行为记录。
[0017]在本公开的一种示例性实施方案中,序列数据确定模块包括序列数据确定单元,用于获取各用户行为记录的行为发生时间;根据行为发生时间对多个用户行为记录进行排序,以生成用户行为序列;确定两个相邻用户行为记录之间的时间间隔,根据时间间隔生成行为时间间隔序列。
[0018]在本公开的一种示例性实施方案中,异常值确定模块包括异常值确定单元,用于获取预先构建的异常行为确定模型;异常行为确定模型基于用户行为向量字典以及训练行为数据集训练生成;将用户行为序列对应的用户行为向量与行为时间间隔序列输入至异常行为确定模型,以得到行为异常值。
[0019]在本公开的一种示例性实施方案中,异常值确定模块还包括模型训练单元,用于基于用户行为日志文件确定历史用户行为序列;对历史用户行为序列进行向量转化处理,以根据生成的历史用户行为向量构建用户行为向量字典;根据用户行为日志文件确定用户行为训练集与行为时间间隔训练集;获取初始模型,基于用户行为向量字典、用户行为训练集与行为时间间隔训练集对初始模型进行训练,以得到异常行为确定模型。
[0020]在本公开的一种示例性实施方案中,异常值确定单元包括异常值确定子单元,用于将用户行为向量输入至第一长短期记忆层,得到由第一长短期记忆层的最后一个时间步输出的中间行为向量;将行为时间间隔序列输入至第二长短期记忆层,得到由第二长短期记忆层的最后一个时间步输出的中间时间间隔向量;通过连接层对中间行为向量与中间时间间隔向量进行拼接处理,以得到行为拼接向量;对行为拼接向量进行全连接处理,以得到行为异常值。
[0021]在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常用户识别方法,其特征在于,包括:获取用户行为日志文件,根据所述用户行为日志文件确定目标用户对应的多个用户行为记录;根据多个所述用户行为记录确定对应的行为序列数据;所述行为序列数据包括用户行为序列与行为时间间隔序列;根据所述用户行为序列与所述行为时间间隔序列确定行为异常值;获取所述目标用户的用户特征,并根据所述用户特征与所述行为异常值确定所述目标用户是否为异常用户。2.根据权利要求1所述的方法,其特征在于,所述根据所述用户行为日志文件确定目标用户对应的多个用户行为记录,包括:获取预先设定的行为记录要素;所述行为记录要素包括行为要素与对应的页面要素;根据所述用户行为日志文件中的所述行为要素与对应的页面要素生成所述用户行为记录。3.根据权利要求1所述的方法,其特征在于,所述根据多个所述用户行为记录确定对应的行为序列数据,包括:获取各所述用户行为记录的行为发生时间;根据所述行为发生时间对多个所述用户行为记录进行排序,以生成所述用户行为序列;确定两个相邻所述用户行为记录之间的时间间隔,根据所述时间间隔生成所述行为时间间隔序列。4.根据权利要求1或3所述的方法,其特征在于,所述根据所述用户行为序列与所述行为时间间隔序列确定行为异常值,包括:获取预先构建的异常行为确定模型;所述异常行为确定模型基于用户行为向量字典以及训练行为数据集训练生成;将用户行为序列对应的用户行为向量与所述行为时间间隔序列输入至所述异常行为确定模型,以得到所述行为异常值。5.根据权利要求4所述的方法,其特征在于,所述训练行为数据集包括用户行为训练集与行为时间间隔训练集;所述异常行为确定模型通过下述步骤训练得到:基于所述用户行为日志文件确定历史用户行为序列;对所述历史用户行为序列进行向量转化处理,以根据生成的历史用户行为向量构建用户行为向量字典;根据所述用户行为日志文件确定所述用户行为训练集与所述行为时间间隔训练集;获取初始模型,基于所述用户行为向量字典、所述用户行为训练集与所述行为时间间隔训练集对所述初始模型进行训练,以得到所述异常行为确定模型。6.根据权利要求4所述的方法,其特征在于,所述异常行为确定模型包括第一长短期记忆层、第二长短期记忆层和连接层;所述将用户行为序列对应的用户行为向量与所述行为时间间隔序列输入至所述异常行为确定模型,以得到所述行为异常值,包括:
将所述用户行为向...

【专利技术属性】
技术研发人员:张泽磊
申请(专利权)人:广州博冠信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1