一种识别恶意用户的方法、装置及存储介质制造方法及图纸

技术编号：20177768 阅读：18 留言：0更新日期：2019-01-23 00:40

本发明专利技术实施例提供了一种识别恶意用户的方法、装置及存储介质，该方法包括：获取训练样本集，训练样本集包括训练样本的特征以及与训练样本对应的标签，所述训练样本对应的标签用于标识用户是否为恶意用户；从训练样本集中确定最优的切分特征与切分阈值；将训练样本集分裂处理，得到第一样本集和第二样本集，将第一样本集和所述第二样本集中各特征的均值作为目标输出值；根据目标输出值判断用户的是否为恶意用户；将第一样本集和第二样本集中判断为恶意用户的训练样本对应的标签设置为恶意用户，以及将判断为非恶意用户的训练样本对应的标签设置为非恶意用户。通过采用该方案，能够准确的分析用户的行为特征，根据行为特征识别出恶意用户。

全部详细技术资料下载

【技术实现步骤摘要】
一种识别恶意用户的方法、装置及存储介质
本专利技术涉及软件
，尤其涉及一种识别恶意用户的方法、装置及存储介质。
技术介绍
在直播平台发展过程中，一些黑产团体为了达到私人目的，常常会批量注册许多平台账号，使用这些账号刷评论、刷弹幕和刷人气等恶意行为，企图刷高某个直播间的热度，使得整个直播平台的资源出现不平等的现象，从中获利。直播平台需要对这些恶意账号的用户进行封禁处理，然而，恶意账号的行为难以从海量数据中直接挖掘。利用算法进行恶意用户挖掘是一个可行的思路。恶意用户由于是黑产批量操作，其行为与动作往往具有一定的相似性，与正常用户的行为模式有一定差异。常见的恶意用户分类算法有决策树、支撑向量机、感知机等算法。这些算法往往是基于对恶意用户的判别，无法给出连续分布的恶意用户评价指标，基于这些算法创建的模型针对恶意用户的挖掘结果难以人工调控。并且挖掘结果的可解释性较差，无法自动形成对判别结果的理由解释。
技术实现思路
本专利技术实施例提供了一种识别恶意用户的方法、装置及存储介质，用于解决现有机制中挖掘恶意用户的准确性较低的问题。第一方面，本专利技术提供了一种识别恶意用户的方法，该方法包括：获取训练样本集，所述训练样本集为回归树结构，所述训练样本集包括训练样本的特征以及与训练样本对应的标签，所述训练样本对应的标签用于标识用户是否为恶意用户；从所述训练样本集中确定最优的切分特征与切分阈值；将所述训练样本集分裂处理，得到第一样本集和第二样本集，所述第一样本集是指特征的取值不小于所述切分阈值的特征集，所述第二样本集是指特征的取值大于所述切分阈值的特征集；将所述第一样本集和所...

【技术保护点】
1.一种识别恶意用户的方法，其特征在于，所述方法包括：获取训练样本集，所述训练样本集为回归树结构，所述训练样本集包括训练样本的特征以及与训练样本对应的标签，所述训练样本对应的标签用于标识用户是否为恶意用户；从所述训练样本集中确定最优的切分特征与切分阈值；将所述训练样本集分裂处理，得到第一样本集和第二样本集，所述第一样本集是指特征的取值不小于所述切分阈值的特征集，所述第二样本集是指特征的取值大于所述切分阈值的特征集；将所述第一样本集和所述第二样本集中各特征的均值作为目标输出值；根据所述目标输出值判断用户的是否为恶意用户；将所述第一样本集和所述第二样本集中判断为恶意用户的训练样本对应的标签设置为恶意用户，以及将所述第一样本集和所述第二样本集中判断为非恶意用户的训练样本对应的标签设置为非恶意用户。

【技术特征摘要】
1.一种识别恶意用户的方法，其特征在于，所述方法包括：获取训练样本集，所述训练样本集为回归树结构，所述训练样本集包括训练样本的特征以及与训练样本对应的标签，所述训练样本对应的标签用于标识用户是否为恶意用户；从所述训练样本集中确定最优的切分特征与切分阈值；将所述训练样本集分裂处理，得到第一样本集和第二样本集，所述第一样本集是指特征的取值不小于所述切分阈值的特征集，所述第二样本集是指特征的取值大于所述切分阈值的特征集；将所述第一样本集和所述第二样本集中各特征的均值作为目标输出值；根据所述目标输出值判断用户的是否为恶意用户；将所述第一样本集和所述第二样本集中判断为恶意用户的训练样本对应的标签设置为恶意用户，以及将所述第一样本集和所述第二样本集中判断为非恶意用户的训练样本对应的标签设置为非恶意用户。2.如权利要求1所述的方法，其特征在于，所述目标输出值用于评估用户的恶意等级；所述训练样本的特征至少包括用户的异常弹幕数量、用户播放数量、用户在第一时段内发表的评论数量、用户在第二时段内发表的相同评论数量和用户账户余额。3.如权利要求2所述的方法，其特征在于，所述根据所述目标输出值判断用户的是否为恶意用户之后，所述方法还包括以下之一：封禁判断为恶意用户的用户账号；或者，封禁判断为恶意用户的用户账号且设置有效封禁时长；或者，对判断为恶意用户的用户账号发送警告消息。4.如权利要求1-3中任一项所述的方法，其特征在于，所述方法还包括：设置封禁阈值；所述根据所述目标输出值判断用户的是否为恶意用户，包括：若所述目标输出值大于所述封禁阈值，则确定用户的恶意等级满足恶意用户的判断条件。5.如权利要求4所述的方法，其特征在于，所述训练样本包括第一特征、第二特征和第三特征，所述根据所述目标输出值判断用户的是否为恶意用户之后...

【专利技术属性】
技术研发人员：王非池，
申请(专利权)人：武汉斗鱼网络科技有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人