一种高风险用户的检测方法、计算设备及可读存储介质技术

技术编号:34390302 阅读:17 留言:0更新日期:2022-08-03 21:17
本发明专利技术公开了一种高风险用户的检测方法、计算设备及可读存储介质,该方法包括:获取第一用户的第一数据样本,第一数据样本包括第一用户的注册行为特征和登录行为特征;将第一数据样本输入到训练好的检测模型中,输出预测第一用户属于高风险用户的概率值作为第一风险评分;获取目标营销活动的专家规则以及第一用户在目标营销活动中的行为特征;基于所获取的专家规则对第一用户在目标营销活动中的行为特征进行评估,得出第二风险评分;基于第一风险评分和第二风险评分,确定第一用户是否为高风险用户。本发明专利技术的技术方案,结合了检测模型和专家规则的优点,提供了稳定可靠的高用户风险用户的检测方法。险用户的检测方法。险用户的检测方法。

【技术实现步骤摘要】
一种高风险用户的检测方法、计算设备及可读存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种高风险用户的检测方法、计算设备及可读存储介质。

技术介绍

[0002]在互联网营销策划中,经常提到“以正合,以奇胜”,正乃战略,奇乃策略。根据不同的营销策略,商家经常会举行一些以奇致胜的活动,数量繁多,形式各异,比如朋友圈集赞送礼,转发微博抽奖,拉新用户送福利,参加活动领取优惠券等等。这些活动的举办方大都有一些明确的目标,比如宣传,拉新,促销等等。然而,在活动具体的实施过程中,会有一些恶意用户通过各种手段进行“作弊”,其中有一些人自称为“羊毛客”,目的就是薅羊毛,即企图在不遵守活动规则的前提下也实现获利。这种作弊行为会给活动举办方造成很大损害,不但造成经济损失,也损害了其他正常参加活动用户的利益,还可能导致举办方信誉受损,最终致使活动效果大打折扣,活动目标无法实现。
[0003]因此,识别薅羊毛的黑灰产用户是风控人员必不可少的课题,现有的风险识别技术/风险评分可以分为两类:一是基于专家规则的风险评分方法,二是基于人工智能风险评分方法。基于专家规则的风险评分方法可以基于单条规则也可以多条规则结合使用,其缺点也比较明显,包括:泛化能力较弱,黑产特征行为稍有变动很可能就识别不了。基于人工智能风险评分方法采用机器学习、深度学习等人工智能技术,对营销场景数据进行特征加工、训练模型,根据模型结果进行风险评估。其缺点是准确率和上线周期相对于专家规则的方案要低要长一些。
[0004]为此,亟需一种检测高风险用户的方法,提高检测的准确率和泛化能力。

技术实现思路

[0005]为此,本专利技术提供了一种高风险用户的检测方法、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
[0006]根据本专利技术的一个方面,提供了一种高风险用户的检测方法,在计算设备中执行,方法包括步骤:获取第一用户的第一数据样本,第一数据样本包括第一用户的注册行为特征和登录行为特征;将第一数据样本输入到训练好的检测模型中,输出预测第一用户属于高风险用户的概率值作为第一风险评分;获取目标营销活动的专家规则以及第一用户在目标营销活动中的行为特征;基于所获取的专家规则对第一用户在目标营销活动中的行为特征进行评估,得出第二风险评分;基于第一风险评分和第二风险评分,确定第一用户是否为高风险用户。
[0007]可选地,在根据本专利技术的高风险用户的检测方法中,基于第一风险评分和第二风险评分,确定第一用户是否为高风险用户的步骤,包括:将第一风险评分和第二风险评分进行融合处理,得到第三风险评分;如果第三风险评分高于第一预定值,则确定第一用户属于高风险用户;否则,确定第一用户不属于高风险用户。
[0008]可选地,在根据本专利技术的高风险用户的检测方法中,第二风险评分通过以下公式计算:其中,rules_score(x
i
)为用户x
i
的第二风险评分;r
j
(x
i
)为用户x
i
的第j个专家规则风险得分,m为规则的总数。
[0009]可选地,在根据本专利技术的高风险用户的检测方法中,训练好的检测模型通过以下方式生成:获取第二数据样本集,第二数据样本集包括多个用户的第二数据样本,第二数据样本包括多个用户的注册行为特征、登录行为特征以及用户是否属于高风险用户;通过第二数据样本集对检测模型进行训练,直到达到预定条件,得到训练好的检测模型。
[0010]可选地,在根据本专利技术的高风险用户的检测方法中,预定条件为检测模型的预测值与真实值之间的损失函数的值最小或检测模型的准确率不再提高。
[0011]可选地,在根据本专利技术的高风险用户的检测方法中,在通过第二数据样本集对检测模型进行训练的步骤之前,还包括:对第二数据样本集进行预处理。
[0012]可选地,在根据本专利技术的高风险用户的检测方法中,对第二数据样本集进行预处理的步骤,包括:如果第二数据样本集中的一个用户的第二数据样本具有缺失项,且缺失项的数量超过第二数据样本所包括的数据总数的第四预定值,则将该用户的第二数据样本进行舍弃;如果第二数据样本集中的一个用户的第二数据样本具有缺失项,但缺失项的数量未超过第二数据样本所包括的数据总数的第四预定值,则对该用户的第二数据样本的缺失项进行填充。
[0013]可选地,在根据本专利技术的高风险用户的检测方法中,对该用户的第二数据样本的缺失项进行填充的步骤,包括:如果该用户的第二数据样本中的缺失项在第二数据样本集中属于连续型变量,则从第二数据样本集中获取该缺失项对应的全部的值,对该全部的值进行均值计算,采用均值计算的结果对该用户的第二数据样本的缺失项进行填充;如果该用户的第二数据样本中的缺失项在第二数据样本集中属于离散型变量,则从第二数据样本集中获取该缺失项对应的全部的值,采用该全部的值中的众数对该用户的第二数据样本的缺失项进行填充。
[0014]可选地,在根据本专利技术的高风险用户的检测方法中,注册行为特征和登录行为特征包括注册IP归属地、注册时长、注册昵称、登录IP归属地、登录时长、登录设备中的至少一项。
[0015]根据本专利技术的另一个方面,提供一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行上述高风险用户的检测方法的指令。
[0016]根据本专利技术的还有一个方面,还提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当计算设备执行时,使得计算设备执行上述高风险用户的检测方法。
[0017]根据本专利技术的技术方案,训练好的检测模型具有泛化能力强的特点,通过专家规则确定风险评分的方法具有准确性高,针对性强的特点。本专利技术基于第一风险评分和第二风险评分,确定第一用户是否为高风险用户,结合了检测模型和专家规则的优点,提供了稳定可靠的高用户风险用户的检测方法。
[0018]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,
而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0019]为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
[0020]图1示出了根据本专利技术一个实施例的计算设备100的示意图;
[0021]图2示出了根据本专利技术一个实施例的高风险用户的检测方法200的流程图;以及
[0022]图3示出了根据本专利技术一个实施例的训练检测模型的示意图。
具体实施方式
[0023]下面将参照本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高风险用户的检测方法,在计算设备中执行,所述方法包括步骤:获取第一用户的第一数据样本,所述第一数据样本包括所述第一用户的注册行为特征和登录行为特征;将所述第一数据样本输入到训练好的检测模型中,输出预测所述第一用户属于高风险用户的概率值作为第一风险评分;获取目标营销活动的专家规则以及第一用户在所述目标营销活动中的行为特征;基于所获取的专家规则对所述第一用户在所述目标营销活动中的行为特征进行评估,得出第二风险评分;基于所述第一风险评分和所述第二风险评分,确定所述第一用户是否为高风险用户。2.根据权利要求1所述的方法,其中,所述基于所述第一风险评分和所述第二风险评分,确定所述第一用户是否为高风险用户的步骤,包括:将所述第一风险评分和所述第二风险评分进行融合处理,得到第三风险评分;如果所述第三风险评分高于所述第一预定值,则确定所述第一用户属于高风险用户;否则,确定所述第一用户不属于高风险用户。3.根据权利要求1或2所述的方法,其中,所述第二风险评分通过以下公式计算:其中,rules_score(x
i
)为用户x
i
的第二风险评分;r
j
(x
i
)为用户x
i
的第j个专家规则风险得分,m为规则的总数。4.根据权利要求1所述的方法,其中,所述训练好的检测模型通过以下方式生成:获取第二数据样本集,所述第二数据样本集包括多个用户的第二数据样本,所述第二数据样本包括多个用户的注册行为特征、登录行为特征以及用户是否属于高风险用户;通过所述第二数据样本集对检测模型进行训练,直到达到预定条件,得到训练好的检测模型。5.根据权利要求5所述的方法,其中,所述预...

【专利技术属性】
技术研发人员:邓永国范光亮
申请(专利权)人:北京齐尔布莱特科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1