【技术实现步骤摘要】
一种电商平台风险识别模型训练方法和装置
[0001]本申请涉及网络
,尤其涉及一种电商平台风险识别模型训练方法和装置。
技术介绍
[0002]互联网电商往往面临着攻击风险;比如,一些用户利用脚本软件恶意抢购低价商品;比如,一些用户利用脚本或抢购等方式将优惠券一扫而空;这些用户行为给正常的商业活动带来负面影响。需要一种有效的方法,能够准确识别电商平台被攻击或被恶意使用的风险,以保证电商平台的正常运转。
技术实现思路
[0003]本申请实施例提供一种电商平台风险识别模型训练方法和装置,能够优化风险识别模型,提高电商平台识别风险行为的准确性。
[0004]为达到上述目的,本申请的实施例采用如下技术方案:第一方面,提供了一种电商平台风险识别模型训练方法,该方法包括:获取第一场景中电商平台运行的第一样本数据集和第二场景中电商平台运行的第二样本数据集;第一场景和第二场景可以是人机识别场景、风险行为识别场景或风险用户识别场景等;第二场景与第一场景是不同的场景。根据第一样本数据集对第一风险识别模型进行第i(i大 ...
【技术保护点】
【技术特征摘要】
1.一种电商平台风险识别模型训练方法,其特征在于,包括:获取第一场景中电商平台运行的第一样本数据集;其中,所述第一场景包括人机识别场景、风险行为识别场景或风险用户识别场景;获取第二场景中电商平台运行的第二样本数据集;其中,所述第二场景包括人机识别场景、风险行为识别场景或风险用户识别场景,所述第二场景与所述第一场景不同;根据所述第一样本数据集对第一风险识别模型进行第i轮训练,获取第一信息;其中,i大于或等于1,所述第一信息为所述第一风险识别模型的预设类型的信息;根据所述第二样本数据集对第二风险识别模型进行第i轮训练,获取第二信息;其中,所述第二信息为所述第二风险识别模型的预设类型的信息;根据所述第一信息与所述第二样本数据集对所述第二风险识别模型进行第i+1轮训练;根据所述第二信息与所述第一样本数据集对所述第一风险识别模型进行第i+1轮训练。2.根据权利要求1所述的方法,其特征在于,所述第一信息包括:所述第一样本数据集的样本向量表示;所述第二信息包括:所述第二样本数据集的样本向量表示。3.根据权利要求1或2所述的方法,其特征在于,在根据所述第一样本数据集对第一风险识别模型进行第i轮训练之前,所述方法还包括:根据所述第一样本数据集对第一风险识别模型进行预设次数的训练,获取所述第一风险识别模型的初始模型;所述根据所述第一样本数据集对第一风险识别模型进行第i轮训练,包括:根据所述第一样本数据集对所述第一风险识别模型的初始模型进行第1轮训练;在根据所述第二样本数据集对第二风险识别模型进行第i轮训练之前,所述方法还包括:根据所述第二样本数据集对第二风险识别模型进行预设次数的训练,获取所述第二风险识别模型的初始模型;所述根据所述第二样本数据集对第二风险识别模型进行第i轮训练,包括:根据所述第二样本数据集对所述第二风险识别模型的初始模型进行第1轮训练。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对所述第一风险识别模型的初始模型进行离线评估,获取离线评估指标的第一值;根据所述离线评估指标的第一值获取所述第一风险识别模型的第一效果权重;所述第一效果权重用于表征所述第一风险识别模型识别结果的准确程度;对所述第二风险识别模型的初始模型进行离线评估,获取离线评估指标的第二值;根据所述离线评估指标的第二值获取所述第二风险识别模型的第二效果权重;所述第二效果权重用于表征所述第二风险识别模型识别结果的准确程度。5.根据权利要求4所述的方法,其特征在于,所述离线评估指标包括:准确率,精准率,召回率,接收者操作特征曲线下面积AUC,和柯尔莫哥洛夫
‑
斯米尔诺夫KS统计量中至少一项。
6.根据权利要求4所述的方法,其特征在于,所述第一风险识别模型和所述第二风险识别模型为梯度提升树,所述第一信息还包括第一负梯度,所述第二信息还包括第二负梯度。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:根据所述第一负梯度、所述第二负梯度和所述第一效果权重,获取所述第一风险识别模型第i+1轮训练的拟合目标;根据所述第一负梯度、所述第二负梯度和所述第二效果权重,获取所述第二风险识别模型第i+1轮训练的拟合目标。8.一种电商平台风险识别模型训练方法,其特征在于,包括:获取第一场景的第一样本数据集;根据所述第一样本数据集中每个样本数据对应的用户行为获取高频行为样本数据集和低频行为样本数据集;根据所述高频行为样本数据集对所述低频行为样本数据集进行扩充,获取扩充后的低频行为样本数据集;根据所述扩充后的低频行为样本数据集对所述第一场景的低频行为风险识别模型进行训练。9.根据权利要求8所述的方法,其特征在于,所述方法还包括:根据所述高频行为样本数据集对所述第一场景的高频行为风险识别模型进行训练。10.根据权利要求8所述的方法,其特征在于,所述根据所述高频行为样本数据集对所述低频行为样本数据集进行扩充,包括:对所述低频行为样本数据集进行...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。